Загрузил Полина Антошина

Minko Statisticheskiy analiz v MS Excel

реклама
ПРОФЕССИОНАЛЬНАЯ РАБОТА
СТАТИСТИЧЕСКИЙ
АНАЛИЗ
В MS EXCEL
ПРОФЕССИОНАЛЬНАЯ РАБОТА
А.А.МИНЬКО
СТАТИСТИЧЕСКИЙ
АНАЛИЗ
В MS EXCEL
Москва • СанктПетербург • Киев
2004
ÁÁÊ 32.973.26-018.2.75
M62
ÓÄÊ 681.3.07
Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà”
Çàâ. ðåäàêöèåé À.Â. Ñëåïöîâ
Ïî îáùèì âîïðîñàì îáðàùàéòåñü â èçäàòåëüñòâî “Äèàëåêòèêà” ïî àäðåñó:
info@dialektika.com, http://www.dialektika.com
Ìèíüêî, À.À.
M62 Ñòàòèñòè÷åñêèé àíàëèç â MS Excel. : — Ì. : Èçäàòåëüñêèé äîì “Âèëüÿìñ”,
2004. — 448 ñ. : èë. — Ïàðàë. òèò. àíãë.
ISBN 5-8459-0692-X (ðóñ.)
Êíèãà ïðåäíàçíà÷åíà äëÿ âñåõ, êòî èñïîëüçóåò ìåòîäû ñòàòèñòè÷åñêîãî
àíàëèçà â ñâîåé ðàáîòå. Îíà íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî ïðèìåíÿþòñÿ íà ïðàêòèêå è êîòîðûå ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé
åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ìåòîäû ïðåäñòàâëåíû â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî ïðîñòî ðåàëèçîâàòü ïðàêòè÷åñêèå ðàáîòíèêè, êîòîðûì
íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ.
Äëÿ ñòóäåíòîâ, àñïèðàíòîâ, ïðåïîäàâàòåëåé è ïðàêòè÷åñêèõ ðàáîòíèêîâ,
çàíèìàþùèõñÿ âîïðîñàìè àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ.
ÁÁÊ 32.973.26-018.2.75
Âñå íàçâàíèÿ ïðîãðàììíûõ ïðîäóêòîâ ÿâëÿþòñÿ çàðåãèñòðèðîâàííûìè òîðãîâûìè
ìàðêàìè ñîîòâåòñòâóþùèõ ôèðì.
Íèêàêàÿ ÷àñòü íàñòîÿùåãî èçäàíèÿ íè â êàêèõ öåëÿõ íå ìîæåò áûòü âîñïðîèçâåäåíà
â êàêîé áû òî íè áûëî ôîðìå è êàêèìè áû òî íè áûëî ñðåäñòâàìè, áóäü òî ýëåêòðîííûå
èëè ìåõàíè÷åñêèå, âêëþ÷àÿ ôîòîêîïèðîâàíèå è çàïèñü íà ìàãíèòíûé íîñèòåëü, åñëè íà
ýòî íåò ïèñüìåííîãî ðàçðåøåíèÿ èçäàòåëüñòâà “Äèàëåêòèêà”.
Copyright © 2004 by Dialektika Computer Publishing.
All rights reserved including the right of reproduction in whole or in part in any form.
ISBN 5-8459-0692-X (ðóñ.)
© Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà”, 2004
Оглавление
ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
19
Глава 1. Основные понятия теории вероятностей
20
Глава 2. Основные статистические методы
49
Глава 3. Анализ статистических зависимостей
78
ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА
101
Глава 4. Статистические функции
102
Глава 5. Надстройка Пакет анализа
146
Глава 6. Дополнительные возможности Excel для проведения
статистического анализа
193
Глава 7. Моделирование случайных величин
229
ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК
249
Глава 8. Предварительный анализ
250
Глава 9. Подбор распределения
286
Глава 10. Интервальное оценивание параметров распределения
307
Глава 11. Проверка гипотез о параметрах распределений
335
Глава 12. Сравнение одномерных выборок
349
ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ
381
Глава 13. Корреляционный анализ
382
Глава 14. Сравнение зависимых выборок
400
Глава 15. Регрессионный анализ
417
Литература
427
Предметный указатель
429
Содержание
Предисловие
15
ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
19
Глава 1. Основные понятия теории вероятностей
20
1.1. Понятия случайного события и случайной величины
1.1.1. Вероятности
1.1.2. Алгебра случайных событий
1.1.3. Условные вероятности
1.2. Распределения случайных величин
1.2.1. Дискретные случайные величины
1.2.2. Непрерывные случайные величины
1.2.3. Числовые характеристики случайных величин
1.2.4. Вероятностные неравенства
1.2.5. Двумерные распределения
1.3. Функции от случайных величин
1.3.1. Линейное преобразование случайных величин
1.3.2. Суммы случайных величин
1.3.3. Центральная предельная теорема
1.4. Примеры дискретных распределений
1.4.1. Равномерное дискретное распределение
1.4.2. Распределение Бернулли
1.4.3. Биномиальное распределение
1.4.4. Распределение Пуассона
1.4.5. Геометрическое распределение
1.4.6. Гипергеометрическое распределение
1.4.7. Отрицательное биномиальное распределение
(распределение Паскаля)
1.5. Примеры непрерывных распределений
1.5.1. Равномерное непрерывное распределение
1.5.2. Треугольное распределение
1.5.3. Показательное (экспоненциальное) распределение
1.5.4. Нормальное распределение
1.5.5. Распределение “хи/квадрат”
1.5.6. Распределение Стьюдента
1.5.7. F/распределение
1.5.8. Логарифмически нормальное распределение
1.5.9. Бета/распределение
1.5.10. Гамма/распределение
Содержание
20
21
22
22
23
23
25
25
27
28
29
30
30
31
32
32
32
33
34
34
35
35
36
36
37
37
38
39
40
41
42
43
44
6
1.5.11. Распределение Вейбулла–Гнеденко
1.5.12. Распределения Пирсона
Глава 2. Основные статистические методы
2.1. Точечное оценивание параметров распределения
2.1.1. Несмещенность оценки
2.1.2. Эффективность оценки
2.1.3. Состоятельность оценки
2.2. Интервальное оценивание параметров распределения
2.3. Выборочные статистики и интервальные оценки
2.3.1. Статистика для оценивания математического ожидания
2.3.2. Статистика для оценивания дисперсии
2.3.3. Статистики для оценивания моментов
2.3.4. Статистики для оценивания коэффициентов асимметрии
и эксцесса
2.3.5. Статистика для оценивания медианы
2.3.6. Оценки параметров нормального распределения
2.3.7. Оценка параметра р распределения Бернулли
2.3.8. Оценка параметра λ распределения Пуассона
2.3.9. Порядковые статистики
2.4. Проверка статистических гипотез
2.4.1. Критерии проверки гипотез о значениях параметров
генеральной совокупности
2.4.2. Критерии сравнения значений параметров генеральных
совокупностей
2.4.3. Критерии проверки гипотез о принадлежности
распределения выборки классу распределений
Глава 3. Анализ статистических зависимостей
3.1. Общая модель статистических зависимостей
3.2. Задачи статистического анализа зависимостей
3.3. Корреляционный анализ
3.3.1. Анализ зависимостей между количественными переменными
3.3.2. Анализ зависимостей между порядковыми переменными
3.3.3. Анализ зависимостей между классификационными
переменными
3.4. Регрессионный анализ
3.4.1. Выбор функции регрессии
3.4.2. Построение функции регрессии
3.4.3. Проверка адекватности функции регрессии
3.4.4. Статистические характеристики параметров
функции регрессии
3.4.5. Прогнозирование
3.5. Дисперсионный анализ
3.5.1. Статистическая модель
7
Содержание
44
45
49
49
50
51
51
52
54
54
56
58
58
59
59
61
63
65
65
68
70
75
78
78
79
81
81
83
86
88
88
90
91
92
93
94
94
3.5.2. Однофакторный дисперсионный анализ
3.5.3. Двухфакторный дисперсионный анализ
95
97
ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА
101
Глава 4. Статистические функции
102
4.1. Функции для определения экстремальных значений выборки
4.1.1. Функции МАКС, МАКСА, МИН, МИНА
4.1.2. Функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ
4.2. Функции для работы с порядковыми статистиками
4.2.1. Функция КВАРТИЛЬ
4.2.2. Функция ПЕРСЕНТИЛЬ
4.2.3. Функция МЕДИАНА
4.2.4. Функция ПРОЦЕНТРАНГ
4.2.5. Функция РАНГ
4.3. Функции для вычисления средних
4.3.1. Функция СРГАМ
4.3.2. Функция СРГЕОМ
4.3.3. Функции СРЗНАЧ и СРЗНАЧА
4.3.4. Функция УРЕЗСРЕДНЕЕ
4.4. Функции для вычисления геометрических характеристик
распределения
4.4.1. Функция СКОС
4.4.2. Функция ЭКСЦЕСС
4.5. Функции для вычисления выборочной дисперсии и отклонения
4.5.1. Функции ДИСП и ДИСПА
4.5.2. Функции ДИСПР и ДИСПРА
4.5.3. Функция КВАДРОТКЛ
4.5.4. Функции СТАНДОТКЛОН и СТАНДОТКЛОНА
4.5.5. Функции СТАНДОТКЛОНП и СТАНДОТКЛОНПА
4.5.6. Функция СРОТКЛ
4.6. Функции для вычисления значений функций распределения
4.6.1. Функция FРАСП
4.6.2. Функция БЕТАРАСП
4.6.3. Функция БИНОМРАСП
4.6.4. Функция ВЕЙБУЛЛ
4.6.5. Функция ГАММАРАСП
4.6.6. Функция ГИПЕРГЕОМЕТ
4.6.7. Функция ЛОГНОРМРАСП
4.6.8. Функция НОРМРАСП
4.6.9. Функция НОРМСТРАСП
4.6.10. Функция ОТРБИНОМРАСП
4.6.11. Функция ПУАССОН
4.6.12. Функция СТЬЮДРАСП
4.6.13. Функция ХИ2РАСП
4.6.14. Функция ЭКСПРАСП
Содержание
102
103
103
104
104
105
106
106
107
109
109
109
109
110
110
110
111
111
112
112
112
112
113
113
113
114
114
115
115
116
116
117
117
117
117
118
118
119
119
8
4.7. Функции, обратные к функциям распределения
4.7.1. Функция FРАСПОБР
4.7.2. Функция БЕТАОБР
4.7.3. Функция ГАММАОБР
4.7.4. Функция ЛОГНОРМОБР
4.7.5. Функция НОРМОБР
4.7.6. Функция НОРМСТОБР
4.7.7. Функция СТЬЮДРАСПОБР
4.7.8. Функция ХИ2ОБР
4.7.9. Функция КРИТБИНОМ
4.8. Функции для проверки статистических критериев
4.8.1. Функция ZТЕСТ
4.8.2. Функция ТТЕСТ
4.8.3. Функция ФТЕСТ
4.8.4. Функция ХИ2ТЕСТ
4.9. Функции для построения уравнения регрессии и прогнозирования
4.9.1. Функция ЛИНЕЙН
4.9.2. Функции НАКЛОН и ОТРЕЗОК
4.9.3. Функция СТОШYX
4.9.4. Функция ПРЕДСКАЗ
4.9.5. Функция ТЕНДЕНЦИЯ
4.9.6. Функция ЛГРФПРИБЛ
4.9.7. Функция РОСТ
4.10. Функции для вычисления ковариации и коэффициента корреляции
4.10.1. Функция КОВАР
4.10.2. Функция КОРРЕЛ
4.10.3. Функция ПИРСОН
4.10.4. Функция КВПИРСОН
4.10.5. Функции ФИШЕР и ФИШЕРОБР
4.11. Дополнительные функции
4.11.1. Функция ВЕРОЯТНОСТЬ
4.11.2. Функция ДОВЕРИТ
4.11.3. Функция МОДА
4.11.4. Функция ЧАСТОТА
4.12. Вспомогательные функции
4.12.1. Функция ГАММАНЛОГ
4.12.2. Функция НОРМАЛИЗАЦИЯ
4.12.3. Функция ПЕРЕСТ
4.12.4. Функции СЧЁТ и СЧЁТЗ
4.13. Функции для генерирования равномерно распределенных
случайных чисел
4.13.1. Функция СЛЧИС
4.13.2. Функция СЛУЧМЕЖДУ
9
Содержание
119
120
121
121
121
122
122
122
122
123
123
124
124
126
127
128
129
131
132
133
133
134
135
136
136
137
137
138
139
139
140
140
141
141
142
142
142
143
143
143
144
144
Глава 5. Надстройка Пакет анализа
146
5.1. Описательная статистика
5.1.1. Опции диалогового окна Описательная статистика
5.2. Гистограмма
5.2.1. Опции диалогового окна Гистограмма
5.3. Генерация случайных чисел
5.3.1. Опции диалогового окна Генерация случайных чисел
5.4. Выборка
5.4.1. Опции диалогового окна Выборка
5.5. Ранг и персентиль
5.6. Двухвыборочный z/тест для средних
5.7. Двухвыборочный t/тест с одинаковыми дисперсиями
5.8. Двухвыборочный t/тест с различными дисперсиями
5.9. Парный двухвыборочный t/тест для средних
5.10. Двухвыборочный F/тест для дисперсий
5.11. Однофакторный дисперсионный анализ
5.12. Двухфакторный дисперсионный анализ с повторениями
5.13. Двухфакторный дисперсионный анализ без повторений
5.14. Корреляция
5.15. Ковариация
5.16. Регрессия
5.17. Скользящее среднее
5.18. Экспоненциальное сглаживание
5.19. Анализ Фурье
Глава 6. Дополнительные возможности Excel для проведения
статистического анализа
149
151
151
152
154
155
160
160
161
161
165
167
169
172
173
175
177
179
180
181
187
188
189
193
6.1. Массивы и формулы массивов
6.1.1. Редактирование формул массивов
6.1.2. Массивы констант
6.1.3. Поименованные массивы и диапазоны
6.1.4. Примеры использования формул массивов
6.1.5. Матричные вычисления
6.1.6. Функции суммирования
6.2. Диаграммы
6.2.1. Линии тренда
6.2.2. Планки погрешностей
6.2.3. Построение гистограмм и функций распределения
дискретных случайных величин
6.2.4. Гистограммы с перекрытием
6.3. Надстройка Поиск решения
6.3.1. Задачи оптимизации и средство Поиск решения
6.3.2. Задачи, решаемые средством Поиск решения
6.3.3. Примеры применения средства Поиск решения
Содержание
193
196
196
197
200
203
204
206
207
210
212
215
217
218
224
225
10
Глава 7. Моделирование случайных величин
7.1. Средства Excel для генерирования случайных чисел
7.2. Метод обратных функций моделирования случайных величин
7.3. Метод суперпозиций
7.4. Метод отбора
7.5. Моделирование многомерных случайных величин
7.5.1. Моделирование зависимых случайных величин с известным
коэффициентом корреляции
229
229
234
238
242
244
245
ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК
249
Глава 8. Предварительный анализ
250
8.1. Цензурирование
8.1.1. Цензурирования на основе построения доверительных
интервалов
8.1.2. Непараметрическое цензурирование
8.1.3. Винзоризация выборки
8.2. Преобразование данных
8.2.1. Преобразование квадратного корня
8.2.2. Логарифмическое преобразование
8.2.3. Стандартизирующее преобразование
8.3. Построение гистограмм, полигонов и эмпирических функций
распределения
8.3.1. Построение гистограммы и эмпирической функции
распределения для дискретных случайных величин
8.3.2. Построение гистограммы и полигона для непрерывных
распределений
8.4. Вычисление точечных оценок параметров распределения
8.4.1. Точечные оценки дискретного распределения
8.4.2. Вычисление моды для непрерывных распределений
Глава 9. Подбор распределения
9.1. Предварительное определение класса распределения
9.1.1. Построение пробит/графиков
9.2. Подбор функции распределения на основе числовых характеристик
выборки
9.2.1. Критерии отклонения распределения от нормального
9.2.2. Критерий отклонения от распределения Пуассона
2
9.3. Критерий χ
2
9.3.1. Критерий χ для дискретных распределений
2
9.3.2. Критерий χ для непрерывных распределений
9.4. Критерий Колмогорова
Глава 10. Интервальное оценивание параметров распределения
10.1. Общие доверительные интервалы для математического ожидания
10.1.1. Общая модель при известной дисперсии
11
Содержание
250
251
257
258
263
263
265
267
267
268
273
278
283
285
286
286
288
291
293
296
297
297
299
304
307
307
307
10.1.2. Одномодальное симметричное распределение при известной
дисперсии
10.1.3. Общая модель с неизвестной дисперсией
10.2. Общий доверительный интервал для дисперсии
10.3. Интервальные оценки параметров нормального распределения
10.3.1. Интервальные оценки для неизвестного математического
ожидания при известной дисперсии
10.3.2. Интервальные оценки для неизвестного математического
ожидания при неизвестной дисперсии
10.3.3. Интервальные оценки для неизвестной дисперсии при
известном математическом ожидании
10.3.4. Интервальные оценки для неизвестной дисперсии при
неизвестном математическом ожидании
10.4. Оценка параметров логарифмически нормального распределения
10.5. Оценка параметра показательного распределения
10.6. Оценка параметров гамма/распределения
10.6.1. Оценка параметра λ при известном параметре α
10.6.2. Оценка параметра α при известном параметре λ
10.6.3. Совместная оценка параметров α и λ
10.7. Оценка параметров равномерного распределения
10.7.1. Оценка границы равномерного распределения
10.7.2. Оценка обеих границ равномерного распределения
10.8. Оценки параметра распределения Бернулли
10.8.1. Оценивание вероятности р по одному эксперименту
10.8.2. Оценивание вероятности р по нескольким экспериментам
10.8.3. Применение преобразования арксинуса
10.9. Оценка параметра распределения Пуассона
10.10. Оценки параметра геометрического распределения
10.11. Доверительные интервалы для квантилей
Глава 11. Проверка гипотез о параметрах распределений
308
308
310
312
312
313
315
315
317
318
319
320
321
322
323
323
324
324
325
327
328
329
331
333
335
11.1. Критерии проверки гипотез о параметрах нормального распределения
11.1.1. Критерий проверки значения математического ожидания
нормальной совокупности
11.1.2. Критерий проверки значения дисперсии нормальной
совокупности
11.2. Проверка гипотезы о значении параметра показательного
распределения
11.3. Проверка гипотезы о значении параметра биномиального
распределения
11.3.1. Использование биномиального распределения
11.3.2. Асимптотический критерий
11.4. Критерии проверки гипотез о значении медианы
11.4.1. Критерий знаков
11.4.2. Критерий знаковых рангов Уилкоксона
Содержание
335
335
337
339
341
341
343
343
344
346
12
Глава 12. Сравнение одномерных выборок
12.1. Сравнение выборочных распределений
12.1.1. Непараметрический критерий медианы
12.1.2. Критерий Уилкоксона–Манна–Уитни
12.1.3. Критерий Краскала–Уоллиса
12.1.4. Критерий серий Вальда–Вольфовица
2
12.1.5. Критерий χ
12.1.6. Критерий Смирнова
12.2. Доверительные интервалы для параметров распределений
12.2.1. Доверительный интервал для разности средних нормальных
совокупностей (равные дисперсии)
12.2.2. Доверительный интервал для разности средних нормальных
совокупностей (разные дисперсии)
12.2.3. Доверительный интервал для отношения дисперсий
нормальных совокупностей
12.2.4. Доверительный интервал для разности двух биномиальных
вероятностей
12.3. Проверка гипотез о параметрах распределений
12.3.1. Проверка гипотез о математических ожиданиях
нормальных распределений
12.3.2. Проверка гипотез о дисперсиях нормальных распределений
12.3.3. Непараметрический критерий Ансари–Бредли проверки
гипотезы о равенстве дисперсий
12.3.4. Проверка гипотез о равенстве биномиальных вероятностей
349
349
350
355
357
359
360
362
364
364
365
366
367
368
368
374
378
380
ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ
381
Глава 13. Корреляционный анализ
382
13.1. Критерии независимости
13.1.1. Критерий независимости на основе преобразования Фишера
13.1.2. Критерий независимости для двумерных нормальных
совокупностей
13.1.3. Критерий независимости на основе рангового коэффициента
корреляции Спирмена
13.1.4. Критерий независимости на основе рангового коэффициента
корреляции Кендалла
13.1.5. Критерий независимости для многомерных выборок
13.1.6. Критерий независимости на основе таблиц сопряженности
13.2. Оценивание коэффициента корреляции
13.2.1. Доверительные интервалы для коэффициента корреляции
13.2.2. Доверительные интервалы для коэффициента корреляции
нормальной совокупности
13.3. Критерии проверки гипотез о значениях коэффициента
корреляции
13.3.1. Критерий проверки значения коэффициента корреляции
13
Содержание
382
383
384
385
386
389
390
393
393
394
396
396
13.3.2. Критерий проверки равенства двух коэффициентов
корреляции
13.3.3. Критерий проверки равенства нескольких коэффициентов
корреляции
Глава 14. Сравнение зависимых выборок
397
399
400
14.1. Доверительные интервалы для разности математических
ожиданий нормальных совокупностей
14.1.1. Доверительный интервал для разности математических
ожиданий
14.1.2. Доверительный интервал для математических ожиданий
нескольких совокупностей
14.2. Критерии проверки гипотез о равенстве математических ожиданий
14.2.1. Парный критерий Стьюдента
14.2.2. Непараметрический критерий знаков
14.2.3. Непараметрический критерий Уилкоксона
14.3. Дисперсионный анализ для зависимых выборок
14.3.1. Двухфакторный дисперсионный анализ
14.3.2. Двухфакторный дисперсионный анализ Фридмана
14.3.3. Критерий множественных сравнений Шеффе для зависимых
выборок
Глава 15. Регрессионный анализ
400
400
401
403
404
405
407
408
409
411
415
417
15.1. Построение функции регрессии
15.2. Адекватность уравнения регрессии
15.3. Доверительные интервалы и проверка гипотез для коэффициентов
функции регрессии
15.4. Доверительный интервал для значения прогноза
418
420
422
423
Литература
427
Предметный указатель
429
Содержание
14
Предисловие
Ñ
åãîäíÿ â ðàçëè÷íûõ ñôåðàõ îáùåñòâåííîé æèçíè ê ñòàòèñòè÷åñêèì ìåòîäàì
ïðîÿâëÿåòñÿ ïîâûøåííûé èíòåðåñ êàê ê îäíîìó èç âàæíåéøèõ àíàëèòè÷åñêèõ èíñòðóìåíòîâ äëÿ ïîääåðæêè ïðîöåññîâ ïðèíÿòèÿ ðåøåíèé. Ñòàòèñòèêîé
ïîëüçóþòñÿ âñå: îò áèçíåñìåíîâ, ñòðåìÿùèõñÿ îïòèìèçèðîâàòü ïðèáûëü îò èíâåñòèöèé, äî ïîëèòèêîâ, æåëàþùèõ ïðåäñêàçàòü èñõîä âûáîðîâ, èëè ñîöèîëîãîâ,
îöåíèâàþùèõ äîâåðèå èçáèðàòåëåé ê ýòèì ïîëèòèêàì, íå ãîâîðÿ óæå î òðàäèöèîííûõ îáëàñòÿõ ïðèìåíåíèÿ ìàòåìàòè÷åñêîé ñòàòèñòèêè — íàóêå, òåõíèêå, ýêîíîìèêå. Î÷åâèäíî, ÷òî, êàê ïðàâèëî, ñòàòèñòè÷åñêèìè ìåòîäàìè â ñâîåé äåÿòåëüíîñòè ïîëüçóþòñÿ íå ïðîôåññèîíàëû-ñòàòèñòèêè (ãäå íàáðàòü ñòîëüêî
ïðîôåññèîíàëîâ!), à “îáû÷íûå” ïðîôåññèîíàëû â ñâîåé îáëàñòè, êîòîðûå, âîçìîæíî, êîãäà-òî “ïðîõîäèëè” â ñâîèõ óíèâåðñèòåòàõ êóðñ ìàòåìàòè÷åñêîé ñòàòèñòèêè, íî “ýòî áûëî òàê äàâíî, ÷òî ñòàëî íåïðàâäîé”.
Ìîé äîñòàòî÷íî áîëüøîé îïûò ïðèìåíåíèÿ ñòàòèñòè÷åñêèõ ìåòîäîâ â ñîâìåñòíîé ðàáîòå ñ áèîëîãàìè, ìåäèêàìè è â ïîñëåäíèå ãîäû ñ ýêîíîìèñòàìè ïîêàçûâàåò, ÷òî ðàñïðîñòðàíåííîå ìíåíèå î ñòàòèñòèêå êàê îá îäíîé èç ðàçíîâèäíîñòåé ëæè èäåò îò íåïðàâîìåðíîãî ïðèìåíåíèÿ òåõ èëè èíûõ ñòàòèñòè÷åñêèõ
ìåòîäîâ â êîíêðåòíûõ ñèòóàöèÿõ. Äàæå îáùåóïîòðåáèòåëüíûé è “áåçîïàñíûé”
êðèòåðèé Ñòüþäåíòà, ïðèìåíåííûé áåçäóìíî, íàïðèìåð, ê âûáîðêàì èç äèñêðåòíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, ìîæåò â íåêîòîðûõ ñëó÷àÿõ ïîêàçàòü óäèâèòåëüíûå ðåçóëüòàòû. Ñ äðóãîé ñòîðîíû, ïî÷òè âî âñåé ëèòåðàòóðå ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå, âêëþ÷àÿ ïðàêòè÷åñêèå ðóêîâîäñòâà, ìàòåðèàë èçëàãàåòñÿ
òàêèì îáðàçîì, ÷òî ñíà÷àëà èäåò “òåîðèÿ”, íàïðèìåð îñíîâû ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, à çàòåì â êà÷åñòâå èëëþñòðàöèè ê “òåîðèè” ïðåäëàãàåòñÿ
íåñêîëüêî ïðàêòè÷åñêèõ ìåòîäîâ.  òàêîì ñëó÷àå ïðàêòèêó âåñüìà ñëîæíî âûáðàòü íåîáõîäèìûå ìåòîäû ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà, ñðàâíèòü ýòè
ìåòîäû è òåì áîëåå îáîñíîâàòü èõ ïðèìåíåíèå. (Ðåäêèì èñêëþ÷åíèåì â îáùåì
ðÿäó òàêîé ñòàòèñòè÷åñêîé ëèòåðàòóðû ÿâëÿåòñÿ êíèãà Äæ. Ïîëëàðäà Ñïðàâî÷íèê ïî âû÷èñëèòåëüíûì ìåòîäàì ñòàòèñòèêè, â êîòîðîé ïðåäñòàâëåíû ïðàêòè÷åñêèå ìåòîäû ñòàòèñòèêè è îïèñàíèå îáëàñòè ïðèìåíèìîñòè êàæäîãî èç íèõ.)
Ýòà êíèãà çàäóìûâàëàñü è íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî èñïîëüçóþòñÿ íà ïðàêòèêå è ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà
ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Òàêèì îáðàçîì, îòäåëüíî îïèñàíû ìåòîäû äëÿ àíàëèçà îäíîìåðíûõ
âûáîðîê, îòäåëüíî — äëÿ çàâèñèìûõ íàáëþäåíèé è ò.ä. Ìåòîäû ïðåäñòàâëåíû
â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî
ïðîñòî ðåàëèçîâàòü ïðàêòèêè (íåîáÿçàòåëüíî ïðîôåññèîíàëû-ñòàòèñòèêè), êîòîðûì
íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ.
 ýòîé ñâÿçè íåîáõîäèìî îòìåòèòü âûáîð ýëåêòðîííîé òàáëèöû Excel êàê ñðåäñòâà ðåàëèçàöèè ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà. Ñóùåñòâóåò ìíîæåñòâî ñïåöèàëèçèðîâàííûõ ïðîãðàììíûõ ñðåäñòâ äëÿ ñòàòèñòè÷åñêèõ ðàñ÷åòîâ: îòå÷åñòâåííûå
STADIA, ÑÈÃÀÌÄ, ÎËÈÌÏ:ÑòàòÝêñïåðò èëè çàðóáåæíûå STATGRAPHICS,
STATISTICA, SPSS è îáùåìàòåìàòè÷åñêèå ïàêåòû (íàïðèìåð, Mathcad, Mathlab,
Maple), êîòîðûå òàêæå èìåþò âñòðîåííûå ñòàòèñòè÷åñêèå ñðåäñòâà. Íî íàèáîëüøåå ðàñïðîñòðàíåíèå êàê ñðåäñòâî ïðîâåäåíèÿ ðàçëè÷íûõ ðàñ÷åòîâ, â òîì ÷èñëå
è ñòàòèñòè÷åñêèõ, â íàñòîÿùåå âðåìÿ ïîëó÷èëè ýëåêòðîííûå òàáëèöû, ñðåäè êîòîðûõ áåçóñëîâíûì ëèäåðîì ÿâëÿåòñÿ Microsoft Excel. Ýòà ýëåêòðîííàÿ òàáëèöà
âõîäèò â ïàêåò Microsoft Office, êîòîðûé óñòàíîâëåí ïðàêòè÷åñêè íà êàæäîì
êîìïüþòåðå. Microsoft Excel èìååò äîñòàòî÷íîå êîëè÷åñòâî âñòðîåííûõ ñòàòèñòè÷åñêèõ ñðåäñòâ, âêëþ÷àÿ íàäñòðîéêó Пакет анализа è ïîðÿäêà 80 ñòàòèñòè÷åñêèõ
ôóíêöèé. Ýòî îáóñëîâèëî âûáîð Excel â êà÷åñòâå îñíîâíîãî ñðåäñòâà äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Íåñìîòðÿ íà òî ÷òî â êíèãå âñå ïðèìåðû ðåàëèçîâàíû â Excel 2002, îíè áåç ñóùåñòâåííûõ èçìåíåíèé ìîãóò áûòü ïåðåíåñåíû íà
äðóãèå âåðñèè Excel, íà÷èíàÿ ñ Excel 97 è çàêàí÷èâàÿ Excel 2003.
Õîòÿ êíèãà çàäóìûâàëàñü òîëüêî êàê ñáîðíèê ñòàòèñòè÷åñêèõ ìåòîäîâ, îêàçàëîñü íåâîçìîæíûì îáîéòèñü áåç ââîäíîé ÷àñòè, ïîñâÿùåííîé îñíîâàì òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, è ñïåöèàëüíîé ÷àñòè, îïèñûâàþùåé
ñòàòèñòè÷åñêèå âîçìîæíîñòè Excel. Ïîýòîìó êíèãà ñîñòîèò èç ÷åòûðåõ ÷àñòåé.
 ÷àñòè I, Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Âåñü ìàòåðèàë ýòîé ÷àñòè ïðåäñòàâëåí êîíñïåêòèâíî;
çäåñü ïðèâåäåíû âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå ïîçâîëÿò ÷èòàòåëþ âïîëíå îñîçíàííî è ïðîäóêòèâíî ïðèìåíÿòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ ÷àñòÿõ êíèãè.
Êîíå÷íî, ýòà ÷àñòü ñîâñåì íå ïðåäíàçíà÷åíà äëÿ òîãî, ÷òîáû ïî íåé èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî), êàê òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. Åå ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íîå ïîñîáèå, ê êîòîðîìó ðàíî èëè
ïîçäíî áóäåò âûíóæäåí îáðàòèòüñÿ êàê ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, òàê è ñïåöèàëèñò-ñòàòèñòèê (ó ëþáîãî
ñïåöèàëèñòà ðàíî èëè ïîçäíî âîçíèêàåò íåîáõîäèìîñòü âåðíóòüñÿ ê “èñòîêàì” —
áàçîâûì ïîíÿòèÿì). Êðîìå òîãî, ìàòåðèàë ýòîé ÷àñòè èñïîëüçóåòñÿ â ÷àñòè II
äëÿ ññûëîê ïðè îïèñàíèè ñòàòèñòè÷åñêèõ ñðåäñòâ Excel.
 ÷àñòè II, Ñðåäñòâà Excel äëÿ ñòàòèñòè÷åñêîãî àíàëèçà, îïèñàíû âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ïðåäïîëàãàåòñÿ, ÷òî ÷èòàòåëü
çíàêîì ñ îñíîâàìè ðàáîòû â ýòîé ýëåêòðîííîé òàáëèöå õîòÿ áû â ñëåäóþùåì îáúåìå: îí ìîæåò ââîäèòü è ðåäàêòèðîâàòü äàííûå, ñîçäàâàòü ôîðìóëû, èñïîëüçîâàòü
ôóíêöèè, ñòðîèòü äèàãðàììû è ãðàôèêè, ôîðìàòèðîâàòü ðàáî÷èé ëèñò è ò.ï. Ýòî
áàçîâûå íàâûêè ðàáîòû ñ Excel, êîòîðûå èçâåñòíû êàæäîìó, êòî ïðîñëóøàë êóðñ
èíôîðìàòèêè è âû÷èñëèòåëüíîé òåõíèêè (è ïðè ýòîì, êîíå÷íî, óñâîèë íåîáõîäèìûå çíàíèÿ) â ëþáîì âóçå ëþáîãî ïðîôèëÿ.  ýòîé ÷àñòè äîñòàòî÷íî ïîëíî îïèñàíû ñòàòèñòè÷åñêèå ôóíêöèè è ñðåäñòâà, ïðåäîñòàâëÿåìûå íàäñòðîéêîé Пакет
анализа. Ê ñîæàëåíèþ, ñïðàâî÷íàÿ ñèñòåìà Excel íàñòîëüêî íåïîëíî è íåâíÿòíî
(è äàæå ñ îøèáêàìè!) ïðåäñòàâëÿåò ýòè ôóíêöèè è ñðåäñòâà, ÷òî íåîáõîäèìîñòü èõ
ïîëíîãî îïèñàíèÿ î÷åâèäíà. (Ñëåäóåò îòìåòèòü, ÷òî â Excel 2003 ñïðàâî÷íàÿ ñèñòåìà íàïèñàíà áîëåå ïðîôåññèîíàëüíî, ïðè ýòîì èñïðàâëåíû íåêîòîðûå îøèáêè.)
Êðîìå ñòàòèñòè÷åñêèõ ôóíêöèé è ñðåäñòâ ïàêåòà àíàëèçà, â äàííîé ÷àñòè ðàññìîòðåíû îáùèå ñðåäñòâà è íàäñòðîéêè Excel, êîòîðûå “íå çàÿâëåíû” êàê èìåþùèå
íåïîñðåäñòâåííîå îòíîøåíèå ê ñòàòèñòè÷åñêèì ìåòîäàì, íî êîòîðûå òàêæå ìîæíî
èñïîëüçîâàòü â ñòàòèñòè÷åñêîì àíàëèçå. Ýòî ôîðìóëû ìàññèâîâ, ñïåöèàëüíîãî âèäà
16
Предисловие
äèàãðàììû è ãðàôèêè, à òàêæå íàäñòðîéêà Поиск решения.  êîíöå ÷àñòè îïèñàíû
ñïîñîáû ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí â Excel.
 ÷àñòè III, Àíàëèç îäíîìåðíûõ âûáîðîê, ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê, ðàññìîòðåíû âîïðîñû ïðåäâàðèòåëüíîé îáðàáîòêè äàííûõ è ïîäáîðà ðàñïðåäåëåíèé ïî
èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì, à òàêæå ïðèâåäåíû ìåòîäû èíòåðâàëüíîãî
îöåíèâàíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ
ýòèõ ïàðàìåòðîâ. Ïîñëåäíÿÿ ãëàâà ÷àñòè ïîñâÿùåíà ñðàâíåíèþ ðàñïðåäåëåíèé
íåñêîëüêèõ îäíîìåðíûõ âûáîðîê.
 ÷àñòè IV, Ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé, îïèñàíû ìåòîäû àíàëèçà
ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, êîòîðûå âêëþ÷àþò â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ. Çäåñü ðàññìîòðåíû ìåòîäû êîððåëÿöèîííîãî àíàëèçà, ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè, à òàêæå ïîêàçàíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ
ðàñïðåäåëåíèé çàâèñèìûõ êîìïîíåíòîâ ìíîãîìåðíûõ âûáîðîê. Â ïîñëåäíåé ãëàâå
îïèñàí ðÿä çàäà÷, ñâÿçàííûõ ñ ïîñòðîåíèåì ðåãðåññèé, íà÷èíàÿ ñ îáùåé âû÷èñëèòåëüíîé ñõåìû îïðåäåëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè è çàêàí÷èâàÿ
êðèòåðèÿìè ïðîâåðêè àäåêâàòíîñòè ïîñòðîåííîãî óðàâíåíèÿ ðåãðåññèè. Õîòÿ ÷èñëî
ðàññìîòðåííûõ â ýòîé ÷àñòè ìåòîäîâ äîñòàòî÷íî âåëèêî è ñàìè ìåòîäû âåñüìà ãðîìîçäêè, ÷àñòü ïîëó÷èëàñü íà óäèâëåíèå íåáîëüøîé. “Âèíîé” ýòîìó Excel, â êîòîðîé åñòü ïðàêòè÷åñêè âñå ñðåäñòâà, íåîáõîäèìûå äëÿ ðåàëèçàöèè äàííûõ ìåòîäîâ.
 êîíöå êíèãè ïðèâåäåí íåáîëüøîé ñïèñîê ëèòåðàòóðû, íà êîòîðóþ åñòü
ññûëêè â òåêñòå èëè êîòîðàÿ ìîæåò äîïîëíèòü îïðåäåëåííûå òåìû, îñâåùåííûå
íåäîñòàòî÷íî ïîëíî.
ß áóäó ïðèçíàòåëåí âñåì, êòî ïîäåëèòñÿ ñâîèìè ñîîáðàæåíèÿìè ïî óëó÷øåíèþ ñîäåðæàíèÿ êíèãè è ñòèëÿ èçëîæåíèÿ ìàòåðèàëà, à òàêæå óêàæåò íà âîçìîæíûå îøèáêè (ê ñîæàëåíèþ, â êíèãàõ, ñîäåðæàùèõ áîëåå ñòà ôîðìóë, âåðîÿòíîñòü îøèáîê âñåãäà îòëè÷íà îò íóëÿ). Ìîé àäðåñ ýëåêòðîííîé ïî÷òû —
aminko@dialektika.com.
À.À. Ìèíüêî
Предисловие
17
От издательства “Диалектика”
Âû, ÷èòàòåëü ýòîé êíèãè, è åñòü ãëàâíûé åå êðèòèê. Ìû öåíèì âàøå ìíåíèå
è õîòèì çíàòü, ÷òî áûëî ñäåëàíî íàìè ïðàâèëüíî, ÷òî ìîæíî áûëî ñäåëàòü ëó÷øå è ÷òî åùå âû õîòåëè áû óâèäåòü èçäàííûì íàìè. Íàì èíòåðåñíî óñëûøàòü
è ëþáûå äðóãèå çàìå÷àíèÿ, êîòîðûå âàì õîòåëîñü áû âûñêàçàòü â íàø àäðåñ.
Ìû æäåì âàøèõ êîììåíòàðèåâ è íàäååìñÿ íà íèõ. Âû ìîæåòå ïðèñëàòü íàì
áóìàæíîå èëè ýëåêòðîííîå ïèñüìî ëèáî ïðîñòî ïîñåòèòü íàø Web-ñåðâåð è îñòàâèòü ñâîè çàìå÷àíèÿ òàì. Îäíèì ñëîâîì, ëþáûì óäîáíûì äëÿ âàñ ñïîñîáîì äàéòå íàì çíàòü, íðàâèòñÿ ëè âàì ýòà êíèãà, à òàêæå âûñêàæèòå ñâîå ìíåíèå î òîì,
êàê ñäåëàòü íàøè êíèãè áîëåå èíòåðåñíûìè äëÿ âàñ.
Ïîñûëàÿ ïèñüìî èëè ñîîáùåíèå, íå çàáóäüòå óêàçàòü íàçâàíèå êíèãè è åå àâòîðîâ, à òàêæå âàø îáðàòíûé àäðåñ. Ìû âíèìàòåëüíî îçíàêîìèìñÿ ñ âàøèì
ìíåíèåì è îáÿçàòåëüíî ó÷òåì åãî ïðè îòáîðå è ïîäãîòîâêå ê èçäàíèþ ïîñëåäóþùèõ êíèã. Íàøè êîîðäèíàòû:
E-mail:
info@dialektika.com
WWW:
http://www.dialektika.com
Èíôîðìàöèÿ äëÿ ïèñåì èç:
18
Ðîññèè:
115419, Ìîñêâà, à/ÿ 783
Óêðàèíû:
03150, Êèåâ, à/ÿ 152
Предисловие
Часть I
Основные понятия
теории вероятностей
и математической
статистики
В этой части...
Ãëàâà 1. Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé
Ãëàâà 2. Îñíîâíûå ñòàòèñòè÷åñêèå ìåòîäû
Ãëàâà 3. Àíàëèç ñòàòèñòè÷åñêèõ çàâèñèìîñòåé
Â
ãëàâå 1 ýòîé ÷àñòè ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé. Ìàòåðèàë ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðåäñòàâëåí â äâóõ
ãëàâàõ: â ãëàâå 2 ïðèâîäÿòñÿ îáùèå ñâåäåíèÿ ïî ñòàòèñòèêå (áîëüøàÿ ÷àñòü ýòîé
ãëàâû ïîñâÿùåíà èíòåðâàëüíîìó îöåíèâàíèþ è ïðîâåðêå ãèïîòåç), â ãëàâå 3 îïèñûâàåòñÿ ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé. Âåñü ìàòåðèàë ïðåäñòàâëåí êîíñïåêòèâíî è ïðåäíàçíà÷åí ñêîðåå äëÿ òîãî, ÷òîáû “îñâåæèòü” â ïàìÿòè ÷èòàòåëÿ
òåîðèþ âåðîÿòíîñòåé è ìàòåìàòè÷åñêóþ ñòàòèñòèêó, íî, êîíå÷íî, ñîâñåì íå äëÿ
òîãî, ÷òîáû ïî ýòèì ãëàâàì èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî). Âìåñòå ñ òåì
ëþáîé ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, íàéäåò çäåñü âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû
è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå äàäóò åìó âîçìîæíîñòü âïîëíå îñîçíàííî
è ïðîäóêòèâíî ïðèìåíèòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ
÷àñòÿõ êíèãè. Ñïåöèàëèñò-ñòàòèñòèê ìîæåò èñïîëüçîâàòü ìàòåðèàë ýòîé ÷àñòè
â êà÷åñòâå ñïðàâî÷íîãî ïîñîáèÿ.
Глава
1
Основные понятия теории
вероятностей
Â
äàííîé ãëàâå ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé, íåîáõîäèìûå äëÿ èçëîæåíèÿ îñíîâ ìàòåìàòè÷åñêîé ñòàòèñòèêè â ïîñëåäóþùèõ ãëàâàõ. Çíà÷èòåëüíàÿ ÷àñòü ãëàâû ïîñâÿùåíà ïðèìåðàì âåðîÿòíîñòíûõ ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî
àíàëèçà, â òîì ÷èñëå ïðèâåäåíî ïîëíîå îïèñàíèå ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ýòó ÷àñòü ãëàâû ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íûé ìàòåðèàë ïî âåðîÿòíîñòíûì ðàñïðåäåëåíèÿì.
1.1. Понятия случайного события и случайной
величины
Ñðåäè îñíîâíûõ ïîíÿòèé òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè
ïîíÿòèÿ îïûò (ýêñïåðèìåíò) è ñîáûòèå ÿâëÿþòñÿ ôóíäàìåíòàëüíûìè. Áóäåì
íàçûâàòü îïûòîì íàáëþäåíèå êàêîãî-ëèáî ÿâëåíèÿ ïðè âûïîëíåíèè íåêîòîðîãî
êîìïëåêñà óñëîâèé, êîòîðûé äîëæåí êàæäûé ðàç ñòðîãî âûïîëíÿòüñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Íàáëþäåíèå òîãî æå ÿâëåíèÿ ïðè äðóãîì êîìïëåêñå
óñëîâèé áóäåò óæå äðóãèì îïûòîì. Ðåçóëüòàò ñëó÷àéíîãî îïûòà íå èçâåñòåí äî
åãî îêîí÷àíèÿ. Äàëåå áóäåì èìåòü äåëî òîëüêî ñî ñëó÷àéíûì îïûòîì.
Ðåçóëüòàòû ñëó÷àéíîãî îïûòà ìîæíî îõàðàêòåðèçîâàòü êà÷åñòâåííî è êîëè÷åñòâåííî. Êà÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â ðåãèñòðàöèè êàêîãî-ëèáî
ôàêòà. Ëþáîé òàêîé ôàêò íàçûâàåòñÿ ñëó÷àéíûì ñîáûòèåì. Ïðè ýòîì ãîâîðÿò,
÷òî “ñîáûòèå ïðîèçîøëî (ïîÿâèëîñü)” èëè “ñîáûòèå íå ïðîèçîøëî (íå ïîÿâèëîñü)” â ðåçóëüòàòå ñëó÷àéíîãî îïûòà.
Ïðèìåðàìè ñîáûòèé ìîãóò ñëóæèòü âûïàäåíèå ðåøêè ïðè áðîñàíèè ìîíåòû
èëè öèôðû “3” ïðè áðîñàíèè èãðàëüíîé êîñòè, îòêàç ïðèáîðà â çàäàííîì èíòåðâàëå âðåìåíè, ïîïàäàíèå èëè ïðîìàõ ïðè âûñòðåëå, ïîëó÷åíèå m ïîïàäàíèé ïðè
n âûñòðåëàõ è ò.ä. Èòàê, ñëó÷àéíûì ñîáûòèåì (èëè ïðîñòî “ñîáûòèåì”) íàçûâàåòñÿ
âñÿêèé ôàêò, êîòîðûé â ðåçóëüòàòå îïûòà ìîæåò ïðîèçîéòè èëè íå ïðîèçîéòè.
Êîëè÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â îïðåäåëåíèè çíà÷åíèé íåêîòîðûõ âåëè÷èí, ïîëó÷åííûõ â ðåçóëüòàòå îïûòà. Âåëè÷èíû, êîòîðûå ìîãóò ïðèíèìàòü â ðåçóëüòàòå îïûòà ðàçëè÷íûå çíà÷åíèÿ, ïðè÷åì äî îïûòà íåâîçìîæíî
ïðåäâèäåòü, êàêèìè èìåííî îíè áóäóò, íàçûâàþòñÿ ñëó÷àéíûìè âåëè÷èíàìè.
Ïðèìåðàìè ñëó÷àéíûõ âåëè÷èí ìîãóò ñëóæèòü êàê ðåçóëüòàòû, òàê è îøèáêè
èçìåðåíèé, âðåìÿ áåçîòêàçíîé ðàáîòû ïðèáîðà èëè ñèñòåìû, ðîñò è âåñ íàóãàä
âûáðàííîãî ÷åëîâåêà, ÷èñëî ïîïàäàíèé ïðè n âûñòðåëàõ è ò.ä.
20
Часть I. Основные понятия теории вероятностей и математической статистики
Ñ êàæäîé ñëó÷àéíîé âåëè÷èíîé ìîæíî ñâÿçàòü ðàçëè÷íûå ñëó÷àéíûå ñîáûòèÿ.
Òèïè÷íûì ñîáûòèåì, ñâÿçàííûì ñî ñëó÷àéíîé âåëè÷èíîé, ÿâëÿåòñÿ ñîáûòèå, ñîñòîÿùåå â òîì, ÷òî ýòà ñëó÷àéíàÿ âåëè÷èíà ïðèìåò â ðåçóëüòàòå îïûòà êàêîå-ëèáî
çíà÷åíèå, ïðèíàäëåæàùåå çàäàííîìó ÷èñëîâîìó ìíîæåñòâó. Êðàòêî òàêîå ñîáûòèå
íàçûâàåòñÿ ïîïàäàíèåì ñëó÷àéíîé âåëè÷èíû â äàííîå ìíîæåñòâî çíà÷åíèé.
1.1.1. Вероятности
Åñòåñòâåííî ñðàâíèâàòü ñîáûòèÿ ïî òîìó, êàê ÷àñòî êàæäîå èç íèõ ïîÿâëÿåòñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Åñëè ïðè ïîâòîðåíèè îïûòà îäíî ñîáûòèå ïîÿâëÿåòñÿ ÷àùå, ÷åì äðóãîå, òî ãîâîðÿò, ÷òî ïåðâîå ñîáûòèå âåðîÿòíåå âòîðîãî.
Ïðè ýòîì ÿñíî, ÷òî äëÿ ñðàâíåíèÿ ñîáûòèé íåîáõîäèìî ïðåäïîëîæèòü, ÷òî äàííûé îïûò ìîæíî ïðîâîäèòü ñêîëüêî óãîäíî ðàç ïðè ñîáëþäåíèè îäíîãî è òîãî
æå êîìïëåêñà óñëîâèé.
×àñòîòîé ïîÿâëåíèÿ ñîáûòèÿ À íàçûâàåòñÿ îòíîøåíèå ÷èñëà åãî ïîÿâëåíèé
ê ÷èñëó âñåõ ïðîâåäåííûõ îïûòîâ. Òàêèì îáðàçîì, åñëè â n îïûòàõ ñîáûòèå À
ïîÿâèëîñü m ðàç, òî ÷àñòîòà åãî ïîÿâëåíèÿ â äàííîé ñåðèè îïûòîâ ðàâíà m/n.
Âàæíûì ýêñïåðèìåíòàëüíî óñòàíîâëåííûì ôàêòîì ÿâëÿåòñÿ ñâîéñòâî óñòîé÷èâîñòè ÷àñòîò. Ïðè óâåëè÷åíèè ÷èñëà îïûòîâ ÷àñòîòû ñîáûòèé êîëåáëþòñÿ îêîëî
íåêîòîðûõ ÷èñåë, íå çàâèñÿùèõ íè îò êîëè÷åñòâà, íè îò ñåðèè îïûòîâ, ïðè÷åì
÷àñòîòû íåîãðàíè÷åííî ïðèáëèæàþòñÿ ê ýòèì ÷èñëàì, êîãäà ÷èñëî îïûòîâ ñòðåìèòñÿ ê áåñêîíå÷íîñòè. ( òåîðèè âåðîÿòíîñòåé ýòîò ôàêò íàçûâàåòñÿ çàêîíîì
áîëüøèõ ÷èñåë.  êà÷åñòâå èëëþñòðàöèè íà ðèñ. 1.1 ïîêàçàíà ðàáî÷àÿ êíèãà Excel,
ãäå ñìîäåëèðîâàíî 1 000 ïîäáðàñûâàíèé ìîíåòû è ïîñòðîåí ãðàôèê ÷àñòîò âûïàäåíèÿ ãåðáà.) Ýòè ÷èñëà åñòåñòâåííî ñâÿçàòü ñ êàæäûì ñîáûòèåì, ïðîèñõîäÿùèì
â ñëó÷àéíîì îïûòå. Îíè íàçûâàþòñÿ âåðîÿòíîñòÿìè è â òåîðèè âåðîÿòíîñòåé
îïðåäåëÿþòñÿ ÷èñòî àêñèîìàòè÷åñêè. Âåðîÿòíîñòü ñîáûòèÿ À îáîçíà÷àåòñÿ êàê
Ð(À) è ìîæåò ïðèíèìàòü ëþáûå çíà÷åíèÿ îò íóëÿ äî åäèíèöû: 0 ≤ Ð(À) ≤ 1.
Ðèñ. 1.1. Ìîäåëü ïîäáðàñûâàíèÿ ìîíåòû è ãðàôèê ÷àñòîòû âûïàäåíèÿ ãåðáà
Глава 1. Основные понятия теории вероятностей
21
1.1.2. Алгебра случайных событий
Ïðèâåäåì íåêîòîðûå âàæíûå îïðåäåëåíèÿ è òåîðåìû àëãåáðû ñëó÷àéíûõ
ñîáûòèé.
Ðàçëè÷àþò ñëåäóþùèå âèäû ñëó÷àéíûõ ñîáûòèé. Äîñòîâåðíûì íàçûâàåòñÿ
ñîáûòèå U, êîòîðîå â ðåçóëüòàòå îïûòà íåïðåìåííî äîëæíî ïðîèçîéòè, â ýòîì
ñëó÷àå Ð(U) = 1. Íåâîçìîæíûì íàçûâàåòñÿ ñîáûòèå V, êîòîðîå â ðåçóëüòàòå
îïûòà íå ìîæåò ïðîèçîéòè íèêîãäà; òîãäà Ð(V) = 0. Ñîáûòèå } íàçûâàåòñÿ ïðîòèâîïîëîæíûì ñîáûòèþ À, åñëè îíî ñîñòîèò â íåïîÿâëåíèè ñîáûòèÿ À. Ñóììà
âåðîÿòíîñòåé ïðîòèâîïîëîæíûõ ñîáûòèé âñåãäà ðàâíà åäèíèöå: Ð(}) + Ð(À) = 1.
Íàïðèìåð, ïðè ïîäáðàñûâàíèè ìîíåòû ìîæåò ïðîèçîéòè òîëüêî îäíî èç äâóõ ñîáûòèé (âûïàäåíèå îðëà èëè âûïàäåíèå ðåøêè), êîòîðûå íå ìîãóò ïðîèçîéòè îäíîâðåìåííî. Ïîýòîìó äàííûå ñîáûòèÿ ïðîòèâîïîëîæíû.
Íåñêîëüêî ñîáûòèé â äàííîì îïûòå íàçûâàþòñÿ íåñîâìåñòíûìè èëè âçàèìîèñêëþ÷àþùèìè, åñëè íèêàêèå äâà èç íèõ íå ìîãóò ïîÿâèòüñÿ âìåñòå. Êëàññè÷åñêèé ïðèìåð íåñîâìåñòíûõ ñîáûòèé: 6 ñîáûòèé, ñîñòîÿùèõ â òîì, ÷òî ïðè áðîñàíèè èãðàëüíîãî êóáèêà ïîÿâÿòñÿ öèôðû 1, 2, 3, 4, 5 èëè 6 ñîîòâåòñòâåííî.
Ñóììà âåðîÿòíîñòåé âñåõ íåñîâìåñòíûõ ñîáûòèé, ñâÿçàííûõ ñ òåì èëè èíûì
îïûòîì, ðàâíà åäèíèöå (â òàêîì ñëó÷àå ãîâîðÿò, ÷òî ýòè ñîáûòèÿ ñîñòàâëÿþò
ïîëíóþ ãðóïïó ñîáûòèé). Åñëè À1, À2, ..., Àn — íåñîâìåñòíûå ñîáûòèÿ, òî
Ð(À1 èëè À2 èëè ... èëè Àn) = Ð(À1) + Ð(À2) + ... + Ð(Àn).
Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé ñëîæåíèÿ âåðîÿòíîñòåé.
 ëåâîé ÷àñòè ïîñëåäíåãî ðàâåíñòâà çàïèñàíà âåðîÿòíîñòü ñóììû ñîáûòèé:
ñóììîé (îáúåäèíåíèåì) äâóõ ñîáûòèé À è  íàçûâàåòñÿ ñîáûòèå “À èëè ”
(òàêæå îáîçíà÷àåòñÿ êàê À +  èëè À J Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà,
êîãäà ïðîèñõîäèò èëè ñîáûòèå À, èëè ñîáûòèå Â. Àíàëîãè÷íî îïðåäåëÿåòñÿ ñóììà ëþáîãî ÷èñëà ñîáûòèé.  àëãåáðå ñëó÷àéíûõ ñîáûòèé ââîäèòñÿ åùå îäíà îïåðàöèÿ íàä ñîáûòèÿìè. Ïðîèçâåäåíèåì (ïåðåñå÷åíèåì) ñîáûòèé À è  íàçûâàåòñÿ
ñîáûòèå “À è ” (òàêæå îáîçíà÷àåòñÿ êàê À #  èëè À Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà, êîãäà ïðîèñõîäèò è ñîáûòèå À, è ñîáûòèå Â. Ïîäîáíûì îáðàçîì îïðåäåëÿåòñÿ ïðîèçâåäåíèå ëþáîãî ÷èñëà ñîáûòèé.
Ñîáûòèÿ À è Â íàçûâàþòñÿ íåçàâèñèìûìè, åñëè ïîÿâëåíèå îäíîãî èç íèõ íå
ìåíÿåò âåðîÿòíîñòè ïîÿâëåíèÿ äðóãîãî. Íàïðèìåð, íåçàâèñèìûìè áóäóò ñîáûòèÿ
“ïðè ïåðâîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 2” è “ïðè âòîðîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 5”. Åñëè À1, À2, ..., Àn — âçàèìíî íåçàâèñèìûå ñëó÷àéíûå ñîáûòèÿ, òî
Ð(À1 è À2 è ... è Àn) = Ð(À1)×Ð(À2)×...×Ð(Àn).
Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé óìíîæåíèÿ âåðîÿòíîñòåé.
1.1.3. Условные вероятности
Óñëîâíóþ âåðîÿòíîñòü ñîáûòèÿ À ïðè óñëîâèè, ÷òî ïðîèçîøëî ñîáûòèå Â,
îáîçíà÷àþò êàê Ð(À|Â). Ïðèâåäåì ôîðìóëó, ñâÿçûâàþùóþ âåðîÿòíîñòü ñîâìåñòíîãî ïîÿâëåíèÿ ñîáûòèé À è  è óñëîâíûå âåðîÿòíîñòè ýòèõ ñîáûòèé:
Ð(À è Â) = Ð(À) Ð(Â|À) = Ð(Â) Ð(À|Â).
Åñëè ñîáûòèÿ À è Â íåçàâèñèìû, òî Ð(À|Â) = Ð(À) è Ð(Â|À) = Ð(Â).
22
Часть I. Основные понятия теории вероятностей и математической статистики
Ïðèìåð 1. Èãðîê áðîñàåò ïÿòü ðàç ñèììåòðè÷íóþ ìîíåòó. Ñ÷èòàÿ, ÷òî ïîäáðàñûâàíèÿ íåçàâèñèìû, êàêîâà âåðîÿòíîñòü ñîáûòèÿ, ÷òî ãåðá âûïàäåò òî÷íî äâà ðàçà?
Ãåðá âûïàäåò òî÷íî äâà ðàçà òîëüêî ïðè ñëåäóþùèõ äåñÿòè âîçìîæíûõ ïîñëåäîâàòåëüíîñòÿõ âûïàäåíèÿ ãåðáà èëè ðåøêè (à — ãåðá, Ð — ðåøêà):
ÃÃÐÐÐ, ÃÐÃÐÐ, ÃÐÐÃÐ, ÃÐÐÐÃ, ÐÃÃÐÐ, ÐÃÐÃÐ, ÐÃÐÐÃ, ÐÐÃÃÐ, ÐÐÃÐÃ, ÐÐÐÃÃ.
Ïðè ëþáîì ïîäáðàñûâàíèè ìîíåòû âåðîÿòíîñòü âûïàäåíèÿ ãåðáà è âåðîÿòíîñòü âûïàäåíèÿ ðåøêè ðàâíû 1/32. Ïÿòü ïîäáðàñûâàíèé ìîíåòû íåçàâèñèìû.
Èç òåîðåìû óìíîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî âåðîÿòíîñòü ïîëó÷åíèÿ ïîñëåäîâàòåëüíîñòè ÃÃÐÐÐ ìîæíî ïîäñ÷èòàòü ñëåäóþùèì îáðàçîì:
Ð(ÃÃÐÐÐ) = Ð(Ã)·Ð(Ã)·Ð(Ð)·Ð(Ð)·Ð(Ð) = (1/2)5 = 1/32.
Äëÿ êàæäîé èç îñòàëüíûõ äåñÿòè ïîñëåäîâàòåëüíîñòåé âåðîÿòíîñòü òàêæå
ðàâíà 1/32. Êàæäàÿ èç ýòèõ äåñÿòè ïîñëåäîâàòåëüíîñòåé ñîäåðæèò ïî äâà âûïàäåíèÿ ãåðáà, è ýòè ïîñëåäîâàòåëüíîñòè ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè. Èç òåîðåìû ñëîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî èñêîìàÿ âåðîÿòíîñòü ïðåäñòàâëÿåò ñîáîé ñóììó ýòèõ äåñÿòè ðàâíûõ ìåæäó ñîáîé âåðîÿòíîñòåé, ò.å. îíà ðàâíà 10/32.
Àíàëîãè÷íî ìîæíî ïîêàçàòü, ÷òî âåðîÿòíîñòü ñîáûòèÿ “ãåðá íå âûïàäåò íè ðàçó” ðàâíà 1/32; âåðîÿòíîñòü òîãî, ÷òî ãåðá âûïàäåò ðîâíî îäèí ðàç, ðàâíà 5/32; âåðîÿòíîñòü âûïàäåíèÿ ãåðáà ðîâíî òðè ðàçà ðàâíà 10/32; âåðîÿòíîñòè òîãî, ÷òî
ãåðá âûïàäåò òî÷íî 4 è 5 ðàç, ðàâíû 5/32 è 1/32 ñîîòâåòñòâåííî. Âñå øåñòü ïåðå÷èñëåííûõ âûøå ñîáûòèé ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè è îáðàçóþò ïîëíóþ
ãðóïïó ñîáûòèé. Êàê íå òðóäíî ïîäñ÷èòàòü, ñóììà èõ âåðîÿòíîñòåé ðàâíà 1.
1.2. Распределения случайных величин
Åñëè ñëó÷àéíîå ñîáûòèå ïîëíîñòüþ õàðàêòåðèçóåòñÿ âåðîÿòíîñòüþ ïîÿâëåíèÿ
ýòîãî ñîáûòèÿ, à ñîâîêóïíîñòü ñëó÷àéíûõ ñîáûòèé ìîæíî îïèñàòü ñ ïîìîùüþ
âåðîÿòíîñòåé ýòèõ ñîáûòèé è òåîðåì àëãåáðû ñëó÷àéíûõ ñîáûòèé, òî îïèñàíèå
âåðîÿòíîñòíûõ ñâîéñòâ ñëó÷àéíûõ âåëè÷èí ÿâëÿåòñÿ áîëåå ñëîæíîé çàäà÷åé. Íàïîìíèì, ÷òî ñëó÷àéíîé íàçûâàåòñÿ âåëè÷èíà, êîòîðàÿ â ðåçóëüòàòå îïûòà ìîæåò
ïðèíèìàòü òî èëè èíîå çíà÷åíèå (çàðàíåå íåèçâåñòíî, êàêîå èìåííî).
Âåðîÿòíîñòíûå ñâîéñòâà ñëó÷àéíûõ âåëè÷èí îïèñûâàþòñÿ çàêîíîì ðàñïðåäåëåíèÿ, ò.å. ñîîòíîøåíèåì, óñòàíàâëèâàþùèì ñâÿçü ìåæäó âîçìîæíûìè çíà÷åíèÿìè ñëó÷àéíîé âåëè÷èíû è ñîîòâåòñòâóþùèìè èì âåðîÿòíîñòÿìè. Çàêîí ðàñïðåäåëåíèÿ ìîæåò èìåòü ðàçëè÷íûå ôîðìû.
Ðàçëè÷àþò äèñêðåòíûå è íåïðåðûâíûå ñëó÷àéíûå âåëè÷èíû.
1.2.1. Дискретные случайные величины
Äèñêðåòíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàþò âåëè÷èíó, ïðèíèìàþùóþ òîëüêî
êîíå÷íîå èëè ñ÷åòíîå ìíîæåñòâî çíà÷åíèé.
Äëÿ îïèñàíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Õ, ïðèíèìàþùåé êîíå÷íîå
ìíîæåñòâî çíà÷åíèé, ÷àñòî ïðèìåíÿåòñÿ òàáëèöà âèäà
õi
Ð(Õ = õi)
õ1
p1
õ2
p2
...
...
õn–1
pn–1
xn
pn
Çäåñü õi — âîçìîæíûå çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ, ði = Ð(Õ = õi) — âåðîÿòíîñòü ñîáûòèÿ, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå õi (1 ≤ i ≤ n).
Îòìåòèì, ÷òî
Глава 1. Основные понятия теории вероятностей
23
n
∑p
i
= 1, P(X < u ) =
i =1
∑
pi .
i : xi < u
 ïîñëåäíåì âûðàæåíèè ñóììèðîâàíèå âåäåòñÿ ïî âñåì òàêèì íîìåðàì i, ÷òî
õi < u. Ñîâîêóïíîñòü âåðîÿòíîñòåé ði = Ð(Õ = õi) ÷àñòî íàçûâàþò ôóíêöèåé âåðîÿòíîñòåé, à âåðîÿòíîñòü Ð(Õ < u) îáîçíà÷àþò êàê F(u) è íàçûâàþò ôóíêöèåé
ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ. Îíà ÿâëÿåòñÿ íåóáûâàþùåé ðàçðûâíîé
ñòóïåí÷àòîé ôóíêöèåé, ïðèíèìàþùåé çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1.
Ïðèìåð 2. Êàê è â ïðèìåðå 1, èãðîê ïÿòü ðàç ïîäáðàñûâàåò ñèììåòðè÷íóþ ìîíåòó. Îáîçíà÷èì ÷åðåç Õ ñëó÷àéíóþ âåëè÷èíó, ðàâíóþ ÷èñëó âûïàäåíèÿ ãåðáà â ñåðèè
ïîäáðàñûâàíèÿ ìîíåòû. Ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 0, 1, 2,
3, 4 è 5. Âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò êàêîå-ëèáî èç ýòèõ
çíà÷åíèé, îïðåäåëåíà â ïðèìåðå 1. Ñîñòàâèì òàáëèöó ðàñïðåäåëåíèÿ ýòîé ñëó÷àéíîé
âåëè÷èíû. (Íà ðèñ. 1.2 ïîêàçàíî ãðàôè÷åñêîå ïðåäñòàâëåíèå ýòîãî ðàñïðåäåëåíèÿ.)
õi
0
1
2
3
4
5
Ð(Õ = õi)
1/32
5/32
10/32
10/32
5/32
1/32
Ðèñ. 1.2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé
Ïðèâåäåì çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ:
0, u < 0,
 p = 1 32, 0 ≤ u < 1,
 1
 p1 + p2 = 6 32, 1 ≤ u < 2,

F (u ) = P(X < n) =  p1 + p2 + p3 = 16 32, 2 ≤ u < 3,
 p + p + p + p = 26 32, 3 ≤ u < 4,
2
3
4
 1
 p1 + p2 + p3 + p4 + p5 = 31 32, 4 ≤ u < 5,

1, u ≥ 5.
Ãðàôèêîì ôóíêöèè F(u) áóäåò âîçðàñòàþùàÿ ñòóïåí÷àòàÿ ôóíêöèÿ ñî ñêà÷êàìè â òî÷êàõ õ = 1, 2, 3, 4, 5, ïîêàçàííàÿ íà ðèñ. 1.3.
24
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.3. Ãðàôèê ôóíêöèè ðàñïðåäåëåíèÿ
Ïðèìåðû äðóãèõ äèñêðåòíûõ ðàñïðåäåëåíèé ïðèâåäåíû â ðàçäåëå 1.4.
1.2.2. Непрерывные случайные величины
Íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàåòñÿ ñëó÷àéíàÿ âåëè÷èíà, âîçìîæíûå çíà÷åíèÿ êîòîðîé íåïðåðûâíî çàïîëíÿþò êàêîé-ëèáî èíòåðâàë (âîçìîæíî,
áåñêîíå÷íûé). Äëÿ íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû Õ òàêæå â êà÷åñòâå çàêîíà
ðàñïðåäåëåíèÿ âûñòóïàåò ôóíêöèÿ ðàñïðåäåëåíèÿ F(u), ÷èñëåííî ðàâíàÿ âåðîÿòíîñòè òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ îêàæåòñÿ ìåíüøå çàäàííîãî ÷èñëà u, ò.å.
F(u) = Ð(Õ < u). Ôóíêöèÿ F(u) — íåïðåðûâíàÿ ôóíêöèÿ, íåóáûâàþùàÿ è ïðèíèìàþùàÿ çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1, ïðè÷åì F(–∞) = 0 è F(+∞) = 1.
Îòìåòèì, ÷òî ðàñïðåäåëåíèå íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû íåâîçìîæíî
çàäàòü ñ ïîìîùüþ âåðîÿòíîñòåé îòäåëüíûõ çíà÷åíèé ïîäîáíî ðàñïðåäåëåíèÿì
äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, ïîñêîëüêó Ð(Õ = õ) = 0 äëÿ ëþáîãî çíà÷åíèÿ õ.
Íî åñëè ôóíêöèÿ F(u) äèôôåðåíöèðóåìàÿ, òî ìîæíî îïðåäåëèòü âåðîÿòíîñòü ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â êàêîé-ëèáî ìàëûé èíòåðâàë äëèíîé dx, ïðèìûêàþùèé ê òî÷êå õ, è ïðè ýòîì Ð(õ ≤ Õ < õ + dx) = f(x)dx, ãäå f(x) — ïðîèçâîäíàÿ ôóíêöèè F(u) â òî÷êå õ. Ôóíêöèÿ f(x) íàçûâàåòñÿ ïëîòíîñòüþ
âåðîÿòíîñòè ñëó÷àéíîé âåëè÷èíû Õ. Îíà ìîæåò ïðèíèìàòü òîëüêî íåîòðèöàòåëüíûå çíà÷åíèÿ. Èç îïðåäåëåíèÿ ïëîòíîñòè âåðîÿòíîñòè ñëåäóåò, ÷òî
+∞
u
F (u ) =
∫
−∞
f ( x)dx,
∫
−∞
b
f ( x)dx = 1, P (a ≤ X < b) = ∫ f ( x)dx = F (b) − F (a).
a
Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî, íàïðèìåð, ïîëîæèòåëüíûå çíà÷åíèÿ, òî äëÿ òàêîé ñëó÷àéíîé âåëè÷èíû çíà÷åíèÿ îáåèõ ôóíêöèé
F(õ) è f(x) ïðè îòðèöàòåëüíûõ õ äîëæíû áûòü íóëåâûìè.
Ïðèìåðû íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí ïðèâåäåíû â ðàçäåëå 1.5.
1.2.3. Числовые характеристики случайных величин
Çàêîí ðàñïðåäåëåíèÿ ïîëíîñòüþ õàðàêòåðèçóåò ñëó÷àéíóþ âåëè÷èíó. ×òîáû îïðåäåëèòü çàêîí ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû, äîñòàòî÷íî çàäàòü åå ïëîòíîñòü âåðîÿòíîñòè èëè ôóíêöèþ ðàñïðåäåëåíèÿ. Îäíàêî òàêàÿ ïîëíàÿ, èñ÷åðïûâàþùàÿ õàðàêòåðèñòèêà ñëó÷àéíîé âåëè÷èíû äîâîëüíî ñëîæíà. Ìåæäó òåì äëÿ
ðåøåíèÿ ìíîãèõ çàäà÷ ïðàêòè÷åñêè âîâñå íå íóæíî çíàòü ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû, à äîñòàòî÷íî çíàòü ëèøü íåêîòîðûå ÷èñëà, õàðàêòåðèçóþùèå ðàñГлава 1. Основные понятия теории вероятностей
25
ïðåäåëåíèå, òàê íàçûâàåìûå ÷èñëîâûå õàðàêòåðèñòèêè ñëó÷àéíîé âåëè÷èíû. Íàïðèìåð, äëÿ ãðóáîãî îïèñàíèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû ìîæíî îãðàíè÷èòüñÿ åå ñðåäíèì çíà÷åíèåì è âåëè÷èíîé ðàçáðîñà âîçìîæíûõ çíà÷åíèé.
Èç ÷èñëîâûõ õàðàêòåðèñòèê íàèáîëåå ÷àñòî èñïîëüçóþòñÿ ìîìåíòû ñëó÷àéíîé
âåëè÷èíû. Ïåðâûé ìîìåíò íàçûâàåòñÿ ìàòåìàòè÷åñêèì îæèäàíèåì (èëè ñðåäíèì
ñëó÷àéíîé âåëè÷èíû) è âû÷èñëÿåòñÿ ïî îäíîé èç ñëåäóþùèõ ôîðìóë (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ):
MX = ∑ xi pi , MX =
i
+∞
∫ xf ( x)dx.
−∞
Âåëè÷èíà ÌÕ õàðàêòåðèçóåò ñðåäíåå ïîëîæåíèå çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ.
Âòîðîé öåíòðàëüíûé ìîìåíò (ò.å. ìîìåíò îòíîñèòåëüíî ìàòåìàòè÷åñêîãî
îæèäàíèÿ ÌÕ) õàðàêòåðèçóåò ðàçáðîñ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû âîêðóã çíà÷åíèÿ ÌÕ è íàçûâàåòñÿ äèñïåðñèåé. Äèñïåðñèÿ DX (÷àñòî òàêæå èñïîëüçóþò
îáîçíà÷åíèå σ2 èëè σÕ2) âû÷èñëÿåòñÿ ïî ôîðìóëàì (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ
äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ)
DX = M(X − MX) 2 = ∑ ( xi − MX)2 pi =∑ xi2 pi − (MX) 2 ,
i
DX = M(X − MX) 2 =
i
+∞
∫ ( x − MX)
+∞
2
−∞
f ( x)dx = ∫ x 2 f ( x)dx − (MX) 2 .
−∞
Íà ïðàêòèêå èíîãäà èñïîëüçóþò ìîìåíòû áîëåå âûñîêîãî ïîðÿäêà, íî, êàê
ïðàâèëî, íå âûøå ÷åòâåðòîãî. Öåíòðàëüíûé ìîìåíò r-ãî ïîðÿäêà µr îïðåäåëÿåòñÿ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ñëó÷àéíîé âåëè÷èíû (Õ – ÌÕ)r è âû÷èñëÿåòñÿ ïî ôîðìóëàì
µ r = M(X − MX) r = ∑ ( xi − MX) r pi ,
i
µ r = M(X − MX) r =
+∞
∫ ( x − MX) dx,
r
−∞
ñîîòâåòñòâóþùèì äèñêðåòíîìó è íåïðåðûâíîìó ñëó÷àÿì.  ýòèõ îáîçíà÷åíèÿõ
DX = µ2.
Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé âñå öåíòðàëüíûå ìîìåíòû íå÷åòíîãî ïîðÿäêà
ðàâíû íóëþ. Îíè ïîëîæèòåëüíû, åñëè ðàñïðåäåëåíèå àñèììåòðè÷íî è èìååò äëèííûé “õâîñò” ñïðàâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåðîì òàêîãî ðàñïðåäåëåíèÿ ìîæåò ñëóæèòü F-ðàñïðåäåëåíèå, îïèñàííîå íèæå), è îòðèöàòåëüíû, åñëè ðàñïðåäåëåíèå èìååò äëèííûé “õâîñò” ñëåâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåð —
ëîãèñòè÷åñêîå ðàñïðåäåëåíèå). Ïîýòîìó ôóíêöèÿ ìîìåíòîâ β1 = µ3/µ23/2 ÷àñòî
ñëóæèò ìåðîé àñèììåòðèè è íàçûâàåòñÿ êîýôôèöèåíòîì àñèììåòðèè.
Öåíòðàëüíûå ìîìåíòû ÷åòíûõ ïîðÿäêîâ âñåãäà ïîëîæèòåëüíû, ÷åðåç íèõ
âûðàæàþò êîýôôèöèåíò ýêñöåññà, êîòîðûé õàðàêòåðèçóåò îñòðîòó ïèêà ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè è çàäàåòñÿ âûðàæåíèåì β 2 = µ4/µ22 – 3. Äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. íèæå) β 1 = 0 è β 2 = 0. Ðàñïðåäåëåíèÿ ñ ïîëîæèòåëüíûì ýêñöåññîì îáû÷íî èìåþò áîëåå îñòðûé ïèê, ÷åì ãðàôèê ôóíêöèè
ïëîòíîñòè íîðìàëüíîãî ðàñïðåäåëåíèÿ, à ðàñïðåäåëåíèÿ ñ îòðèöàòåëüíûì β 2 —
26
Часть I. Основные понятия теории вероятностей и математической статистики
áîëåå ñãëàæåííûé ïèê ïî ñðàâíåíèþ ñ íîðìàëüíûì (íàïðèìåð — ðàñïðåäåëåíèå Ñòüþäåíòà, êîòîðîå îïèñàíî íèæå).
Äðóãèìè õàðàêòåðèñòèêàìè ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé ìîãóò ñëóæèòü ìåäèàíà è ìîäà. Ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå
íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2. Îòìåòèì, ÷òî
äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ ìåäèàíà íå âñåãäà âû÷èñëÿåòñÿ îäíîçíà÷íî.
Ìîäà µ îïðåäåëÿåòñÿ äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé, èìåþùèõ ïëîòíîñòü
âåðîÿòíîñòè, è ñîîòâåòñòâóåò òàêîìó çíà÷åíèþ ñëó÷àéíîé âåëè÷èíû, êîòîðîå ÿâëÿåòñÿ òî÷êîé ìàêñèìóìà äëÿ ôóíêöèè ïëîòíîñòè âåðîÿòíîñòåé. Îáû÷íî â ñòàòèñòèêå èìåþò äåëî ñ îäíîìîäàëüíûìè ðàñïðåäåëåíèÿìè, ò.å. ñ òàêèìè, ôóíêöèÿ
ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ èìååò îäèí ìàêñèìóì1. Äëÿ ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå îæèäàíèå, ìîäà è ìåäèàíà ñîâïàäàþò.
Îòìåòèì, ÷òî äëÿ áîëüøèíñòâà îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå
îæèäàíèå, ìåäèàíà è ìîäà ðàñïîëàãàþòñÿ íà ÷èñëîâîé îñè â òîì ïîðÿäêå, â êîòîðîì îíè çäåñü ïåðå÷èñëåíû, ëèáî â îáðàòíîì (ýòî íàçûâàåòñÿ “àëôàâèòíîå ïðàâèëî”). Òàêèì îáðàçîì, ìåäèàíà ëåæèò ìåæäó ìàòåìàòè÷åñêèì îæèäàíèåì è ìîäîé,
ïðè÷åì áëèæå ê ìàòåìàòè÷åñêîìó îæèäàíèþ. Äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé
îïðåäåëåíà ñïåöèàëüíàÿ ìåðà àñèììåòðèè — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà,
êîòîðûé âû÷èñëÿåòñÿ ïî ôîðìóëå s = (MX – µ)/σ, ãäå µ — ìîäà, σ — êîðåíü èç
äèñïåðñèè. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé êîýôôèöèåíò Ïèðñîíà ðàâåí íóëþ,
îí õàðàêòåðèçóåò ñòåïåíü îòêëîíåíèÿ ìîäû îò ìàòåìàòè÷åñêîãî îæèäàíèÿ.
 ìàòåìàòè÷åñêîé ñòàòèñòèêå òàêæå øèðîêî èñïîëüçóþòñÿ êâàíòèëè ñëó÷àéíûõ âåëè÷èí. Êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 1/2. Êâàíòèëè íåêîòîðûõ ïîðÿäêîâ èìåþò ñïåöèàëüíûå íàçâàíèÿ: êâàðòèëè ξ0,25, ξ0,5, ξ0,75, äåöèëè
ξ0,1, ξ0,2, ..., ξ0,9, ïðîöåíòèëè ξ0,01, ξ0,02, ..., ξ0,99 äåëÿò îáëàñòü èçìåíåíèÿ ñëó÷àéíîé
âåëè÷èíû Õ ñîîòâåòñòâåííî íà 4, 10 è 100 èíòåðâàëîâ, çíà÷åíèÿ èç êîòîðûõ ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò ñ ðàâíûìè âåðîÿòíîñòÿìè. Äëÿ ìíîãèõ âåðîÿòíîñòíûõ ðàñïðåäåëåíèé çíà÷åíèÿ êâàíòèëåé çàäàííîãî óðîâíÿ ïîäñ÷èòàíû, ñâåäåíû
â ñïåöèàëüíûå òàáëèöû è èñïîëüçóþòñÿ ïðè ïîñòðîåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ.
1.2.4. Вероятностные неравенства
 òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå áîëüøóþ ðîëü èãðàþò
íåðàâåíñòâà, ñâÿçûâàþùèå âåðîÿòíîñòè ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â îïðåäåëåííûé èíòåðâàë ñ ÷èñëîâûìè õàðàêòåðèñòèêàìè ðàñïðåäåëåíèÿ. Íàèáîëåå
îáùèì íåðàâåíñòâîì òàêîãî òèïà ÿâëÿåòñÿ íåðàâåíñòâî ×åáûøåâà, êîòîðîå
ñïðàâåäëèâî äëÿ ëþáîãî âåðîÿòíîñòíîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ:
Ð(|ÌÕ – X| ≥ kσ) ≤ 1/k2.
Çäåñü è äàëåå â ýòîì ðàçäåëå ÌÕ — ìàòåìàòè÷åñêîå îæèäàíèå, σ2 = DX —
äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Õ. Ïðåäïîëàãàåòñÿ, ÷òî k > 0. Åñëè ñëó÷àéíàÿ
âåëè÷èíà Õ ïðèíèìàåò òîëüêî ïîëîæèòåëüíûå çíà÷åíèÿ, òî èìååò ìåñòî íåðàâåíñòâî Ìàðêîâà Ð(Õ ≥ k⋅ÌX) ≤ 1/k.
Äëÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ îäíîìîäàëüíîå ðàñïðåäåëåíèå, äîêàçàíî
íåñêîëüêî ïîäîáíûõ íåðàâåíñòâ, êîòîðûå â îáùåì ñëó÷àå òî÷íåå, ÷åì íåðàâåíñòâî ×åáûøåâà.
1
Äëÿ òàêèõ ðàñïðåäåëåíèé òàêæå âñòðå÷àþòñÿ íàçâàíèÿ óíèìîäàëüíîå è îäíîâåðøèííîå.
Глава 1. Основные понятия теории вероятностей
27
Íåðàâåíñòâî Ãàóññà:
P(| X − MX | ≥ kσ) ≤
4 1 + s2
, k > |s|,
9 (k − | s |) 2
çäåñü s — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà (ñì. ïðåäûäóùèé ðàçäåë)2. Åñëè
ðàñïðåäåëåíèå ñèììåòðè÷íî (â ýòîì ñëó÷àå s = 0), òîãäà íåðàâåíñòâî Ãàóññà èìååò âèä (ñðàâíèòå åãî ñ íåðàâåíñòâîì ×åáûøåâà)
P(| X − MX | ≥ kσ) ≤
4
.
9k 2
Åñëè â êà÷åñòâå ìåðû àñèììåòðèè ðàñïðåäåëåíèÿ èñïîëüçîâàòü âåëè÷èíó
δ = ν/σ, ãäå ν = M|X – µ|, òîãäà äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ñïðàâåäëèâî
íåðàâåíñòâî Ïèêà
P(| X − MX | ≥ kσ) ≤
4 1 − δ2
,
9 (k − δ) 2
êîòîðîå èíîãäà òî÷íåå íåðàâåíñòâà Ãàóññà.
Ïðèìåðû èñïîëüçîâàíèÿ ýòèõ íåðàâåíñòâ ïðèâåäåíû â ãëàâå 2 ïðè ïîñòðîåíèè
äîâåðèòåëüíûõ èíòåðâàëîâ.
1.2.5. Двумерные распределения
Ðàññìîòðèì êðàòêî äâóìåðíûå ñëó÷àéíûå âåëè÷èíû Z = (X, Y). Âåðîÿòíîñòíûå ñâîéñòâà òàêèõ ñëó÷àéíûõ âåëè÷èí õàðàêòåðèçóþò ôóíêöèè ñîâìåñòíîãî
ðàñïðåäåëåíèÿ F(x, y), êîòîðûå îïðåäåëÿþòñÿ òàê æå, êàê äëÿ îäíîìåðíûõ âåëè÷èí, ò.å. F(x, y) = P(X < x è Y < y). Äëÿ êàæäîé ñîñòàâëÿþùåé X è Y ñëó÷àéíîé
âåëè÷èíû Z ñóùåñòâóþò ÷àñòíûå ôóíêöèè ðàñïðåäåëåíèÿ:
F1(x) ≡ F(X < x) ≡ P(X < x è Y < ∞) = F(x, ∞),
F2(ó) ≡ F(Y < y) ≡ P(X < ∞ è Y < y) = F(∞, y).
Îòìåòèì, ÷òî ôóíêöèÿ F(x, y) ïîëíîñòüþ îïðåäåëÿåò ôóíêöèè F1(x) è F2(ó).
Îäíàêî ýòè ôóíêöèè îïðåäåëÿþò ôóíêöèþ F(x, y) òîëüêî â òîì ñëó÷àå, êîãäà
êîìïîíåíòû X è Y íåçàâèñèìû; òîãäà F(x, y) = F1(x)F2(ó).
Ìîæíî âû÷èñëèòü ëþáûå ìîìåíòû êàæäîé ñîñòàâëÿþùåé X è Y (åñëè, êîíå÷íî, îíè ñóùåñòâóþò), íàïðèìåð ÌÕ, DX, MY, DY. Ìîæíî òàêæå âû÷èñëèòü
ðàçëè÷íûå ñìåøàííûå ìîìåíòû ñëó÷àéíûõ âåëè÷èí X è Y. Ñðåäè ñìåøàííûõ
ìîìåíòîâ âûäåëÿþò êîâàðèàöèþ âåëè÷èí X è Y, îïðåäåëÿåìóþ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ïðîèçâåäåíèÿ (X – MX)(Y – MY), ò.å.
cov(X, Y) = M[(X – MX)(Y – MY)].
Íîðìèðîâàííóþ íà äèñïåðñèè êîâàðèàöèþ íàçûâàþò êîýôôèöèåíòîì êîððåëÿöèè ρ ñëó÷àéíûõ âåëè÷èí X è Y:
ρ=
cov(X, Y)
DX ⋅ DY
.
2
Ñóùåñòâóåò äðóãîé âàðèàíò íåðàâåíñòâà Ãàóññà, â êîòîðîì ðàññìàòðèâàåòñÿ èíòåðâàë,
ñèììåòðè÷íûé îòíîñèòåëüíî ìîäû (à íå îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ). Äëÿ
ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ýòè äâà âàðèàíòà íåðàâåíñòâà ñîâïàäàþò.
28
Часть I. Основные понятия теории вероятностей и математической статистики
Çíà÷åíèå ýòîãî êîýôôèöèåíòà ëåæèò ìåæäó –1 è 1. Îí õàðàêòåðèçóåò ñòåïåíü
ëèíåéíîé çàâèñèìîñòè ìåæäó âåëè÷èíàìè X è Y. Åñëè X è Y ñâÿçàíû ñòðîãî
ëèíåéíî (íàïðèìåð, Y = –2Õ + 5), òî àáñîëþòíàÿ âåëè÷èíà ρ ðàâíà 1, åñëè X
è Y íåçàâèñèìû, òî ρ = 0. Îäíàêî íóëåâàÿ êîððåëÿöèÿ íå îçíà÷àåò íåçàâèñèìîñòü X è Y (çà èñêëþ÷åíèåì ñëó÷àÿ, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò
íîðìàëüíîå ðàñïðåäåëåíèå) — èç ýòîãî ñëåäóåò òîëüêî îòñóòñòâèå êàêîé-ëèáî ëèíåéíîé çàâèñèìîñòè ìåæäó X è Y.
1.3. Функции от случайных величин
Ôóíêöèÿ îò ñëó÷àéíûõ âåëè÷èí òàêæå ÿâëÿåòñÿ ñëó÷àéíîé âåëè÷èíîé.  ïðèíöèïå, ëþáóþ ñëó÷àéíóþ âåëè÷èíó ìîæíî ïðåäñòàâèòü â âèäå ôóíêöèè îò íåêîòîðîé äðóãîé ñëó÷àéíîé âåëè÷èíû (íàïðèìåð, êàê ôóíêöèþ îò ðàâíîìåðíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû; ñì. ïðèâåäåííóþ íèæå òåîðåìó). Ïðåîáðàçîâàíèå
ñëó÷àéíûõ âåëè÷èí øèðîêî ïðèìåíÿåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå. Ôóíêöèè îò
ñëó÷àéíûõ âåëè÷èí òàêæå èñïîëüçóþòñÿ ïðè ãåíåðèðîâàíèè ñëó÷àéíûõ âåëè÷èí.
Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ è Y ñâÿçàíû âçàèìíî îäíîçíà÷íûì ñîîòâåòñòâèåì Y = ϕ(Õ) è Õ = ψ(Y), ãäå ψ — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ϕ3. Îáîçíà÷èì
÷åðåç fX(x), fY(x), FX(x) è FY(x) ïëîòíîñòè âåðîÿòíîñòåé è ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî. Îíè ñâÿçàíû ìåæäó ñîáîé ñëåäóþùèìè ôîðìóëàìè:
fY(x) = fX(ψ(x))⋅|ψ′(õ)|, FY(x) = FX(ψ(x)).
Èìåþò ìåñòî òàêæå “îáðàòíûå” ôîðìóëû (åñëè ïîìåíÿòü ìåñòàìè Õ è Y
è ôóíêöèþ ψ çàìåíèòü íà ϕ), ïîêàçûâàþùèå çàâèñèìîñòü ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ îò ðàñïðåäåëåíèÿ âåëè÷èíû Y.
 îáùåì ñëó÷àå (åñëè íå òðåáîâàòü âçàèìíî îäíîçíà÷íîãî ñîîòâåòñòâèÿ ìåæäó
Õ è Y) ôóíêöèÿ ðàñïðåäåëåíèÿ FY(x) ñâÿçàíà ñ ôóíêöèåé FX(x) ôîðìóëîé
FY (u ) =
∫
dFX ( x) .
ϕ ( x ) ≤u
Îòìåòèì, ÷òî äëÿ ìîìåíòîâ ñëó÷àéíûõ âåëè÷èí Õ è Y íåò ïðîñòûõ ôîðìóë,
îòîáðàæàþùèõ èõ çàâèñèìîñòü. (Ôîðìóëà ÌY = ϕ(ÌÕ), êîòîðóþ ÷àñòî ïûòàþòñÿ èñïîëüçîâàòü ñòóäåíòû, â îáùåì ñëó÷àå íåâåðíà.) Îäíàêî ìîæíî óêàçàòü
ïðîñòóþ çàâèñèìîñòü ìåæäó êâàíòèëÿìè ζð è ξð ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî: åñëè ϕ — âîçðàñòàþùàÿ ôóíêöèÿ, òî ζð = ϕ(ξð) äëÿ ëþáîãî ð
(0 < p < 1); åñëè æå ϕ — óáûâàþùàÿ ôóíêöèÿ, òî â ýòîì ñëó÷àå ζð = ϕ(ξ1–ð).
Äëÿ ìåäèàí ζ0,5 è ξ0,5 ñîîòíîøåíèå ζ0,5 = ϕ(ξ0,5) ñïðàâåäëèâî êàê äëÿ âîçðàñòàþùåé, òàê è äëÿ óáûâàþùåé ôóíêöèè ϕ.
Ïðèâåäåì äâå òåîðåìû, êîòîðûå íàõîäÿò ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå.
Òåîðåìà. Ïóñòü ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íåïðåðûâíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = F(X) ðàñïðåäåëåíà ðàâíîìåðíî íà
èíòåðâàëå [0, 1].
3
Îòñóòñòâèå ñâîéñòâà âçàèìíî îäíîçíà÷íîãî îòîáðàæåíèÿ Õ ↔ Y èçìåíÿåò (óñëîæíÿåò) ïðèâåäåííûå íèæå ôîðìóëû, íî íå ÿâëÿåòñÿ ïðèíöèïèàëüíûì ïðåïÿòñòâèåì äëÿ èõ ïîñòðîåíèÿ.
Глава 1. Основные понятия теории вероятностей
29
Òåîðåìà4. Ïóñòü G(x) — ôóíêöèÿ, îáðàòíàÿ ê íåïðåðûâíîé ñòðîãî ìîíîòîííîé ôóíêöèè ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = G(X), ãäå
ñëó÷àéíàÿ âåëè÷èíà X ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1], èìååò
ôóíêöèþ ðàñïðåäåëåíèÿ F(x).
Ïåðâàÿ òåîðåìà èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ òàê íàçûâàåìûõ ïðîáèòãðàôèêîâ íà ýòàïå ïðåäâàðèòåëüíîãî àíàëèçà âûáîðî÷íûõ ðàñïðåäåëåíèé (ñì.
ãëàâó 9). Âòîðàÿ òåîðåìà ëåæèò â îñíîâå ìåòîäà îáðàòíûõ ôóíêöèé ãåíåðèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, àêòèâíî ïðèìåíÿåìîãî íà ïðàêòèêå (ñì. ãëàâó 7).
1.3.1. Линейное преобразование случайных величин
Ýòî ïðîñòåéøàÿ çàâèñèìîñòü âèäà Y = aX + b ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ
è Y.  ýòîì ñëó÷àå FY(x) = FX((x – b)/à). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ íåïðåðûâíà
(ò.å. ñóùåñòâóåò åå ïëîòíîñòü âåðîÿòíîñòè fX(x)), òîãäà f Y ( x) =
1
 x −b
fX 
.
|a|  a 
Ìåæäó ìîìåíòàìè ñëó÷àéíûõ âåëè÷èí Õ è Y ñóùåñòâóþò òàêèå ñîîòíîøåíèÿ:
ÌY = Ì(aX + b) = ÌX + b, DY = D(aX + b) = a2DX,
M(Y)r = M(aX + b) r = a r mr + Cr1a r −1bmr −1 + ... + Crr −1ab r −1m1 + b r ,
çäåñü Ì(Õ)k — íà÷àëüíûå (îòíîñèòåëüíî õ = 0) ìîìåíòû ïîðÿäêà k ñëó÷àéíîé
r!
— áèíîìèàëüíûå êîýôôèöèåíòû.
k !(r − k )!
Äëÿ ñòàòèñòè÷åñêîãî àíàëèçà îñîáûé èíòåðåñ ïðåäñòàâëÿåò ëèíåéíîå ïðåîáðàçîâàíèå ê ñòàíäàðòíîìó âèäó (íîðìèðîâàíèå ñëó÷àéíîé âåëè÷èíû). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå ÌÕ è äèñïåðñèþ σ2, òîãäà ñëó÷àéíàÿ âåX − MX
ëè÷èíà Y =
, ó êîòîðîé ÌY = 0 è DY = 1, íàçûâàåòñÿ ñòàíäàðòèçîâàííîé
σ
(íîðìèðîâàííîé) ñëó÷àéíîé âåëè÷èíîé. Íîðìèðîâàíèå ñëó÷àéíûõ âåëè÷èí ÷àñòî
ïðèìåíÿåòñÿ íà ïðåäâàðèòåëüíîì ýòàïå ñòàòèñòè÷åñêîãî àíàëèçà (ñì. ãëàâó 8).
âåëè÷èíû Õ, Crk =
1.3.2. Суммы случайных величин
Äëÿ ñëó÷àéíîé âåëè÷èíû Z = X + Y âñåãäà âåðíî (âíå çàâèñèìîñòè îò òîãî,
áóäóò ëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìûìè), ÷òî
MZ = M(X + Y) = MX + MY.
Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Z âû÷èñëÿåòñÿ ïî ôîðìóëå
DZ = D(X + Y) = DX + DY + 2cov(X, Y).
Åñëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû, òî D(X + Y) = DX + DY.
4
 ôîðìóëèðîâêàõ òåîðåì ìû íàìåðåíî íàëîæèëè æåñòêèå îãðàíè÷åíèÿ (íåïðåðûâíîñòü
è ñòðîãóþ ìîíîòîííîñòü) íà ôóíêöèþ ðàñïðåäåëåíèÿ F(x), ÷òîáû èçáåæàòü ïðîáëåì ñ íåîäíîçíà÷íîñòüþ îáðàòíîé ôóíêöèè G(x) â ñëó÷àå ðàçðûâíîé èëè íåñòðîãî ìîíîòîííîé ôóíêöèè
F(x). Íà ïðàêòèêå ýòè òåîðåìû èñïîëüçóþòñÿ äëÿ ëþáûõ ôóíêöèé ðàñïðåäåëåíèÿ, åñëè äîîïðåäåëèòü èõ äîëæíûì îáðàçîì.
30
Часть I. Основные понятия теории вероятностей и математической статистики
 ñëó÷àå, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò ñîâìåñòíóþ ïëîòíîñòü âåðîÿòíîñòè f(x, y), òîãäà ïëîòíîñòü âåðîÿòíîñòè g(x) ñëó÷àéíîé âåëè÷èíû
Z = X + Y âûðàæàåòñÿ ôîðìóëîé
g ( z) =
+∞
∫
−∞
+∞
f ( x, z − x)dx = ∫ f ( z − y, y )dy .
−∞
 ÷àñòíîñòè, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû (â ýòîì ñëó÷àå
f(x, y) = fX(x) fY(ó)), òîãäà
g ( z) =
+∞
∫
−∞
+∞
f X ( x) f Y ( z − x )dx = ∫ f X ( z − y ) f Y ( y )dy .
−∞
N
Åñëè Z ÿâëÿåòñÿ ñóììîé N ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN, ò.å. Z = ∑ X i , òîi =1
N
ãäà MZ = ∑ MX i . Äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí âû÷èñëÿåòñÿ ïî ôîðìóëå
i =1
N
N −1 N
DZ = ∑ DX i + 2∑∑ cov(X i , X j ) .
i =1
j =1 j > i
Òàêèì îáðàçîì, äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí ðàâíÿåòñÿ ñóììå èõ
äèñïåðñèé è ñóììû êîâàðèàöèé âñåõ âîçìîæíûõ ïàð ñëó÷àéíûõ âåëè÷èí. Äëÿ
N
íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN DZ = ∑ DX i .
i=1
N
Åñëè êîëè÷åñòâî ñëàãàåìûõ â ñóììå Z = ∑ X i íåîãðàíè÷åííî âîçðàñòàåò, òî
i =1
ïðè äîñòàòî÷íî îáùèõ óñëîâèÿõ, íàêëàäûâàåìûõ íà ñëó÷àéíûå âåëè÷èíû Xi,
ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Z ñõîäèòñÿ ê íîðìàëüíîìó ðàñïðåäåëåíèþ.
Ïåðå÷èñëåíèå ýòèõ óñëîâèé ñîñòàâëÿåò ñîäåðæàíèå öåíòðàëüíûõ ïðåäåëüíûõ
òåîðåì òåîðèè âåðîÿòíîñòåé.
1.3.3. Центральная предельная теорема
Èñêëþ÷èòåëüíîå çíà÷åíèå öåíòðàëüíûõ ïðåäåëüíûõ òåîðåì îáúÿñíÿåòñÿ òåì,
÷òî îíè ÿâëÿþòñÿ òåîðåòè÷åñêîé îñíîâîé ïðèìåíåíèÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ïðè ðåøåíèè ìíîãèõ ïðàêòè÷åñêèõ çàäà÷. Âñåãäà, êîãäà ìîæíî ïðåäïîëîæèòü, ÷òî ðàññìàòðèâàåìàÿ âåëè÷èíà ÿâëÿåòñÿ ñóììîé áîëüøîãî ÷èñëà ñëó÷àéíûõ ôàêòîðîâ, âëèÿíèå êàæäîãî èç êîòîðûõ ïðåíåáðåæèìî ìàëî, åå
ðàñïðåäåëåíèå áóäåò áëèçêî ê íîðìàëüíîìó ðàñïðåäåëåíèþ. Òàêèìè âåëè÷èíàìè
ÿâëÿþòñÿ, íàïðèìåð, îøèáêè ðåãèñòðàöèè â èçìåðèòåëüíûõ ïðèáîðàõ, ðåçóëüòàòû ñëó÷àéíîãî ýêñïåðèìåíòà, çàâèñÿùåãî îò ìíîãèõ ìàëûõ ôàêòîðîâ, ðàññåèâàíèå ýëåêòðîíîâ ïðè áîìáàðäèðîâêå èìè ìèøåíåé è ò.ä.
Ïðèâåäåì ïðîñòåéøèé âàðèàíò öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, îòíîñÿùèéñÿ ê ñóììàì íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëàãàåìûõ ñ êîíå÷íîé
äèñïåðñèåé. Èìåííî ýòîò âàðèàíò òåîðåìû ñëóæèò îñíîâîé äëÿ ïîñòðîåíèÿ ðàçëè÷íûõ àñèìïòîòè÷åñêèõ îöåíîê âûáîðî÷íûõ ïàðàìåòðîâ ðàñïðåäåëåíèé â ñòàòèñòè÷åñêîì àíàëèçå (ñì. ðàçäåë 2.2).
Глава 1. Основные понятия теории вероятностей
31
Òåîðåìà. Ïóñòü Õ1, Õ2, ..., Xn, ... — ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí ñ ìàòåìàòè÷åñêèì îæèäàíèåì
ÌXk = m è êîíå÷íîé äèñïåðñèåé DXk = σ2 > 0. Îáîçíà÷èì Yn = Õ1 + Õ2 + ... + Xn.
Òîãäà ïðè n → ∞ äëÿ ëþáîãî õ
 Y − nm

< x  → Φ ( x) ,
P n
 σ n

ãäå Ô(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
Ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Yn íàçûâàåòñÿ àñèìïòîòè÷åñêè íîðìàëüíîé.
Ñóùåñòâóþò áîëåå îáùèå âàðèàíòû öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, ñïðàâåäëèâûå äëÿ ïîñëåäîâàòåëüíîñòåé Yn = Õ1 + Õ2 + ... + Xn, êîãäà Xk ìîãóò èìåòü
ðàçëè÷íûå ðàñïðåäåëåíèÿ è áûòü çàâèñèìûìè. Ðàçëè÷íûå âàðèàíòû òåîðåìû
ìîæíî íàéòè â [6].
1.4. Примеры дискретных распределений
Ïðèâåäåì ïðèìåðû ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà.
1.4.1. Равномерное дискретное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå äèñêðåòíîå ðàñïðåäåëåíèå, åñëè
îíà ïðèíèìàåò êîíå÷íîå ÷èñëî ðàçëè÷íûõ çíà÷åíèé ñ îäèíàêîâîé âåðîÿòíîñòüþ.
Ïóñòü, äëÿ îïðåäåëåííîñòè, âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 1, 2, ..., n.
Òîãäà Ð(Õ = i) = 1/n äëÿ âñåõ öåëûõ çíà÷åíèé i èç èíòåðâàëà [1, n]. Îòìåòèì,
÷òî â ýòîì ñëó÷àå ÌÕ = (n + 1)/2, DX = (n + 1)(2n + 1)/6. Ãðàôèê ýòîãî
ðàñïðåäåëåíèÿ äëÿ n = 10 ïîêàçàí íà ðèñ. 1.4.
Ýòî ðàñïðåäåëåíèå ÷àñòî èñïîëüçóåòñÿ äëÿ ìîäåëèðîâàíèÿ ðàâíîâåðîÿòíûõ
äèñêðåòíûõ ñîáûòèé.
Ðèñ. 1.4.
Äèñêðåòíîå
ðàñïðåäåëåíèå
ðàâíîìåðíîå
1.4.2. Распределение Бернулли
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Áåðíóëëè ñ ïàðàìåòðîì ð
(0 < p < 1), åñëè Ð(Õ = 1) = ð è Ð(Õ = 0) = 1 – p. Òàêèì îáðàçîì, ñëó÷àéíàÿ âå-
32
Часть I. Основные понятия теории вероятностей и математической статистики
ëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî äâà çíà÷åíèÿ, 1 è 0, ñ âåðîÿòíîñòÿìè ð è 1 – p
ñîîòâåòñòâåííî. Îòìåòèì, ÷òî ÌÕ = ð è DX = p(1 – p).
Ýòî ðàñïðåäåëåíèå èãðàåò ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïîñêîëüêó ÿâëÿåòñÿ ìîäåëüþ ëþáîãî ñëó÷àéíîãî ýêñïåðèìåíòà, ðåçóëüòàòîì êîòîðîãî ìîæåò áûòü îäèí èç äâóõ âîçìîæíûõ èñõîäîâ:
èñõîä “1” ïðîèçîéäåò ñ âåðîÿòíîñòüþ ð è èñõîä “0” — ñ âåðîÿòíîñòüþ 1 – ð
(èñõîä “1” ÷àñòî íàçûâàþò “óñïåõîì”, à èñõîä “0” — “íåóäà÷åé”).
1.4.3. Биномиальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè
n è p (0 < p < 1, n ≥ 1), åñëè
P(X = k ) = Cnk p k (1 − p) n − k , k ∈ 0, n.
Çäåñü Cnk =
n!
— áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåk !(n − k )!
ëè÷èíû ÌÕ = np, DX = np(1 – p). Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ n = 20 è p = 0,5 ïîêàçàíî íà ðèñ. 1.5.
Ðèñ. 1.5. Áèíîìèàëüíîå ðàñïðåäåëåíèå
Áèíîìèàëüíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ ñëó÷àéíûõ ýêñïåðèìåíòîâ,
ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé. Â ðåçóëüòàòå êàæäîãî èç
íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0”. Ïðèíÿòûì íàçâàíèåì äëÿ òàêîé ìîäåëè ñëó÷àéíûõ ýêñïåðèìåíòîâ ÿâëÿåòñÿ ñõåìà Áåðíóëëè. Ñëó÷àéíàÿ âåëè÷èíà, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1”
â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè äîñòàòî÷íî áîëüøèõ n è ïðè óñëîâèè, ÷òî 1/(n + 1) < p
< n/(n + 1), ÷àñòî èñïîëüçóþòñÿ ïðèáëèæåííûå ôîðìóëû, îñíîâàííûå íà àïïðîêñèìàöèè ýòîãî ðàñïðåäåëåíèÿ íîðìàëüíûì.  Excel åñòü ôóíêöèÿ
БИНОМРАСП (ñì. ãëàâó 4), êîòîðàÿ ïîçâîëÿåò âû÷èñëÿòü êàê çíà÷åíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè ëþáûõ n, p è k, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ
F(x). (Ãðàôèêè íà ðèñ. 1.5 ïîñòðîåíû ñ ïîìîùüþ ýòîé ôóíêöèè.)
Глава 1. Основные понятия теории вероятностей
33
1.4.4. Распределение Пуассона
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ
(λ > 0), åñëè
P(X = k ) = e − λ
λk
, k = 0, 1, 2, ... .
k!
Äëÿ ýòîãî ðàñïðåäåëåíèÿ ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ñîâïàäàþò,
ò.å. ÌÕ = DX = λ. Ðàñïðåäåëåíèÿ âåðîÿòíîñòåé äëÿ äâóõ çíà÷åíèé λ ïîêàçàíû
íà ðèñ. 1.6.
Ðèñ. 1.6. Ðàñïðåäåëåíèå Ïóàññîíà
Ðàñïðåäåëåíèå Ïóàññîíà èãðàåò âàæíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå. Îíî ÿâëÿåòñÿ ìîäåëüþ äëÿ îïèñàíèÿ ñëó÷àéíîãî ÷èñëà
ïîÿâëåíèé îïðåäåëåííûõ ñîáûòèé â ôèêñèðîâàííûé ïðîìåæóòîê âðåìåíè èëè
â ôèêñèðîâàííîé îáëàñòè ïðîñòðàíñòâà. Òðàäèöèîííûìè ïðèìåðàìè ñëó÷àéíûõ
âåëè÷èí, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà, ÿâëÿþòñÿ ÷èñëî àëüôà÷àñòèö, èñïóñêàåìûõ ðàäèîàêòèâíûì èñòî÷íèêîì çà îïðåäåëåííûé ïðîìåæóòîê
âðåìåíè; êîëè÷åñòâî áàêòåðèé, âèäèìûõ ïîä ìèêðîñêîïîì; ìóòàöèè, âûçâàííûå
ðàäèàöèåé; êîëè÷åñòâî çâåçä â îïðåäåëåííîé îáëàñòè çâåçäíîãî íåáà; êîëè÷åñòâî
äåðåâüåâ íà ó÷àñòêå ëåñà è ò.ä.  Excel äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k)
è çíà÷åíèé ôóíêöèè ðàñïðåäåëåíèÿ F(x) åñòü ôóíêöèÿ ПУАССОН (ñì. ãëàâó 4).
Îòìåòèì òàêæå ñîîòíîøåíèÿ ìåæäó ðàñïðåäåëåíèÿìè Ïóàññîíà è χ2 (ñì.
ðàçäåë 1.5.5), êîòîðûå èñïîëüçóþòñÿ ïðè ïîñòðîåíèè èíòåðâàëüíûõ îöåíîê äëÿ
ïàðàìåòðà λ (ñì. ðàçäåë 2.3.8): Ð(Õ ≥ k) = Ð(Y ≤ 2λ), ãäå Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2k ñòåïåíÿìè ñâîáîäû, è Ð(Õ ≤ k) =
= Ð(Z ≥ 2λ), ãäå Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1)
ñòåïåíÿìè ñâîáîäû.
1.4.5. Геометрическое распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì ð
(0 < p < 1), åñëè
Ð(Õ = k) = p(1 – p)k, k = 0, 1, 2, ... .
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (1 – p)/p, DX = (1 – p)/p2. Ðàñïðåäåëåíèå
âåðîÿòíîñòåé äëÿ çíà÷åíèÿ ïàðàìåòðà p = 0,7 ïîêàçàíî íà ðèñ. 1.7.
34
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.7. Ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå
Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì îòðèöàòåëüíîãî áèíîìèàëüíîãî
ðàñïðåäåëåíèÿ ïðè ïàðàìåòðå r = 1 (ñì. ðàçäåë 1.4.7) è îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè (ðàçäåë 1.4.3), íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1” ðîâíî îäèí ðàç.
1.4.6. Гипергеометрическое распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè N, n è ð (N ≥ n ≥ 0, 0 < p < 1), åñëè
P(X = k ) =
k
C Np
C Nn −(1k− p )
C Nn
, k = 0, 1, 2, ..., n .
Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
ÌÕ = np, DX = np (1 − p )
N −n
. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàN −1
ìåòðîâ N = 100, n = 10 è p = 0,4 ïîêàçàíî íà ðèñ. 1.8.
Òèïè÷íàÿ ñèòóàöèÿ, â êîòîðîé ïîÿâëÿåòñÿ ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå,
ñëåäóþùàÿ: ïðîâåðÿåòñÿ ïàðòèÿ ãîòîâîé ïðîäóêöèè îáúåìîì N, â êîòîðîé ëþáîå
èçäåëèå ñ âåðîÿòíîñòüþ ð ÿâëÿåòñÿ ãîäíûì è, ñîîòâåòñòâåííî, ñ âåðîÿòíîñòüþ 1 –
ð — áðàêîâàííûì. Ñëó÷àéíûì îáðàçîì âûáèðàþòñÿ n èçäåëèé. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî ãîäíûõ èçäåëèé ñðåäè n âûáðàííûõ èçäåëèé.
Åñëè n/N < 0,1, ýòî ðàñïðåäåëåíèå õîðîøî àïðîêñèìèðóåòñÿ áèíîìèàëüíûì
ðàñïðåäåëåíèåì.  Excel èìååòñÿ ôóíêöèÿ ГИПЕРГЕОМЕТ, âû÷èñëÿþùàÿ âåðîÿòíîñòè Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ N, n, ð è k (ñì. ðàçäåë 4.6.6).
1.4.7. Отрицательное биномиальное распределение
(распределение Паскаля)
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå
(ðàñïðåäåëåíèå Ïàñêàëÿ) ñ ïàðàìåòðàìè r è ð (0 < p < 1), åñëè
P(X = k ) = Crk+ k −1 p r (1 − p) r , k = 0, 1, 2, ... .
Глава 1. Основные понятия теории вероятностей
35
Ðèñ. 1.8. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå
Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
ÌÕ = r(1 – p)/p, DX = r(1 – p)/p2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ r = 10 è p = 0,8 ïîêàçàíî íà ðèñ. 1.9.
Ðèñ. 1.9. Îòðèöàòåëüíîå
ðàñïðåäåëåíèå
áèíîìèàëüíîå
Ïðè íàòóðàëüíîì r îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè, íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1”
ðîâíî r ðàç. Ýòî ðàñïðåäåëåíèå ÷àñòî ïîÿâëÿåòñÿ â ïîïóëÿöèîííîé áèîëîãèè.
 Excel èìååòñÿ ôóíêöèÿ ОТРБИНОМРАСП, âû÷èñëÿþùàÿ âåðîÿòíîñòè
Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ r, ð è k (ñì. ðàçäåë 4.6.10).
1.5. Примеры непрерывных распределений
1.5.1. Равномерное непрерывное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b],
åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.10) âû÷èñëÿåòñÿ ïî ôîðìóëå
 1
, если x ∈ [a, b],

f ( x) =  b − a
 0,
если x ∉ [a, b].
36
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.10. Ïëîòíîñòü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (a + b)/2, DX = (b – a)2/12, β1 = 0,
β2 = –1,2. Ñëó÷àéíàÿ âåëè÷èíà Y = (X – a)/(b – a) ðàñïðåäåëåíà ðàâíîìåðíî íà
èíòåðâàëå [0, 1]. Ðàâíîìåðíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íåïðåðûâíûì àíàëîãîì
äèñêðåòíîãî ðàâíîìåðíîãî ðàñïðåäåëåíèÿ, îïèñûâàþùåãî ñëó÷àéíûå ýêñïåðèìåíòû ñ ðàâíîâåðîÿòíûìè èñõîäàìè.
Òåîðåìû èç ðàçäåëà 1.3, ïîêàçûâàþùèå âçàèìîñâÿçü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ ñ äðóãèìè òèïàìè ðàñïðåäåëåíèé, îáúÿñíÿþò øèðîêîå èñïîëüçîâàíèå ðàâíîìåðíîãî ðàñïðåäåëåíèÿ â ñòàòèñòè÷åñêîì ìîäåëèðîâàíèè (áîëåå ïîäðîáíî îá
ýòîì ðå÷ü èäåò â ãëàâå 7).  Excel ôóíêöèÿ СЛЧИС ãåíåðèðóåò ñëó÷àéíûå ÷èñëà,
ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] (ñì. ðàçäåë 4.13.1).
1.5.2. Треугольное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò òðåóãîëüíîå ðàñïðåäåëåíèå (íàçûâàåìîå òàêæå
ðàñïðåäåëåíèåì Ñèìïñîíà) íà èíòåðâàëå [a, b], åñëè åå ïëîòíîñòü âåðîÿòíîñòè
(ðèñ. 1.11) âû÷èñëÿåòñÿ ïî ôîðìóëå
2
 2
−
a + b − 2 x , если x ∈ [a, b],

f ( x ) =  b − a (b − a ) 2
 0,
если x ∉ [a, b].

Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû MX =
1
(4(a3 + b3 ) − (a + b)3 ) , DX = (b –
6(b − a) 2
– a)3/24. Åñëè Õ1 è Õ2 — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, ðàâíîìåðíî ðàñïðå-
a b
äåëåííûå íà èíòåðâàëå  ,  , òî ñëó÷àéíàÿ âåëè÷èíà Õ = Õ1 + Õ2 èìååò òðå2 2
óãîëüíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b].
1.5.3. Показательное (экспоненциальное) распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.12) âû÷èñëÿåòñÿ ïî ôîðìóëå
λe − λx , если x ≥ 0,
f ( x) = 
если x < 0.
 0,
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = 1/λ, DX = 1/λ2; åå ôóíêöèÿ ðàñïðåäåëåíèÿ âû÷èñëÿåòñÿ ïî ïðîñòîé ôîðìóëå F(u) = 1 – e–λu (u ≥ 0). Ýòî ðàñïðåäåëåíèå
Глава 1. Основные понятия теории вероятностей
37
Ðèñ. 1.11. Ïëîòíîñòü òðåóãîëüíîãî ðàñïðåäåëåíèÿ
Ðèñ. 1.12. Ïëîòíîñòü ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ
÷àñòî âñòðå÷àåòñÿ â ìîäåëèðîâàíèè ñëó÷àéíûõ ïðîöåññîâ (îíî îáëàäàåò òàê íàçûâàåìûì ñâîéñòâîì îòñóòñòâèÿ ïîñëåäåéñòâèÿ).  Excel ôóíêöèÿ ЭКСПРАСП
âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.15).
1.5.4. Нормальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m
è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.13) âû÷èñëÿåòñÿ ïî ôîðìóëå
f ( x) =
1
2πσ
e
−
( x − m )2
2σ 2
,
x ∈ (−∞, ∞).
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = m, DX = σ2, β1 = 0, β2 = 0. Íîðìàëüíîå
ðàñïðåäåëåíèå íàçûâàþò òàêæå ãàóññîâñêèì ðàñïðåäåëåíèåì, çàêîíîì Ãàóññà,
âòîðûì çàêîíîì Ëàïëàñà, ðàñïðåäåëåíèåì Ãàóññà–Ëàïëàñà è äð.
Åñëè m = 0 è σ2 = 1, òî ðàñïðåäåëåíèå íàçûâàåòñÿ ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì. Ëèíåéíîå ïðåîáðàçîâàíèå Y = (X – m)/σ ïðèâîäèò ïðîèçâîëüíóþ íîðìàëüíî ðàñïðåäåëåííóþ âåëè÷èíó Õ ê ñòàíäàðòíîìó íîðìàëüíîìó ðàñïðåäåëåíèþ.
Ôóíäàìåíòàëüíàÿ ðîëü, êîòîðóþ èãðàåò íîðìàëüíîå ðàñïðåäåëåíèå â òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, îáúÿñíÿåòñÿ òåì, ÷òî ïðè äîñòà-
38
Часть I. Основные понятия теории вероятностей и математической статистики
òî÷íî øèðîêèõ óñëîâèÿõ ðàñïðåäåëåíèå ñóììû ñëó÷àéíûõ âåëè÷èí ñ ðîñòîì
÷èñëà ñëàãàåìûõ àñèìïòîòè÷åñêè ñõîäèòñÿ ê íîðìàëüíîìó. Ñîîòâåòñòâóþùèå
óñëîâèÿ ñõîäèìîñòè ïðèâåäåíû â öåíòðàëüíîé ïðåäåëüíîé òåîðåìå òåîðèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.3.3).
Ðèñ. 1.13. Ïëîòíîñòü íîðìàëüíîãî ðàñïðåäåëåíèÿ
Íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà ñ áîëüøîé âåðîÿòíîñòüþ ïðèíèìàåò çíà÷åíèÿ, áëèçêèå ê ñâîåìó ìàòåìàòè÷åñêîìó îæèäàíèþ. Ýòî ñâîéñòâî
íîðìàëüíîãî ðàñïðåäåëåíèÿ ôîðìóëèðóåòñÿ êàê ïðàâèëî ñèãì:
 0,3173..., k = 1,

P(| X − m |≥ kσ ) = 0, 0455...., k = 2,
 0, 0027...., k = 3.

×àùå âñåãî èñïîëüçóþò ïðàâèëî òðåõ ñèãì, êîòîðîå íàõîäèò øèðîêîå ïðèìåíåíèå â ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ.
 Excel ôóíêöèè НОРМСТРАСП è НОРМРАСП (ñì. ðàçäåëû 4.6.8 è 4.6.9) âû÷èñëÿþò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ ñîîòâåòñòâåííî ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî ðàñïðåäåëåíèé, à ôóíêöèè
НОРМСТОБР è НОРМОБР — çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî çàêîíîâ (ñì. ðàçäåëû 4.7.5
è 4.7.6). Ïîñëåäíèå ôóíêöèè ìîæíî èñïîëüçîâàòü äëÿ ãåíåðèðîâàíèÿ íîðìàëüíî
ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ãëàâó 7).
1.5.5. Распределение “хи/квадрат”
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå
ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.14) âû÷èñëÿåòñÿ ïî ôîðìóëå
n
x
−1 −

1
2
2
, если x ≥ 0,
x
e
 n
 2 n
f ( x) =  2 Γ  
2

 0,
если x < 0.
Глава 1. Основные понятия теории вероятностей
39
Çäåñü è äàëåå Ã(õ) — ãàììà-ôóíêöèÿ Ýéëåðà5. Äëÿ äàííîãî ðàñïðåäåëåíèÿ
ÌÕ = n, DX = 2n, β1 = 2
2
, β2 = 12/n. Ïðè n ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå õ = n – 2.
n
Ðèñ. 1.14. Ðàñïðåäåëåíèå χ2
Ìíîãî÷èñëåííûå ïðèìåíåíèÿ ýòîãî ðàñïðåäåëåíèÿ â òåîðèè âåðîÿòíîñòåé îñíîâàíû íà òîì ôàêòå, ÷òî åñëè Õ1, Õ2, ..., Õn — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, òî ñëó÷àéíàÿ âåëè÷èíà
Y = ∑ i =1 X i2 èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ìàòåìàòè÷åñêîé
n
ñòàòèñòèêå ðàñïðåäåëåíèå χ2 ïðèìåíÿåòñÿ ïðè ïîñòðîåíèè öåëîãî ðÿäà ðàçíîîáðàçíûõ êðèòåðèåâ, â òîì ÷èñëå ïðè ñîãëàñîâàíèè âûáîðî÷íûõ äàííûõ ñ âûáðàííûì çàêîíîì ðàñïðåäåëåíèÿ è â ìåòîäå íàèìåíüøèõ êâàäðàòîâ (ñì. ãëàâû 2 è 3).
 Excel åñòü òðè ôóíêöèè, ХИ2РАСП, ХИ2ОБР è ХИ2ТЕСТ, ñâÿçàííûå ñ ðàñïðåäåëåíèåì χ2. Ïîäðîáíî ýòè ôóíêöèè îïèñàíû â ãëàâå 4.
1.5.6. Распределение Стьюдента
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ñòüþäåíòà (t-ðàñïðåäåëåíèå)
ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.15) âû÷èñëÿåòñÿ ïî ôîðìóëå
 n +1
n +1
Γ
−

2   x2  2

f ( x) =
, x ∈ (−∞, ∞).
1 + 
n 
n
nπ Γ   
2
5
Çíà÷åíèÿ ãàììà-ôóíêöèè Γ ( n ) =
∫
∞
0
e − x x n −1 dx ìîæíî ïîëó÷èòü ñ ïîìîùüþ ôóíêöèè Excel
ГАММАНЛОГ, âû÷èñëÿþùåé íàòóðàëüíûé ëîãàðèôì ãàììà-ôóíêöèè. Òàêæå îòìåòèì, ÷òî
Ã(n) = (n – 1)!, åñëè n — íàòóðàëüíîå ÷èñëî.
40
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.15. Ïëîòíîñòü ðàñïðåäåëåíèÿ Ñòüþäåíòà
Äëÿ ýòîãî ðàñïðåäåëåíèÿ ïðè n > 2 ÌÕ = 0, DX = n/(n – 2) (åñëè n ≤ 2, òî DX = ),
β1 = 0, β2 = 6/(n – 4) (ïðè n > 4). Ïðè áîëüøèõ çíà÷åíèÿõ n ðàñïðåäåëåíèå Ñòüþäåíòà
àñèìïòîòè÷åñêè ñáëèæàåòñÿ ñî ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì.
Ðàñïðåäåëåíèå Ñòüþäåíòà èìååò ìíîãî÷èñëåííûå ïðèìåíåíèÿ â ìàòåìàòè÷åñêîé
ñòàòèñòèêå. Åñëè Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè
ñâîáîäû, òîãäà ñëó÷àéíàÿ âåëè÷èíà X = Y
n
èìååò t-ðàñïðåäåëåíèå òàêæå ñ n
Z
ñòåïåíÿìè ñâîáîäû. (Î ïðèìåíåíèè ðàñïðåäåëåíèÿ Ñòüþäåíòà ðå÷ü èäåò â ãëàâå 2.)
 Excel èìåþòñÿ ôóíêöèè СТЬЮДРАСП è СТЬЮДОБР, âû÷èñëÿþùèå ñîîòâåòñòâåííî çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.12 è 4.7.7).
1.5.7. F/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà)
ñ (m, n) ñòåïåíÿìè ñâîáîäû (m, n ≥ 1), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.16)
âû÷èñëÿåòñÿ ïî ôîðìóëå
 m+n
m
m+n
 Γ  2   m  2 m −1  m  − 2


2
, если x ≥ 0,
x 1 + x 

f ( x) =   m   n   n 
n 

Γ Γ 
  2  2

если x < 0.
 0,
2n 2 (m + n − 2)
n
(ïðè n > 2), DX =
(åñëè
m(n − 2) 2 (n − 4)
n−2
n(m − 2)
.
n > 4). Ïðè m ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå x =
m(n + 2)
Äëÿ ýòîãî ðàñïðåäåëåíèÿ MX =
Глава 1. Основные понятия теории вероятностей
41
Ðèñ. 1.16. Ïëîòíîñòü F-ðàñïðåäåëåíèÿ
Åñëè íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû Y1 è Y2 èìåþò ðàñïðåäåëåíèå χ2 ñ m
è n ñòåïåíÿìè ñâîáîäû ñîîòâåòñòâåííî, òîãäà ñëó÷àéíàÿ âåëè÷èíà X =
Y1 m
áóY2 n
äåò èìåòü F-ðàñïðåäåëåíèå.
F-ðàñïðåäåëåíèå èãðàåò îñíîâíóþ ðîëü ïðè ñðàâíåíèè âûáîðî÷íûõ äèñïåðñèé
èç íîðìàëüíî ðàñïðåäåëåííûõ ñîâîêóïíîñòåé. Îíî òàêæå øèðîêî èñïîëüçóåòñÿ
â ðåãðåññèîííîì è äèñïåðñèîííîì àíàëèçå. Â Excel èìåþòñÿ ôóíêöèè FРАСП
è FРАСПОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.1 è 4.7.1).
1.5.8. Логарифмически нормальное распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãàðèôìè÷åñêè íîðìàëüíîå (ëîãíîðìàëüíîå)
ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.17)
âû÷èñëÿåòñÿ ïî ôîðìóëå
 1
 (ln x − m) 2 
exp  −

 , если x > 0,
f ( x) =  xσ 2π
2σ 2



если x ≤ 0.
 0,
Ðèñ. 1.17. Ïëîòíîñòü ëîãíîðìàëüíîãî ðàñïðåäåëåíèÿ
42
Часть I. Основные понятия теории вероятностей и математической статистики
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = exp(m + σ2/2), DX = (exp(σ2) –
1)exp(2m + σ2). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãíîðìàëüíîå ðàñïðåäåëåíèå, òî åå ëîãàðèôì Y = lnX ðàñïðåäåëåí ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2.
Ýòî ðàñïðåäåëåíèå íàõîäèò ïðèìåíåíèå â òåîðèè íàäåæíîñòè, ñòàòèñòè÷åñêîé ôèçèêå, ýêîíîìè÷åñêîé ñòàòèñòèêå, áèîëîãèè è ò.ä.  Excel èìåþòñÿ
ôóíêöèè ЛОГНОРМРАСП è ЛОГНОРМОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.7 è 4.7.4).
1.5.9. Бета/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áåòà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è β (α > 0,
β > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.18) âû÷èñëÿåòñÿ ïî ôîðìóëå
 Γ (α + β) α −1
x (1 − x)β −1 , если x ∈ [0,1],

f ( x) =  Γ(α)Γ(β)
 0,
если x ∉ [0,1].

Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/(α + β), DX = αβ/(α + β)2(α + β + 1).
Åñëè α > 1 è β > 1, òî ðàñïðåäåëåíèå îäíîìîäàëüíî ñ ìîäîé â òî÷êå õ = (α –
– 1)/(α + β – 1). Ïðè α = β = 1 áåòà-ðàñïðåäåëåíèå ÿâëÿåòñÿ ðàâíîìåðíûì íà èíòåðâàëå [0, 1] ðàñïðåäåëåíèåì, ïðè α = β = 2 — òðåóãîëüíûì, â ñëó÷àå
α = β = 1/2 îíî íàçûâàåòñÿ ðàñïðåäåëåíèåì àðêñèíóñà, à ïðè β = α + 1 — îáîáùåííûì ðàñïðåäåëåíèåì àðêñèíóñà.
 ìàòåìàòè÷åñêîé ñòàòèñòèêå áåòà-ðàñïðåäåëåíèå íàèáîëåå ÷àñòî âñòðå÷àåòñÿ
â êà÷åñòâå ðàñïðåäåëåíèÿ ïîðÿäêîâûõ ñòàòèñòèê (ñì. ãëàâó 2).  Excel ôóíêöèè
БЕТАРАСП è БЕТАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.2 è 4.7.2).
Ðèñ. 1.18. Ïëîòíîñòü áåòà-ðàñïðåäåëåíèÿ
Глава 1. Основные понятия теории вероятностей
43
1.5.10. Гамма/распределение
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ
(α > 0, λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.19) âû÷èñëÿåòñÿ ïî ôîðìóëå
 λ α α −1 − λx
x e , если x > 0,

f ( x) =  Γ(α)
 0,
если x ≤ 0.

Ðèñ. 1.19. Ïëîòíîñòü ãàììà-ðàñïðåäåëåíèÿ ïðè α = 1 è λ = 0,5
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/λ, DX = α/λ2. Ïðè α ≤ 1 ìîäà ðàñïðåäåëåíèÿ íàõîäèòñÿ â íóëå, à ïðè α ≥ 1 — â òî÷êå õ = (α – 1)/λ. Åñëè α = 1, òî
ãàììà-ðàñïðåäåëåíèå ñîâïàäàåò ñ ïîêàçàòåëüíûì ðàñïðåäåëåíèåì, à ïðè α = n/2,
λ = 1/2 — ñ ðàñïðåäåëåíèåì χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ñëó÷àå λ = nµ è α = n
(n — íàòóðàëüíîå ÷èñëî) ýòî ðàñïðåäåëåíèå íàçûâàþò ðàñïðåäåëåíèåì Ýðëàíãà
ñ ïàðàìåòðàìè n è µ. Ïðè íàòóðàëüíîì α è λ = 1 ãàììà-ðàñïðåäåëåíèå íàçûâàåòñÿ ïîêàçàòåëüíî-ñòåïåííûì.
Äàííîå ðàñïðåäåëåíèå è åãî ÷àñòíûå ñëó÷àè øèðîêî èñïîëüçóþòñÿ â òåîðèè
âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå.  Excel ôóíêöèè ГАММАРАСП
è ГАММАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.5 è 4.7.3).
1.5.11. Распределение Вейбулла–Гнеденко
Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ñ ïàðàìåòðàìè
α è λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.20) âû÷èñëÿåòñÿ ïî ôîðìóëå
| α | λx α −1e− λx , если x > 0,
f ( x) = 
если x ≤ 0.
 0,
α
Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû
 2  2  1
λ −1/ α  1 
MX =
Γ   è DX = λ −2 / α  Γ   − 2
α
α
 α  α  α
44
2
  1   
Γ  α    .
    
Часть I. Основные понятия теории вероятностей и математической статистики
Ðèñ. 1.20. Ïëîòíîñòü ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî ïðè α = 1 è α = 3 è λ = 2
Ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ÷àñòî èñïîëüçóåòñÿ â òåîðèè íàäåæíîñòè,
â ÷àñòíîñòè äëÿ îïèñàíèÿ âðåìåíè áåçîòêàçíîé ðàáîòû ïðèáîðîâ.  Excel ôóíêöèÿ ВЕЙБУЛЛ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.4).
1.5.12. Распределения Пирсона
Ñèñòåìà ðàñïðåäåëåíèé Ïèðñîíà îñíîâàíà íà òîì, ÷òî ïëîòíîñòè âåðîÿòíîñòè
ìíîãèõ èçâåñòíûõ ðàñïðåäåëåíèé ïîä÷èíÿþòñÿ äèôôåðåíöèàëüíîìó óðàâíåíèþ
îäíîãî îïðåäåëåííîãî òèïà, êîòîðîå çàâèñèò îò ÷åòûðåõ ïàðàìåòðîâ.  çàâèñèìîñòè
îò çíà÷åíèé ýòèõ ïàðàìåòðîâ ðàçëè÷àþò 12 òèïîâ ðàñïðåäåëåíèé, ñðåäè êîòîðûõ òàêèå ðàñïðåäåëåíèÿ, êàê íîðìàëüíîå, ãàììà-ðàñïðåäåëåíèå, áåòà-ðàñïðåäåëåíèå, ðàñïðåäåëåíèå Ñòüþäåíòà è äðóãèå. Óæå ýòî ïåðå÷èñëåíèå ðàñïðåäåëåíèé, èãðàþùèõ
ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, ïîêàçûâàåò âàæíîñòü ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ïîñêîëüêó â ìàòåìàòè÷åñêîé ëèòåðàòóðå ïîëíîå îïèñàíèå ðàñïðåäåëåíèé Ïèðñîíà âñòðå÷àåòñÿ ðåäêî (îáû÷íî óêàçûâàþòñÿ òîëüêî íåêîòîðûå òèïû ðàñïðåäåëåíèé), ïðèâåäåì èõ ïîäðîáíóþ
êëàññèôèêàöèþ. (Ïðèâåäåííûé íèæå ìàòåðèàë, ñ íåáîëüøèìè äîïîëíåíèÿìè àâòîðà, âçÿò èç [8]. Äðóãóþ êëàññèôèêàöèþ êðèâûõ Ïèðñîíà ìîæíî íàéòè â [4].)
Ðàñïðåäåëåíèÿìè Ïèðñîíà íàçûâàþòñÿ íåïðåðûâíûå ðàñïðåäåëåíèÿ, ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ ÿâëÿþòñÿ ðåøåíèÿìè äèôôåðåíöèàëüíîãî óðàâíåíèÿ
df ( x)
x+a
=
f ( x),
dx
b0 + 2b1 x + b2 x 2
ãäå a, b0, b1, b2 — ïàðàìåòðû ðàñïðåäåëåíèÿ. Ýòè ïàðàìåòðû ïîëíîñòüþ îïðåäåëÿþòñÿ ïåðâûìè ÷åòûðüìÿ öåíòðàëüíûìè ìîìåíòàìè ðàñïðåäåëåíèÿ. Ïóñòü
µk — k-é öåíòðàëüíûé ìîìåíò, òîãäà
a=
b1 = −
µ 3 (µ 4 + 3µ 22 )
µ (4µ 2 µ 4 − 3µ 32 )
, b0 = − 2
,
A
A
µ 3 (µ 4 + 3µ 22 )
2µ µ − 3µ 32 − 6µ 32
, b2 = − 2 4
,
2A
A
ãäå A = 10µ 2 µ 4 − 18µ 32 − 12µ 32 .
Глава 1. Основные понятия теории вероятностей
45
Òèïû ðàñïðåäåëåíèé Ïèðñîíà ðàçëè÷àþò â ñîîòâåòñòâèè ñî çíà÷åíèÿìè êîðíåé êâàäðàòíîãî óðàâíåíèÿ b0 + 2b1õ + b2õ2 = 0. Ââåäåì îáîçíà÷åíèÿ: D = b0b2 –
b12, λ = b12/b0b2 = 1 – D. Îòìåòèì, ÷òî áîëüøèíñòâî ïðèâåäåííûõ íèæå ôîðìóë
äëÿ ïëîòíîñòåé âåðîÿòíîñòè óïðîùàåòñÿ, åñëè çà íà÷àëî îòñ÷åòà âçÿòü ìîäó ðàñïðåäåëåíèÿ èëè ìàòåìàòè÷åñêîå îæèäàíèå.
Òèï I. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β), α, β > 0. Îáîçíà÷èì
êàê m = (α – à)/b2(α + β), n = (β – à)/b2(α + β). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé Ïèðñîíà îïðåäåëÿåòñÿ ôîðìóëîé

α 2mβ2 n
(α + x) m (β − x) n , если x ∈ [−α,β],

m + n +1
f ( x) =  (α + β)
B(m + 1, n + 1)
0,
если x ∉ [−α,β].

Çäåñü è äàëåå B(m, n) =
Γ ( m) Γ ( n )
(m > 0, n > 0) — áåòà-ôóíêöèÿ.
Γ ( m + n)
Ðàñïðåäåëåíèÿìè ýòîãî òèïà ÿâëÿþòñÿ áåòà-ðàñïðåäåëåíèÿ.
Òèï II. D < 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 – α2), α = −b0 b2 > 0. Îáîçíà÷èì êàê m = 1/2b2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
1

(α 2 − x 2 )m , если x ∈ [−α, α],
 2 m +1
f ( x) =  α B (m + 1,1/ 2)
0,
если x ∉ [−α,α].

Ýòî ðàñïðåäåëåíèå ñèììåòðè÷íî îòíîñèòåëüíî òî÷êè õ = 0.
Òèï III. D < 0, λ = ∞ è b0 + 2b1õ + b2õ2 = 2b1(õ + α), α = b0/2b1. Îáîçíà÷èì
êàê m = (à – α)/2b1, k = –1/2b1 (k > 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 k m +1
( x + α) m e − k ( x + α ) , если x > −α,

f ( x) =  Γ(m + 1)
0,
если x ≤ −α.

Ýòîò òèï ðàñïðåäåëåíèÿ ÿâëÿåòñÿ ãàììà-ðàñïðåäåëåíèåì.
Òèï IV. D > 0, 0 < λ < 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α2 = D/(b2)2. Îáîçíà÷èì êàê m = –1/2b2 ≥ 1/2, k = –b1(2b2 + 1)/(b2)2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî
òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) = c(α 2 + x 2 ) − m e − k arctg(x / α ) , x ∈ (−∞, ∞),
∞
ãäå c −1 = ∫ (α 2 + x 2 )− m e− k arctg(x / α) dx.
−∞
Òèï V. D = 0, λ = 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α = b1/b2. Îáîçíà÷èì êàê
m = –1/b2 ≥ 1, k = –b1(2b2 + 1)/b2 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
46
Часть I. Основные понятия теории вероятностей и математической статистики
k
−
 k m −1
x − m e x , если x > 0,

f ( x) =  Γ(m − 1)
0,
если x ≤ 0.

Òèï VI. D < 0, λ > 1 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β). Îáîçíà÷èì êàê
m = (α – à)/b2(α + β) > 1, n = (β – à)/b2(α + β) > –1. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî
òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 (α + β) − ( m + n +1)
( x + α) m ( x − β) n , если x > β,

f ( x) =  B(−m − n − 1, n + 1)
0,
если x ≤ β.

Òèï VII. D > 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 + α2), α2 = b0/b2. Îáîçíà÷èì
êàê m = 1/2b2 ≥ 1/2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) =
α
(α 2 + x 2 ) − m , если x ∈ (−∞, ∞).
1 1

B m − , 
2 2

Ðàñïðåäåëåíèå ýòîãî òèïà ÿâëÿåòñÿ ðàñïðåäåëåíèåì Ñòüþäåíòà.
Òèï VIII. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì
êàê m = 1/b2 (–1 < m < 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 m +1
( x + α)m , если x ∈ [−α,0],

f ( x) =  α m +1
0,
если x ∉ [−α, 0].
Òèï IX. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì
êàê m = 1/b2 (m < –1). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
 m +1
( x + α)m , если x ∈ [−α,0],

f ( x) =  α m +1
0,
если x ∉ [−α, 0].
Òèï X. D = 0, λ = 0 è b0 + 2b1õ + b2õ2 = b0, ÷èñëèòåëü äðîáè â äèôôåðåíöèàëüíîì óðàâíåíèè Ïèðñîíà ðàâåí à. Îáîçíà÷èì êàê m = à/b0 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
me − mx , если x > 0,
f ( x) = 
если x ≤ 0.
0,
Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ïîêàçàòåëüíûì.
Òèï XI. D = 0, λ íå îïðåäåëåíî, b0 + 2b1õ + b2õ2 = b0. Îáîçíà÷èì êàê σ2 = b0.
Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé
f ( x) =
1
2πσ
e
−
x2
2 σ2
, x ∈ (−∞, ∞).
Глава 1. Основные понятия теории вероятностей
47
Äàííîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íîðìàëüíûì.
Òèï ÕII. Ðàñïðåäåëåíèå ýòîãî òèïà ñîâïàäàåò ñ ðàñïðåäåëåíèåì òèïà I, åñëè
â ïîñëåäíåì ðàñïðåäåëåíèè ïîëîæèòü m = –n.
Ðàñïðåäåëåíèÿ Ïèðñîíà èñïîëüçóþòñÿ äëÿ ñãëàæèâàíèÿ ðàñïðåäåëåíèé âûáîðî÷íûõ çíà÷åíèé. Ýòà ñèñòåìà ðàñïðåäåëåíèé ïðèìåíÿåòñÿ òàêæå äëÿ ïîäáîðà
ðàñïðåäåëåíèÿ ê ýìïèðè÷åñêèì äàííûì òîãäà, êîãäà ïî êàêèì-ëèáî ïðè÷èíàì
òðóäíî èëè íåâîçìîæíî îáîñíîâàòü òèï ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.  ýòîì ñëó÷àå ïî âûáîðêå âû÷èñëÿþòñÿ ïåðâûå ÷åòûðå ìîìåíòà, çàòåì îïðåäåëÿåòñÿ òèï ðàñïðåäåëåíèÿ Ïèðñîíà, çàòåì ìîæíî ïðîâåðèòü ñòåïåíü ñîãëàñîâàííîñòè ýìïèðè÷åñêèõ äàííûõ è ïîëó÷åííîãî ðàñïðåäåëåíèÿ Ïèðñîíà
ñ ïîìîùüþ êðèòåðèÿ Êîëìîãîðîâà–Ñìèðíîâà èëè êðèòåðèÿ χ2.
48
Часть I. Основные понятия теории вероятностей и математической статистики
Глава
2
Основные статистические
методы
Ï
ðè âûïîëíåíèè ñòàòèñòè÷åñêîãî àíàëèçà íàèáîëåå ÷àñòî â êà÷åñòâå èñõîäíîãî ìàòåðèàëà èñïîëüçóåòñÿ ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ íàáëþäåíèé
ñëó÷àéíîé âåëè÷èíû Õ. Äðóãèìè ñëîâàìè, ïðåäïîëàãàåòñÿ, ÷òî èìååòñÿ âåðîÿòíîñòíûé ýêñïåðèìåíò, â êîòîðîì íàáëþäàåòñÿ ñëó÷àéíàÿ âåëè÷èíà Õ, è âûïîëíÿåòñÿ n íåçàâèñèìûõ ðåàëèçàöèé ýòîãî ýêñïåðèìåíòà. Íàáëþäàåìûå çíà÷åíèÿ
õ1, õ2, ..., õn íàçûâàþòñÿ ñëó÷àéíîé âûáîðêîé, êîëè÷åñòâî íàáëþäåíèé n — îáúåìîì âûáîðêè. Êàê ñëó÷àéíàÿ âåëè÷èíà Õ, òàê è åå çíà÷åíèÿ ìîãóò áûòü âåêòîðàìè. Ìíîæåñòâî âîçìîæíûõ çíà÷åíèé, êîòîðûå ìîãóò íàáëþäàòüñÿ ïðè ðåàëèçàöèè
ýêñïåðèìåíòà, îáðàçóþò âûáîðî÷íîå ïðîñòðàíñòâî, èëè, â äðóãèõ òåðìèíàõ, ãåíåðàëüíóþ ñîâîêóïíîñòü. Ñ òî÷êè çðåíèÿ òåîðèè âåðîÿòíîñòåé âûáîðêà õ1, õ2, ..., õn
ÿâëÿåòñÿ ðåàëèçàöèåé íåêîòîðîé ñëó÷àéíîé âåëè÷èíû Õ. Çàäà÷è ìàòåìàòè÷åñêîé
ñòàòèñòèêè âîçíèêàþò, êîãäà ôóíêöèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ íåèçâåñòíà, ïðè ýòîì ìåòîäû ñòàòèñòè÷åñêîãî àíàëèçà ïîçâîëÿþò ïîëó÷èòü èíôîðìàöèþ î ðàçëè÷íûõ çàêîíîìåðíîñòÿõ â ãåíåðàëüíîé ñîâîêóïíîñòè.
Ïðåæäå ÷åì îïèñûâàòü çàäà÷è ñòàòèñòè÷åñêîãî àíàëèçà, îòìåòèì, ÷òî ïåðåä íåïîñðåäñòâåííûì ïðîâåäåíèåì àíàëèçà äàííûõ, êàê ïðàâèëî, âûïîëíÿåòñÿ ýòàï
ïðåäâàðèòåëüíîãî àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ. Íà ýòîì ýòàïå íåîáõîäèìî ÷åòêî îïðåäåëèòü öåëè àíàëèçà, ïîëó÷èòü è ïåðâè÷íî îáðàáîòàòü äàííûå,
îïðåäåëèòü èõ òèï è ñòðóêòóðó, ïîäîáðàòü è îáîñíîâàòü ñòàòèñòè÷åñêèå ìåòîäû,
ñ ïîìîùüþ êîòîðûõ ìîæíî äîñòè÷ü öåëåé àíàëèçà, ïîäãîòîâèòü äàííûå äëÿ ïðèìåíåíèÿ âûáðàííûõ ñòàòèñòè÷åñêèõ ìåòîäîâ è òîëüêî ïîñëå ýòîãî âûïîëíèòü íåïîñðåäñòâåííî ñòàòèñòè÷åñêèé àíàëèç äàííûõ. Ýòîò ýòàï, êðîìå ôîðìàëüíûõ ìåòîäîâ
àíàëèçà äàííûõ, ÷àñòî âêëþ÷àåò â ñåáÿ íåôîðìàëüíûå ñïîñîáû îöåíêè ýòèõ äàííûõ. Èç ñêàçàííîãî ÿñíî, ÷òî ïðåäâàðèòåëüíûé ýòàï ñòàòèñòè÷åñêîãî àíàëèçà
òðåáóåò îòäåëüíîãî ðàññìîòðåíèÿ. Êðîìå òîãî, íà ýòîì ýòàïå òàêæå ïðèìåíÿþòñÿ
ñòàòèñòè÷åñêèå ìåòîäû. Ïðåäâàðèòåëüíîìó àíàëèçó ïîñâÿùåíà ãëàâà 8. Çäåñü
æå ìû ðàññìîòðèì îáùèå ïîíÿòèÿ è ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè.
 çàâèñèìîñòè îò òîãî, êàêîâ êëàññ âîçìîæíûõ ðàñïðåäåëåíèé ãåíåðàëüíîé
ñîâîêóïíîñòè è ÷òî íóæíî çíàòü î ôóíêöèè ðàñïðåäåëåíèÿ, âîçíèêàþò ðàçëè÷íûå ñòàòèñòè÷åñêèå çàäà÷è. Ðàññìîòðèì îñíîâíûå èç íèõ.
2.1. Точечное оценивание параметров распределения
Ïðåäïîëàãàåòñÿ, ÷òî íåèçâåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ïðèíàäëåæèò íåêîòîðîìó ñåìåéñòâó ðàñïðåäåëåíèé F(u, θ), çàâèñÿùåìó îò íåêîòîðîãî ïàðàìåòðà θ
(ïàðàìåòð θ, âîçìîæíî, âåêòîðíûé, ò.å. θ = (θ1, θ2, ..., θk)); òàê, íàïðèìåð,
ñåìåéñòâî íîðìàëüíûõ ðàñïðåäåëåíèé çàâèñèò îò äâóõ ïàðàìåòðîâ — ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè. Íóæíî ïî íàáëþäåíèÿì (çíà÷åíèÿì âûáîðêè)
îöåíèòü ïàðàìåòð (èëè íåñêîëüêî ïàðàìåòðîâ).
Äëÿ ïîñòðîåíèÿ îöåíîê èñïîëüçóþòñÿ ñòàòèñòèêè — ôóíêöèè îò âûáîðî÷íûõ çíà÷åíèé. Ðàñïðîñòðàíåííûìè ïðèìåðàìè ñòàòèñòèê ÿâëÿþòñÿ:
âûáîðî÷íîå ñðåäíåå x =
1 n
∑ xi ,
n i =1
âûáîðî÷íàÿ äèñïåðñèÿ Sn2 =
1 n
∑ ( xi − x )2 ,
n i =1
âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk =
1 n k
∑ xi ,
n i =1
âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k =
1 n
∑ ( xi − x )k .
n i =1
Íèæå áóäóò ïðèâåäåíû ïðèìåðû äðóãèõ ñòàòèñòèê.
ßñíî, ÷òî íå âñÿêàÿ ñòàòèñòèêà ìîæåò ñëóæèòü îöåíêîé íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ. Ïîñêîëüêó ðåçóëüòàòû îïûòîâ ñëó÷àéíû, ëþáàÿ ñòàòèñòèêà ïðåäñòàâëÿåò ñîáîé ñëó÷àéíóþ âåëè÷èíó. ×òîáû ñòàòèñòèêà ìîãëà ñëóæèòü îöåíêîé äàííîãî ïàðàìåòðà θ, íåîáõîäèìî, ÷òîáû ðàñïðåäåëåíèå ýòîé
ñòàòèñòèêè áûëî ñîñðåäîòî÷åíî â äîñòàòî÷íîé áëèçîñòè îò íåèçâåñòíîãî çíà÷åíèÿ
ïàðàìåòðà θ, ò.å. òàê, ÷òîáû âåðîÿòíîñòü áîëüøèõ îòêëîíåíèé ýòîé ñòàòèñòèêè
îò θ áûëà äîñòàòî÷íî ìàëà. Æåëàòåëüíî òàêæå, ÷òîáû òî÷íîñòü îöåíèâàíèÿ óâåëè÷èâàëàñü ïðè óâåëè÷åíèè îáúåìà âûáîðêè.  ñâÿçè ñ ýòèì ââîäÿò ñëåäóþùèå
îïðåäåëåíèÿ, õàðàêòåðèçóþùèå îöåíêè.
Ïóñòü θ̂ n — íåêîòîðàÿ ñòàòèñòè÷åñêàÿ îöåíêà, ïîëó÷åííàÿ ïî âûáîðêå õ1,
õ2, ..., xn è îöåíèâàþùàÿ íåèçâåñòíûé ïàðàìåòð θ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Åñëè îöåíêà îïðåäåëÿåòñÿ îäíèì ÷èñëîì θ̂ n , òî åå íàçûâàþò òî÷å÷íîé; åñëè âû÷èñëÿþòñÿ äâå âåëè÷èíû, θ1n è θ2n, òàêèå, ÷òî
θ1n ≤ θ ≤ θ2n, òî òàêóþ îöåíêó äëÿ θ íàçûâàþò èíòåðâàëüíîé (èíòåðâàëüíûå
îöåíêè ðàññìîòðåíû â ñëåäóþùåì ðàçäåëå).
2.1.1. Несмещенность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ íåñìåùåííîé, åñëè ïðè ëþáîì îáúåìå âûáîðêè åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî îöåíèâàåìîìó ïàðàìåòðó θ: Ì θ̂ n = θ. Ýòî ñâîéñòâî
îçíà÷àåò, ÷òî îöåíêà θ̂ n â ñðåäíåì ïðàâèëüíî îöåíèâàåò íåèçâåñòíûé ïàðàìåòð θ;
ò.å. åñëè åñòü íåêîòîðîå ìíîæåñòâî îöåíîê äàííîãî ïàðàìåòðà (çíà÷åíèÿ îäíîé è
òîé æå ñòàòèñòèêè), òî ñðåäíåå ýòèõ îöåíîê áóäåò ñîâïàäàòü ñ èñòèííûì çíà÷åíèåì ïàðàìåòðà èëè áóäåò ê íåìó áëèçêî.
Îòìåòèì, ÷òî âñå âûáîðî÷íûå íà÷àëüíûå ìîìåíòû, âêëþ÷àÿ âûáîðî÷íîå
ñðåäíåå, ÿâëÿþòñÿ íåñìåùåííûìè îöåíêàìè ñîîòâåòñòâóþùèõ ìîìåíòîâ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îäíàêî âûáîðî÷íàÿ äèñïåðñèÿ Sn2 ÿâëÿåòñÿ
50
Часть I. Основные понятия теории вероятностей и математической статистики
ñìåùåííîé (êàê è äðóãèå öåíòðàëüíûå âûáîðî÷íûå ìîìåíòû): íåòðóäíî ïîêàçàòü, ÷òî MS n2 =
n −1
DX . Íî ïîñêîëüêó ïðè n → ∞ ÌSn2 → DX, îöåíêó Sn2 íàçûn
âàþò àñèìïòîòè÷åñêè íåñìåùåííîé. Åñëè íåìíîãî èçìåíèòü ñòàòèñòèêó Sn2, òî
íîâàÿ îöåíêà äèñïåðñèè áóäåò íåñìåùåííîé:
sn2 =
n 2
1 n
Sn =
∑ ( xi − x )2 .
n −1
n − 1 i =1
Îòìåòèì òàêæå, ÷òî äëÿ íåñìåùåííûõ îöåíîê âåëè÷èíà Ì( θ̂ n – θ)2 ñîâïàäàåò
ñ äèñïåðñèåé ñòàòèñòèêè θ̂ n .
2.1.2. Эффективность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ ýôôåêòèâíîé, åñëè èìååò íàèìåíüøóþ äèñïåðñèþ ñðåäè âñåõ âîçìîæíûõ îöåíîê ïàðàìåòðà θ ïðè ôèêñèðîâàííîì îáúåìå âûáîðêè n.
Ýôôåêòèâíîñòü îöåíêè îáåñïå÷èâàåò íàèìåíüøèé ðàçáðîñ âîçìîæíûõ çíà÷åíèé
îöåíêè θ̂ n âîêðóã èñòèííîãî çíà÷åíèÿ ïàðàìåòðà θ.
Ýôôåêòèâíîñòü îöåíîê ñèëüíî çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè1. Òàê, åñëè ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå,
òî âûáîðî÷íûå ñðåäíåå è äèñïåðñèÿ áóäóò ýôôåêòèâíûìè îöåíêàìè.
2.1.3. Состоятельность оценки
Îöåíêà θ̂ n íàçûâàåòñÿ ñîñòîÿòåëüíîé, åñëè ïðè íåîãðàíè÷åííîì ðîñòå îáúåìà
âûáîðêè äëÿ ïðîèçâîëüíîãî ε > 0
P(| θ̂ n – θ| > ε) → 0 ïðè n → ∞,
èëè, êàê ãîâîðÿò, θ̂ n ñòðåìèòñÿ ê θ ïî âåðîÿòíîñòè ïðè n → ∞.
Ïîíÿòèÿ ñîñòîÿòåëüíîñòè îöåíêè è íåñìåùåííîñòè (òî÷íåå, àñèìïòîòè÷åñêîé
íåñìåùåííîñòè) òåñíî ñâÿçàíû: åñëè îöåíêà θ̂ n ÿâëÿåòñÿ ñîñòîÿòåëüíîé, òî îíà
àñèìïòîòè÷åñêè íåñìåùåííàÿ. Îáðàòíîå óòâåðæäåíèå íå âåðíî, ò.å. ñâîéñòâî ñîñòîÿòåëüíîñòè ÿâëÿåòñÿ áîëåå ñèëüíûì, ÷åì óñëîâèå íåñìåùåííîñòè.
Îòìåòèì, ÷òî âûáîðî÷íîå ñðåäíåå è âûáîðî÷íàÿ äèñïåðñèÿ ÿâëÿþòñÿ ñîñòîÿòåëüíûìè îöåíêàìè. Íèæå áóäóò ïðèâåäåíû ïðèìåðû âûáîðî÷íûõ ñòàòèñòèê,
êîòîðûå ÷àñòî èñïîëüçóþòñÿ â ñòàòèñòè÷åñêîì àíàëèçå, âìåñòå ñ èíòåðâàëüíûìè
îöåíêàìè ïàðàìåòðîâ ðàñïðåäåëåíèé, êîòîðûå ñåé÷àñ ðàññìîòðèì.
1
Òî÷íåå, ýôôåêòèâíîñòü îöåíîê îáû÷íî äîêàçûâàåòñÿ (èëè, èíà÷å ãîâîðÿ, ñòðîÿòñÿ ýôôåêòèâíûå îöåíêè) íà îñíîâå ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, â êîòîðîì ôóíêöèÿ ïðàâäîïîäîáèÿ îïðåäåëÿåòñÿ èñõîäÿ èç ïðåäïîëîæåíèÿ, ÷òî èçâåñòåí êëàññ ðàñïðåäåëåíèé, êîòîðîìó
ïðèíàäëåæèò ðàñïðåäåëåíèå äàííîé ãåíåðàëüíîé ñîâîêóïíîñòè.
Глава 2. Основные статистические методы
51
2.2. Интервальное оценивание параметров
распределения
Òî÷å÷íûå îöåíêè èìåþò òîò íåäîñòàòîê, ÷òî ïî íèì íåëüçÿ ñóäèòü î òî÷íîñòè
ïîëó÷åííûõ îöåíîê. Ïîýòîìó âîçíèêàåò çàäà÷à îïðåäåëåíèÿ íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé òàêîãî èíòåðâàëà (θ1, θ2), êîòîðûé ïîêðûâàë áû íåèçâåñòíîå
çíà÷åíèå ïàðàìåòðà θ ñ çàäàííîé âåðîÿòíîñòüþ.
Ïóñòü Ð(θ1 ≤ θ ≤ θ2) = α, ãäå ñëó÷àéíûé èíòåðâàë (θ1, θ2), êîòîðûé íàçûâàåòñÿ
äîâåðèòåëüíûì èíòåðâàëîì, ñ çàäàííîé âåðîÿòíîñòüþ α ñîäåðæèò îöåíèâàåìûé
ïàðàìåòð θ. Âåëè÷èíó α íàçûâàþò äîâåðèòåëüíûì óðîâíåì èëè íàäåæíîñòüþ.
Âåëè÷èíà δ = (θ1 – θ2)/2 õàðàêòåðèçóåò òî÷íîñòü èíòåðâàëüíîé îöåíêè. Îáû÷íî
âåëè÷èíó α áåðóò ðàâíîé 0,95, 0,99 èëè 0,999. Âåëè÷èíó 1 – α íàçûâàþò óðîâíåì çíà÷èìîñòè îòêëîíåíèÿ îöåíêè. Êîíöû äîâåðèòåëüíîãî èíòåðâàëà θ1 è θ2
íàçûâàþò äîâåðèòåëüíûìè ãðàíèöàìè.
Îäèí èç ðàñïðîñòðàíåííûõ ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ çàêëþ÷àåòñÿ â ñëåäóþùåì. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåòñÿ íåñìåùåííàÿ
òî÷å÷íàÿ îöåíêà θ̂ n ïàðàìåòðà θ. Íàïîìíèì, ÷òî îöåíêà (ñòàòèñòèêà) θ̂ n ÿâëÿåòñÿ
ñëó÷àéíîé âåëè÷èíîé. Êàêèì-ëèáî ñïîñîáîì âû÷èñëÿåòñÿ äèñïåðñèÿ ñòàòèñòèêè θ̂ n
èëè
åå
îöåíêà
σ̂ 2n . Çàòåì ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà ( θ̂ n –
k1 σ̂ n , θ̂ n + k2 σ̂ n ), ãäå k1 è k2 — êîýôôèöèåíòû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþò
âûáðàííûé äîâåðèòåëüíûé óðîâåíü è àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè
ãåíåðàëüíîé ñîâîêóïíîñòè (íàïðèìåð, íîðìàëüíîñòü èëè ñèììåòðè÷íîñòü ðàñïðåäåëåíèÿ). Íî ïîñêîëüêó òàêîé èíòåðâàë îïðåäåëÿåòñÿ íå îäíîçíà÷íî, íàêëàäûâàåòñÿ äîïîëíèòåëüíîå óñëîâèå, ÷òîáû äàííûé èíòåðâàë èìåë ìèíèìàëüíóþ äëèíó.
Åñëè ðàñïðåäåëåíèå ñòàòèñòèêè θ̂ n ñèììåòðè÷íî (èëè áëèçêî ê ñèììåòðè÷íîìó),
òî â ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë ìèíèìàëüíîé äëèíû ïîëó÷àåòñÿ ïðè
k1 = k2. Íà òàêîé îñíîâå ñòðîèòñÿ, â ÷àñòíîñòè, èçâåñòíûé êðèòåðèé Ñòüþäåíòà
(ñì. íèæå) äëÿ íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé. Â ñàìîì
îáùåì ñëó÷àå (ïðè ìèíèìàëüíûõ ïðåäïîëîæåíèÿõ îòíîñèòåëüíî ðàñïðåäåëåíèÿ
ãåíåðàëüíîé ñîâîêóïíîñòè) äîâåðèòåëüíûå èíòåðâàëû ìîæíî ïîñòðîèòü íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà èëè äðóãèõ ïîäîáíûõ íåðàâåíñòâ (ñì. ðàçäåë 1.2.4).
Îäíàêî òàêèå èíòåðâàëüíûå îöåíêè èìåþò íåáîëüøóþ òî÷íîñòü.
Âàæíóþ ðîëü ïðè ïîñòðîåíèè òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê èãðàþò èõ àñèìïòîòè÷åñêèå ñâîéñòâà. ×àñòî ÿâíî èëè íå ÿâíî èñïîëüçóåòñÿ ñëåäóþùàÿ äîñòàòî÷íî
îáùàÿ ñõåìà ðàññóæäåíèé [6, ñ. 371]. Ïóñòü èìåþòñÿ íåçàâèñèìûå îäèíàêîâî ðàñïðåäåëåííûå âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn, êîòîðûå ÿâëÿþòñÿ ðåàëèçàöèåé
ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u). Òðåáóåòñÿ ïî âûáîðêå îöåíèòü ìàòåìàòè÷åñêîå îæèäàíèå G = MY = ∫ g (u )dF (u ) ñëó÷àéíîé âåëè÷èíû
Y = g(X). (Åñòåñòâåííî ïðåäïîëîæåíèå î òîì, ÷òî ôóíêöèÿ g òàêîâà, ÷òî ñëó÷àéíàÿ
âåëè÷èíà Y èìååò êîíå÷íûé ïåðâûé ìîìåíò.) Ñòàòèñòèêà Gˆ n , îöåíèâàþùàÿ çíà÷åíèå âåëè÷èíû G, âû÷èñëÿåòñÿ ïî ôîðìóëå Gˆ n =
52
1 n
∑ g ( xi ) . Ýòà îöåíêà íåñìåùåíà:
n i =1
Часть I. Основные понятия теории вероятностей и математической статистики
1 n
1 n
1 n
MGˆ n = ∑ Mg ( xi ) = ∑ Mg (X) = ∑ MY = G.
n i =1
n i =1
n i =1
Ïî óñèëåííîìó çàêîíó áîëüøèõ ÷èñåë îíà òàêæå ñîñòîÿòåëüíà2, ò.å. ñ âåðîÿòíîñòüþ 1 ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Gˆ ñõîäèòñÿ ê çíà÷åíèþ G. Åñn
ëè åùå ïîòðåáîâàòü, ÷òîáû ñóùåñòâîâàëà äèñïåðñèÿ DY = σ2, òî èç öåíòðàëüíîé
ïðåäåëüíîé òåîðåìû äëÿ ñóììû îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ ñëàãàåìûõ ñëåäóåò, ÷òî ñëó÷àéíàÿ âåëè÷èíà
Zn =
n ˆ
1 n g ( xi ) − G
(Gn − G ) =
∑ σ
σ
n i =1
àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1). Îòñþäà âûòåêàåò, ÷òî ïðè
áîëüøèõ n íåðàâåíñòâî
σ
σ
Gˆ n − α
< G < Gˆ n + α
n
n
âûïîëíÿåòñÿ ñ âåðîÿòíîñòüþ pα =
2
2π
∫
α
0
−
e
u2
2
du = 2Ô(α) – 1, ãäå Ô(u) — ôóíêöèÿ
ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ïðè çàäàííîì çíà÷åíèè âåðîÿòíîñòè ðα èç ïîñëåäíåãî ðàâåíñòâà îïðåäåëÿåòñÿ çíà÷åíèå α, â ðåçóëüòàòå ïîëó÷àåì äîâåðèòåëüíûé èíòåðâàë
 ˆ
σ ˆ
σ 
, Gn + α
 Gn − α
,
n
n

êîòîðûé ñîäåðæèò îöåíèâàåìîå çíà÷åíèå G ñ âåðîÿòíîñòüþ ðα.
Ïîñòðîåííàÿ èíòåðâàëüíàÿ îöåíêà íå âñåãäà ïðèìåíèìà íà ïðàêòèêå, ïîñêîëüêó çíà÷åíèå äèñïåðñèè σ2 ìîæåò áûòü íåèçâåñòíûì. Îäíàêî ïðè áîëüøèõ
n, èñõîäÿ èç òåõ æå ñîîáðàæåíèé, êîòîðûå èçëîæåíû âûøå, èìååì
DY = σ 2 ≈
1 n
∑ ( g ( xi ) − Gˆ n )2 = Sn2 .
n i =1
Îøèáêà, âîçíèêàþùàÿ ïðè çàìåíå â ïðèâåäåííûõ âûøå ôîðìóëàõ âåëè÷èíû σ
åå îöåíêîé Sn, èìååò áîëåå âûñîêèé ïîðÿäîê ìàëîñòè (ïðè n → ), ÷åì îøèáêà,
âîçíèêàþùàÿ ïðè çàìåíå òî÷íîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Zn íîðìàëüíûì ðàñïðåäåëåíèåì. Ïîýòîìó “áåç çàçðåíèÿ ñîâåñòè” â êà÷åñòâå äîâåðèòåëüíîãî èíòåðâàëà äëÿ èñòèííîãî çíà÷åíèÿ G ìîæíî èñïîëüçîâàòü èíòåðâàë
Sn ˆ
S 
 ˆ
, Gn + α n  .
 Gn − α
n
n

Åñëè îäíîâðåìåííî îöåíèâàþòñÿ íåñêîëüêî ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, òî èíîãäà âîçìîæíî ïîñòðîåíèå ìíîãîìåðíûõ (ðàçìåðíîñòü ïî ÷èñëó îöåíèâàåìûõ ïàðàìåòðîâ) äîâåðèòåëüíûõ îáëàñòåé, êîòîðûå ñîäåðæàò íåèçâåñòíûå
çíà÷åíèÿ ïàðàìåòðîâ. Îäíàêî ïîñòðîåíèå òàêèõ îáëàñòåé âûçûâàåò îïðåäåëåííûå
çàòðóäíåíèÿ, ïîñêîëüêó ñòàòèñòèêè, îöåíèâàþùèå ïàðàìåòðû, íå ÿâëÿþòñÿ íåçàâèñèìûìè ñëó÷àéíûìè âåëè÷èíàìè (ïîýòîìó íåëüçÿ ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü ïðîñòî êàê ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ îòäåëüíûõ ïàðàìåòðîâ).
2
Òî÷íåå, îíà ñèëüíî ñîñòîÿòåëüíà.
Глава 2. Основные статистические методы
53
Âìåñòå ñ òåì, åñëè óäàåòñÿ ïîñòðîèòü òàêóþ äîâåðèòåëüíóþ îáëàñòü, êàê ïðàâèëî, îíà çíà÷èòåëüíî áîëåå òî÷íî ëîêàëèçóåò çíà÷åíèÿ íåèçâåñòíûõ ïàðàìåòðîâ
ðàñïðåäåëåíèÿ, ÷åì ïðîñòîå ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ.  ýòîé êíèãå ìû íå áóäåì ðàññìàòðèâàòü ìíîãîìåðíûå äîâåðèòåëüíûå îáëàñòè.
2.3. Выборочные статистики и интервальные оценки
Ïðèâåäåì ïðèìåðû ñòàòèñòèê è äîâåðèòåëüíûå èíòåðâàëû äëÿ íèõ, êîòîðûå
íàõîäÿò íàèáîëüøåå ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå.  ïîñëåäóþùèõ ÷àñòÿõ êíèãè áóäåò ïîêàçàíà èõ ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ñ èñïîëüçîâàíèåì ñòàòèñòè÷åñêèõ ôóíêöèé èëè ñðåäñòâ Excel.
Ïîñêîëüêó ñâîéñòâà ýòèõ ñòàòèñòèê, è îñîáåííî ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ, çàâèñÿò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ïðè èõ
îïèñàíèè íåîáõîäèìî óêàçûâàòü ñòàòèñòè÷åñêóþ ìîäåëü, â ðàìêàõ êîòîðîé ïðèìåíèìû äàííûå ñòàòèñòèêè è äîâåðèòåëüíûå èíòåðâàëû. Ñòàòèñòè÷åñêàÿ ìîäåëü
îïèñûâàåò àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè,
òðåáîâàíèÿ ê âûáîðî÷íûì çíà÷åíèÿì (íàïðèìåð, èõ íåçàâèñèìîñòü èëè ìèíèìàëüíûé îáúåì âûáîðêè) è, âîçìîæíî, ñïîñîá ïðåäñòàâëåíèÿ äàííûõ. Ñòàòèñòè÷åñêèå
ìîäåëè ìîãóò áûòü ðàçëè÷íûìè äëÿ òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê. Äàëåå
â ýòîì ðàçäåëå ïðåäïîëàãàåòñÿ, ÷òî, åñëè íå óêàçàíî äðóãîå, âñå âûáîðî÷íûå çíà÷åíèÿ íåçàâèñèìû è èìåþò îäèíàêîâîå ðàñïðåäåëåíèå, ò.å. òðåáîâàíèå íåçàâèñèìîñòè
âûáîðî÷íûõ çíà÷åíèé âêëþ÷àåòñÿ â ñòàòèñòè÷åñêóþ ìîäåëü îáÿçàòåëüíî.
Åñëè êîíêðåòíàÿ âûáîðêà íå ñîîòâåòñòâóåò îïðåäåëåííîé ñòàòèñòè÷åñêîé ìîäåëè, íî âñå ðàâíî íà îñíîâå äàííîé âûáîðêè âû÷èñëÿþòñÿ êàêèå-ëèáî îöåíêè, îïðåäåëÿåìûå â ðàìêàõ òîëüêî ýòîé ñòàòèñòè÷åñêîé ìîäåëè, òî âåñüìà âåðîÿòíî, ÷òî òå
âûâîäû, êîòîðûå ìîæíî ñäåëàòü íà îñíîâå ïîëó÷åííûõ îöåíîê, îêàæóòñÿ îøèáî÷íûìè. Çàìåòèì, ÷òî ñòàòèñòè÷åñêèé àíàëèç âûïîëíÿåòñÿ íå ïðîñòî èç-çà ëþáâè
ê âû÷èñëåíèÿì, à äëÿ îïðåäåëåííûõ öåëåé, ñðåäñòâîì äîñòèæåíèÿ êîòîðûõ ñëóæèò
ñòàòèñòè÷åñêèé àíàëèç. Ïðè÷èíîé áîëüøèíñòâà íåâåðíûõ ñòàòèñòè÷åñêèõ âûâîäîâ,
êîòîðûå âåñüìà ÷àñòî ìîæíî âñòðåòèòü íà ïðàêòèêå, ÿâëÿåòñÿ íåïðàâîìåðíîå
ïðèìåíåíèå îöåíîê (è ñòàòèñòè÷åñêèõ êðèòåðèåâ, î êîòîðûõ ñêàçàíî íèæå) â ñèòóàöèè, êîãäà âûáîðêà íå óäîâëåòâîðÿåò óñëîâèÿì ñòàòèñòè÷åñêîé ìîäåëè.
Ñ äðóãîé ñòîðîíû, ÷àñòî ìîæíî ïðåíåáðå÷ü óìåðåííûìè îòêëîíåíèÿìè îò óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è ïîïûòàòüñÿ ïðèìåíèòü îöåíêè äàííîé ìîäåëè.
Ïîýòîìó ïðè îïèñàíèè îöåíîê áóäåì ïîêàçûâàòü âîçìîæíîñòü îñëàáëåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è óêàçûâàòü ñòåïåíü îòêëîíåíèÿ îò ìîäåëè, ïðè êîòîðîé ñòàòèñòèêè ñîõðàíÿþò ñâîè ñâîéñòâà.
Ñäåëàåì åùå îäíî çàìå÷àíèå. Çäåñü ìû íå ðàññìàòðèâàåì ìåòîäû ïîñòðîåíèÿ
îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ. Ìû ïðèâîäèì òîëüêî ãîòîâûå ôîðìóëû è ðåêîìåíäàöèè ïî èõ ïðèìåíåíèþ. ×èòàòåëü, êîòîðûé õî÷åò ïîáëèæå ïîçíàêîìèòüñÿ
ñ ìåòîäàìè ïîñòðîåíèÿ îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ, ìîæåò îáðàòèòüñÿ ê
ìíîãî÷èñëåííûì èçäàíèÿì ïî äàííîìó âîïðîñó, ñðåäè êîòîðûõ âûäåëèì [5, 6, 17].
2.3.1. Статистика для оценивания математического ожидания
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íîå ìàòåìàòè÷åñêîå îæèäàíèå. Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè
54
Часть I. Основные понятия теории вероятностей и математической статистики
êîíå÷íîãî âòîðîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Çäåñü
è äàëåå, åñëè íå óêàçàíî äðóãîå, n — îáúåì âûáîðêè.
Ñòàòèñòèêà äëÿ îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ:
x=
1 n
∑ xi .
n i =1
Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå äèñïåðñèÿ: Dx =
DX
,
n
ãäå DX — äèñïåðñèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îòìåòèì òàêæå,
÷òî êîýôôèöèåíò àñèììåòðèè β1 ( x ) ðàñïðåäåëåíèÿ ñòàòèñòèêè x ñâÿçàí ñ êîýôôèöèåíòîì àñèììåòðèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè β1 (X) (ñì. ðàçäåë 1.2.3) çàâèñèìîñòüþ β1 ( x ) =
β1 (X)
n
.
Интервальные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íîé èçâåñòíîé äèñïåðñèåé σ2.
Ýòî íàèáîëåå îáùàÿ ñòàòèñòè÷åñêàÿ ìîäåëü.  ðàìêàõ òàêîé ìîäåëè äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ìîæíî ïîñòðîèòü
òîëüêî íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà (ñì. ðàçäåë 1.2.4), êîòîðîå â äàííîì
ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k
σ
n
) ≤ 1−
1
. Êîýôôèöèåíò k íàõîäèòñÿ
k2
â ñîîòâåòñòâèè ñ çàäàííûì äîâåðèòåëüíûì óðîâíåì α èç ðàâåíñòâà α = 1 – 1/k2:

σ
σ 
,x +k
k = 1/ 1 − α . Äîâåðèòåëüíûé èíòåðâàë áóäåò èìåòü âèä  x − k
.
n
n

Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñèììåòðè÷íîå îäíîìîäàëüíîå ðàñïðåäåëåíèå ñ èçâåñòíîé êîíå÷íîé äèñïåðñèåé σ2.
 ýòîé ñòàòèñòè÷åñêîé ìîäåëè ðàñïðåäåëåíèå ñòàòèñòèêè x òàêæå áóäåò ñèììåòðè÷íûì è îäíîìîäàëüíûì3. Ïîýòîìó äëÿ ïîñòðîåíèÿ èíòåðâàëüíûõ îöåíîê
ìîæíî âîñïîëüçîâàòüñÿ íåðàâåíñòâîì Ãàóññà, êîòîðîå â äàííîì ñëó÷àå áóäåò
èìåòü âèä P(| x − MX | ≤ k
k=
3
2 1− α
σ
n
) ≤ 1−
4
. Çíà÷åíèå k çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå
9k 2
, ãäå α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, à äîâåðèòåëüíûé èíòåð-

σ

n
âàë èìååò âèä  x − k
,x +k
σ 
.
n
Ñòàòèñòè÷åñêàÿ ìîäåëü 3. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì è íåèçâåñòíîé äèñïåðñèåé. Îáúåì âûáîðêè n áîëüøå 30.
3
Ê ñîæàëåíèþ, â ýòîé ìîäåëè íåëüçÿ îñâîáîäèòüñÿ îò óñëîâèÿ ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ, ïîñêîëüêó, êàê èçâåñòíî, ñâåðòêà îäíîìîäàëüíûõ ðàñïðåäåëåíèé íå îáÿçàíà áûòü îäíîìîäàëüíûì ðàñïðåäåëåíèåì. Äðóãèìè ñëîâàìè, åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè
îäíîìîäàëüíî, òî ðàñïðåäåëåíèå
x
íå âñåãäà áóäåò îäíîìîäàëüíûì.
Глава 2. Основные статистические методы
55
 äàííîé ìîäåëè ìîæíî ïîñòðîèòü èíòåðâàëüíûå îöåíêè, îñíîâûâàÿñü íà àñèìïòîòè÷åñêèõ ñâîéñòâàõ ñòàòèñòèêè x (ñì. ðàçäåë 2.2). Ñäåëàåì îáùåå çàìå÷àíèå
î òîì, êàêîé îáúåì âûáîðêè ñ÷èòàòü äîñòàòî÷íûì, ÷òîáû ïðèìåíÿòü àñèìïòîòè÷åñêèå îöåíêè.  ëèòåðàòóðå ïî ïðèêëàäíîé ñòàòèñòèêå îáû÷íî óêàçûâàåòñÿ, ÷òî äëÿ
ýòîãî äîñòàòî÷íî, ÷òîáû n áûëî áîëüøå 20, 25 èëè 30. Òî÷íóþ íèæíþþ ãðàíèöó
äëÿ n îïðåäåëèòü ñëîæíî, ïîñêîëüêó îíà çàâèñèò îò ìíîãèõ ôàêòîðîâ, ïðåæäå âñåãî îò òèïà ðàñïðåäåëåíèÿ.  òåîðèè âåðîÿòíîñòåé ïîêàçàíî (íåðàâåíñòâî ÁåððèÝññååíà è ïîäîáíûå), ÷òî ñêîðîñòü ñõîäèìîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè x ê íîðìàëüíîìó â ðàâíîìåðíîé ìåòðèêå (è äàæå â èíòåãðàëüíûõ ìåòðèêàõ) èìååò ïîðÿ-
 1 
 è ýòîò ïîðÿäîê íåëüçÿ óëó÷øèòü, íå ââîäÿ äîïîëíèòåëüíûõ ïðåäïî n
äîê O 
ëîæåíèé. Îòñþäà ñëåäóåò, ÷òî çíà÷åíèå n äîëæíî áûòü äîñòàòî÷íî áîëüøèì (õîòÿ
áû áîëüøå 100). Îäíàêî íà ïðàêòèêå óæå ïðè n ≥ 20 ïîëó÷àþòñÿ äîñòàòî÷íî òî÷íûå îöåíêè.  äàëüíåéøåì, åñëè íå îãîâîðåíî äðóãîå, áóäåì ïðèìåíÿòü àñèìïòîòè÷åñêèå ìåòîäû, êîãäà n ≥ 30. Îäíàêî ñëåäóåò ïîìíèòü, ÷òî êàêîé áû íå áûë îáúåì âûáîðêè, àñèìïòîòè÷åñêèå îöåíêè — ýòî âñåãäà òîëüêî ïðèáëèæåííûå îöåíêè.
Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ íà îñíîâå
àñèìïòîòè÷åñêîé íîðìàëüíîñòè îöåíîê, êàê ïîêàçàíî â ðàçäåëå 2.2. Äîâåðèòåëü-

Sn

n
íûé èíòåðâàë èìååò âèä  x − k
,x +k
Sn 
 , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç
n
óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ
ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
Îòìåòèì, ÷òî ïðèìåíåíèå âìåñòî íîðìàëüíîãî ðàñïðåäåëåíèÿ ðàñïðåäåëåíèÿ
Ñòüþäåíòà ðàñøèðÿåò äîâåðèòåëüíûé èíòåðâàë, òåì ñàìûì ïîâûøàÿ åãî íàäåæíîñòü. Ïîýòîìó íà ïðàêòèêå îáû÷íî ïðèìåíÿþò äîâåðèòåëüíûé èíòåðâàë, ïîñòðîåííûé ñ ïîìîùüþ ðàñïðåäåëåíèÿ Ñòüþäåíòà, êàê ïîêàçàíî â ðàçäåëå 2.3.6.
Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ êîíêðåòíûõ
ðàñïðåäåëåíèé áóäóò ïîêàçàíû íèæå.
2.3.2. Статистика для оценивания дисперсии
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íóþ äèñïåðñèþ.
Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè êîíå÷íîãî ÷åòâåðòîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
Ñòàòèñòèêà äëÿ îöåíêè äèñïåðñèè DX:
âûáîðî÷íàÿ äèñïåðñèÿ Sn2 =
1 n
∑ ( xi − x )2 ,
n i =1
ãäå n — îáúåì âûáîðêè.
Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî MSn2 =
56
n −1
DX , äèñïåðñèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå
n
Часть I. Основные понятия теории вероятностей и математической статистики
DS n2 =
µ 4 − µ 22 2(µ 4 − 2µ 22 ) µ 4 − 3µ 22 µ 4 − µ 22
 1
−
+
=
+ O 2
n
n2
n3
n
n

,

ãäå µr — r-é öåíòðàëüíûé ìîìåíò ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðèâåäåì òàêæå
ôîðìóëû äëÿ òðåòüåãî öåíòðàëüíîãî ìîìåíòà ñòàòèñòèêè S n2 è åå êîýôôèöèåíòà
àñèììåòðèè β1 ( S n2 ) (ñì. ðàçäåë 1.2.3):
M(Sn2 − MS n2 )3 =
β1 (Sn2 ) =
Íåñìåùåííîé
îöåíêîé
µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32
 1
+ O 3  ,
2
n
n 
µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32
(µ 4 − µ )n
2
2
äëÿ
 1
+ O  3/ 2
n
äèñïåðñèè

.

DX
áóäåò
ñòàòèñòèêà
µ −µ
1
 1 
+ O 2  .
( xi − x ) 2 , äèñïåðñèÿ êîòîðîé èìååò ïîðÿäîê Dsn2 = 4
∑
n − 1 i =1
n
n 
2
2
Ðàçëè÷èå ìåæäó îöåíêàìè S n è sn èìååò çíà÷åíèå òîëüêî ïðè î÷åíü ìàëûõ
sn2 =
2
2
n
çíà÷åíèÿõ n. Ïðè n > 10 ðàçíîñòü ìåæäó íèìè ìåíüøå 10%.
Ïðèâåäåì åùå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè îöåíêè ñðåäíåêâàäðàòè÷íîãî
îòêëîíåíèÿ Sn:
µ − µ 22
1
 1 
+ O 2  .
MSn = σ + O   è DS n = 4
4µ 2 n
n
n 
Интервальные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì. Îáúåì âûáîðêè — íå ìåíåå 50.
Åñëè íåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîé äèñïåðñèè ÿâëÿåòñÿ èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè
ðàñïðåäåëåíèÿ ñòàòèñòèê äëÿ âû÷èñëåíèÿ ìîìåíòîâ ãåíåðàëüíîé ñîâîêóïíîñòè.
 ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë èìååò âèä
(S
2
n
− kσ( S n2 ), Sn2 + kσ( Sn2 ) ) , ãäå
êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå σ(S n2 ) ñòàòèñòèêè S n2 âû÷èñëÿåòñÿ ïî ôîð-
µ 4 − S 22
1 n
, ãäå µ 4 = ∑ ( xi − x )4 4.
n i =1
n
Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ äèñïåðñèè êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò
ïîêàçàíû íèæå.
ìóëå σ(S n2 ) =
4
Ïî ýòîé ôîðìóëå âû÷èñëÿåòñÿ ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå ñòàòèñòèêè Sn2 ñ òî÷íîñòüþ
O (1/ n ) . Ìîæíî èñïîëüçîâàòü áîëåå òî÷íóþ ôîðìóëó, íî, êàê ïðàâèëî, ýòîãî íå òðåáóåòñÿ.
Глава 2. Основные статистические методы
57
2.3.3. Статистики для оценивания моментов
Точечные оценки для начальных моментов
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà.
Ñòàòèñòèêà äëÿ îöåíêè íà÷àëüíîãî ìîìåíòà mk ïîðÿäêà k:
âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk =
1 n k
∑ xi .
n i =1
Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Ðàñïðåäåëåíèå ñòàòèñòèêè mk àñèìïòîòè÷åñêè íîðìàëüíî. Åå äèñïåðñèÿ: Dmk =
m2 k − mk2
.
n
Точечные оценки для центральных моментов
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà.
Ñòàòèñòèêà äëÿ îöåíêè öåíòðàëüíîãî ìîìåíòà µk ïîðÿäêà k:
âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k =
1 n
( xi − x ) k .
∑
n i =1
Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ: Ì µ k = µk + Î(n–1). Åå äèñïåðñèÿ:
µ 2 k − 2kµ k −1µ k +1 − µ k2 + k 2 µ 2 µ 2k −1
 1 
+ O 2  .
n
n 
Èíòåðâàëüíûå îöåíêè äëÿ ìîìåíòîâ âûøå âòîðîãî ïîðÿäêà ñòðîÿòñÿ ðåäêî.
Åñëè íå äåëàòü ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè,
òî äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíûõ ìîìåíòîâ ìîæíî ïîñòðîèòü òîëüêî
íà îñíîâå èõ àñèìïòîòè÷åñêîé íîðìàëüíîñòè ïðè äîñòàòî÷íî áîëüøèõ çíà÷åíèÿõ n.
Dµ k =
2.3.4. Статистики для оценивания коэффициентов
асимметрии и эксцесса
Точечные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ÷åòâåðòîãî ïîðÿäêà.
Íàïîìíèì, ÷òî êîýôôèöèåíò àñèììåòðèè âû÷èñëÿåòñÿ ïî ôîðìóëå β1 = µ3/µ23/2,
à êîýôôèöèåíò ýêñöåññà — ïî ôîðìóëå β2 = µ4/µ22 – 3, ãäå µk — öåíòðàëüíûå ìîìåíòû ïîðÿäêà k (ñì. ðàçäåë 1.2.3). Äëÿ ïîëó÷åíèÿ îöåíîê ýòèõ êîýôôèöèåíòîâ
âû÷èñëÿþòñÿ âûáîðî÷íûå öåíòðàëüíûå ìîìåíòû µ k =
1 n
∑ ( xi − x )k , êîòîðûå çàòåì
n i =1
ïîäñòàâëÿþòñÿ â ïðèâåäåííûå ôîðìóëû âìåñòî µk. Ïîëó÷àåì îöåíêè:
β1 =
58
µ3
µ
3
2
,
β2 =
µ4
−3.
µ 22
Часть I. Основные понятия теории вероятностей и математической статистики
Ýòè îöåíêè ñîñòîÿòåëüíûå è àñèìïòîòè÷åñêè íåñìåùåííûå: M β1 = β1 + O(n −1 ) ,
M β2 = β 2 + O (n −1 ) . Îòìåòèì òàêæå, ÷òî D β1 =
d=
d
 1
+ O  3/ 2
n
n

 , ãäå

4µ 22 µ 6 − 12µ 2 µ 3µ 5 − 24µ 32 µ 4 + 9µ 32 µ 4 + 35µ 32 µ 32 + 36µ 52
.
4µ 52
Åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñèììåòðè÷íî, òî
d=
4µ 22 µ 6 − 24µ 32 µ 4 + 36µ 52
.
4µ 52
Îòìåòèì òàêæå, ÷òî íà ïðàêòèêå, åñëè âûáîðî÷íîå ðàñïðåäåëåíèå áëèçêî
ê íîðìàëüíîìó, äëÿ îöåíêè ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé s1 è s2 êîýôôèöèåíòîâ β1 è β2 èñïîëüçóþò ôîðìóëû
s1 =
6(n − 2)
24n(n − 2)(n − 3)
, s2 =
.
(n + 1)(n + 3)
(n + 1)2 (n + 3)(n + 5)
 ðàçäåëå 9.2 ïîêàçàíî ïðàêòè÷åñêîå ïðèìåíåíèå êîýôôèöèåíòîâ β1 è β2 äëÿ
ïîäáîðà ôóíêöèé ðàñïðåäåëåíèé.
2.3.5. Статистика для оценивания медианы
Точечная оценка
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè.
Íàïîìíèì, ÷òî ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2.
Òî÷å÷íàÿ îöåíêà äëÿ ìåäèàíû ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
Íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé ñòðîèòñÿ âàðèàöèîííûé ðÿä, ò.å. çíà÷åíèÿ õ1, õ2, ..., õn ðàñïîëàãàþòñÿ â ïîðÿäêå âîçðàñòàíèÿ. Ïîëó÷àåì ïîñëåäîâàòåëüíîñòü õ(1) ≤ õ(2) ≤ ... ≤ õ(n), êîòîðàÿ íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì (î âàðèàöèîííîì ðÿäå ðå÷ü èäåò íèæå, â ðàçäåëå 2.3.9). Åñëè îáúåì âûáîðêè n —
íå÷åòíîå ÷èñëî, ò.å. n = 2k + 1, òî â êà÷åñòâå îöåíêè ìåäèàíû âûáèðàåòñÿ çíà÷åíèå õ(k) èç âàðèàöèîííîãî ðÿäà. Åñëè n ÷åòíîå, ò.å. n = 2k , òî â êà÷åñòâå
îöåíêè ìåäèàíû âûáèðàåòñÿ ïîëóñóììà çíà÷åíèé õ(k) è õ(k+1) âàðèàöèîííîãî ðÿäà5. Áîëåå ïîäðîáíî ïîëó÷åíèå îöåíêè ìåäèàíû îïèñàíî â ðàçäåëå 8.4.
Äàëåå ïðèâåäåì ìåòîäû îöåíèâàíèÿ ïàðàìåòðîâ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé, äëÿ ðåàëèçàöèè êîòîðûõ â Excel ïðåäóñìîòðåíû ñïåöèàëüíûå ôóíêöèè èëè ñðåäñòâà (ñì. ãëàâû 4 è 5).
2.3.6. Оценки параметров нормального распределения
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2.
5
 ïðèíöèïå, â ïîñëåäíåì ñëó÷àå â êà÷åñòâå îöåíêè ìåäèàíû ìîæíî âçÿòü ëþáîå çíà÷åíèå èç
èíòåðâàëà (õ(k), õ(k+1)).
Глава 2. Основные статистические методы
59
Точечные оценки
Äëÿ òî÷å÷íîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ m è äèñïåðñèè σ2 èñïîëüçóþòñÿ ñòàòèñòèêè x =
1 n
1 n
xi è Sn2 = ∑ ( xi − x )2 , êîòîðûå ÿâëÿþòñÿ íåñìå∑
n i =1
n i =1
ùåííûìè ( S n2 àñèìïòîòè÷åñêè íåñìåùåííàÿ), ýôôåêòèâíûìè è ñîñòîÿòåëüíûìè
îöåíêàìè íåèçâåñòíûõ m è σ2. Ôîðìóëû äëÿ äèñïåðñèé ýòèõ ñòàòèñòèê ïðèâåäåíû â ðàçäåëàõ 2.3.1 è 2.3.2.
Ñòàòèñòèêà x ðàñïðåäåëåíà ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíè-
n ( x − m) / σ èìååò ñòàíäàðòíîå íîð-
åì m è äèñïåðñèåé σ2/n, à ñëó÷àéíàÿ âåëè÷èíà
ìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà n S /σ2 èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1)
2
n
ñòåïåíüþ ñâîáîäû (ñì. ðàçäåë 1.5.5). Ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ
ñâîáîäû (ñì. ðàçäåë 1.5.6) èìååò ñëó÷àéíàÿ âåëè÷èíà
n − 1( x − m) / S n . Ýòè ñâîéñò-
2
n
âà ñòàòèñòèê x è S èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ.
Интервальные оценки для математического ожидания
Ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ
çàâèñèò îò òîãî, èçâåñòíî ëè çíà÷åíèå äèñïåðñèè σ2. Åñëè çíà÷åíèå äèñïåðñèè
èçâåñòíî, òî äîâåðèòåëüíûé èíòåðâàë, ñîîòâåòñòâóþùèé äîâåðèòåëüíîìó óðîâíþ

σ 
 , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ
n
n

α = 2Ô(k) – 1, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
( Excel, êðîìå äðóãèõ ñðåäñòâ, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé Excel ДОВЕРИТ, êîòîðàÿ ïî çàäàííûì çíà÷åíèÿì
σ
α, σ è n âû÷èñëÿåò âåëè÷èíó k
(ñì. ðàçäåë 4.11.2).)
n
 ñëó÷àå, êîãäà çíà÷åíèå äèñïåðñèè σ2 íåèçâåñòíî, âìåñòî ýòîãî çíà÷åíèÿ èñ1 n
ïîëüçóþò âûáîðî÷íóþ äèñïåðñèþ Sn2 = ∑ ( xi − x ) 2 , à çíà÷åíèå êîýôôèöèåíòà k
n i =1
îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ
Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà
α, èìååò âèä  x − k
σ
,x +k
n − 1( x − m) / S n èìååò èìåííî òàêîå ðàñïðåäåëåíèå. Äîâåðèòåëüíûé èíòåðâàë

Sn

n −1
èìååò âèä  x − k
,x +k

.
n −1 
Sn
 ãëàâå 10 ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ.
Интервальные оценки для дисперсии
Ïðåäïîëîæèì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ
ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû (ñëó÷àé, êîãäà èçâåñòíî ìàòåìàòè÷åñêîå
îæèäàíèå, ðàññìîòðåí â ãëàâå 10). Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà n S n2 /σ2 èìååò
60
Часть I. Основные понятия теории вероятностей и математической статистики
ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû, äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ïðè
çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì îáðàçîì. Âû÷èñëÿþòñÿ
òî÷å÷íûå îöåíêè x =
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 è îïðåäåëÿþòñÿ êîýôôèöèåíòû
∑
n i =1
n i =1
tн = Fn−−11 ( β н ) è tв = Fn−−11 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fn−−11 — ôóíêöèÿ,
îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Äîâåðèòåëü-
n 2 n 2
S n , Sn  .
tн 
 tв
íûé èíòåðâàë èìååò âèä 
Òàêæå ìîæíî ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü äëÿ ñîâìåñòíîãî îöåíèâàíèÿ
ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè [7, ñ. 94, 18, ñ. 181].
2.3.7. Оценка параметра р распределения Бернулли
Íàïîìíèì, ÷òî ðàñïðåäåëåíèå Áåðíóëëè îáû÷íî ðàññìàòðèâàåòñÿ êàê ìîäåëü
ñëó÷àéíîãî ýêñïåðèìåíòà, â ðåçóëüòàòå êîòîðîãî ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0” (ñì. ðàçäåë 1.4.2). Öåëüþ
ñòàòèñòè÷åñêîãî àíàëèçà îáû÷íî ÿâëÿåòñÿ îïðåäåëåíèå çíà÷åíèÿ âåðîÿòíîñòè ð
(âåðîÿòíîñòü ð ÷àñòî íàçûâàþò áèíîìèàëüíîé âåðîÿòíîñòüþ).
Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä
“1”, è 0 — â ïðîòèâíîì ñëó÷àå.
Точечная оценка
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Äèñïåðñèÿ ñòàòèñòèêè p̂ :
pˆ = r / n ,
Dpˆ = p (1 − p) / n , åå âûáîðî÷íàÿ îöåíêà: Sn2 ( pˆ ) = r (n − r ) / n 2 (n − 1) . Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (ñì. ðàçäåë 1.4.3). Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n.
Интервальные оценки
Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîÿòñÿ
èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ .
Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì
îáðàçîì6. Ñíà÷àëà ïîäñ÷èòûâàåòñÿ âåëè÷èíà r — êîëè÷åñòâî èñõîäîâ “1”, çàòåì
îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1,1k 2 ( β н ) è tв = Fk−3,1k 4 ( β в ) , ãäå βí = (1 – α)/2,
β â = (1 + α)/2, Fm−1,1 m 2 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè áåòà-ðàñïðåäåëåíèÿ
6
Ïîñêîëüêó ñóùåñòâóåò íåñêîëüêî ðàçëè÷íûõ âàðèàíòîâ ïîñòðîåíèÿ äàííîãî äîâåðèòåëüíîãî
èíòåðâàëà, óêàæåì, ÷òî ïðèâåäåííûå íèæå ôîðìóëû âçÿòû èç [4, ñ. 69].
Глава 2. Основные статистические методы
61
ñ ïàðàìåòðàìè m1 è m2 (ñì. ðàçäåë 1.5.9), k1 = r, k2 = n – r + 1, k3 = r + 1,
k4 = n – r. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä ( tн , tв ) . Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó áèíîìèàëüíûì ðàñïðåäåëåíèåì è áåòàðàñïðåäåëåíèåì: åñëè Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p, òîãäà Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Fn–k,k+1 — ôóíêöèÿ áåòà-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè.
Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Êàê óêàçûâàëîñü, ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) òî÷å÷íàÿ îöåíêà pˆ = r / n ðàñïðåäåëåíà
ïðèáëèæåííî ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì p è äèñïåðñèåé
p(1 – p)/n. Ïîýòîìó ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ìîæíî ïîñòðîèòü ñëåäóþùèì îáðàçîì. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n .
Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Äàëåå ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë

1
1
1
1
ˆ + k 2 − k pˆ (1 − pˆ )n + k 2 pn
ˆ + k 2 + k pˆ (1 − pˆ )n + k 2
 pn
2
4
2
4

,

n + k2
n + k2








è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
 pˆ − k
 .
n
n


Çäåñü ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî
íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ = p (1 − p) / n çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n .
Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Âûáîðêà õ1, õ2, ..., xn ñîñòîèò èç ðåçóëüòàòîâ n
ýêñïåðèìåíòîâ, â êàæäîì èç êîòîðûõ ïðîâîäèëîñü N èñïûòàíèé, â êàæäîì èñïûòàíèè ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) —
èñõîä “0”. Çäåñü xi ðàâíî ÷èñëó èñõîäîâ “1” â i-ì ýêñïåðèìåíòå.
Точечная оценка
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
pˆ =
1
nN
n
∑x
i
. Äèñïåðñèÿ ñòàòèñòèêè p̂ : Dpˆ = p (1 − p) / nN . Ðàñïðåäåëåíèå ñòàòè-
i =1
ñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/nN.
Интервальные оценки
Ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, áîëüøå 30, òî íàèáîëåå ïðîñòîé äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ
íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ , êîòîðàÿ
çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå pˆ =
62
1
nN
n
∑x
i
. Ïî çàäàííîìó çíà÷åíèþ äîâåðèòåëüíîãî
i =1
Часть I. Основные понятия теории вероятностей и математической статистики
óðîâíÿ α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå êîýôôèöèåíòà k. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
 pˆ − k
.
nN
nN 

Çäåñü, êàê è â àñèìïòîòè÷åñêèõ îöåíêàõ ïðåäûäóùåé ìîäåëè, ïðè ïîñòðîåíèè
äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ
íîðìàëüíûì
è
çàìåíà
íåèçâåñòíîãî
çíà÷åíèÿ
äèñïåðñèè
Dpˆ = p (1 − p) / nN âåëè÷èíîé pˆ (1 − pˆ ) / nN .
Преобразование арксинуса
Íåäîñòàòêîì àñèìïòîòè÷åñêèõ äîâåðèòåëüíûõ èíòåðâàëîâ ÿâëÿåòñÿ òî, ÷òî ïðè èõ
ïîñòðîåíèè íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n
(â ìîäåëè 1) èëè âåëè÷èíîé pˆ (1 − pˆ ) / nN (â ìîäåëè 2). Ñóùåñòâóåò ïðåîáðàçîâàíèå
ñòàòèñòèêè p̂ , ðàñïðåäåëåíèå êîòîðîãî ïî÷òè íå çàâèñèò îò íåèçâåñòíîãî çíà÷åíèÿ
âåðîÿòíîñòè ð. Òàêîå ïðåîáðàçîâàíèå íàçûâàåòñÿ ïðåîáðàçîâàíèåì àðêñèíóñà
è èìååò âèä z = arcsin
pˆ . Ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû z ïðè-
áëèæåííî ðàâíî arcsin
p , à äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1/4n. Êðîìå òîãî, ðàñ-
ïðåäåëåíèå âåëè÷èíû z áëèæå ê íîðìàëüíîìó, ÷åì ðàñïðåäåëåíèå ñòàòèñòèêè p̂ .
Èíîãäà
èñïîëüçóþò
äðóãîé
âàðèàíò
ïðåîáðàçîâàíèÿ
àðêñèíóñà:
y = 2 n arcsin pˆ . Çäåñü äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû ó ïðàêòè÷åñêè íå çàâèñèò îò n è ð è ïðèáëèæåííî ðàâíà 1. Åå ìàòåìàòè÷åñêîå îæèäàíèå ïðèáëèæåííî
ðàâíî 2 n arcsin
p.
Ïðèâåäåííûå ïðåîáðàçîâàíèÿ íå ïðèìåíèìû â ñëó÷àå, êîãäà çíà÷åíèå ð áëèçêî ê 0 èëè 1. Ïðåîáðàçîâàíèå Ýíñêîìáà w = arcsin
r + 3/8
(r — êîëè÷åñòâî èñõîn + 1/ 4
äîâ “1”) ëèøåíî ýòîãî íåäîñòàòêà. Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû w ïðèáëèæåííî ðàâíà 1/(4n + 2).
Ïðàêòè÷åñêîå ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ íà îñíîâå ïðåîáðàçîâàíèÿ àðêñèíóñà ïîêàçàíî â ãëàâå 10, ðàçäåë 10.8.3.
2.3.8. Оценка параметра λ распределения Пуассона
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (ñì. ðàçäåë 1.4.4).
Точечная оценка
1 n
∑ xi áóäåò íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé
n i =1
äëÿ íåèçâåñòíîãî ïàðàìåòðà λ. Äèñïåðñèÿ ýòîé îöåíêè: D x = λ/n. Ñëó÷àéíàÿ
Âûáîðî÷íîå ñðåäíåå x =
Глава 2. Основные статистические методы
63
n
âåëè÷èíà
∑x
i
èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì nλ, à ñëó÷àéíàÿ âå-
i =1
ëè÷èíà
n / λ ( x − λ ) àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1).
Интервальные оценки
Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè λ ñòðîÿòñÿ
n
èëè íà îñíîâå ðàñïðåäåëåíèÿ Ïóàññîíà, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
∑x
i
,
i =1
èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷è-
n / λ ( x − λ) .
íû
Èñïîëüçîâàíèå ðàñïðåäåëåíèÿ Ïóàññîíà. Åñëè çàäàí äîâåðèòåëüíûé óðîâåíü
α è âû÷èñëåíà òî÷å÷íàÿ îöåíêà x =
1 n
∑ xi , òî äàëåå äëÿ ïîñòðîåíèÿ äîâåðèòåëün i =1
íîãî èíòåðâàëà ñ èñïîëüçîâàíèåì ðàñïðåäåëåíèÿ Ïóàññîíà îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1 ( β н ) è tв = Fk−1 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fk−1 —
ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè χ2-ðàñïðåäåëåíèÿ ñ k = 2(n x + 1) ñòåïåíÿìè ñâî-
 tн tв 
,
.
 2n 2n 
áîäû (ñì. ðàçäåë 1.5.5). Äîâåðèòåëüíûé èíòåðâàë èìååò âèä 
Çäåñü èñïîëüçîâàíî ñîîòíîøåíèå ìåæäó ðàñïðåäåëåíèåì Ïóàññîíà è ðàñïðåäåëåíèåì χ2 (ñì. ðàçäåë 1.4.4): Ð(Õ ≤ k) = Ð(Z ≥ 2λ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
ðàñïðåäåëåííàÿ ïî çàêîíó Ïóàññîíà ñ ïàðàìåòðîì λ, Z — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1) ñòåïåíüþ ñâîáîäû.
Èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Ïðè äîñòàòî÷íî áîëüøîì n
ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ λ ñòðîèòñÿ òàêèì îáðàçîì. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α è âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà
x=
1 n
∑ xi . Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàín i =1
äàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë


k2 k
k2 k
−
k 2 + 4nx , x +
+
k 2 + 4nx 
x +
2
n
2
n
2
n
2
n


è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà

x
x
x −k
, x +k
.

n
n 

Ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dx = λ / n çàìåíÿåòñÿ âåëè÷èíîé x / n .
64
Часть I. Основные понятия теории вероятностей и математической статистики
2.3.9. Порядковые статистики
Ïîðÿäêîâûå (ðàíãîâûå) ñòàòèñòèêè èãðàþò áîëüøóþ ðîëü â ìàòåìàòè÷åñêîé ñòàòèñòèêå. Íà èõ îñíîâå ñòðîÿòñÿ òàê íàçûâàåìûå íåïàðàìåòðè÷åñêèå èëè
ñâîáîäíûå îò ðàñïðåäåëåíèÿ ìåòîäû, ò.å. ìåòîäû, êîòîðûå íå çàâèñÿò îò íåèçâåñòíîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Íåêîòîðûå òàêèå ìåòîäû áóäóò îïèñàíû íèæå, â ðàçäåëå 2.4. Êðîìå òîãî, ïîðÿäêîâûå ñòàòèñòèêè èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ, àïïðîêñèìèðóþùåé
ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè (ñì. ðàçäåë 8.3), äëÿ îöåíèâàíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, êàê ïîêàçàíî íèæå â ýòîì ðàçäåëå, è âî ìíîãèõ äðóãèõ ñòàòèñòè÷åñêèõ ìåòîäàõ.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ êîíå÷íàÿ âûáîðêà õ1, õ2, ..., xn îáúåìîì n, êîòîðàÿ ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u).
Óïîðÿäî÷åííàÿ ïî âîçðàñòàíèþ ïîñëåäîâàòåëüíîñòü âûáîðî÷íûõ çíà÷åíèé
õ(1) ≤ õ(2) ≤ ... ≤ õ(n)
íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì. Ðàâíûå ìåæäó ñîáîé ÷ëåíû âûáîðêè íóìåðóþòñÿ â ïðîèçâîëüíîì ïîðÿäêå. ×ëåíû âàðèàöèîííîãî ðÿäà õ(i) (i = 1, 2, ..., n) íàçûâàþòñÿ ïîðÿäêîâûìè (ðàíãîâûìè) ñòàòèñòèêàìè. ×èñëî ri = i íàçûâàåòñÿ
ðàíãîì ÷ëåíà õ(i). ( ëèòåðàòóðå òàêæå ìîæíî âñòðåòèòü îïðåäåëåíèå ðàíãà êàê
ri = i/n.)  ñòàòèñòè÷åñêîì àíàëèçå ÷àñòî èñïîëüçóåòñÿ ñòàòèñòèêà Rn = x(n) – x(1),
êîòîðàÿ íàçûâàåòñÿ ðàçìàõîì èëè øèðîòîé âûáîðêè.
Ðàñïðåäåëåíèå ïîðÿäêîâûõ ñòàòèñòèê çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé
ñîâîêóïíîñòè, íî âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå
èç èíòåðâàëà (õ(i–1), õ(i)), íå çàâèñèò îò ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1).
 ÷àñòíîñòè, âåðîÿòíîñòè Ð(Õ < õ(0)) è Ð(Õ > õ(n)) òàêæå ðàâíû 1/(n + 1) [6, ñ. 367].
Оценки квантилей
Íàïîìíèì, ÷òî êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. (Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 0,5).
Îöåíêîé íåèçâåñòíîé êâàíòèëè ïîðÿäêà ð ξð ïðèíèìàåòñÿ âûáîðî÷íàÿ ðêâàíòèëü ξ p = õ(k(p)), ãäå k(p) = np, åñëè np — öåëîå ÷èñëî è k(p) = [np] + 1
â ïðîòèâíîì ñëó÷àå7.
2.4. Проверка статистических гипотез
Ñòàòèñòè÷åñêîé ãèïîòåçîé íàçûâàåòñÿ óòâåðæäåíèå, âûñêàçàííîå îòíîñèòåëüíî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èëè íåêîòîðûõ åãî ïàðàìåòðîâ.
Îáû÷íî òàêóþ ãèïîòåçó îáîçíà÷àþò êàê Í0 — ýòî íóëåâàÿ (ïðåäëîæåííàÿ) ãèïîòåçà. Ïðîòèâîïîëîæíîå óòâåðæäåíèå — îòðèöàíèå ãèïîòåçû Í0 — íàçûâàåòñÿ
êîíêóðèðóþùåé (èëè àëüòåðíàòèâíîé) ãèïîòåçîé è îáîçíà÷àåòñÿ êàê Í1.
Ïðèâåäåì íåñêîëüêî ïðèìåðîâ ñòàòèñòè÷åñêèõ ãèïîòåç.
Ãèïîòåçà Í0: âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè,
ðàâíîìåðíî ðàñïðåäåëåííîé íà èíòåðâàëå [à, b].
Ãèïîòåçà Í0: âûáîðî÷íûå çíà÷åíèÿ èçâëå÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè,
ìàòåìàòè÷åñêîå îæèäàíèå êîòîðîé ëåæèò â ïðåäåëàõ îò à äî b (à è b — àïðèîðíî
çàäàííûå ÷èñëà).
7
[m] îáîçíà÷àåò öåëóþ ÷àñòü ÷èñëà m.
Глава 2. Основные статистические методы
65
Èìååì ïàðíûå íàáëþäåíèÿ (õ1, ó1), (õ2, ó2), ..., (õn, ón), ÿâëÿþùèåñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (Õ, Y). Ãèïîòåçà Í0: êîìïîíåíòû Õ è Y íåçàâèñèìû.
Åñòü äâå âûáîðêè, õ1, õ2, ..., õn è y1, y2, ..., yk, èçâëå÷åííûå èç äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè m1 è m2 ñîîòâåòñòâåííî. Ãèïîòåçà Í0: m1 ≥ m2.
Î÷åâèäíî, â êàæäîé êîíêðåòíîé ñèòóàöèè ìîæíî ñôîðìóëèðîâàòü öåëîå ñåìåéñòâî ðàçëè÷íûõ ãèïîòåç. Ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà èç ýòîãî ìíîæåñòâà
ãèïîòåç ñëåäóåò âûáðàòü òå ãèïîòåçû, êîòîðûå ñôîðìóëèðîâàíû íàèáîëåå ÷åòêî, íå
îñòàâëÿÿ ìåñòà äâîéñòâåííîñòè â óòâåðæäåíèÿõ, è ìàêñèìàëüíî ñîîòâåòñòâóþò öåëè êîíêðåòíîãî èññëåäîâàíèÿ. Ðåêîìåíäóåòñÿ òàêæå âûáèðàòü ïðîñòûå ãèïîòåçû,
ñôîðìóëèðîâàííûå îòíîñèòåëüíî îäíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, òàê êàê ñëîæíûå ãèïîòåçû òðåáóþò è ñëîæíûõ êðèòåðèåâ äëÿ ïðîâåðêè èõ èñòèííîñòè.
Êðèòåðèé ïðîâåðêè ñòàòèñòè÷åñêîé ãèïîòåçû — ýòî ïðîöåäóðà âûðàáîòêè
ðåøåíèÿ î òîì, ïðèíÿòü èëè îòâåðãíóòü äàííóþ ãèïîòåçó. Êðèòè÷åñêîé îáëàñòüþ êðèòåðèÿ (èëè îáëàñòüþ íåïðèíÿòèÿ ãèïîòåçû) ÿâëÿåòñÿ òà ÷àñòü âûáîðî÷íîãî ïðîñòðàíñòâà, êîòîðàÿ ïðèâîäèò ê îòêëîíåíèÿì ãèïîòåçû. Óðîâíåì çíà÷èìîñòè α êðèòåðèÿ ÿâëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ýòîò êðèòåðèé ïðèâåäåò
ê îòêëîíåíèþ íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè, ò.å. âåðîÿòíîñòü òîãî, ÷òî
ïðè âûïîëíåíèè íóëåâîé ãèïîòåçû ðåçóëüòàòû ïðîâåðîê ïîïàäóò â êðèòè÷åñêóþ
îáëàñòü. Åñëè ðåçóëüòàòû ïðîâåðêè íàõîäÿòñÿ â êðèòè÷åñêîé îáëàñòè, òî ãèïîòåçà
Í0 îòêëîíÿåòñÿ è ïðèíèìàåòñÿ àëüòåðíàòèâíàÿ ãèïîòåçà Í1. Ïîýòîìó êðèòè÷åñêàÿ
îáëàñòü äîëæíà áûòü ðàñïîëîæåíà òàì, ãäå îíà ñîîòâåòñòâóåò êîíêóðèðóþùåé ãèïîòåçå. Ïðè âûáîðå ãèïîòåç íóëåâîé ãèïîòåçîé (ïî ñðàâíåíèþ ñ àëüòåðíàòèâíîé)
äîëæíà áûòü òà ãèïîòåçà, êîòîðóþ áîëåå îïàñíî îøèáî÷íî îòâåðãíóòü.
Îòêëîíåíèå íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè íàçûâàåòñÿ îøèáêîé
ïåðâîãî ðîäà. Ïîýòîìó óðîâåíü çíà÷èìîñòè α åñòü âåðîÿòíîñòü ñîâåðøåíèÿ îøèáêè ïåðâîãî ðîäà. Ïðèíÿòèå ãèïîòåçû Í0, êîãäà îíà íåâåðíà, íàçûâàåòñÿ îøèáêîé
âòîðîãî ðîäà. Âåðîÿòíîñòü îøèáêè âòîðîãî ðîäà îáû÷íî îáîçíà÷àþò êàê β.
Åñòåñòâåííî ñòðåìëåíèå ìèíèìèçèðîâàòü âåðîÿòíîñòè îøèáîê ïåðâîãî è âòîðîãî
ðîäà. Ñíèæàÿ óðîâåíü çíà÷èìîñòè α, òåì ñàìûì ñíèæàåì âåðîÿòíîñòü âîçíèêíîâåíèÿ îøèáêè ïåðâîãî ðîäà, íî â ýòîì ñëó÷àå âîçðàñòàåò âåðîÿòíîñòü β âîçíèêíîâåíèÿ îøèáîê âòîðîãî ðîäà.  ñâÿçè ñ ýòèì ââîäÿò ïîíÿòèå ìîùíîñòè êðèòåðèÿ, êîòîðîå îïðåäåëÿþò êàê âåðîÿòíîñòü îòêëîíåíèÿ íóëåâîé ãèïîòåçû, êîãäà îíà
íåâåðíà, ò.å. ìîùíîñòü êðèòåðèÿ ìîæíî îïðåäåëèòü êàê 1 – β. Ýòà âåðîÿòíîñòü çàâèñèò îò ðåàëüíîãî çíà÷åíèÿ ðàññìàòðèâàåìîãî ïàðàìåòðà ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîñêîëüêó ðåàëüíîå çíà÷åíèå ïàðàìåòðà çàðàíåå íå èçâåñòíî, ðàññìàòðèâàþò
ôóíêöèþ ìîùíîñòè, êîòîðàÿ ïîêàçûâàåò ñîîòâåòñòâóþùåå çíà÷åíèå ìîùíîñòè
êðèòåðèÿ äëÿ êàæäîãî âîçìîæíîãî çíà÷åíèÿ ïàðàìåòðà. Ôóíêöèÿ ìîùíîñòè èãðàåò â òåîðèè ïðîâåðêè ãèïîòåç ôóíäàìåíòàëüíóþ ðîëü. Îíà ïîëíîñòüþ õàðàêòåðèçóåò êðèòåðèé, òàê êàê ïîêàçûâàåò, íàñêîëüêî õîðîøî îí ñîîòâåòñòâóåò ñâîåìó îñíîâíîìó íàçíà÷åíèþ — “óëàâëèâàòü” âîçìîæíûå îòêëîíåíèÿ îò íóëåâîé ãèïîòåçû.
×àñòî âîçìîæíûå çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè, íà îñíîâå êîòîðîé
ñòðîèòñÿ êðèòåðèé, ïðèíàäëåæàò íåêîòîðîìó èíòåðâàëó. Òîãäà êðèòè÷åñêàÿ îáëàñòü òàêæå ÿâëÿåòñÿ èíòåðâàëîì. Ãðàíè÷íûå òî÷êè êðèòè÷åñêîé îáëàñòè
íàçûâàþòñÿ êðèòè÷åñêèìè çíà÷åíèÿìè. Êðèòè÷åñêèå çíà÷åíèÿ âûáèðàþòñÿ
òàêèì îáðàçîì, ÷òîáû ïðè âûáðàííîì óðîâíå çíà÷èìîñòè α ìîùíîñòü êðèòåðèÿ
1 – β áûëà íàèáîëüøåé.
66
Часть I. Основные понятия теории вероятностей и математической статистики
Âîçìîæíû òðè âàðèàíòà ðàñïîëîæåíèÿ êðèòè÷åñêîé îáëàñòè, îïðåäåëÿåìûõ
âèäîì íóëåâîé è àëüòåðíàòèâíîé ãèïîòåç, à òàêæå ðàñïðåäåëåíèåì êðèòåðèàëüíîé ñòàòèñòèêè θ.
1. Ïðàâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (têð, +∞), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ > têð) = α. Çíà÷åíèå têð
íàçûâàåòñÿ ïðàâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ
çíà÷èìîñòè α.
2. Ëåâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (–∞, têð), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ < têð) = α. Çíà÷åíèå
têð íàçûâàåòñÿ ëåâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ
çíà÷èìîñòè α.
3. Äâóõñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü, ñîñòîÿùàÿ èç äâóõ èíòåðâàëîâ
(–∞, têð1) è (têð2, +∞), ãäå êðèòè÷åñêèå çíà÷åíèÿ têð1 è têð2 îïðåäåëÿåòñÿ èç
ðàâåíñòâ Ð(θ < têð1) = α/2 è Ð(θ > têð2) = α/2. Ýòè çíà÷åíèÿ íàçûâàþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè, îòâå÷àþùèìè óðîâíþ çíà÷èìîñòè α.
Íåîáõîäèìî ïîä÷åðêíóòü, ÷òî ñòàòèñòè÷åñêèå êðèòåðèè íà îñíîâàíèè âûáîðî÷íûõ íàáëþäåíèé íå äîêàçûâàþò òó èëè èíóþ ãèïîòåçó. Îíè ïîçâîëÿþò óòâåðæäàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò ïðèíÿòîé ãèïîòåçå. Òàêèì
îáðàçîì, âûâîäû, ïðèíèìàåìûå íà îñíîâå ñòàòèñòè÷åñêèõ äàííûõ, ôîðìóëèðóþòñÿ â ñëåäóþùåì âèäå: “ýêñïåðèìåíòàëüíûå äàííûå ñîãëàñóþòñÿ ñ äàííîé ãèïîòåçîé (èëè ïðîòèâîðå÷àò åé)”.
Ñëåäóåò ïðåäóïðåäèòü îá îïàñíîñòè, ñâÿçàííîé ñ ïðèìåíåíèåì íåñêîëüêèõ
ñòàòèñòè÷åñêèõ êðèòåðèåâ ïðè àíàëèçå îäíèõ è òåõ æå äàííûõ. Åñëè ê îäíèì
è òåì æå äàííûì ïðèìåíÿþò äâà ðàçëè÷íûõ êðèòåðèÿ äëÿ ïðîâåðêè îäíîé è òîé
æå íóëåâîé ãèïîòåçû (èëè äâóõ ñõîäíûõ ãèïîòåç) è â êàæäîì ñëó÷àå ïðèíèìàåòñÿ óðîâåíü çíà÷èìîñòè, íàïðèìåð, 0,05, òî âåðîÿòíîñòü òîãî, ÷òî õîòÿ áû ïî îäíîìó èç êðèòåðèåâ íóëåâàÿ ãèïîòåçà áóäåò îøèáî÷íî îòêëîíåíà, ïðåâîñõîäèò 0,05.
Ñëåäóåò âîñïîëüçîâàòüñÿ ëèøü îäíèì êðèòåðèåì, æåëàòåëüíî áîëåå ìîùíûì.
Ñäåëàåì åùå íåêîòîðûå çàìå÷àíèÿ î ïðèìåíåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ.
Âñå ñòàòèñòè÷åñêèå êðèòåðèè äëÿ êîððåêòíîãî ñâîåãî èñïîëüçîâàíèÿ ïðåäïîëàãàþò
âûïîëíåíèå íåêîòîðîãî êîìïëåêñà óñëîâèé (íàïðèìåð, óñëîâèÿ íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè), èëè, êàê ãîâîðÿò, êðèòåðèé “ðàáîòàåò”
â ðàìêàõ êîíêðåòíîé ñòàòèñòè÷åñêîé ìîäåëè. Íà ïðàêòèêå óñëîâèÿ, íàëàãàåìûå
ñòàòèñòè÷åñêîé ìîäåëüþ, ìîãóò è íå âûïîëíÿòüñÿ, ÷òî ïðèâîäèò ê âîçðàñòàíèþ âåðîÿòíîñòè íåïðàâèëüíûõ âûâîäîâ, êîòîðûå äåëàþòñÿ íà îñíîâå òîãî èëè èíîãî êðèòåðèÿ. Äëÿ îäíèõ êðèòåðèåâ ïîäîáíîå ñíèæåíèå íàäåæíîñòè âûâîäîâ ïðîèñõîäèò
â áîëüøåé ñòåïåíè, äëÿ äðóãèõ â ìåíüøåé. Óñòîé÷èâûìè (ðîáàñòíûìè) íàçûâàþòñÿ
òàêèå êðèòåðèè, äëÿ êîòîðûõ óìåðåííûå îòêëîíåíèÿ îò ïðåäïîëàãàåìîé ñòàòèñòè÷åñêîé ìîäåëè íåçíà÷èòåëüíî âëèÿþò íà íàäåæíîñòü âûâîäîâ. Ìíîãèå êðèòåðèè, îïèñàííûå â ïîñëåäíèõ äâóõ ÷àñòÿõ êíèãè, îñíîâàíû íà ïðåäïîëîæåíèè î íîðìàëüíîì
ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè ýòîì êðèòåðèè ïðîâåðêè ãèïîòåç
î ñðåäíèõ çíà÷åíèÿõ â áîëüøèíñòâå ñâîåì óñòîé÷èâû ïðè óìåðåííûõ îòêëîíåíèÿõ
îò íîðìàëüíîñòè, à êðèòåðèè äëÿ ãèïîòåç î çíà÷åíèÿõ äèñïåðñèè — íåò.
Íåêîòîðûå èç êðèòåðèåâ ÿâëÿþòñÿ íåïàðàìåòðè÷åñêèìè èëè ñâîáîäíûìè îò
ðàñïðåäåëåíèé. Ïðèìåíåíèå òàêèõ êðèòåðèåâ íå îñíîâûâàåòñÿ íà ïðåäïîëîæåíèÿõ
Глава 2. Основные статистические методы
67
î êàêîì-ëèáî êîíêðåòíîì âèäå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè èññëåäîâàíèè âûáîðêè èç íîðìàëüíî ðàñïðåäåëåííîé ãåíåðàëüíîé ñîâîêóïíîñòè êðèòåðèè ýòîãî òèïà íåñêîëüêî óñòóïàþò ïî ìîùíîñòè ñîîòâåòñòâóþùèì êðèòåðèÿì,
ïîñòðîåííûì íà ïðåäïîëîæåíèè î íîðìàëüíîñòè. Îíè îáëàäàþò, îäíàêî, òåì ïðåèìóùåñòâîì, ÷òî ñâîáîäíû îò ïîäîáíîãî ïðåäïîëîæåíèÿ î íîðìàëüíîñòè, ïîýòîìó
èõ ìîæíî èñïîëüçîâàòü â ñèòóàöèÿõ, êîãäà âèä ðàñïðåäåëåíèÿ çàðàíåå íå èçâåñòåí.
×òîáû ïîêàçàòü, êàê ñòðîÿòñÿ è êàê “ðàáîòàþò” êðèòåðèè ïðîâåðêè ãèïîòåç,
ðàññìîòðèì òðè òèïà êðèòåðèåâ: êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, êðèòåðèè ïðîâåðêè ãèïîòåç î ðàçëè÷èè (èëè
ðàâåíñòâå) ïàðàìåòðîâ íåñêîëüêèõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è êðèòåðèè ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé. Ìíîãî÷èñëåííûå ïðèìåðû äðóãèõ êðèòåðèåâ
ïðèâåäåíû â ÷àñòÿõ III è IV êíèãè.
2.4.1. Критерии проверки гипотез о значениях параметров
генеральной совокупности
Ìíîãèå ïîäîáíûå êðèòåðèè ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ
(ñì. ðàçäåë 2.3). Íàïðèìåð, íåîáõîäèìî ïðîâåðèòü ãèïîòåçó, ÷òî íåèçâåñòíîå ìàòåìàòè÷åñêîå îæèäàíèå m ãåíåðàëüíîé ñîâîêóïíîñòè ðàâíî íåêîòîðîìó êîíêðåòíîìó çíà÷åíèþ m0. Ïóñòü íà îñíîâå âûáîðêè ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë
(t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α (ò.å. ñ âåðîÿòíîñòüþ α ýòîò èíòåðâàë ñîäåðæèò
íåèçâåñòíîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ m). Òîãäà, åñëè èíòåðâàë (t1, t2)
ïîêðûâàåò çíà÷åíèå m0 (ò.å. âûïîëíÿþòñÿ íåðàâåíñòâà t1 ≤ m0 ≤ t2), ïðèíèìàåòñÿ
âûäâèíóòàÿ ãèïîòåçà ñ óðîâíåì çíà÷èìîñòè 1 – α. Êðèòè÷åñêàÿ îáëàñòü çäåñü ñîñòîèò èç îáúåäèíåíèÿ äâóõ îáëàñòåé: (–∞, t1) è (t2, +∞), t1 è t2 ÿâëÿþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè. Òàêèì îáðàçîì, ÷òîáû ïðîâåðèòü ãèïîòåçó Í0:
m = m0 ñ óðîâíåì çíà÷èìîñòè 1 – α, íåîáõîäèìî ïîñòðîèòü äëÿ çíà÷åíèÿ m äîâåðèòåëüíûé èíòåðâàë (t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α è ïðîâåðèòü âûïîëíåíèå
íåðàâåíñòâ t1 ≤ m0 ≤ t2. Åñëè ýòè íåðàâåíñòâà âûïîëíÿþòñÿ, òî ñ âåðîÿòíîñòüþ α
ãèïîòåçà Í0 ïðèíèìàåòñÿ. Åñëè õîòÿ áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, òî ãèïîòåçà îòêëîíÿåòñÿ. Àíàëîãè÷íî ñòðîÿòñÿ êðèòåðèè î ïðîâåðêå ãèïîòåç
â âèäå íåðàâåíñòâ. Íàïðèìåð, ãèïîòåçà Í0: m ≥ m0.  ýòîì ñëó÷àå íåîáõîäèìî
ïîñòðîèòü ïðàâîñòîðîííèé äîâåðèòåëüíûé èíòåðâàë âèäà (t, +∞), êîòîðûé ñîäåðæàë áû çíà÷åíèå m ñ âåðîÿòíîñòüþ α, è ïðîâåðèòü íåðàâåíñòâî t ≥ m0 (t —
êðèòè÷åñêîå çíà÷åíèå). Åñëè ýòî íåðàâåíñòâî âûïîëíÿåòñÿ, òî ãèïîòåçà Í0 ïðèíèìàåòñÿ ñ óðîâíåì çíà÷èìîñòè 1 – α.  ïðîòèâíîì ñëó÷àå îíà îòâåðãàåòñÿ.
Îáû÷íî â ïîäîáíûõ êðèòåðèÿõ äëÿ óïðîùåíèÿ âû÷èñëåíèé äîâåðèòåëüíûå
èíòåðâàëû ñòðîÿòñÿ íå äëÿ íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, à äëÿ óíèôèöèðîâàííîé ñòàòèñòèêè, êîòîðàÿ ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 èìååò èçâåñòíîå ðàñïðåäåëåíèå. Òàêàÿ ñòàòèñòèêà íàçûâàåòñÿ êðèòåðèàëüíîé ñòàòèñòèêîé. Íàïðèìåð, äëÿ êðèòåðèÿ ïðîâåðêè ãèïîòåçû î çíà÷åíèè ìàòåìàòè÷åñêîãî
îæèäàíèÿ, ñôîðìóëèðîâàííîé âûøå, âû÷èñëÿåòñÿ ñòàòèñòèêà T =
(çäåñü x =
68
n ( x − m0 )
Sn
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 ), êîòîðàÿ â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëå∑
n i =1
n i =1
Часть I. Основные понятия теории вероятностей и математической статистики
íèÿ ãåíåðàëüíîé ñîâîêóïíîñòè è ïðè âûïîëíåíèè óñëîâèÿ m = m0 ïîä÷èíÿåòñÿ
ðàñïðåäåëåíèþ Ñòüþäåíòà. Òîãäà ãðàíèöàìè êðèòè÷åñêîé îáëàñòè äëÿ êðèòåðèÿ
áóäóò ïðîñòî êâàíòèëè ýòîãî ðàñïðåäåëåíèÿ, ïîðÿäîê êîòîðûõ îïðåäåëÿåòñÿ çàäàííûì óðîâíåì çíà÷èìîñòè. Íà òàêîì ïðèíöèïå ïîñòðîåíû ïðèâåäåííûå íèæå
êðèòåðèè. Áîëüøóþ ðîëü â òàêèõ êðèòåðèÿõ èãðàþò àïðèîðíûå ïðåäïîëîæåíèÿ
î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîýòîìó èñïîëüçîâàíèå êîíêðåòíûõ
êðèòåðèåâ ïðîâåðêè ãèïîòåç òðåáóåò îáÿçàòåëüíîãî ñîáëþäåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè, â ðàìêàõ êîòîðîé ïðèìåíèì äàííûé êðèòåðèé.
Âî ìíîãèõ ñëó÷àÿõ, ÷òîáû óìåíüøèòü çàâèñèìîñòü êðèòåðèàëüíûõ ñòàòèñòèê
îò àïðèîðíûõ ïðåäïîëîæåíèé î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè
(à òàêæå â ñëó÷àÿõ, êîãäà ñ òî÷íûìè ðàñïðåäåëåíèÿìè êðèòåðèàëüíûõ ñòàòèñòèê
ïî êàêèì-ëèáî ïðè÷èíàì òðóäíî ðàáîòàòü (ñëîæíûå âû÷èñëåíèÿ è ò.ï.)), êðèòåðèè ñòðîÿò íà îñíîâå àñèìïòîòè÷åñêèõ ðàñïðåäåëåíèé ýòèõ ñòàòèñòèê. Ïðè èñïîëüçîâàíèè òàêèõ êðèòåðèåâ ñëåäóåò ïîìíèòü, ÷òî, âî-ïåðâûõ, îíè ðàáîòàþò òîëüêî
ïðè äîñòàòî÷íî áîëüøîì îáúåìå âûáîðêè, âî-âòîðûõ, ýòè êðèòåðèè ïðèáëèæåííûå, ñòåïåíü òî÷íîñòè êîòîðûõ óäàåòñÿ îïðåäåëèòü òîëüêî â ðåäêèõ ñëó÷àÿõ.
Ïðèâåäåì íåñêîëüêî êðèòåðèåâ ïðîâåðêè çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðûå ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ. Ðàññìîòðèì êðèòåðèè äëÿ ñëó÷àÿ ðàâåíñòâà è íåðàâåíñòâ. Ôîðìû îïèñàíèÿ êðèòåðèåâ, èñïîëüçóåìîé â ýòèõ ïðèìåðàõ, áóäåì ïðèäåðæèâàòüñÿ è äàëåå ïðè îïèñàíèè êðèòåðèåâ
â ïîñëåäóþùèõ ãëàâàõ.
Критерий проверки значения математического ожидания нормальной
совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ïîä÷èíÿþùåéñÿ íîðìàëüíîìó çàêîíó ðàñïðåäåëåíèÿ ñ íåèçâåñòíûì
ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: µ = m0
Í0: µ ≤ m0
Í0: µ ≥ m0
Í1: µ ≠ m0
Í1: µ > m0
Í1: µ < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
 êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåì ñòàòèñòèêó T =
n ( x − m0 )
,
Sn
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòè∑
n i =1
n i =1
ñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Îïðåäåëÿþòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê
êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ
íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ ïðàâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
ãäå x =
Глава 2. Основные статистические методы
69
Ñëó÷àé â). Îïðåäåëÿåòñÿ ëåâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü
ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Ýòîò êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî. Ïðè ïðîâåðêå ðàâåíñòâà â ñèëó ñèììåòðèè ðàñïðåäåëåíèÿ Ñòüþäåíòà äîñòàòî÷íî ñðàâíèòü |Ò| ñ êâàíòèëåì tâ ïîðÿäêà 1 – α/2.
Критерий проверки значения дисперсии нормальной совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ è ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
2
2
á) Íåðàâåíñòâî
2
â) Íåðàâåíñòâî
Í0: σ = σ0
Í0: σ ≤ σ0
2
Í0: σ2 ≥ σ02
Í1: σ2 ≠ σ02
Í1: σ2 > σ02
Í1: σ2 < σ02
Çäåñü σ02 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Êðèòåðèàëüíàÿ
ñòàòèñòèêà
âû÷èñëÿåòñÿ
ïî
ôîðìóëå
T=
(n − 1) S n2
,
σ 20
ãäå
1 n
∑ ( xi − x )2 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñn i =1
ïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Îïðåäåëÿþòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ ïðàâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
Ñëó÷àé â). Îïðåäåëÿåòñÿ ëåâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü
ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Êðèòåðèé íå óñòîé÷èâ, åñëè íå âûïîëíÿåòñÿ óñëîâèå íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
Sn2 =
2.4.2. Критерии сравнения значений параметров генеральных
совокупностей
Ïðè ïîñòðîåíèè êðèòåðèåâ ïðîâåðêè ãèïîòåç î ñðàâíåíèè çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèé äâóõ è áîëåå íåçàâèñèìûõ âûáîðîê ïðèìåíÿþòñÿ äâà îñíîâíûõ ïîäõîäà. Ïåðâûé ïîäõîä ïðåäïîëàãàåò, ÷òî ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ñðàâíèâàåìûõ ïàðàìåòðîâ ðàñïðåäåëåíèé è çàòåì íà îñíîâå
òî÷å÷íûõ îöåíîê ñòðîèòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà, ðàñïðåäåëåíèå êîòîðîé,
êîíå÷íî æå, çàâèñèò îò ðàñïðåäåëåíèé òî÷å÷íûõ îöåíîê. Ãðàíèöû êðèòè÷åñêîé
îáëàñòè êðèòåðèÿ ñîñòàâëÿþò êâàíòèëè ðàñïðåäåëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè
70
Часть I. Основные понятия теории вероятностей и математической статистики
(ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû), ïîðÿäîê êîòîðûõ îïðåäåëÿåòñÿ çàäàííûì óðîâíåì çíà÷èìîñòè êðèòåðèÿ. Íà òàêîé îñíîâå ïîñòðîåíû ïðèâåäåííûå
íèæå íåñêîëüêî êðèòåðèåâ ïðîâåðêè ãèïîòåç î ðàçëè÷èè ìåæäó ìàòåìàòè÷åñêèìè
îæèäàíèÿìè äâóõ íîðìàëüíûõ ðàñïðåäåëåíèé (ïðèâåäåíû òàêèå êðèòåðèè, äëÿ êîòîðûõ â Excel ïðåäóñìîòðåíû ñïåöèàëüíûå ñðåäñòâà, îïèñàííûå â ãëàâå 5).
Ïðè âòîðîì ïîäõîäå èç èìåþùèõñÿ íåñêîëüêèõ íåçàâèñèìûõ âûáîðîê îáðàçóåòñÿ åäèíàÿ îáùàÿ âûáîðêà è êðèòåðèàëüíàÿ ñòàòèñòèêà ñòðîèòñÿ íà îñíîâå îáùåé
âûáîðêè. ×àñòî òàêîé ïîäõîä èñïîëüçóåòñÿ ïðè ïîñòðîåíèè íåïàðàìåòðè÷åñêèõ
êðèòåðèåâ. Íèæå äëÿ èëëþñòðàöèè ýòîãî ïîäõîäà ïðèâåäåí íåïàðàìåòðè÷åñêèé
êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè äëÿ ñðàâíåíèÿ ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ âûáîðîê. Äðóãèå êðèòåðèè ýòîãî òèïà îïèñàíû â ÷àñòè III.
Критерий проверки гипотезы о равенстве математических ожиданий для
нормальных совокупностей (случай известных дисперсий)
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1
è µ2 ñîîòâåòñòâåííî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Í1: µ1 > µ2
Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x =
è çàòåì êðèòåðèàëüíàÿ ñòàòèñòèêà z =
(x − y)
σ / n + σ 22 / m
2
1
1 n
1 m
xi , y = ∑ yi
∑
n i =1
m i =1
. Ïðè óñëîâèè èñòèííîñòè
ãèïîòåçû Í0 ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α/2
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |z| ≤ zêð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t.
Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò
íîðìàëüíîãî.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный z-тест для средних
èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.6).
Критерий Стьюдента проверки гипотезы о равенстве математических
ожиданий для нормальных совокупностей (случай равных дисперсий)
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè, íî ðàâíûìè äèñïåðñèÿìè σ12 = σ22 = σ2 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2.
Глава 2. Основные статистические методы
71
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Í1: µ1 > µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x =
1 n
1 n
1 m
1 m
xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 . Ïîñêîëüêó ïðè
∑
n i =1
n i =1
m i =1
m i =1
óñëîâèè ðàâåíñòâà äèñïåðñèé èìåþòñÿ äâå îöåíêè îäíîé è òîé æå âåëè÷èíû σ2, ýòè
îöåíêè îáúåäèíÿþò â îäíó îöåíêó S 2 =
ñòè ãèïîòåçû Í0 âåëè÷èíà T =
x−y
1 1
+
S
n m
(n − 1) S x2 + (m − 1) S y2
(n − 1) + (m − 1)
. Ïðè óñëîâèè èñòèííî-
èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n + m –
2) ñòåïåíüþ ñâîáîäû. Ýòà âåëè÷èíà Ò ïðèíèìàåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè; îáû÷íî åå âû÷èñëÿþò ïî ôîðìóëå T =
n + m − 2( x − y )
n+m
(n − 1) S x2 + (m − 1) S y2
nm
, îáúå-
äèíÿþùåé äâå âûøåïðèâåäåííûå ôîðìóëû âû÷èñëåíèÿ S2 è T.
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.
Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò
íîðìàëüíîãî. Êðèòåðèé òàêæå óñòîé÷èâ, åñëè äèñïåðñèè ãåíåðàëüíûõ ñîâîêóïíîñòåé íåçíà÷èòåëüíî îòëè÷àþòñÿ, à çíà÷åíèÿ n è m ïðèáëèçèòåëüíî ðàâíû.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест
с одинаковыми дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.7).
Критерий Стьюдента проверки гипотезы о равенстве математических
ожиданий для нормальных совокупностей (случай неравных дисперсий)
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1
è µ2 ñîîòâåòñòâåííî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Í1: µ1 > µ2
72
Часть I. Основные понятия теории вероятностей и математической статистики
Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x =
1 n
1 n
xi , S x2 = ∑ ( xi − x ) 2 ,
∑
n i =1
n i =1
y=
1 m
1 m
yi , S y2 = ∑ ( yi − y ) 2 .  êà÷åñòâå
∑
m i =1
m i =1
êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ àíàëîã z-ñòàòèñòèêè èç êðèòåðèÿ ïðîâåðêè
ãèïîòåçû î ðàâåíñòâå ñðåäíèõ äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé ïðè èçâåñòíûõ
äèñïåðñèÿõ: T =
x−y
. Òî÷íîå ðàñïðåäåëåíèå ýòîé ñòàòèñòèêè äîñòàòî÷-
S / n + S y2 / m
2
x
íî ñëîæíî, íî äîêàçàíî, ÷òî åãî ìîæíî àïïðîêñèìèðîâàòü ðàñïðåäåëåíèåì Ñòüþäåíòà, åñëè âçÿòü ÷èñëî ñòåïåíåé ñâîáîäû ðàâíûì
k=
( S x2 / n + S y2 / m)2
2
2
( S x2 / n) 2 ( S y / m)
+
n −1
m −1
.
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà
1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.
Ýòîò êðèòåðèé, åñëè ñòåïåíü ñâîáîäû ðàñïðåäåëåíèÿ Ñòüþäåíòà âû÷èñëÿåòñÿ
ïî ïðèâåäåííîé âûøå ôîðìóëå, ÷àñòî íàçûâàþò êðèòåðèåì Áåðåíñà–Ôèøåðà.
Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé ïðåäïîëàãàòü, ÷òî
äèñïåðñèè íå ðàâíû (êðèòåðèé ïðîâåðêè ðàâåíñòâà äèñïåðñèé îïèñàí íèæå), ñëåäóåò ïðèìåíèòü òî÷íûé êðèòåðèé ïðîâåðêè ñðåäíèõ ïðè ðàâíûõ äèñïåðñèÿõ. Åñëè ñóììà îáúåìîâ âûáîðîê áîëüøå 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî
èñïîëüçîâàòü íîðìàëüíîå ðàñïðåäåëåíèå.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с различными
дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.8).
Критерий Стьюдента проверки гипотезы о равенстве математических
ожиданий для зависимых нормальных совокупностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äâóìåðíàÿ âûáîðêà (õ1, y1), (õ2, y2), ..., (õn, ón) îáúåìîì n èçâëå÷åíà èç äâóìåðíîé íîðìàëüíîé ñîâîêóïíîñòè ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2 êîìïîíåíòîâ âûáîðêè.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Í1: µ1 > µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëÿþòñÿ n ðàçíîñòåé d1 = x1 – y1, d2 = x2 – y2, ..., dn = xn – yn, è ïî íèì
îïðåäåëÿþòñÿ
Sn2 =
ñðåäíåå
d =
1 n
∑ di
n i =1
è
âûáîðî÷íàÿ
äèñïåðñèÿ
ðàçíîñòåé
1 n
d
ïðè óñëîâèè èñòèííîñòè
(di − d )2 . Êðèòåðèàëüíàÿ ñòàòèñòèêà T =
∑
n i =1
Sn / n
íóëåâîé ãèïîòåçû èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Глава 2. Основные статистические методы
73
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè Ò ≤ têð.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Парный двухвыборочный t-тест для
средних èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.9).
Непараметрический критерий Уилкоксона–Манна–Уитни для двух не:
зависимых выборок
Ýòîò êðèòåðèé ïðèìåíÿåòñÿ òîãäà, êîãäà íåëüçÿ ñäåëàòü îáîñíîâàííûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèé âûáîðîê, ïîñêîëüêó îí ìåíåå ìîùíûé, ÷åì
àíàëîãè÷íûå êðèòåðèè, îñíîâàííûå íà ïðåäïîëîæåíèÿõ î êîíêðåòíûõ òèïàõ
ðàñïðåäåëåíèé ãåíåðàëüíûõ ñîâîêóïíîñòåé.
Êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè ìîæíî ïðèìåíèòü äëÿ ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé. Îäíàêî çàìåòèì, ÷òî ðàññìàòðèâàåìàÿ íóëåâàÿ ãèïîòåçà, ïðîâåðÿåìàÿ ñ ïîìîùüþ äàííîãî êðèòåðèÿ, ñîñòîèò â òîì, ÷òî ãåíåðàëüíûå ñîâîêóïíîñòè îäèíàêîâî ðàñïðåäåëåíû. Åñëè
êðèòåðèé îòêëîíÿåò íóëåâóþ ãèïîòåçó, òî ýòî åùå íå ïîçâîëÿåò çàêëþ÷èòü, ÷òî
ìàòåìàòè÷åñêèå îæèäàíèÿ îáåèõ âûáîðîê íå ðàâíû. Äëÿ òàêîãî âûâîäà íåîáõîäèìî ïðåäïîëîæèòü, ÷òî ðàññìàòðèâàåìûå ðàñïðåäåëåíèÿ èäåíòè÷íû âî âñåõ
îñòàëüíûõ àñïåêòàõ, íàïðèìåð, ÷òî èõ äèñïåðñèè ðàâíû. Íà ïðàêòèêå äîïóñòèìû óìåðåííûå ðàçëè÷èÿ â çíà÷åíèÿõ äèñïåðñèé, òàê êàê êðèòåðèé íåçíà÷èòåëüíî ÷óâñòâèòåëåí ê íèì.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è y1, y2,
..., ym îáúåìîâ ñîîòâåòñòâåííî n è m. Ïðåäïîëàãàåòñÿ, ÷òî n, m ≥ 30.
Ãèïîòåçû
Í0: ãåíåðàëüíûå ñîâîêóïíîñòè îáåèõ âûáîðîê îäèíàêîâî ðàñïðåäåëåíû;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Äëÿ ðåàëèçàöèè ýòîãî êðèòåðèÿ âûïîëíÿþòñÿ ñëåäóþùèå âû÷èñëåíèÿ. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåäèíÿþòñÿ â îäíó îáùóþ âûáîðêó z1, z2,
..., zN, N = n + m. Çíà÷åíèÿ z1, z2, ..., zN ðàññòàâëÿþòñÿ â ïîðÿäêå âîçðàñòàíèÿ.
Ïîëó÷àåì âàðèàöèîííûé ðÿä z(1) ≤ z(2) ≤ ... ≤ z(N). Íîìåð i ìåñòîïîëîæåíèÿ z(i)
â ýòîì ðÿäó ÿâëÿåòñÿ ðàíãîì äàííîãî çíà÷åíèÿ. Ðàíãè ïðèíèìàþò çíà÷åíèÿ îò 1
äî N. Ñóììèðóþòñÿ ðàíãè òåõ çíà÷åíèé, êîòîðûå ïðèíàäëåæàò ïåðâîé âûáîðêå,
è ïîëó÷àåòñÿ ÷èñëî R1. Àíàëîãè÷íî îïðåäåëÿåòñÿ R2 — ñóììà ðàíãîâ âòîðîé âûáîðêè. Åñëè äâà (èëè áîëåå) âûáîðî÷íûõ çíà÷åíèÿ èìåþò îäèíàêîâûå çíà÷åíèÿ,
òî êàæäîìó èç íèõ ïðèïèñûâàåòñÿ çíà÷åíèå ðàíãà, ðàâíîå ñðåäíåìó èç ðàíãîâ,
êîòîðûå áûëè áû èì ïðèïèñàíû ïðè îòñóòñòâèè ñîâïàäåíèé.
Âû÷èñëÿþòñÿ âåëè÷èíû U1 = nm +
n(n + 1)
m(m + 1)
− R1 è U 2 = nm +
− R2 , èç êî2
2
òîðûõ âûáèðàåòñÿ íàèáîëüøàÿ, ò.å. U = max(U1, U2). Âû÷èñëÿåòñÿ êðèòåðèàëü-
74
Часть I. Основные понятия теории вероятностей и математической статистики
1
U − nm
2
íàÿ ñòàòèñòèêà T =
. Ïðè óñëîâèÿ èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà
nm( N + 1)
12
Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ïðèâåäåííàÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Ò ïðèìåíÿåòñÿ ïðè áîëüøèõ âûáîðêàõ. Ïðè ìàëûõ âûáîðêàõ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ
âåëè÷èíà U, à êðèòè÷åñêàÿ îáëàñòü îïðåäåëÿåòñÿ ïî ñïåöèàëüíîìó ðàñïðåäåëåíèþ Ìàííà–Óèòíè.
Критерий Фишера проверки равенства дисперсий двух независимых
выборок из нормально распределенных генеральных совокупностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1
è µ2 ñîîòâåòñòâåííî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: σ12 = σ22
Í0: σ12 ≤ σ22
Í1: σ12 ≠ σ22
Çàäàí óðîâåíü çíà÷èìîñòè α.
Í1: σ12 > σ22
Äëÿ êàæäîé âûáîðêè âû÷èñëÿþòñÿ âûáîðî÷íûå äèñïåðñèè S x2 =
S y2 =
1 n
∑ ( xi − x )2 ,
n i =1
S2
1 m
( yi − y ) 2 è èõ îòíîøåíèå F = x2 . Ýòî îòíîøåíèå, íàçûâàåìîå äèñïåðñè∑
m i =1
Sy
îííûì îòíîøåíèåì Ôèøåðà, âûáèðàåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè
è â ñëó÷àå èñòèííîñòè íóëåâîé ãèïîòåçû èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè
ñâîáîäû k1 = n – 1 è k2 = m – 1 (î F-ðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7).
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α/2 F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè F ≤ têð.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный F-тест для
дисперсий èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.10).
2.4.3. Критерии проверки гипотез о принадлежности
распределения выборки классу распределений
Êðèòåðèè ýòîãî òèïà ÿâëÿþòñÿ, âåðîÿòíî, íàèáîëåå ÷àñòî èñïîëüçóåìûìè, ïîñêîëüêó áåç ïðîâåðêè ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè
Глава 2. Основные статистические методы
75
êîíêðåòíîìó êëàññó ðàñïðåäåëåíèé ñëîæíî ïîñòðîèòü äîñòàòî÷íî òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ îöåíèâàåìûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ èëè ïîäîáðàòü
íàèáîëåå ìîùíûé êðèòåðèé ïðîâåðêè ñôîðìóëèðîâàííûõ ãèïîòåç.
Ðàññìîòðèì äâà êðèòåðèÿ äàííîãî òèïà: êðèòåðèé χ2 (òàêæå íàçûâàåìûé êðèòåðèåì ñîãëàñèÿ, êðèòåðèåì ñîãëàñèÿ χ2 èëè êðèòåðèåì Ïèðñîíà) è êðèòåðèé
Êîëìîãîðîâà. Ïåðâûé èç íèõ ÿâëÿåòñÿ áîëåå îáùèì, íî, êàê ïðàâèëî, ìåíåå
òî÷íûì, ÷åì âòîðîé. Ñ äðóãîé ñòîðîíû, êðèòåðèé Êîëìîãîðîâà ïðèìåíÿåòñÿ
òîëüêî äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé.
Критерий χ2
Ðàññìîòðèì ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ìîæåò îñóùåñòâèòüñÿ îäèí èç èñõîäîâ À1, À2, ..., Am ñ âåðîÿòíîñòÿìè ð1, ð2,
..., pm ñîîòâåòñòâåííî ( ∑ i =1 pi = 1 ). Ïóñòü ïðîâåäåíî n èñïûòàíèé, ïðè ýòîì ñîáûm
òèå À1 íàáëþäàëîñü ν1 ðàç, ñîáûòèå À2 íàáëþäàëîñü ν2 ðàç è ò.ä., ñîáûòèå Am íàáëþäàëîñü νm ðàç ( ∑ i =1 ν i = n ). Ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû
m
m
η=∑
i =1
m
(ν i − npi ) 2
ν2
= ∑ i −n
npi
i =1 npi
ïðè n → ∞ ñòðåìèòñÿ ê ðàñïðåäåëåíèþ χ2 ñ (m – 1) ñòåïåíüþ ñâîáîäû (òåîðåìà
Ê. Ïèðñîíà).
Ýòî ñâîéñòâî ñëó÷àéíîé âåëè÷èíû η ïîçâîëÿåò âçÿòü åå â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè äëÿ êðèòåðèÿ ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè êëàññó ðàñïðåäåëåíèé. Ðàññìîòðèì ýòîò êðèòåðèé äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé (âñå âàðèàíòû êðèòåðèÿ è èõ ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
ïðèâåäåíû â ãëàâå 9, ðàçäåë 9.2).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé
ôóíêöèþ ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò k ïàðàìåòðîâ, èç êîòîðûõ k1 ïàðàìåòðîâ íåèçâåñòíî.
Ãèïîòåçû
Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé
ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò k ïàðàìåòðîâ, èç êîòîðûõ k1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
×òîáû ïîñòðîèòü êðèòåðèàëüíóþ ñòàòèñòèêó, îáëàñòü âîçìîæíûõ âûáîðî÷íûõ
çíà÷åíèé ðàçáèâàåòñÿ íà m íåïåðåñåêàþùèõñÿ èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 =
(õ(2), õ(3)), ..., ∆m = (õ(m), õ(m+1)). Ïîäñ÷èòûâàåòñÿ, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé
ïîïàëî â êàæäûé èíòåðâàë ∆i. Ïîëó÷àåòñÿ ðÿä ÷àñòîò ν1, ν2, ..., νm (ïðè ýòîì, êîíå÷íî, äîëæíî âûïîëíÿòüñÿ ðàâåíñòâî ν1 + ν2 +...+ νm = n, ãäå n — îáúåì âûáîðêè).  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå ni =
npi = n[F(x(i+1)) – F(x(i))] âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò, ò.å. êîëè÷åñòâî ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i) è x(i+1) —
ãðàíèöû èíòåðâàëà ∆i. Òåïåðü ìîæíî âû÷èñëèòü êðèòåðèàëüíóþ ñòàòèñòèêó
76
Часть I. Основные понятия теории вероятностей и математической статистики
m
T =∑
i =1
(ν i − npi ) 2
. Îòìåòèì, ÷òî, ïîñêîëüêó k1 ïàðàìåòðîâ ðàñïðåäåëåíèÿ îïðåäånpi
ëÿåòñÿ íà îñíîâå âûáîðî÷íûõ çíà÷åíèé, ðàñïðåäåëåíèå χ2, êîòîðîå àñèìïòîòè÷åñêè èìååò ñòàòèñòèêà Ò, èìååò (m – k1 – 1) ñòåïåíåé ñâîáîäû.
Êðèòè÷åñêîå çíà÷åíèå êðèòåðèÿ têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ χ2 ñ (m – k1 – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ïðîáëåìà âûáîðà êîëè÷åñòâà è ïîñòðîåíèå èíòåðâàëîâ ∆i = (õ(i), õ(i+1)) ðàññìîòðåíû â ðàçäåëå 9.2.
Критерий Колмогорова
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåíèå
êîòîðîé ïðåäïîëàãàåòñÿ íåïðåðûâíûì.
Ãèïîòåçû
Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé
ðàñïðåäåëåíèÿ F(u);
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Êðèòåðèàëüíàÿ ñòàòèñòèêà çäåñü îïðåäåëÿåòñÿ êàê ìàêñèìóì îòêëîíåíèÿ âûáîðî÷íîãî ðàñïðåäåëåíèÿ Fn(u) (ñòðîèòñÿ ïî âûáîðêå) îò ãèïîòåòè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ F(u). Äëÿ âû÷èñëåíèÿ òàêîé ñòàòèñòèêè âûïîëíÿþòñÿ ñëåäóþùèå äåéñòâèÿ.
Ïî âûáîðêå õ1, õ2, ..., õn ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Çàòåì âû÷èñëÿþòñÿ òàê íàçûâàåìûå êóìóëÿòèâíûå ðàçíîñòè:
è Dm− = F ( x( m ) ) −
Dm+ =
m
− F ( x( m ) )
n
m −1
, m = 1, 2, ..., n. Ïîñëå âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèn
ñòèêà Dn = max( Dm+ , Dm− ) . Ïðè óñëîâèÿ èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn
1≤ m ≤ n
èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Êîëìîãîðîâà–Ñìèðíîâà.
Êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî êðèòåðèÿ ïîêàçàíà â ãëàâå 9 (ðàçäåë 9.3).
Глава 2. Основные статистические методы
77
Глава
3
Анализ статистических
зависимостей
Â
ýòîé ãëàâå ðàññìîòðåíû çàäà÷è è ìåòîäû àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, êîòîðûå âêëþ÷àþò â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ. Íî ïðåæäå ÷åì ïåðåéòè ê ôîðìóëèðîâêå îáùåé è ÷àñòíûõ çàäà÷ ñòàòèñòè÷åñêîãî àíàëèçà çàâèñèìîñòåé, ïðåäñòàâèì âåñüìà îáùóþ ìîäåëü, â ðàìêàõ êîòîðîé ëåã÷å ïîíÿòü è ñôîðìóëèðîâàòü ýòè çàäà÷è.
3.1. Общая модель статистических зависимостей
Áîëüøîå êîëè÷åñòâî ïðèðîäíûõ ÿâëåíèé, ÿâëåíèé îáùåñòâåííîé æèçíè, ìîäåëèðîâàíèå òåõíè÷åñêèõ óñòðîéñòâ, òåõíîëîãè÷åñêèõ ïðîöåññîâ è ò.ï. ìîæíî ïðåäñòàâèòü â âèäå ñëåäóþùåé ìàòåìàòè÷åñêîé ìîäåëè, êîòîðàÿ áóäåò îïèñûâàòü âñå ýòè
ðàçíîðîäíûå ÿâëåíèÿ è ïðîöåññû. Åñòü íåêîòîðûé îáúåêò (ñèñòåìà, ïðîöåññ, ÿâëåíèå
è ò.ä.), íà âõîäå êîòîðîãî íàáëþäàåòñÿ “âõîäíîå” âîçäåéñòâèå Õ, à íà âûõîäå — ðåçóëüòèðóþùàÿ ïåðåìåííàÿ Y. Ñóùåñòâóåò òàêæå ñëó÷àéíîå âîçäåéñòâèå ε íà îáúåêò,
íå ïîääàþùååñÿ íåïîñðåäñòâåííîìó èçìåðåíèþ è êîíòðîëþ. Â îáùåì âèäå òàêàÿ
ñõåìà ïðåäñòàâëåíà íà ðèñ. 3.1. Ïåðåìåííûå Õ, Y, ε â îáùåì ñëó÷àå ÿâëÿþòñÿ âåêòîðíûìè ïåðåìåííûìè ðàçëè÷íûõ ðàçìåðíîñòåé, ò.å. Õ = (õ(1), õ(2), ..., õ(ð)),
Y = (y(1), y(2), ..., y(m)), ε = (ε(1), ε(2), ..., ε(k)), ïðè ýòîì âñå èëè íåêîòîðûå êîìïîíåíòû
âåêòîðîâ Õ, Y è ε ìîãóò áûòü ôóíêöèÿìè îò âðåìåíè (âðåìåííûìè ïðîöåññàìè).
Ðèñ. 3.1. Îáùåå ïðåäñòàâëåíèå îáúåêòà ñî ñëó÷àéíûì âîçäåéñòâèåì
Âõîäíàÿ ïåðåìåííàÿ Õ îïèñûâàåò óñëîâèÿ ôóíêöèîíèðîâàíèÿ îáúåêòà (÷àñòü
êîìïîíåíòîâ âåêòîðà Õ, êàê ïðàâèëî, ïîääàåòñÿ ðåãóëèðîâàíèþ èëè ÷àñòè÷íîìó
óïðàâëåíèþ); â ðàçëè÷íûõ ñòàòèñòè÷åñêèõ ìîäåëÿõ êîìïîíåíòû âåêòîðà Õ íàçûâàþò
íåçàâèñèìûìè ïåðåìåííûìè, ôàêòîð-àðãóìåíòàìè, ýêçîãåííûìè, ïðåäèêòîðíûìè
(èëè ïðîñòî ïðåäèêòîðàìè, ò.å. ïðåäñêàçûâàòåëÿìè), îáúÿñíÿþùèìè è ò.ä.
Êîìïîíåíòû y(1), y(2), ..., y(m) âåêòîðà Y — ýòî âûõîäíûå ïåðåìåííûå, õàðàêòåðèçóþùèå ïîâåäåíèå èëè ðåçóëüòàò ôóíêöèîíèðîâàíèÿ îáúåêòà; â ñòàòèñòè÷åñêèõ ìîäåëÿõ èõ íàçûâàþò çàâèñèìûìè, îòêëèêàìè, ýíäîãåííûìè, ðåçóëüòèðóþùèìè èëè îáúÿñíÿåìûìè ïåðåìåííûìè.
Êîìïîíåíòû ε(1), ε(2), ..., ε(k) ñëó÷àéíîãî âåêòîðà ε — ýòî ëàòåíòíûå (ò.å. ñêðûòûå) ñëó÷àéíûå “îñòàòî÷íûå” êîìïîíåíòû, îòðàæàþùèå âëèÿíèå íà Y íåó÷òåííûõ “íà âõîäå” ôàêòîðîâ, à òàêæå ñëó÷àéíûå îøèáêè â èçìåðåíèè àíàëèçèðóåìûõ ïîêàçàòåëåé.
Ñðåäè êîìïîíåíòîâ âåêòîðîâ Õ è Y ìîãóò áûòü ïåðåìåííûå ñëåäóþùèõ òèïîâ.
•
Êîëè÷åñòâåííûå, ò.å. ïðèíèìàþùèå ÷èñëîâûå çíà÷åíèÿ, èçìåðåííûå â îïðåäåëåííîé øêàëå (íàïðèìåð, äåíåæíûé äîõîä è ñáåðåæåíèÿ ñåìüè â ñîöèîëîãèè, ÷èñëåííîñòü ïîïóëÿöèè è ëèíåéíûå ðàçìåðû îñîáè â áèîëîãèè,
ïîòðåáëÿåìàÿ ýíåðãèÿ è âûõîäíàÿ ìîùíîñòü â òåõíèêå è ò.ï.).
•
Ïîðÿäêîâûå (èëè îðäèíàëüíûå), ò.å. ïîçâîëÿþùèå óïîðÿäî÷èâàòü àíàëèçèðóåìûå îáúåêòû ïî ñòåïåíè ïðîÿâëåíèÿ â íèõ èçó÷àåìîãî ñâîéñòâà
(óðîâåíü îáðàçîâàíèÿ ðàáîòíèêîâ èëè óðîâåíü æèëèùíûõ óñëîâèé â ñîöèîëîãèè, ñòåïåíü êàêîãî-ëèáî çàáîëåâàíèÿ â ìåäèöèíå è ò.ï.).
•
Êëàññèôèêàöèîííûå (èëè íîìèíàëüíûå), ïîçâîëÿþùèå ðàçáèâàòü ñîâîêóïíîñòü îáúåêòîâ íà íå ïîääàþùèåñÿ óïîðÿäî÷åíèþ îäíîðîäíûå ïî àíàëèçèðóåìîìó ñâîéñòâó êëàññû (ïðîôåññèÿ ðàáîòíèêà, ìîòèâû ìèãðàöèè â ñîöèîëîãèè, ïîë îñîáè, âèä è ðîä â áèîëîãèè è ò.ä.).
Îòìåòèì, ÷òî òèï ïåðåìåííûõ ñóùåñòâåííî âëèÿåò íà âûáîð ïðèìåíÿåìûõ
ñòàòèñòè÷åñêèõ ìåòîäîâ.
3.2. Задачи статистического анализа
зависимостей
Îáùàÿ çàäà÷à ñòàòèñòè÷åñêîãî àíàëèçà çàâèñèìîñòåé ìîæåò áûòü ñôîðìóëèðîâàíà ñëåäóþùèì îáðàçîì:
ïî ðåçóëüòàòàì n èçìåðåíèé (Õ1, Y1), (Õ2, Y2), ..., (Õn, Yn) èññëåäóåìûõ ïåðåìåííûõ Õ è Y ïîñòðîèòü òàêóþ ôóíêöèþ f(Õ) (â îáùåì ñëó÷àå Õ è Y
ÿâëÿþòñÿ âåêòîðàìè, ôóíêöèÿ f(Õ) — âåêòîðîçíà÷íàÿ), êîòîðàÿ ïîçâîëèëà
áû íàèëó÷øèì îáðàçîì, â îïðåäåëåííîì ñìûñëå, âîññòàíàâëèâàòü çíà÷åíèÿ
ðåçóëüòèðóþùèõ ïåðåìåííûõ Y = (y(1), y(2), ..., y(m)) ïî çàäàííûì çíà÷åíèÿì âõîäíûõ ïåðåìåííûõ Õ = (õ(1), õ(2), ..., õ(ð)).
Äàííàÿ ôîðìóëèðîâêà çàäà÷è íóæäàåòñÿ â óòî÷íåíèÿõ.  ÷àñòíîñòè, ïðåæäå
âñåãî íåîáõîäèìî îòâåòèòü íà ñëåäóþùèå âîïðîñû.
•
Êàêîâî ìàòåìàòè÷åñêîå âûðàæåíèå èñêîìîé çàâèñèìîñòè ìåæäó Õ è Y, çàïèñàííîé â òåðìèíàõ Y, Õ, f(Õ) è ε?
•
 ñîîòâåòñòâèè ñ êàêèì êðèòåðèåì êà÷åñòâà àïïðîêñèìàöèè áóäåò îïðåäåëÿòüñÿ íàèëó÷øèé ñïîñîá âîññòàíîâëåíèÿ çíà÷åíèé Y?
Глава 3. Анализ статистических зависимостей
79
•
Ñ êàêîé ïðèêëàäíîé öåëüþ ïðîâîäèòñÿ ñòàòèñòè÷åñêèé àíàëèç, ò.å. äëÿ
ðåøåíèÿ êàêèõ êîíêðåòíûõ çàäà÷ áóäåò èñïîëüçîâàíà ïîñòðîåííàÿ â ðåçóëüòàòå àíàëèçà ôóíêöèÿ f(Õ)?
Ñ ïîñëåäíåãî âîïðîñà äîëæåí íà÷èíàòüñÿ ëþáîé ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé — îò îòâåòà íà ýòîò âîïðîñ ñóùåñòâåííî çàâèñÿò ïîñëåäîâàòåëüíîñòü
âûïîëíåíèÿ ðàçëè÷íûõ ýòàïîâ àíàëèçà, âûáîð îáùåé ñòðóêòóðû ôóíêöèè f, èíòåðïðåòàöèÿ ïîëó÷åííûõ ñòàòèñòè÷åñêèõ ðåçóëüòàòîâ è ò.ä.
Âûäåëèì òðè îñíîâíûõ òèïà êîíå÷íûõ ïðèêëàäíûõ öåëåé (çàäà÷) àíàëèçà çàâèñèìîñòåé, ðàñïîëîæèâ èõ êàê áû ïî íàðàñòàíèþ ñòåïåíè ïðîíèêíîâåíèÿ â ñîäåðæàòåëüíóþ ñóùíîñòü àíàëèçèðóåìîé êîíêðåòíîé çàäà÷è.
Òèï 1. Óñòàíîâëåíèå ñàìîãî ôàêòà íàëè÷èÿ (èëè îòñóòñòâèÿ) ñòàòèñòè÷åñêè
çíà÷èìîé ñâÿçè ìåæäó Y è Õ. Âûáîð âèäà ôóíêöèè f èãðàåò ïîä÷èíåííóþ ðîëü,
è ÷àñòî äàæå íå ñòîèò âîïðîñ î ïîñòðîåíèè ôóíêöèè f. Çàäà÷è ýòîãî òèïà ðåøàþòñÿ ìåòîäàìè êîððåëÿöèîííîãî àíàëèçà, ðàíãîâûõ êîððåëÿöèé è ñ ïîìîùüþ
àíàëèçà òàáëèö ñîïðÿæåíèÿ.
Òèï 2. Ïðîãíîç (âîññòàíîâëåíèå) çíà÷åíèé ðåçóëüòèðóþùèõ ïåðåìåííûõ Y ïî
çàäàííûì çíà÷åíèÿì âûõîäíûõ ïåðåìåííûõ Õ. Çäåñü òàêæå âûáîð ôóíêöèè f
èãðàåò ïîä÷èíåííóþ ðîëü, ïîñêîëüêó â äàííîì ñëó÷àå èíòåðåñóþòñÿ ëèøü çíà÷åíèÿìè ôóíêöèè f(Õ), íî íå åå ñòðóêòóðîé, ò.å. ôóíêöèÿ f äîëæíà õîðîøî àïïðîêñèìèðîâàòü “÷èñëîâóþ” çàâèñèìîñòü ìåæäó Y è Õ, íî ñîâñåì íå îáÿçàíà îòðàæàòü “ôèçè÷åñêóþ” ñâÿçü ìåæäó Õ è Y.
Òèï 3. Âûÿâëåíèå ïðè÷èííûõ ñâÿçåé ìåæäó âõîäíûìè ïåðåìåííûìè Õ è ðåçóëüòèðóþùèìè ïåðåìåííûìè Y. Òàêàÿ ïîñòàíîâêà çàäà÷è ïðåòåíäóåò íà ïðîíèêíîâåíèå â “ôèçè÷åñêèé ìåõàíèçì” èçó÷àåìûõ ñòàòèñòè÷åñêèõ ñâÿçåé, ò.å.
â òîò ñàìûé ìåõàíèçì ïðåîáðàçîâàíèÿ âõîäíûõ ïåðåìåííûõ Õ è ε â ðåçóëüòèðóþùèå ïîêàçàòåëè Y. Çäåñü íà ïåðâûé ïëàí âûõîäèò çàäà÷à ïðàâèëüíîãî îïðåäåëåíèÿ ñòðóêòóðû ôóíêöèè f(Õ), ïðè ýòîì ÷àñòî ïàðàìåòðû, îò êîòîðûõ ìîæåò
çàâèñåòü ôóíêöèÿ f, èìåþò îïðåäåëåííóþ “ôèçè÷åñêóþ” èíòåðïðåòàöèþ.
Çàäà÷è òèïîâ 2 è 3 ðåøàþòñÿ ìåòîäàìè ðåãðåññèîííîãî è äèñïåðñèîííîãî
àíàëèçà, äèñêðèìèíàíòíîãî àíàëèçà è äð.
Ïðèâåäåì òàáëèöó ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå “îáñëóæèâàþò” òîò èëè
èíîé òèï çàäà÷ â çàâèñèìîñòè îò ïðèðîäû èçó÷àåìûõ ïåðåìåííûõ.
Âèä ðåçóëüòèðóþùèõ
ïåðåìåííûõ Y
Âèä âõîäíûõ ïåðåìåííûõ Õ
Ðàçäåëû ñòàòèñòè÷åñêîãî àíàëèçà
Êîëè÷åñòâåííûå
Êîëè÷åñòâåííûå
Ðåãðåññèîííûé è êîððåëÿöèîííûé àíàëèç
Êîëè÷åñòâåííûå
Åäèíñòâåííàÿ êîëè÷åñòâåííàÿ ïåðåìåííàÿ, èíòåðïðåòèðóåìàÿ êàê “âðåìÿ”
Àíàëèç âðåìåííûõ ðÿäîâ
Êîëè÷åñòâåííûå
Íåêîëè÷åñòâåííûå
(ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå)
Äèñïåðñèîííûé àíàëèç
Êîëè÷åñòâåííûå
Ñìåøàííûå (êîëè÷åñòâåííûå
è íåêîëè÷åñòâåííûå)
Êîâàðèàöèîííûé àíàëèç,
ìîäåëè òèïîëîãè÷åñêîé
ðåãðåññèè
80
Часть I. Основные понятия теории вероятностей и математической статистики
Îêîí÷àíèå òàáë.
Âèä ðåçóëüòèðóþùèõ
ïåðåìåííûõ Y
Âèä âõîäíûõ ïåðåìåííûõ Õ
Ðàçäåëû ñòàòèñòè÷åñêîãî àíàëèçà
Íåêîëè÷åñòâåííûå
(ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå)
Íåêîëè÷åñòâåííûå
(ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå)
Àíàëèç ðàíãîâûõ êîððåëÿöèé è òàáëèö ñîïðÿæåíèÿ
Íåêîëè÷åñòâåííûå
(ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå)
Êîëè÷åñòâåííûå
Äèñêðèìèíàíòíûé àíàëèç, êëàñòåð-àíàëèç, òàêñîíîìèÿ, ðàñùåïëåíèå
ñìåñåé ðàñïðåäåëåíèé
Ñìåøàííûå
(êîëè÷åñòâåííûå è íåêîëè÷åñòâåííûå)
Ñìåøàííûå (êîëè÷åñòâåííûå
è íåêîëè÷åñòâåííûå)
Àïïàðàò ëîãè÷åñêèõ ðåøàþùèõ ôóíêöèé
Îïèøåì áîëåå ïîäðîáíî îñíîâíûå çàäà÷è àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé è ìåòîäû èõ ðåøåíèÿ.
3.3. Корреляционный анализ
 ýòîì ðàçäåëå ðàññìîòðèì çàäà÷ó óñòàíîâëåíèÿ ñàìîãî ôàêòà íàëè÷èÿ ñòàòèñòè÷åñêè çíà÷èìîé ñâÿçè ìåæäó ïåðåìåííûìè. Ýòî çàäà÷à òèïà I èç ïðåäûäóùåãî ðàçäåëà. Ìåòîäû, ïðèìåíÿåìûå äëÿ åå ðåøåíèÿ, çàâèñÿò îò ïðèðîäû èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ (êîëè÷åñòâåííûå, ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå), îò âûáðàííîãî ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (èíäåêñ èëè
êîýôôèöèåíò êîððåëÿöèè, ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè è ò.ï.) è îò êîíêðåòíîé ðåøàåìîé çàäà÷è: òî÷å÷íîå è/èëè èíòåðâàëüíîå îöåíèâàíèå ïîêàçàòåëÿ
ñòàòèñòè÷åñêîé çàâèñèìîñòè, ïðîâåðêà ãèïîòåçû î çíà÷åíèè ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (êàê ïðàâèëî, ïðîâåðÿåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêè çíà÷èìîì îòëè÷èè ýòîãî ïîêàçàòåëÿ îò íóëÿ). Êîíå÷íî, ìîãóò áûòü ïîñòàâëåíû
è äðóãèå êîíêðåòíûå çàäà÷è, íàïðèìåð óñòàíîâëåíèå ñòðóêòóðû ñâÿçåé ìåæäó
êîìïîíåíòàìè âõîäíîé ïåðåìåííîé Õ è âûõîäíîé ïåðåìåííîé Y.
Îïèøåì âîçìîæíûå ìåòîäû ðåøåíèÿ ïåðå÷èñëåííûõ çàäà÷ â çàâèñèìîñòè îò
âèäà èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ.
3.3.1. Анализ зависимостей между количественными
переменными
Ïðåäñòàâèì äâà ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (êîýôôèöèåíò êîððåëÿöèè è èíäåêñ êîððåëÿöèè), èñïîëüçóåìûõ äëÿ àíàëèçà ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó êîëè÷åñòâåííûìè ïåðåìåííûìè.
Коэффициент корреляции
Ïóñòü àíàëèçèðóåòñÿ ïàðíàÿ çàâèñèìîñòü ìåæäó ñëó÷àéíûìè ïåðåìåííûìè Õ
è Y. Íàïîìíèì (ñì. ðàçäåë 1.2.5), ÷òî êîýôôèöèåíò êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ è Y îïðåäåëÿåòñÿ êàê ρ =
cov(X, Y)
DX ⋅ DY
, ãäå êîâàðèàöèÿ
cov(X, Y) âû÷èñëÿåòñÿ ïî ôîðìóëå cov(X, Y) = M[(X – MX)(Y – MY)]. Çíà÷åíèå
Глава 3. Анализ статистических зависимостей
81
êîýôôèöèåíòà êîððåëÿöèè ëåæèò ìåæäó –1 è 1. Îí õàðàêòåðèçóåò ñòåïåíü ëèíåéíîé çàâèñèìîñòè ìåæäó âåëè÷èíàìè X è Y.
Ïðèâåäåì òî÷å÷íûå è èíòåðâàëüíûå îöåíêè âûáîðî÷íîãî êîýôôèöèåíòà
êîððåëÿöèè.
Точечные оценки
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà.
Íèæå ïðèâåäåíà ñòàòèñòèêà äëÿ îöåíêè êîýôôèöèåíòà êîððåëÿöèè:
n
∑ ( x − x )( y
i
r=
i
− y)
i =1
n
,
n
∑ (x − x) ⋅ ∑ ( y
2
i
i =1
ãäå x =
i
− y)
2
i =1
1 n
1 n
xi , y = ∑ yi .
∑
n i =1
n i =1
Ðàñïðåäåëåíèå ýòîé ñòàòèñòèêè â îáùåì ñëó÷àå äîñòàòî÷íî ñëîæíî è çàâèñèò
îò íåèçâåñòíîãî çíà÷åíèÿ êîýôôèöèåíòà êîððåëÿöèè ρ. Äëÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè èçâåñòíî íîðìàëèçóþùåå z-ïðåîáðàçîâàíèå Ôèøåðà
z=
1 1+ r
ln
, çàìå÷àòåëüíîå òåì, ÷òî ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû z íå çà2 1− r
âèñèò îò íåèçâåñòíîãî êîýôôèöèåíòà êîððåëÿöèè. Êðîìå òîãî, óæå ïðè n ≥ 20
ýòî ðàñïðåäåëåíèå áëèçêî ê íîðìàëüíîìó, ïðè÷åì
Mz =


1 1+ r
r
3 − r2
+
+ ... ,
ln
1 −
2 1 − r 2(n − 3)  4(n − 3)

Dz =

1 
r2
2 − 6r 2 + 3r 4
−
−
+ ... ,
1

2
6(n − 3)
n − 3  2(n − 3)

β1 ( z ) =
r6
[M( z − Mz )3 ]2
=
+ ... ,
(Dz )3
(n − 3) 2
β 2 ( z) =
M( z − Mz )4
2
2r 2 − 3r 4
=
+
+
+ ... .
3
n − 3 (n − 3)2
(Dz ) 2
Çäåñü β1(z) — êîýôôèöèåíò àñèììåòðèè, β2(z) — êîýôôèöèåíò ýêñöåññà ñëó÷àéíîé
âåëè÷èíû z. Îòìåòèì, ÷òî ïðè âû÷èñëåíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè ñëó÷àéíîé âåëè÷èíû z â ïðèâåäåííûõ âûøå ôîðìóëàõ îáû÷íî îãðàíè÷èâàþòñÿ
ëèøü ïåðâûìè ñëàãàåìûìè, ò.å. ïîëàãàþò, ÷òî Mz =
1 1+ r
1
ln
è Dz =
.
2 1− r
n−3
Интервальные оценки для коэффициента корреляции
Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà ( z − Mz ) / Dz ðàñïðåäåëåíà ïðèáëèæåííî
ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, ýòî ñâîéñòâî èñïîëüçóåòñÿ ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà êîððåëÿöèè. Åñëè
82
Часть I. Основные понятия теории вероятностей и математической статистики
çàäàí äîâåðèòåëüíûé óðîâåíü α, èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ
ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ êîýôôèöèåíò k.
Çàòåì âû÷èñëÿþòñÿ ãðàíèöû z1 è z2 äîâåðèòåëüíîãî èíòåðâàëà äëÿ z:
z1 =
1 1+ r
k
1 1+ r
k
ln
−
+
è z2 = ln
.
2 1− r
2 1− r
n−3
n−3
Îòñþäà â ðåçóëüòàòå îáðàòíîãî ïðåîáðàçîâàíèÿ Ôèøåðà âû÷èñëÿþòñÿ ãðàíèöû r1
è r2 äîâåðèòåëüíîãî èíòåðâàëà (r1, r2) äëÿ êîýôôèöèåíòà êîððåëÿöèè:
r1 =
e 2 z1 − 1
e 2 z2 − 1
=
r
è
.
2
e2 z1 + 1
e 2 z2 + 1
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà
ïîêàçàíà â ãëàâå 13. Â ýòîé æå ãëàâå ïðèâåäåíû êðèòåðèè ïðîâåðêè ãèïîòåç
î çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè.
Индекс корреляции и коэффициент детерминации
Èíäåêñ êîððåëÿöèè ïðèìåíÿåòñÿ â ìîäåëè Y(Õ) = f(X) + ε, ãäå ε — ñëó÷àéíàÿ
ïåðåìåííàÿ, à ïåðåìåííàÿ Õ ìîæåò áûòü âåêòîðîì. Òàêèì îáðàçîì, èíäåêñ êîððåëÿöèè ìîæíî ïðèìåíÿòü òàì, ãäå íå ïðèìåíèì “ñòàíäàðòíûé” êîýôôèöèåíò
êîððåëÿöèè, èñïîëüçóåìûé äëÿ àíàëèçà ïàðíûõ íàáëþäåíèé.
Îáîçíà÷èì ÷åðåç σ 2Y îáùóþ äèñïåðñèþ ñëó÷àéíîé âåëè÷èíû Y, ÷åðåç σ 2f —
äèñïåðñèþ ôóíêöèè f(X), à ÷åðåç σ ε2 — îñòàòî÷íóþ äèñïåðñèþ, îïðåäåëÿåìóþ
ñëó÷àéíîé âåëè÷èíîé ε (ôîðìóëû äëÿ âû÷èñëåíèÿ ýòèõ äèñïåðñèé ïðèâåäåíû
â ðàçäåëå 3.4.3). Ýòè òðè äèñïåðñèè ñâÿçàíû ðàâåíñòâîì σ 2Y = σ 2f + σ ε2 .
Èíäåêñîì êîððåëÿöèè IYX íàçûâàåòñÿ âåëè÷èíà, îïðåäåëÿåìàÿ ñîîòíîøåíèåì
2
I YX
=
σ 2f
σ 2Y
= 1−
σ ε2
. Î÷åâèäíî, ÷òî 0 ≤ IYX ≤ 1. Åñëè IYX = 0, òîãäà σ 2f = 0 èëè, ÷òî
σ 2Y
òî æå ñàìîå, σ 2Y = σ ε2 . Ýòî îçíà÷àåò ïîëíîå îòñóòñòâèå êàêîãî-ëèáî âëèÿíèÿ ïåðåìåííîé Õ íà ïåðåìåííóþ Y, ò.å. îòñóòñòâèå êîððåëÿöèîííîé ñâÿçè ìåæäó Õ è Y.
Åñëè æå IYX = 1, òî σ ε2 = 0 . Ýòî îçíà÷àåò íàëè÷èå ÷èñòî ôóíêöèîíàëüíîé çàâèñèìîñòè ìåæäó ïåðåìåííûìè Õ è Y.
Êâàäðàò èíäåêñà êîððåëÿöèè ïîêàçûâàåò, êàêàÿ äîëÿ äèñïåðñèè ðåçóëüòèðóþùåé âåëè÷èíû Y îïðåäåëÿåòñÿ (äåòåðìèíèðóåòñÿ) âàðèàöèåé (äèñïåðñèåé)
ôóíêöèè f(X), çàâèñÿùåé îò âëèÿþùåé ïåðåìåííîé Õ. Ïîýòîìó êâàäðàò èíäåêñà
êîððåëÿöèè ÷àñòî íàçûâàþò êîýôôèöèåíòîì äåòåðìèíàöèè è îáîçíà÷àþò êàê
R2. Ýòîò êîýôôèöèåíò èñïîëüçóåòñÿ êàê ìåðà àäåêâàòíîñòè ïîäáîðà ôóíêöèè
ðåãðåññèè äëÿ àïïðîêñèìàöèè èñõîäíûõ äàííûõ (ñì. ðàçäåë 3.4.3).
3.3.2. Анализ зависимостей между порядковыми переменными
Íàïîìíèì, ÷òî ïîðÿäêîâûìè (îðäèíàëüíûìè) íàçûâàþò âåëè÷èíû, çíà÷åíèÿ
êîòîðûõ ìîæíî ðàíæèðîâàòü â ñîîòâåòñòâèè ñ íåêîòîðîé çàäàííîé øêàëîé. Òàêèì îáðàçîì, çíà÷åíèÿìè ïîäîáíûõ âåëè÷èí ñ÷èòàþòñÿ ðàíãè, ïðèñâîåííûå èì
â ñîîòâåòñòâèè ñ ýòîé øêàëîé. Êëàññè÷åñêèìè ïðèìåðàìè òàêèõ âåëè÷èí ÿâëÿþòñÿ óðîâåíü îáðàçîâàíèÿ ðàáîòíèêîâ â ñîöèîëîãèè, óðîâåíü èñïîëüçîâàíèÿ âûñîêèõ òåõíîëîãèé â ïðîìûøëåííîñòè êàêîãî-ëèáî ðåãèîíà èëè ñòðàíû â öåëîì,
Глава 3. Анализ статистических зависимостей
83
ñòåïåíü ýôôåêòèâíîñòè íåêîåãî ìåäèöèíñêîãî ïðåïàðàòà äëÿ ëå÷åíèÿ ðÿäà çàáîëåâàíèé è ò.ï. Êîëè÷åñòâåííûå âåëè÷èíû ÿâëÿþòñÿ ÷àñòíûì ñëó÷àåì ïîðÿäêîâûõ. Ñãðóïïèðîâàííûå êîëè÷åñòâåííûå âåëè÷èíû òàêæå ìîæíî ðàññìàòðèâàòü
êàê ïîðÿäêîâûå âåëè÷èíû. (Èìåííî ïîýòîìó ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè, îïèñàííûå íèæå, ÷àñòî ïðèìåíÿþòñÿ è äëÿ àíàëèçà çàâèñèìîñòåé ìåæäó
êîëè÷åñòâåííûìè ïåðåìåííûìè.)
Åñëè äëÿ àíàëèçà ïðåäîñòàâëÿåòñÿ âûáîðêà, íå ïðåîáðàçîâàííàÿ â ðàíãè, òî
ñíà÷àëà ýòó âûáîðêó íåîáõîäèìî ïðåîáðàçîâàòü ñëåäóþùèì îáðàçîì. Ïóñòü íàáëþäàåòñÿ äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X, Y).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x1, y1), (x2, y2), ..., (xn, yn). Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ
(xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi). Òàêèì îáðàçîì, âìåñòî èñõîäíîé âûáîðêè
èìååì ñîâîêóïíîñòü äâóìåðíûõ çíà÷åíèé (r1, q1), (r2, q2), ..., (rn, qn). Ðàíãè ïðèñâàèâàþòñÿ çíà÷åíèÿì xi è yi íåçàâèñèìî ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(n) (ñì. ðàçäåë 2.3.9). ×èñëî i
÷ëåíà âàðèàöèîííîãî ðÿäà õ(i) áóäåò ðàíãîì ñîîòâåòñòâóþùåãî âûáîðî÷íîãî çíà÷åíèÿ. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. Íàïðèìåð, ïóñòü çíà÷åíèÿ õ(k), õ(k+1) è õ(k+2) ðàâíû ìåæäó
ñîáîé, òîãäà îíè ïîëó÷àþò îäèí è òîò æå ðàíã (k + k + 1 + k + 2)/3 = k + 1. Ïîýòîìó íåêîòîðûå ðàíãè ìîãóò áûòü äðîáíûìè. Äàëåå áóäåì ïðåäïîëàãàòü, ÷òî
âûáîðî÷íûå çíà÷åíèÿ (r1, q1), (r2, q2), ..., (rn, qn) ÿâëÿþòñÿ ðàíãàìè.
Äëÿ îöåíèâàíèÿ ñòåïåíè çàâèñèìîñòè ìåæäó ïîðÿäêîâûìè ñëó÷àéíûìè âåëè÷èíàìè ðàçðàáîòàíû ñïåöèàëüíûå ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè. Íà ïðàêòèêå
íàèáîëåå ÷àñòî èñïîëüçóåòñÿ ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà.
Ранговый коэффициент корреляции Спирмена
Ýòîò êîýôôèöèåíò êîððåëÿöèè âû÷èñëÿåòñÿ ïî ôîðìóëå
n
6
(ri − qi )2 .
∑
n − n i =1
Äîêàçàíî, ÷òî êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà ïî ìîäóëþ íå ïðåâîñõîäèò 1
(òàê æå, êàê è îáû÷íûé êîýôôèöèåíò êîððåëÿöèè). Åñëè âñå ðàíãè (ri, qi) ïîïàðíî ñîâïàäàþò, òî rS = 1. Åñëè æå ýòè ðàíãè ïðîòèâîïîëîæíû, ò.å. qi = n – ri + 1,
òî rS = –1. Îòìåòèì, ÷òî, åñëè íåêîòîðûå ðàíãè ñîâïàäàþò, ñóùåñòâóåò ñâîÿ çíà÷èòåëüíî áîëåå ñëîæíàÿ ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè, íî íà
ïðàêòèêå è â ýòîì ñëó÷àå èñïîëüçóþò âûøåïðèâåäåííóþ ôîðìóëó.
Ïðè óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y Ì(rS) = 0
è D(rS) = 1/(n – 1). Äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà áëèçîê ê îáû÷íîìó êîýôôèöèåíòó êîððåëÿöèè. Íàïðèìåð,
â ñëó÷àå äâóìåðíîé íîðìàëüíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû Z = (X, Y),
äëÿ êîìïîíåíòîâ êîòîðîé êîýôôèöèåíò êîððåëÿöèè ðàâåí ρ, ñîîòíîøåíèå ìåæäó
êîýôôèöèåíòîì êîððåëÿöèè Ñïèðìåíà rS è êîýôôèöèåíò êîððåëÿöèè ρ èìååò
rS = 1 −
3
6
ρ 3
ρ3 3ρ5
arcsin = (ρ +
+
+ ...) .
π
2 π
24 640
Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà îáû÷íî ïðèìåíÿåòñÿ äëÿ
ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X
è Y. Äëÿ ïðîâåðêè ýòîé ãèïîòåçû ïî ìàëûì âûáîðêàì (n ≤ 10) â êà÷åñòâå
âèä rS =
84
Часть I. Основные понятия теории вероятностей и математической статистики
êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò rS, à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äëÿ áîëüøèõ âûáîðîê (n > 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà t =
rS n − 2
1 − rS2
, êîòîðàÿ àñèìïòîòè÷åñêè
èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 2) ñòåïåíüþ ñâîáîäû.
Ранговый коэффициент корреляции Кендалла
“Êîíêóðåíòîì” êîýôôèöèåíòó êîððåëÿöèè Ñïèðìåíà äëÿ îöåíèâàíèÿ ñòåïåíè
çàâèñèìîñòè ìåæäó ïîðÿäêîâûìè ñëó÷àéíûìè âåëè÷èíàìè ìîæåò ñëóæèòü ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà.
Ïóñòü äëÿ âûáîðî÷íûõ çíà÷åíèé (x1, y1), (x2, y2), ..., (xn, yn) âû÷èñëåíû ðàíãè
(r1, q1), (r2, q2), ..., (rn, qn). Ýòà ïîñëåäîâàòåëüíîñòü óïîðÿäî÷èâàþòñÿ ïî âîçðàñòàíèþ ðàíãîâ ri, è ïîëó÷àåòñÿ ïîñëåäîâàòåëüíîñòü (1, q(1)), (2, q(2)), ..., (n, q(n)). Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà âû÷èñëÿåòñÿ ïî ôîðìóëå
rK =
n
n
2
sign(q( j ) − q( i ) ) ,
∑
∑
n(n − 1) i =1 j = i +1
ãäå ôóíêöèÿ sign(x) ïðèíèìàåò çíà÷åíèå +1, åñëè õ > 0, è çíà÷åíèå –1, åñëè
õ < 0. Êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà ïî ìîäóëþ íå ïðåâîñõîäèò 1 è ïðè
óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y Ì(rÊ) = 0 è D(rK ) =
2(2n + 5)
.
9n(n − 1)
Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà (òàê æå, êàê è êîýôôèöèåíò
Ñïèðìåíà) ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y. Äëÿ ïðîâåðêè ýòîé ãèïîòåçû ïî ìàëûì âûáîðêàì
(n ≤ 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò rÊ,
à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äëÿ áîëüøèõ âûáîðîê (n > 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà t = rK
9n(n − 1)
, êîòîðàÿ
2(2n + 5)
àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Åñëè ñðàâíèâàòü ïðèìåíåíèå êîýôôèöèåíòîâ êîððåëÿöèè Ñïèðìåíà è Êåíäàëëà
äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X
è Y, òî ñ÷èòàåòñÿ, ÷òî êîýôôèöèåíò Êåíäàëëà äàåò áîëåå òî÷íûå ðåçóëüòàòû, îñîáåííî äëÿ ìàëûõ âûáîðîê. Êðîìå òîãî, ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ
íåèçâåñòíûõ èñòèííûõ çíà÷åíèé ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè âîçìîæíî
òîëüêî ïðèáëèæåííî è òîëüêî íà îñíîâå êîýôôèöèåíòà Êåíäàëëà.
Коэффициент согласованности множественных связей
Ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè Ñïèðìåíà è Êåíäàëëà ïðèìåíÿþòñÿ äëÿ
îöåíêè ñòàòèñòè÷åñêèõ ñâÿçåé ìåæäó äâóìÿ ïîðÿäêîâûìè ïåðåìåííûìè. Èíîãäà
âîçíèêàåò íåîáõîäèìîñòü â îöåíêå ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó íåñêîëüêèìè (áîëüøå äâóõ) ïåðåìåííûìè. Äëÿ ýòèõ öåëåé èñïîëüçóåòñÿ êîýôôèöèåíò
ñîãëàñîâàííîñòè (òàêæå íàçûâàåìûé êîýôôèöèåíòîì êîíêîðäàöèè).
Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X1, X2, ..., Xm).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x11, x21, ..., xm1), (x12, x22, ..., xm2), ...,
Глава 3. Анализ статистических зависимостей
85
(x1n, x2n, ..., xmn). Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (x1i, x2i, ..., xmi) ïðèñâàèâàþòñÿ ðàíãè (r1i, r2i, ..., rmi). Ðàíãè rji ïðèñâàèâàþòñÿ çíà÷åíèÿì xji íåçàâèñèìî ïóòåì ïîñòðîåíèÿ
îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ äëÿ ðåàëèçàöèè êàæäîãî êîìïîíåíòà Xj òàê æå, êàê
ïðè âû÷èñëåíèè êîýôôèöèåíòîâ Ñïèðìåíà è Êåíäàëëà. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé.
Êîýôôèöèåíò ñîãëàñîâàííîñòè âû÷èñëÿåòñÿ ïî ôîðìóëå
2
W=
n  m
12
m(n + 1) 
 ∑ rji −
 .
∑
2
3
m (n − n) i =1  j =1
2

Ýòîò êîýôôèöèåíò ïðèíèìàåò çíà÷åíèÿ èç èíòåðâàëà [0, 1]. Åñëè W = 0, òî ñ÷èòàåòñÿ, ÷òî êîìïîíåíòû X1, X2, ..., Xm íåçàâèñèìû. Ñ äðóãîé ñòîðîíû, W = 1 òîãäà è òîëüêî òîãäà, êîãäà âñå ðàíãè rji, ñîîòâåòñòâóþùèå âûáîðî÷íîìó çíà÷åíèþ
(x1i, x2i, ..., xmi), ðàâíû è ýòî óñëîâèå âûïîëíÿåòñÿ äëÿ âñåõ âûáîðî÷íûõ çíà÷åíèé. Ïðè óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X1, X2, ..., Xm Ì(W) = 1/m
è D(W ) =
2(m − 1)
. Îòìåòèì, ÷òî ïðè m =2 W = (1 + rS)/2, ãäå rS — êîýôôèöèåíò
m3 (n − 1)
êîððåëÿöèè Ñïèðìåíà.
Äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí
X1, X2, ..., Xm ïî ìàëûì âûáîðêàì â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò W, à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äàííîå ðàñïðåäåëåíèå óäîâëåòâîðèòåëüíî àïïðîêñèìèðóåòñÿ áåòà-ðàïðåäåëåíèåì [4]. Äëÿ
âûáîðîê îáúåìîì áîëåå 7 â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà
t = m(n − 1)W , êîòîðàÿ àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ
ñâîáîäû. Èíîãäà èñïîëüçóåòñÿ ñòàòèñòèêà T =
1  (m − 1)W
ln 
2  1−W

 , êîòîðàÿ ïðèáëèæåííî

èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = n – 1 – 2/m è ν2 = (m – 1)ν1.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ îïèñàííûõ ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè
ïîêàçàíà â ãëàâå 13.
3.3.3. Анализ зависимостей между классификационными
переменными
Íàïîìíèì, ÷òî êëàññèôèêàöèîííûå (íîìèíàëüíûå) ïåðåìåííûå ïðèíèìàþò
çíà÷åíèÿ, êîòîðûå ìîæíî ðàçáèòü íà íåïåðåñåêàþùèåñÿ ìíîæåñòâà, íî ýòè ìíîæåñòâà òðóäíî èëè íåâîçìîæíî óïîðÿäî÷èòü ïî êàêîìó-ëèáî ïðèçíàêó.
“Êëàññè÷åñêèìè” ïðèìåðàìè òàêèõ ïåðåìåííûõ ÿâëÿþòñÿ ïðîôåññèè ðàáîòíèêîâ
èëè ìîòèâû ìèãðàöèè â ñîöèîëîãèè, ïîë îñîáè, âèä è ðîä â áèîëîãèè è ò.ä. Åñëè
õîòÿ áû îäíà èç ïåðåìåííûõ ÿâëÿåòñÿ êîëè÷åñòâåííîé, òàêèå äàííûå èññëåäóþòñÿ ìåòîäàìè äèñïåðñèîííîãî àíàëèçà (â ýòîì ñëó÷àå íåêîëè÷åñòâåííûå ïåðåìåííûå ìîæíî îòîæäåñòâèòü ñ ôàêòîðàìè âëèÿíèÿ; ñì. ðàçäåë 3.5).  îáùåì ñëó÷àå
îñíîâíûì èíñòðóìåíòîì èññëåäîâàíèÿ çàâèñèìîñòåé ìåæäó êëàññèôèêàöèîííûìè ïåðåìåííûìè ÿâëÿþòñÿ òàáëèöû ñîïðÿæåííîñòè.
Ðàññìîòðèì äâóìåðíûå òàáëèöû ñîïðÿæåííîñòè, êîòîðûå ñîîòâåòñòâóþò äâóì
êëàññèôèêàöèîííûì ïåðåìåííûì (òàêèå òàáëèöû èíîãäà íàçûâàþò òàáëèöàìè
86
Часть I. Основные понятия теории вероятностей и математической статистики
ñîïðÿæåííîñòè ñ äâóìÿ âõîäàìè). Àíàëèç ìíîãîìåðíûõ òàáëèö ñîïðÿæåííîñòè
(òàáëèö ñ òðåìÿ è áîëåå âõîäàìè) äîñòàòî÷íî ñëîæåí; ìåòîäû àíàëèçà òàêèõ òàáëèö ìîæíî íàéòè â [3].
Ïóñòü èìååòñÿ äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X, Y), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò çíà÷åíèÿ (ïðèçíàêè) À1, À2, ..., Às, à ñëó÷àéíàÿ
âåëè÷èíà Y — çíà÷åíèÿ (ïðèçíàêè) B1, B2, ..., Br1. Âûáîðî÷íûå äàííûå ïðåäñòàâëÿþòñÿ â âèäå ñëåäóþùåé òàáëèöû ñîïðÿæåííîñòè. Çäåñü xij — êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ïðèçíàêè Bi è Aj.
B1
À1
À2
...
Às
Âñåãî
x11
x12
...
x1s
n1* = ∑ x1i
s
i =1
B2
x21
x22
...
x2s
s
n2* = ∑ x2i
i =1
...
...
...
...
...
...
Br
xr1
xr2
...
xrs
nr * = ∑ xri
s
i =1
Âñåãî
r
n*1 = ∑ xi1
i =1
r
n*2 = ∑ xi 2
...
i =1
r
n*s = ∑ xis
i =1
s
r
i =1
i =1
n = ∑ n*i = ∑ ni*
Äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí Õ è Y âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà
r
s
T = n∑∑
i =1 j =1
( xij − ni* n* j ) 2
ni* n* j
 r s xij2

= n  ∑∑
− 1 .
 i =1 j =1 ni* n* j



Ýòà ñòàòèñòèêà ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñî ñòåïåíüþ ñâîáîäû, ðàâíîé (r – 1)(s – 1). Äëÿ ñëó÷àÿ r = s = 2 èìååòñÿ òî÷íûé êðèòåðèé Ôèøåðà ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè [14, 17].
Åñëè êðèòåðèé ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè óñòàíàâëèâàåò, ÷òî ñóùåñòâóåò ñòàòèñòè÷åñêè çíà÷èìàÿ çàâèñèìîñòü ìåæäó ïåðåìåííûìè Õ è Y, òî ïîëåçíî èìåòü êàêóþ-òî ÷èñëîâóþ ìåðó ýòîé çàâèñèìîñòè (íàïîäîáèå êîýôôèöèåíòà êîððåëÿöèè äëÿ êîëè÷åñòâåííûõ ïåðåìåííûõ). Ñòàòèñòèêà Ò â ñèëó ðÿäà
ïðè÷èí íåïîñðåäñòâåííî íå ìîæåò âûñòóïàòü â êà÷åñòâå òàêîé ìåðû çàâèñèìîñòè, îäíàêî íà åå îñíîâå ðàçðàáîòàíî íåñêîëüêî ïîêàçàòåëåé çàâèñèìîñòè êëàññèôèêàöèîííûõ ïåðåìåííûõ, ñðåäè êîòîðûõ âûäåëèì ñëåäóþùèå:
1
Ïîÿñíÿþùèé ïðèìåð. Ïóñòü íåîáõîäèìî ïðîâåðèòü, åñòü ëè çàâèñèìîñòü ìåæäó öâåòîì
ãëàç è öâåòîì âîëîñ ó ëþäåé (ïðèìåð èç [14]). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ — ýòî “öâåò
ãëàç”, à âåëè÷èíà Y — “öâåò âîëîñ”, òîãäà À1 = “êàðèé öâåò ãëàç”, À2 = “ñèíèé öâåò ãëàç”
è ò.ä., Â1 = “áëîíäèí(êà)”, Â2 = “áðþíåò(êà)” è ò.ä. Êàæäûé èíäèâèäóóì, èíôîðìàöèÿ î êîòîðîì âêëþ÷åíà â èññëåäóåìóþ âûáîðêó, õàðàêòåðèçóåòñÿ äâóìÿ ïðèçíàêàìè: Aij è Bik, ãäå i —
íîìåð èíäèâèäóóìà, j — íîìåð öâåòà ãëàç, k — íîìåð öâåòà âîëîñ.
Глава 3. Анализ статистических зависимостей
87
•
êîýôôèöèåíò ñîïðÿæåííîñòè C =
•
ìåðà ñâÿçè ×óïðîâà K =
•
êîýôôèöèåíò ϕ =
T
;
T +n
T
n (r − 1)( s − 1)
;
T
.
n
Ýòè êîýôôèöèåíòû èñïîëüçóþòñÿ â ðàçëè÷íûõ ñèòóàöèÿõ è êàæäûé èç íèõ èìååò ñâîè ïðåèìóùåñòâà è íåäîñòàòêè.
 çàêëþ÷åíèå îòìåòèì, ÷òî äëÿ àíàëèçà çàâèñèìîñòè êëàññèôèêàöèîííûõ ïåðåìåííûõ ðàçðàáîòàíû òàê íàçûâàåìûå èíôîðìàöèîííûå ïîêàçàòåëè çàâèñèìîñòè, èñïîëüçóþùèå ïîíÿòèå ýíòðîïèè è êîëè÷åñòâà èíôîðìàöèè, ÷òî ïîçâîëÿåò
îïðåäåëÿòü íàïðàâëåííûå ìåðû çàâèñèìîñòè ìåæäó ïåðåìåííûìè. Ýòè âåñüìà
èíòåðåñíûå ïîêàçàòåëè çàâèñèìîñòè îïèñàíû â [1].
3.4. Регрессионный анализ
Ðàññìîòðèì áîëåå ïîäðîáíî âèäû çàâèñèìîñòåé ìåæäó êîëè÷åñòâåííûìè ïåðåìåííûìè Õ è Y (îäíà èëè îáå ýòè ïåðåìåííûå ìîãóò áûòü âåêòîðíûìè). Çäåñü
âîçìîæíû ñëåäóþùèå ñëó÷àè.
Ðåãðåññèîííàÿ çàâèñèìîñòü ñëó÷àéíîãî ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y îò íåñëó÷àéíûõ âõîäíûõ ïåðåìåííûõ Õ. Ïðèðîäà òàêîé ñâÿçè ìîæåò íîñèòü äâîéñòâåííûé õàðàêòåð:
a) ðåãèñòðàöèÿ ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y íåèçáåæíî ñâÿçàíà ñ íåêîòîðûìè ñëó÷àéíûìè îøèáêàìè èçìåðåíèÿ ε, â òî âðåìÿ êàê âõîäíûå ïåðåìåííûå Õ èçìåðÿþòñÿ áåç îøèáîê (èëè âåëè÷èíû ýòèõ îøèáîê ïðåíåáðåæèìî ìàëû ïî ñðàâíåíèþ ñ îøèáêàìè èçìåðåíèÿ Y);
b) çíà÷åíèÿ ïåðåìåííûõ Y çàâèñÿò íå òîëüêî îò ñîîòâåòñòâóþùèõ çíà÷åíèé
Õ, íî è îò ðÿäà íåêîíòðîëèðóåìûõ ôàêòîðîâ, ïîýòîìó ïðè êàæäîì ôèêñèðîâàííîì çíà÷åíèè Õ ñîîòâåòñòâóþùèå çíà÷åíèÿ ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y(Õ), èçìåðåííûå â ðÿäå îïûòîâ, íåèçáåæíî ïîäâåðæåíû íåêîòîðîìó ñëó÷àéíîìó ðàçáðîñó.
Óäîáíîé ìàòåìàòè÷åñêîé ìîäåëüþ òàêîãî ðîäà çàâèñèìîñòåé ÿâëÿåòñÿ óðàâíåíèå âèäà Y(Õ) = f(X) + ε, ãäå ε — ñëó÷àéíàÿ ïåðåìåííàÿ. Ýòî óðàâíåíèå íàçûâàåòñÿ óðàâíåíèåì ðåãðåññèè; ôóíêöèÿ f(Õ) — ôóíêöèåé ðåãðåññèè. Îòíîñèòåëüíî
ñëó÷àéíîé âåëè÷èíû ε îáû÷íî äåëàåòñÿ ïðåäïîëîæåíèå, ÷òî îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì.
3.4.1. Выбор функции регрессии
Âûáîð íàèëó÷øåé â íåêîòîðîì ñìûñëå ôóíêöèè f(Õ) ñîñòàâëÿåò çàäà÷ó ðåãðåññèîííîãî àíàëèçà. Íî ñíà÷àëà íåîáõîäèìî óñòàíîâèòü êðèòåðèé, ñ ïîìîùüþ
êîòîðîãî ìîæíî îïðåäåëèòü, ÷òî òàêîå “íàèëó÷øàÿ” ôóíêöèÿ ðåãðåññèè.
Îäíèì èç øèðîêî ïðèìåíÿåìûõ íà ïðàêòèêå êðèòåðèåâ îïòèìàëüíîñòè ôóíêöèè ðåãðåññèè ÿâëÿåòñÿ êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ. Îí ôîðìóëèðóåòñÿ
88
Часть I. Основные понятия теории вероятностей и математической статистики
ñëåäóþùèì îáðàçîì. Ïóñòü èìåþòñÿ íàáëþäåíèÿ (õ1, y1), (õ2, y2), ..., (õn, yn).
Ôóíêöèÿ f(õ) ïîäáèðàåòñÿ òàêèì îáðàçîì, ÷òîáû ñóììà êâàäðàòîâ
(y1 – f(x1))2 + (y2 – f(x2))2 + ... + (yn – f(xn))2
áûëà ìèíèìàëüíîé. Ïðè îïðåäåëåíèè ôóíêöèè ðåãðåññèè ýòîò êðèòåðèé ïîçâîëÿåò èñïîëüçîâàòü õîðîøî ðàçðàáîòàííûé ìåòîä íàèìåíüøèõ êâàäðàòîâ, îáåñïå÷èâàþùèé ïîñòðîåíèå ôóíêöèè ðåãðåññèè, õàðàêòåðèçóåìîé ìèíèìàëüíûì
ñðåäíèì êâàäðàòîì åå îòêëîíåíèÿ îò ýêñïåðèìåíòàëüíûõ äàííûõ.
Îïðåäåëèâ êðèòåðèé îïòèìàëüíîñòè ðåãðåññèè, ñëåäóåò ïåðåéòè ê âûáîðó òèïà ôóíêöèè ðåãðåññèè. Òèï ôóíêöèè ðåãðåññèè â çíà÷èòåëüíîé ìåðå çàâèñèò îò
ýêñïåðèìåíòàëüíûõ äàííûõ, îäíàêî íàèáîëåå ÷àñòî èñïîëüçóþò ìíîãî÷ëåí âèäà
Y = a + b1X + b2X2 + ... + bmXm (êîýôôèöèåíòû a è bi îïðåäåëÿþòñÿ íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ). Òàêàÿ ôóíêöèÿ ðåãðåññèè íàçûâàåòñÿ ïîëèíîìèàëüíîé.
Îñòàíîâèìñÿ íà ïðîáëåìå âûáîðà ñòåïåíè ìíîãî÷ëåíà. Âûáîð îïòèìàëüíîé
ñòåïåíè àïïðîêñèìèðóþùåãî ìíîãî÷ëåíà çàâèñèò îò ìíîãèõ ôàêòîðîâ. Âîïåðâûõ, îò ñâîéñòâ àïïðîêñèìèðóåìîé ôóíêöèè Y = f(X) (îò åå ãëàäêîñòè [11]);
âî-âòîðûõ, îò ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê íàáëþäàåìûõ çíà÷åíèé Y (îñîáåííî
îò äèñïåðñèè). Åñëè àïðèîðíàÿ èíôîðìàöèÿ î ôóíêöèè f(X) è ñòàòèñòè÷åñêèõ
õàðàêòåðèñòèêàõ íàáëþäàåìûõ çíà÷åíèé ìèíèìàëüíà èëè îòñóòñòâóåò, òî íà
ïðàêòèêå ñ÷èòàåòñÿ, ÷òî ñòåïåíü ìíîãî÷ëåíà íå ìåíåå ÷åì íà ïîðÿäîê äîëæíà
áûòü ìåíüøå ÷èñëà òî÷åê äàííûõ, íî íå áîëåå 6–8. Îáû÷íî èñïîëüçóþò ìíîãî÷ëåíû íåáîëüøîé ñòåïåíè, ÷àñòî — ïåðâîé èëè âòîðîé.
Òàêæå ÷àñòî ïðèìåíÿþòñÿ ôóíêöèè âèäà
•
Y = a + b ln(X);
•
Y = a + bX + c
•
Y=
1
1
èëè
= a + bX ;
Y
a + bX
•
Y=
1
1
èëè
= a + b1X + b2 X 2 + ... + bm X m ;
2
m
Y
a + b1X + b2 X + ... + bm X
•
Y = ea + b X èëè ln(Y) = a + b X;
•
Y = à Õb èëè ln(Y) = a1 + b1 ln(X).
1
;
X
Îáðàùàåì âíèìàíèå, ÷òî âñå ïðèâåäåííûå ôóíêöèè èëè èõ ïðåîáðàçîâàíèÿ
ëèíåéíû îòíîñèòåëüíî êîýôôèöèåíòîâ.  îáùåì ñëó÷àå òàêèå ôóíêöèè ìîæíî
ïðåäñòàâèòü â âèäå
Ψ(Y) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X).
Çäåñü ôóíêöèè Ψ è ϕi çàäàíû è, êàê ïðàâèëî, îáëàäàþò “õîðîøèìè” ñâîéñòâàìè,
íàïðèìåð äèôôåðåíöèðóåìîñòüþ. Êîýôôèöèåíòû bi îïðåäåëÿþòñÿ íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ. Ëèíåéíîñòü îòíîñèòåëüíî êîýôôèöèåíòîâ bi äàííûõ
ôóíêöèé çíà÷èòåëüíî óïðîùàåò âû÷èñëåíèå çíà÷åíèé ýòèõ êîýôôèöèåíòîâ.
Êîíå÷íî, ïðè íåîáõîäèìîñòè ìîæíî èñïîëüçîâàòü ôóíêöèè, íåëèíåéíûå îòíîñèòåëüíî íåèçâåñòíûõ ïàðàìåòðîâ (êîýôôèöèåíòîâ). Îíè íàçûâàþòñÿ ôóíêöèÿìè íåëèíåéíîé ðåãðåññèè.  ýòîì ñëó÷àå êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ òàêæå ñîõðàíÿåò ñâîþ ñèëó, íî íåïîñðåäñòâåííîå âû÷èñëåíèå çíà÷åíèé ýòèõ
Глава 3. Анализ статистических зависимостей
89
íåèçâåñòíûõ ïàðàìåòðîâ ðåçêî óñëîæíÿåòñÿ — íåîáõîäèìî ïðèìåíÿòü ìåòîäû íåëèíåéíîé îïòèìèçàöèè. Êðîìå òîãî, âîçðàñòàåò ñëîæíîñòü èññëåäîâàíèÿ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê âû÷èñëåííûõ ïàðàìåòðîâ è óðàâíåíèÿ ðåãðåññèè â öåëîì.
Åñëè ïåðåìåííàÿ Õ ÿâëÿåòñÿ âåêòîðîì, ò.å. Õ = (Õ1, Õ2, ..., Õn), òî èìååì òàê
íàçûâàåìóþ ìíîæåñòâåííóþ ðåãðåññèþ: ôóíêöèÿ ðåãðåññèè çäåñü ìîæåò çàâèñåòü êàê
îò îòäåëüíûõ êîìïîíåíòîâ âåêòîðà Õ, òàê è îò ëþáîé êîìáèíàöèè ýòèõ êîìïîíåíòîâ.
Ïðîñòåéøèìè ôóíêöèÿìè ìíîæåñòâåííîé ðåãðåññèè ÿâëÿþòñÿ ïîëèíîìû âèäà
n
n
n
Y = a + ∑ bi X i + ∑ ci X i2 + ... + ∑ di X im +
i =1
i =1
i =1
∑
m
eij ...k X imi X j j ...X mk k .
i , j ,..., k
Çäåñü ïîñëåäíÿÿ ñóììà ïðåäñòàâëÿåò âñåâîçìîæíûå ïðîèçâåäåíèÿ ïåðåìåííûõ
Õ1, Õ2, ..., Õn â ðàçíûõ ñòåïåíÿõ. Íàèáîëüøàÿ ñòåïåíü ïåðåìåííûõ Õi èëè ñóììû
ñòåïåíåé èõ ïðîèçâåäåíèé íàçûâàåòñÿ ñòåïåíüþ ïîëèíîìà. Îòìåòèì, ÷òî çäåñü
ôóíêöèÿ ðåãðåññèè òàêæå ëèíåéíà îòíîñèòåëüíî êîýôôèöèåíòîâ ïîëèíîìà. Íà
ïðàêòèêå ðåäêî èñïîëüçóþòñÿ òàêîãî òèïà ïîëèíîìû ñòåïåíè, áîëüøåé 2 èëè 3.
Ïîñëå âûáîðà òèïà ôóíêöèè ðåãðåññèè íåîáõîäèìî âû÷èñëèòü ïàðàìåòðû ýòîé
ôóíêöèè è ïðîâåðèòü àäåêâàòíîñòü ïîñòðîåííîé ôóíêöèè èìåþùèìñÿ äàííûì,
íà îñíîâå êîòîðûõ ðàññ÷èòûâàëèñü ïàðàìåòðû. Ýòèì âîïðîñàì ïîñâÿùåíû ñëåäóþùèå ðàçäåëû.  ðàìêàõ ðåãðåññèîííîãî àíàëèçà òàêæå ðåøàþòñÿ çàäà÷è ïðîâåðêè çíà÷èìîñòè ðåãðåññèè, ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè è ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ êîýôôèöèåíòîâ,
âû÷èñëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y ïðè òåõ çíà÷åíèÿõ Õ, êîòîðûõ íåò â èñõîäíûõ
äàííûõ (çàäà÷à ïðîãíîçèðîâàíèÿ) è äð. Ïåðå÷èñëåííûå çàäà÷è áóäóò êðàòêî ðàññìîòðåíû íèæå. Ïðàêòè÷åñêèå ìåòîäû èõ ðåøåíèÿ îïèñàíû â ãëàâå 15.
3.4.2. Построение функции регрессии
Ðàññìîòðèì ìåòîä íàèìåíüøèõ êâàäðàòîâ â ñàìîì îáùåì ñëó÷àå, êîãäà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ âèäà
Ψ(Y) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X).
Êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ çàïèøåòñÿ êàê
n
∑ ( Ψ ( y ) − b ϕ ( x ) − b ϕ ( x ) − ... − b ϕ
i
i =1
0
0
i
1 0
i
m
( xi ) ) = min .
2
m
Çäåñü (õ1, y1), (õ2, y2), ..., (õn, yn) — èñõîäíûå äàííûå. Äëÿ îïðåäåëåíèÿ íåèçâåñòíûõ êîýôôèöèåíòîâ b0, b1, ..., bm ïîñëåäíåå âûðàæåíèå ñëåäóåò ïðîäèôôåðåíöèðîâàòü ïî ýòèì êîýôôèöèåíòàì è ïîëó÷åííûå ïðîèçâîäíûå ïðèðàâíÿòü
ê íóëþ. Ïîëó÷èì òàê íàçûâàåìóþ ñèñòåìó íîðìàëüíûõ óðàâíåíèé:
n
n
n
 n 2
 b0 ∑ ϕ0 ( xi ) + b1 ∑ ϕ0 ( xi )ϕ1 ( xi ) + ... + bm ∑ ϕ0 ( xi )ϕ m ( xi ) = ∑ Ψ ( yi )ϕ 0 ( xi );
i =1
i =1
i =1
 i =1
n
n
n
n

2
 b0 ∑ ϕ0 ( xi )ϕ1 ( xi ) + b1 ∑ ϕ1 ( xi ) + ... + bm ∑ ϕ1 ( xi )ϕ m ( xi ) = ∑ Ψ ( yi )ϕ1 ( xi );
 i =1
i =1
i =1
i =1

…

n
n
n
 n
2
b
ϕ
(
x
)
ϕ
(
x
)
+
b
ϕ
(
x
)
ϕ
(
x
)
+
...
+
b
ϕ
(
x
)
=
Ψ ( yi )ϕ m ( xi ).
∑
∑
∑
∑
i
m
i
i
m
i
m
m
i
0
0
1
1

i =1
i =1
i =1
 i =1
Çíà÷åíèÿ êîýôôèöèåíòîâ b0, b1, ..., bm îïðåäåëÿþòñÿ êàê ðåøåíèÿ ýòîé ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé. Çà èñêëþ÷åíèåì ðåäêèõ ñëó÷àåâ
90
Часть I. Основные понятия теории вероятностей и математической статистики
âûðîæäåííîñòè ñèñòåìû íàõîæäåíèå ðåøåíèÿ íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé — â Excel èìååòñÿ íåñêîëüêî ñðåäñòâ ðåøåíèÿ òàêèõ ñèñòåì (ñì. ãëàâó 6).
Ïðè ïðîñòåéøåé àïïðîêñèìàöèè ìíîãî÷ëåíîì ïåðâîé ñòåïåíè óðàâíåíèå ëèíåéíîé ðåãðåññèè èìååò âèä Y = a + bX.  íåì ñëåäóåò îïðåäåëèòü çíà÷åíèÿ êîýôôèöèåíòîâ à è b, óäîâëåòâîðÿþùèå êðèòåðèþ ìèíèìóìà ñóììû êâàäðàòîâ.
 äàííîì ñëó÷àå ýòîò êðèòåðèé çàïèøåòñÿ êàê
n
∑(y
i
− a − bxi ) 2 = min .
i =1
Íîðìàëüíàÿ ñèñòåìà óðàâíåíèé áóäåò èìåòü âèä
n
n

+
=
an
b
x
yi ;
∑
∑
i


i =1
i =1
 n
n
n
a x + b x 2 =
yi xi .
∑
∑
i
i
 ∑
i =1
i =1
i =1
Ðåøåíèåì ýòîé ñèñòåìû áóäóò ñëåäóþùèå ôîðìóëû äëÿ âû÷èñëåíèÿ êîýôôèöèåíòîâ à è b:
n
n
2
i
a=
n
n
∑x ∑ y −∑x ∑ y x
i =1
i
i =1
i
i =1
i =1
2
 n 
n∑ xi2 −  ∑ xi 
i =1
 i =1 
n
n
i i
, b=
n
n
i =1
i =1
n∑ yi xi − ∑ xi ∑ yi
i =1
 n 
n∑ xi2 −  ∑ xi 
i =1
 i =1 
n
2
.
Ïðè àïïðîêñèìàöèè èñõîäíûõ äàííûõ ìíîãî÷ëåíàìè áîëåå âûñîêèõ ñòåïåíåé
ïðèìåíÿåòñÿ ïîäîáíûé ñïîñîá âû÷èñëåíèÿ íåèçâåñòíûõ êîýôôèöèåíòîâ ìíîãî÷ëåíà.  Excel èìååòñÿ íåñêîëüêî ñðåäñòâ, ïîçâîëÿþùèõ âû÷èñëÿòü êîýôôèöèåíòû êàê ëèíåéíîé ðåãðåññèè, òàê è ïîëèíîìèàëüíîé. Ýòè ñðåäñòâà îïèñàíû
â ÷àñòè II, à èõ ïðàêòè÷åñêîå ïðèìåíåíèå — â ãëàâå 15.
3.4.3. Проверка адекватности функции регрессии
Ïóñòü íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ (õ1, y1), (õ2, y2), ..., (õn, yn) ïîñòðîåíà
ôóíêöèÿ ðåãðåññèè f(õ), çàâèñÿùàÿ îò k ïàðàìåòðîâ, çíà÷åíèÿ êîòîðûõ ðàññ÷èòûâàþòñÿ ïî èñõîäíûì äàííûì. Îáîçíà÷èì ÷åðåç yˆ i çíà÷åíèÿ ôóíêöèè f(õ) â òî÷êàõ õ1,
õ2, ..., xn: yˆi = f ( xi ) , i = 1, 2, ..., n. Äëÿ ïðîâåðêè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè
èñõîäíûì äàííûì âû÷èñëÿåòñÿ äèñïåðñèîííàÿ òàáëèöà ñëåäóþùåãî âèäà.
Èñòî÷íèê âàðèàöèè
(êîìïîíåíòû äèñïåðñèè)
Ðåãðåññèÿ
Ñóììà êâàäðàòîâ
n
SS1 = ∑ ( yˆi − y ) 2
×èñëî ñòåïåíåé ñâîáîäû
k
Äèñïåðñèÿ
s 2f =
i =1
Îñòàòêè
n
SS 2 = ∑ ( yi − yˆi ) 2
n–k–1
i =1
Ïîëíàÿ (îáùàÿ) âàðèàöèÿ
n
SS = ∑ ( yi − y ) 2
i =1
n–1
sε2 =
SS1
n
SS2
n − k −1
sY2 =
SS
n
Глава 3. Анализ статистических зависимостей
91
Çäåñü y =
1 n
∑ yi . Äîêàçàíî, ÷òî sY2 = s 2f + sε2 . Ìåðîé àäåêâàòíîñòè ôóíêöèè
n i =1
ðåãðåññèè èìåþùèìñÿ äàííûì ñëóæèò âåëè÷èíà R 2 =
s 2f
sY2
, êîòîðàÿ íàçûâàåòñÿ
êîýôôèöèåíòîì äåòåðìèíàöèè. Ýòîò êîýôôèöèåíò ïðèíèìàåò çíà÷åíèÿ îò 0 äî
1 è ïîêàçûâàåò, íàñêîëüêî âåëèêî îáùåå îòêëîíåíèå çíà÷åíèé ôóíêöèè ðåãðåññèè îò ôàêòè÷åñêèõ çíà÷åíèé âåëè÷èíû Y. Åñëè íàéäåíà èäåàëüíàÿ ôóíêöèÿ
ðåãðåññèè, òî R2 = 1 (ìàêñèìàëüíîå çíà÷åíèå).  ñëó÷àå ëèíåéíîé ðåãðåññèè R2
ðàâíî êâàäðàòó êîýôôèöèåíòà êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ
è Y; êîðåíü èç R2 íàçûâàåòñÿ èíäåêñîì êîððåëÿöèè IYX (ñì. ðàçäåë 3.3.1). Òàêèì
îáðàçîì, ÷åì áëèæå êîýôôèöèåíò äåòåðìèíàöèè ê 1, òåì áîëåå òî÷íî âûáðàííàÿ
ôóíêöèÿ ðåãðåññèè ñîîòâåòñòâóåò ýêñïåðèìåíòàëüíûì äàííûì.
Åñëè ñëó÷àéíàÿ âåëè÷èíà ε èç óðàâíåíèÿ çàâèñèìîñòè Y(Õ) = f(X) + ε èìååò
íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì, òî ñóùåñòâóåò êðèòåðèé ïðîâåðêè çíà÷èìîñòè êîýôôèöèåíòà äåòåðìèíàöèè.  ýòîì ñëó÷àå
è ïðè óñëîâèè ñïðàâåäëèâîñòè íóëåâîé ãèïîòåçû Í0: R2 = 0 ñòàòèñòèêà F =
s 2f
sε2
èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1). (Ñòàòèñòèêà F ñâÿçàíà ñ êîýôôèöèåíòîì R2 ñîîòíîøåíèåì F =
n − k −1 R2
.) Åñëè íàéäåíà êâàí⋅
k
1 − R2
òèëü t ïîðÿäêà 1 – α (α — çàäàííûé óðîâåíü çíà÷èìîñòè) F-ðàñïðåäåëåíèÿ ñî
ñòåïåíÿìè ñâîáîäû k è (n – k – 1), òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè F ≤ t.
 ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêîé çíà÷èìîñòè ðåãðåññèè.
Êðîìå êîýôôèöèåíòà äåòåðìèíàöèè, èñïîëüçóþòñÿ äðóãèå ïîêàçàòåëè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè èñõîäíûì äàííûì, â ÷àñòíîñòè óïîìèíàåìûé âûøå
èíäåêñ êîððåëÿöèè. Òàêæå ÷àñòî èñïîëüçóåòñÿ ïîêàçàòåëü ñðåäíåé îòíîñèòåëüíîé îøèáêè àïïðîêñèìàöèè
ε=
1 n yi − yˆi
.
∑
n i =1 yi
×åì ìåíüøå ýòîò ïîêàçàòåëü, òåì ëó÷øå ôóíêöèÿ ðåãðåññèè àïïðîêñèìèðóåò
ýêñïåðèìåíòàëüíûå äàííûå.
3.4.4. Статистические характеристики параметров функции
регрессии
 ðåãðåññèîííîì àíàëèçå îòíîñèòåëüíî êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè
ðåøàþòñÿ ñëåäóþùèå çàäà÷è.
1. Ïðîâåðêà çíà÷èìîñòè êàæäîãî êîýôôèöèåíòà ðåãðåññèè. Åñëè çíà÷åíèÿ
êîýôôèöèåíòîâ ðåãðåññèè ñòàòèñòè÷åñêè íåçíà÷èìû, òî èõ ñëåäóåò èñêëþ÷èòü èç óðàâíåíèÿ ðåãðåññèè.
2. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ çíà÷èìûõ êîýôôèöèåíòîâ ðåãðåññèè. Äîâåðèòåëüíûå èíòåðâàëû ïîêàçûâàþò òî÷íîñòü âû÷èñëåííûõ çíà÷åíèé êîýôôèöèåíòîâ.
92
Часть I. Основные понятия теории вероятностей и математической статистики
Ýòè çàäà÷è îáû÷íî ðåøàþòñÿ â ïðåäïîëîæåíèè, ÷òî ñëó÷àéíàÿ îøèáêà ε
â óðàâíåíèè ðåãðåññèîííîé çàâèñèìîñòè èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì
ìàòåìàòè÷åñêèì îæèäàíèåì, à ñëó÷àéíûå ïîãðåøíîñòè εi êàæäîãî èçìåðåíèÿ yi
(ðåàëèçàöèè ñëó÷àéíîé âåëè÷èíû ε) íåçàâèñèìû è èìåþò îäèíàêîâûå äèñïåðñèè. Åñëè ýòè ïðåäïîëîæåíèÿ âûïîëíÿþòñÿ, òî âû÷èñëåííûå êîýôôèöèåíòû ÿâëÿþòñÿ íåñìåùåííûìè è ñîñòîÿòåëüíûìè2 îöåíêàìè èñòèííûõ êîýôôèöèåíòîâ è àñèìïòîòè÷åñêè èìåþò íîðìàëüíûå ðàñïðåäåëåíèÿ.  äàííîì ñëó÷àå äëÿ ïðîâåðêè èõ çíà÷èìîñòè è ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ èñïîëüçóþòñÿ ñòàíäàðòíûå ìåòîäû,
îñíîâàííûå íà ðàñïðåäåëåíèè Ñòüþäåíòà. Ýòè ìåòîäû îïèñàíû â ðàçäåëå 15.3.
Îòìåòèì, ÷òî äëÿ ðåøåíèÿ îáåèõ çàäà÷ èñïîëüçóþòñÿ îöåíêè äèñïåðñèé âû÷èñëåííûõ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè. Ôîðìóëû äëÿ îïðåäåëåíèÿ ýòèõ
îöåíîê èçâåñòíû è âíåøíå íåñëîæíû, åñëè èñïîëüçîâàòü ìàòðè÷íûå îáîçíà÷åíèÿ. Ïðèâåäåì ôîðìóëû äëÿ äèñïåðñèé êîýôôèöèåíòîâ à è b óðàâíåíèÿ ëèíåéíîé ðåãðåññèè Y = a + bX:
n
Da =
σ 2 ∑ xi2
i =1
 n 
n∑ x −  ∑ xi 
i =1
 i =1 
n
2
i
2
, Db =
σ2n
 n 
n∑ x −  ∑ xi 
i =1
 i =1 
n
2
.
2
i
Çäåñü σ2 — äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû ε (íàïîìíèì çàâèñèìîñòü
Y(Õ) = f(X) + ε). Ïðè âû÷èñëåíèÿõ σ2 çàìåíÿþò âåëè÷èíîé sε2 èç äèñïåðñèîííîé òàáëèöû.
Äëÿ âû÷èñëåíèÿ äèñïåðñèé êîýôôèöèåíòîâ ïîëèíîìèàëüíîé ðåãðåññèè
â Excel åñòü ñïåöèàëüíûå ñðåäñòâà, êîòîðûå áóäóò ïðåäñòàâëåíû â ãëàâå 4
(ôóíêöèÿ ЛИНЕЙН) è ãëàâå 5 (ñðåäñòâî Регрессия) è èñïîëüçîâàíû â ãëàâå 15.
3.4.5. Прогнозирование
Ðåãðåññèîííûé àíàëèç ÷àñòî ïðèìåíÿåòñÿ äëÿ îïðåäåëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y â íåêîòîðîé òî÷êå õ0, íå âõîäÿùåé â èñõîäíîå ìíîæåñòâî çíà÷åíèé
{x1, x2, ..., xn} ïåðåìåííîé Õ. Äëÿ ýòîãî èñïîëüçóåòñÿ ïîñòðîåííàÿ ôóíêöèÿ ðåãðåññèè f(X) è çíà÷åíèåì ïåðåìåííîé Y â òî÷êå õ0 ñ÷èòàåòñÿ âåëè÷èíà yˆ = f ( x0 ) .
Ñ òî÷êè çðåíèÿ ìàòåìàòèêà, çäåñü íåîáõîäèìî ðàçëè÷àòü äâå âîçìîæíûå ñèòóàöèè.
•
Òî÷êà õ0 ïðèíàäëåæèò èíòåðâàëó, îãðàíè÷åííîìó ìèíèìàëüíûì è ìàêñèìàëüíûì çíà÷åíèÿìè ìíîæåñòâà {x1, x2, ..., xn}, åñëè ïåðåìåííàÿ Õ îäíîìåðíà.  ñëó÷àå, êîãäà ïåðåìåííàÿ Õ ÿâëÿåòñÿ âåêòîðîì, ìíîãîìåðíàÿ
òî÷êà õ0 ïðèíàäëåæèò âûïóêëîé îáëàñòè, òàêæå îïðåäåëåííîé èñõîäíûìè
çíà÷åíèÿìè ïåðåìåííîé Õ.  ýòîé ñèòóàöèè çàäà÷à îïðåäåëåíèÿ çíà÷åíèÿ
ïåðåìåííîé Y íàçûâàåòñÿ çàäà÷åé âîññòàíîâëåíèÿ çíà÷åíèé è ÿâëÿåòñÿ
âïîëíå êîððåêòíîé ñ ìàòåìàòè÷åñêîé òî÷êè çðåíèÿ.
•
Òî÷êà õ0 íå ïðèíàäëåæèò èíòåðâàëó, îïðåäåëåííîìó ìèíèìàëüíûì è ìàêñèìàëüíûì çíà÷åíèÿìè ìíîæåñòâà {x1, x2, ..., xn} (ïåðåìåííàÿ Õ îäíîìåðíà), èëè ñîîòâåòñòâóþùåé îáëàñòè äëÿ ìíîãîìåðíîé ïåðåìåííîé Õ.  ýòîé
2
Íåáîëüøîå óòî÷íåíèå: äëÿ ñîñòîÿòåëüíîñòè îöåíîê äîïîëíèòåëüíî íåîáõîäèìî óñëîâèå íåâûðîæäåííîñòè ìàòðèöû, ñîñòàâëåííîé èç âñåâîçìîæíûõ ïîïàðíûõ ïðîèçâåäåíèé xixj.
Глава 3. Анализ статистических зависимостей
93
ñèòóàöèè çàäà÷à îïðåäåëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y íàçûâàåòñÿ çàäà÷åé
ýêñòðàïîëÿöèè (èëè çàäà÷åé ïðîãíîçèðîâàíèÿ; ýòîò òåðìèí ÷àñòî èñïîëüçóåòñÿ ïðè ýêîíîìè÷åñêîé èíòåðïðåòàöèè èñõîäíûõ äàííûõ) è â îáùåì
ñëó÷àå ÿâëÿåòñÿ íåêîððåêòíîé ñ ìàòåìàòè÷åñêîé òî÷êè çðåíèÿ.
 ñòàòèñòèêå îáû÷íî ýòè äâå ñèòóàöèè ÷åòêî íå ðàçëè÷àþòñÿ, íî èõ íåîáõîäèìî ó÷èòûâàòü ïðè ïðîâåäåíèè ïðàêòè÷åñêîãî àíàëèçà.  îáùåì ñëó÷àå íåñìîòðÿ íà èäåàëüíóþ ïîäãîíêó ôóíêöèè ðåãðåññèè ê èñõîäíûì äàííûì ðåøåíèå çàäà÷è ïðîãíîçèðîâàíèÿ ìîæåò áûòü êàê óãîäíî äàëåêèì îò èñòèííîãî çíà÷åíèÿ
Y(x0), åñëè íå íàêëàäûâàòü àïðèîðíûõ ïðåäïîëîæåíèé î ãëàäêîñòè ôóíêöèè,
îïèñûâàþùåé èñòèííóþ çàâèñèìîñòü ìåæäó Õ è Y. Äîâåðèòåëüíûå èíòåðâàëû,
êîòîðûå îáû÷íî ñòðîÿòñÿ äëÿ âåëè÷èíû yˆ = f ( x0 ) (ñì. ðàçäåë 15.4), ñòðîãî ãîâîðÿ, èìåþò ïðàâî íà ñóùåñòâîâàíèå òîëüêî äëÿ çàäà÷è âîññòàíîâëåíèÿ çíà÷åíèé,
õîòÿ èõ ïðèìåíÿþò â îáåèõ ñèòóàöèÿõ. Íà ïðàêòèêå ïðîãíîçèðîâàíèå ìîæíî
ïðèìåíÿòü äîñòàòî÷íî “áåçîïàñíî”, åñëè çàâèñèìîñòü ìåæäó Õ è Y ìîæíî îïèñàòü ãëàäêîé ôóíêöèåé, õîòÿ áû äèôôåðåíöèðóåìîé, è òî÷êà x0 ðàñïîëîæåíà íåäàëåêî îò îáëàñòè, îïðåäåëÿåìîé èìåþùèìèñÿ çíà÷åíèÿìè ïåðåìåííîé Õ. (Íî
çäåñü âîçíèêíåò âîïðîñ, ÷òî ïîíèìàòü ïîä ñëîâîì íåäàëåêî.)
3.5. Дисперсионный анализ
Äèñïåðñèîííûé àíàëèç3 — ýòî ñòàòèñòè÷åñêèé ìåòîä àíàëèçà ðåçóëüòàòîâ
íàáëþäåíèé, çàâèñÿùèõ îò ðàçëè÷íûõ ôàêòîðîâ, îïðåäåëåíèå íàèáîëåå
âëèÿþùèõ ôàêòîðîâ è îöåíêà ýòîãî âëèÿíèÿ. Ôàêòîðàìè îáû÷íî íàçûâàþò
âíåøíèå óñëîâèÿ, âëèÿþùèå íà ðåçóëüòàòû íàáëþäåíèé. Äèñïåðñèîííûé àíàëèç çàêëþ÷àåòñÿ â ðàçëîæåíèè îáùåé âàðèàöèè (äèñïåðñèè) íàáëþäàåìîé ñëó÷àéíîé âåëè÷èíû íà îòäåëüíûå ñëàãàåìûå, êàæäîå èç êîòîðûõ õàðàêòåðèçóåò
âëèÿíèå òîãî èëè èíîãî ôàêòîðà.
3.5.1. Статистическая модель
Äèñïåðñèîííûé àíàëèç ïðèìåíÿåòñÿ â óñëîâèÿõ ñëåäóþùåé ñòàòèñòè÷åñêîé ìîäåëè. Íàáëþäàþòñÿ n ñëó÷àéíûõ âåëè÷èí Õ1, Õ2, ..., Õn, êàæäàÿ èç êîòîðûõ ïðåäñòàâèìà â âèäå Õi = µ + β1 + β2 + ... + βm + εi, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå),
βj — çíà÷åíèå j-ãî ôàêòîðà, εi — “îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà, ïðåäñòàâëÿþùàÿ îøèáêè íàáëþäåíèé, âëèÿíèå íåó÷òåííûõ ôàêòîðîâ è ò.ï. Êàê ïðàâèëî,
ïðåäïîëàãàåòñÿ, ÷òî ñëó÷àéíûå âåëè÷èíû εi íåçàâèñèìû ìåæäó ñîáîé, îäèíàêîâî
ðàñïðåäåëåíû ïî íîðìàëüíîìó çàêîíó ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì.
Ôàêòîðû îáû÷íî ÿâëÿþòñÿ êëàññèôèêàöèîííûìè èëè ïîðÿäêîâûìè âåëè÷èíàìè,
ïðèíèìàþùèìè êîíå÷íîå ìíîæåñòâî çíà÷åíèé.  òàêîì ñëó÷àå, êîãäà βj ïðèíèìàåò êîíêðåòíîå k-å çíà÷åíèå èç ýòîãî ìíîæåñòâà, ãîâîðÿò î k-ì óðîâíå j-ãî ôàêòîðà.
Öåëü äèñïåðñèîííîãî àíàëèçà çàêëþ÷àåòñÿ â îöåíêå àäåêâàòíîñòè ìîäåëè
èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì (äëÿ ÷åãî îïðåäåëÿþòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ñëó÷àéíûõ âåëè÷èí εi), à òàêæå â îöåíêå âëèÿíèÿ ôàêòîðîâ
(äðóãèìè ñëîâàìè, ïðîâåðÿþòñÿ ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé
ñëó÷àéíûõ âåëè÷èí Õ1, Õ2, ..., Õn).
3
 ñîâðåìåííîé ðóññêîé ñòàòèñòè÷åñêîé ëèòåðàòóðå äèñïåðñèîííûé àíàëèçà èíîãäà íàçûâàþò ìåòîäîì ANOVA (îò àíãë. Analisis of Variance — àíàëèç äèñïåðñèé).
94
Часть I. Основные понятия теории вероятностей и математической статистики
Ìîäåëü, â êîòîðîé âñå βj ÿâëÿþòñÿ äåòåðìèíèðîâàííûìè, íàçûâàåòñÿ ìîäåëüþ ñ
ïîñòîÿííûìè ôàêòîðàìè. Åñëè âñå βj ÿâëÿþòñÿ ñëó÷àéíûìè âåëè÷èíàìè, òàêàÿ
ìîäåëü íàçûâàåòñÿ ìîäåëüþ ñî ñëó÷àéíûìè ôàêòîðàìè.  ñëó÷àå, êîãäà ñðåäè βj
åñòü êàê äåòåðìèíèðîâàííûå, òàê è ñëó÷àéíûå âåëè÷èíû, ãîâîðÿò î ñìåøàííîé
ìîäåëè.  çàâèñèìîñòè îò êîëè÷åñòâà ôàêòîðîâ ðàçëè÷àþò îäíîôàêòîðíûé è ìíîãîôàêòîðíûé (äâóõôàêòîðíûé, òðåõôàêòîðíûé è ò.ä.) äèñïåðñèîííûé àíàëèç.
Ïðåæäå ÷åì ïðèìåíÿòü ìåòîäû äèñïåðñèîííîãî àíàëèçà, íåîáõîäèìî ïðîâåðèòü
îáÿçàòåëüíîå óñëîâèå: äèñïåðñèè âñåõ èññëåäóåìûõ âûáîðîê äîëæíû áûòü îäèíàêîâûìè. Åñëè èìåþòñÿ òîëüêî äâå âûáîðêè, äëÿ ýòîãî ìîæíî ïðèìåíèòü êðèòåðèé
Ôèøåðà ñðàâíåíèÿ äèñïåðñèé (îïèñàíèå êðèòåðèÿ ïðèâîäèòñÿ â ðàçäåëå 2.4.2,
à åãî ïðàêòè÷åñêàÿ ðåàëèçàöèÿ — â ðàçäåëå 12.3.2). Äëÿ ïðîâåðêè ðàâåíñòâà äèñïåðñèé íåñêîëüêèõ âûáîðîê èñïîëüçóåòñÿ êðèòåðèé Áàðòëåòòà (ñì. ðàçäåë 12.3.2).
3.5.2. Однофакторный дисперсионный анализ
Ïóñòü èìååòñÿ k âûáîðîê (x11, x12, ..., x1n1 ), (x21, x22, ..., x2n2 ), ..., (xk1, xk2, ..., xknk )
îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, êîòîðûå ÿâëÿþòñÿ ðåàëèçàöèÿìè ñëó÷àéíûõ
âåëè÷èí Õ1, Õ2, ..., Õk. Ïðåäïîëàãàåòñÿ, ÷òî êàæäàÿ ñëó÷àéíàÿ âåëè÷èíà Xi ïðåäñòàâèìà â âèäå Õi = µ + β + εi, ãäå β — ôàêòîð, êîòîðûé ìîæåò ïðèíèìàòü êîíå÷íîå
ìíîæåñòâî çíà÷åíèé (êàæäîå çíà÷åíèå ôàêòîðà íàçûâàåòñÿ óðîâíåì ôàêòîðà), εi —
“îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì
ìàòåìàòè÷åñêèì îæèäàíèåì. Âñå ñëó÷àéíûå âåëè÷èíû εi íåçàâèñèìû.
Ñ÷èòàåòñÿ, ÷òî êàæäàÿ âûáîðêà ñîîòâåòñòâóåò îäíîìó óðîâíþ ôàêòîðà.
Äëÿ êàæäîé âûáîðêè ïî ñòàíäàðòíûì ôîðìóëàì (ñì. ðàçäåë 2.1) ïîäñ÷èòûâàåòñÿ
âûáîðî÷íîå ñðåäíåå x1 , x2 , ..., xk , âûáîðî÷íûå äèñïåðñèè S12 , S 22 , ..., S k2 è îáùåå ñðåäíåå x =
k
1 k
x
,
ãäå
n
=
ni .
∑i
∑
n i =1
i =1
Äàëåå ðàññ÷èòûâàþòñÿ ñóììû êâàäðàòîâ:
k
ìåæãðóïïîâàÿ ñóììà êâàäðàòîâ SS1 = ∑ ni ( xi − x ) 2 ,
i =1
k
k
ni
âíóòðèãðóïïîâàÿ ñóììà êâàäðàòîâ SS 2 = ∑ (ni − 1) Si2 = ∑∑ ( xij − xi ) 2 ,
i =1
k
i =1 j =1
ni
ïîëíàÿ ñóììà êâàäðàòîâ SS = SS1 + SS 2 = ∑∑ ( xij − x )2 .
i =1 j =1
Ìåæãðóïïîâóþ ñóììó êâàäðàòîâ òàêæå íàçûâàþò ðàññåèâàíèåì ïî ôàêòîðàì,
âíóòðèãðóïïîâóþ ñóììó êâàäðàòîâ — îñòàòî÷íûì ðàññåèâàíèåì, ïîëíóþ ñóììó
êâàäðàòîâ — ïîëíîé (èëè îáùåé) ñóììîé êâàäðàòîâ îòêëîíåíèé îòäåëüíûõ íàáëþäåíèé îò îáùåãî ñðåäíåãî x . Äëÿ êàæäîé èç ýòèõ ñóìì îïðåäåëÿþòñÿ ñòåïåíè ñâîáîäû: äëÿ ìåæãðóïïîâîé ñóììû êâàäðàòîâ ÷èñëî ñòåïåíåé ñâîáîäû ðàâíî
k – 1, äëÿ âíóòðèãðóïïîâîé ñóììû êâàäðàòîâ — n – k, à äëÿ ïîëíîé ñóììû —
n – 1. Íà îñíîâàíèè çíà÷åíèé ñóìì êâàäðàòîâ è ñîîòâåòñòâóþùèõ ñòåïåíåé ñâîáîäû âû÷èñëÿþòñÿ ñëåäóþùèå äèñïåðñèè:
ìåæãðóïïîâàÿ äèñïåðñèÿ s12 =
SS1
1 k
=
∑ ni ( xi − x )2 ,
k − 1 k − 1 i =1
Глава 3. Анализ статистических зависимостей
95
âíóòðèãðóïïîâàÿ äèñïåðñèÿ s22 =
ïîëíàÿ äèñïåðñèÿ s 2 =
SS 2
1 k ni
=
∑∑ ( xij − xi )2 ,
n − k n − k i =1 j =1
SS
1 k ni
=
∑∑ ( xij − x )2 .
n − 1 n − 1 i =1 j =1
Ìåæãðóïïîâàÿ äèñïåðñèÿ ïîêàçûâàåò, íàñêîëüêî ðàçëè÷àþòñÿ âûáîðî÷íûå
ñðåäíèå. Îíà ðàâíà íóëþ, åñëè ñðåäíèå ðàâíû, è ÷åì ñèëüíåå ðàçëè÷àþòñÿ ñðåäíèå â ðàçíûõ âûáîðêàõ, òåì îíà áîëüøå. Ýòà äèñïåðñèÿ ÿâëÿåòñÿ ìåðîé ðàçáðîñà
âûáîðî÷íûõ ñðåäíèõ âñëåäñòâèå âëèÿíèÿ ôàêòîðà. Âíóòðèãðóïïîâàÿ äèñïåðñèÿ
ïîêàçûâàåò, íàñêîëüêî íåîäíîðîäíà êàæäàÿ âûáîðêà (ãðóïïà). Îíà ïîêàçûâàåò
âëèÿíèå íåó÷òåííûõ “îñòàòî÷íûõ” ôàêòîðîâ (âåëè÷èí εi).
Ïðîâåäåííûå âû÷èñëåíèÿ ïðèíÿòî ïðåäñòàâëÿòü â âèäå òàáëèöû äèñïåðñèîííîãî àíàëèçà, èëè â äèñïåðñèîííîé òàáëèöå, ñëåäóþùåãî âèäà.
Èñòî÷íèê âàðèàöèè
(êîìïîíåíòû äèñïåðñèè)
Ñóììà êâàäðàòîâ
Ìåæãðóïïîâàÿ âàðèàöèÿ
(ðàçëè÷èÿ ìåæäó âûáîðêàìè)
SS1 = ∑ ni ( xi − x ) 2
k
×èñëî ñòåïåíåé
ñâîáîäû
k–1
Äèñïåðñèÿ
s12 =
SS1
k −1
s22 =
SS2
n−k
s2 =
SS
n −1
i =1
Âíóòðèãðóïïîâàÿ âàðèàöèÿ
(ðàçëè÷èÿ âíóòðè âûáîðîê)
k
ni
SS 2 = ∑∑ ( xij − xi ) 2
n–k
i =1 j =1
Ïîëíàÿ (îáùàÿ) âàðèàöèÿ
k
ni
SS = ∑∑ ( xij − x )2
n–1
i =1 j =1
Îòíîøåíèå R 2 = s12 s 2 íàçûâàåòñÿ êîýôôèöèåíòîì äåòåðìèíàöèè è ïîêàçûâàåò, êàêàÿ ÷àñòü ïîëíîé äèñïåðñèè îáúÿñíÿåòñÿ âëèÿíèåì ôàêòîðà.
Äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé âî âñåõ âûáîðêàõ ïðèìåíÿþò êðèòåðèàëüíóþ ñòàòèñòèêó F = s12 s22 , êîòîðàÿ â ñëó÷àå èñòèííîñòè ïðîâåðÿåìîé ãèïîòåçû èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû
(k – 1) è (n – k). Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α êðèòè÷åñêîå çíà÷åíèå têð
îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ýòîãî ðàñïðåäåëåíèÿ. Åñëè F < têð, òî
ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé íå îòêëîíÿåòñÿ (äðóãèìè ñëîâàìè,
âëèÿíèå ôàêòîðà âî âñåõ âûáîðêàõ îäèíàêîâî).  ñëó÷àå F ≥ têð ýòà ãèïîòåçà îòâåðãàåòñÿ. Îòìåòèì, ÷òî ñòàòèñòèêà F ≥ 1, â ïðîòèâíîì ñëó÷àå ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé ïðèíèìàåòñÿ áåç ïðîâåðêè, ïîñêîëüêó òîãäà ðàçëè÷èÿ ìåæäó âûáîðêàìè ìåíüøå ðàçëè÷èé âíóòðè âûáîðîê, ò.å. âëèÿíèå ôàêòîðà ìåíåå çíà÷èìî, ÷åì âëèÿíèå “îñòàòî÷íûõ” ôàêòîðîâ.
Åñëè ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé îòâåðãàåòñÿ, íåîáõîäèìî
óçíàòü, ìàòåìàòè÷åñêèå îæèäàíèÿ êàêèõ âûáîðîê çíà÷èìî îòëè÷àþòñÿ îò äðóãèõ. Â
ýòîì ñëó÷àå íåëüçÿ íåïîñðåäñòâåííî ïîïàðíî ñðàâíèâàòü îòäåëüíûå âûáîðêè ñ ïîìîùüþ, íàïðèìåð, êðèòåðèÿ Ñòüþäåíòà (ñì. ðàçäåë 2.4.2), ïîñêîëüêó ðåçêî âîçðàñòàåò
ãðóïïîâàÿ îøèáêà ïåðâîãî ðîäà (ò.å. âîçðàñòàåò âåðîÿòíîñòü òîãî, ÷òî ïî êðàéíåé
ìåðå îäèí èç òåñòîâ íåâåðíî îòâåðãíåò íóëåâóþ ãèïîòåçó). Â òàêîé ñèòóàöèè äëÿ
ïîïàðíûõ ñðàâíåíèé ñëåäóåò ïðèìåíÿòü ëèáî ìåòîä ìíîæåñòâåííûõ ñðàâíåíèé
Øåôôå (îïèñàííûé â ðàçäåëå 12.3.1), ëèáî ìîäèôèöèðîâàííûé êðèòåðèé Ñòüþäåíòà.
96
Часть I. Основные понятия теории вероятностей и математической статистики
Ìîäèôèêàöèÿ êðèòåðèÿ Ñòüþäåíòà çàêëþ÷àåòñÿ â òîì, ÷òî êðèòåðèàëüíàÿ
ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå T =
xi − x j
1 1
SS2  + 
 n1 n2 
, ãäå xi è x j — ñðåäíèå
ñðàâíèâàåìûõ âûáîðîê, n1 è n2 — îáúåìû ýòèõ âûáîðîê, à SS2 — âíóòðèãðóïïîâàÿ ñóììà êâàäðàòîâ, êîòîðàÿ ðàññ÷èòûâàåòñÿ â äèñïåðñèîííîé òàáëèöå ïî
âñåì âûáîðêàì. Äëÿ îïðåäåëåíèÿ êðèòè÷åñêîãî çíà÷åíèÿ áåðåòñÿ êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k) ñòåïåíüþ ñâîáîäû (îáðàòèòå
âíèìàíèå íà çíà÷åíèå ñòåïåíè ñâîáîäû).
3.5.3. Двухфакторный дисперсионный анализ
 äâóõôàêòîðíîì äèñïåðñèîííîì àíàëèçå ïðåäïîëàãàåòñÿ, ÷òî ñëó÷àéíûå âåëè÷èíû Õi ïðåäñòàâèìû â âèäå Õi = µ + β + γ + εi, ãäå µ — êîíñòàíòà (îáùåå
ñðåäíåå), β è γ — çíà÷åíèÿ ôàêòîðîâ, εi — “îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ ñòàíäàðòíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (ò.å. âñå εi íåçàâèñèìû
è èìåþò îäèíàêîâûå íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íóëåâûì ìàòåìàòè÷åñêèì
îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè).
Ïðè èñïîëüçîâàíèè äâóõôàêòîðíîãî àíàëèçà âîçìîæíû äâå ñèòóàöèè.  ïåðâîé ñèòóàöèè èìååòñÿ îäíà âûáîðêà, â êîòîðîé êàæäîå âûáîðî÷íîå çíà÷åíèå ñîîòâåòñòâóåò îäíîé êîìáèíàöèè óðîâíåé ôàêòîðîâ β è γ, âî âòîðîé ñèòóàöèè èìååòñÿ íåñêîëüêî ïîäîáíûõ âûáîðîê4. Ðàññìîòðèì ñíà÷àëà ïðèìåíåíèå äèñïåðñèîííîãî àíàëèçà â óñëîâèÿõ ïåðâîé ñèòóàöèè.
Двухфакторный дисперсионный анализ без повторений
Èòàê, èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij,
èíäåêñ i ñîîòâåòñòâóåò i-ìó óðîâíþ ôàêòîðà β (áóäåì îáîçíà÷àòü óðîâíè ôàêòîðà
β êàê βi), èíäåêñ j ñîîòâåòñòâóåò j-ìó óðîâíþ ôàêòîðà γ (óðîâíè ýòîãî ôàêòîðà
îáîçíà÷èì êàê γj). Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t óðîâíåé. Òàêèì îáðàçîì, â îáùåì ñëó÷àå âûáîðêà èìååò ðàçìåðíîñòü r×t5. Òàêóþ âûáîðêó
óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû6.
4
Ñðàçó ñêàæåì, ÷òî â óñëîâèÿõ ïåðâîé ñèòóàöèè ïðèìåíÿåòñÿ ñðåäñòâî Excel Двухфакторный
дисперсионный анализ без повторений, à â óñëîâèÿõ âòîðîé — Двухфакторный дисперсионный
анализ с повторениями (ñì. ãëàâó 5). Ýòè äâå ñèòóàöèè íå ñîâñåì ÷åòêî ïðåäñòàâëåíû â îïèñàíèè äàííûõ ñðåäñòâ â ñïðàâî÷íîé ñèñòåìå Excel.
5
Ïðè ÷òåíèè ìàòåðèàëà î äâóõôàêòîðíîì àíàëèçå ïîëåçíî èìåòü â âèäó “êëàññè÷åñêóþ” ìîäåëü. Èìååòñÿ ðÿä ñåëüñêîõîçÿéñòâåííûõ ïîëåé (ó÷àñòêîâ), ê êàæäîìó èç íèõ ïðèìåíÿåòñÿ
ñâîé ñïîñîá îáðàáîòêè çåìëè (åñòü r ðàçëè÷íûõ ñïîñîáîâ îáðàáîòêè) è âíîñèòñÿ t ðàçëè÷íûõ
óäîáðåíèé (íà êàæäûé ó÷àñòîê âíîñèòñÿ îäèí òèï óäîáðåíèÿ). Òðåáóåòñÿ èññëåäîâàòü óðîæàéíîñòü íåêîòîðîé ñåëüñêîõîçÿéñòâåííîé êóëüòóðû â çàâèñèìîñòè îò äâóõ ôàêòîðîâ —
ñïîñîáà îáðàáîòêè çåìëè è âèäà óäîáðåíèÿ.  äàííîì ñëó÷àå çíà÷åíèåì ñëó÷àéíîé âåëè÷èíû Õ
ÿâëÿåòñÿ óðîæàéíîñòü íà êàæäîì îïûòíîì ó÷àñòêå. “Êëàññèêà” çäåñü çàêëþ÷àåòñÿ â òîì,
÷òî äèñïåðñèîííûé àíàëèç ïåðâîíà÷àëüíî áûë ïðåäëîæåí Ð. Ôèøåðîì (Fisher, 1925) äëÿ îáðàáîòêè ðåçóëüòàòîâ àãðîíîìè÷åñêèõ îïûòîâ ïî îïðåäåëåíèþ óñëîâèé, ïðè êîòîðûõ èñïûòûâàåìûé ñîðò ñåëüñêîõîçÿéñòâåííîé êóëüòóðû äàåò íàèáîëüøèé óðîæàé.
6
Ýòà òàáëèöà íàïîìèíàåò òàáëèöó ñîïðÿæåííîñòè (ñì. ðàçäåë 3.3.3), íî âåëè÷èíû xij â íèõ
èìåþò ðàçíûé ñìûñë — â òàáëèöå ñîïðÿæåííîñòè âåëè÷èíà xij ðàâíà êîëè÷åñòâó íàáëþäåíèé, ñîîòâåòñòâóþùèõ ïðèçíàêàì Ài è Bj, çäåñü æå xij — çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Õ.
Глава 3. Анализ статистических зависимостей
97
γ1
γ2
...
γt
β1
x11
x12
...
x1t
β2
x21
x22
...
x2t
...
...
...
...
...
βr
xr1
xr2
...
xrt
Ñðåäíèå
x*1 = ∑ xi1
r
...
x*t = ∑ xit
r
i =1
x*2 = ∑ xi 2
i =1
Ñðåäíèå
x1* =
1 t
∑ x1i
t i =1
x2* =
1 t
∑ x2i
t i =1
...
xr * =
r
x=
i =1
Òî÷å÷íîé îöåíêîé îáùåãî ñðåäíåãî µ ÿâëÿåòñÿ âåëè÷èíà x =
1 t
∑ xri
t i =1
1 r t
∑∑ xij
rt i =1 j =1
1 r t
∑∑ xij . Âåëèrt i =1 j =1
r
1 t
xki è x*m = ∑ xim íàçûâàþòñÿ ñðåäíèìè ïî óðîâíÿì ôàêòîðîâ:
∑
t i =1
i =1
— ñðåäíåå ïî óðîâíþ k ôàêòîðà β, x*m — ñðåäíåå ïî óðîâíþ m ôàêòîðà γ.
÷èíû xk * =
xk *
Îïðåäåëåíèå ñòåïåíè âëèÿíèÿ ôàêòîðîâ âûïîëíÿåòñÿ òàê æå, êàê è â îäíîôàêòîðíîì àíàëèçå, íà îñíîâå äèñïåðñèîííîé òàáëèöû, êîòîðàÿ äëÿ äâóõôàêòîðíîãî àíàëèçà áåç ïîâòîðåíèé èìååò ñëåäóþùóþ ñòðóêòóðó.
Èñòî÷íèê âàðèàöèè
Ñóììà êâàäðàòîâ
(êîìïîíåíòû äèñïåðñèè)
Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòðîêàì
(ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà β)
SS1 = t ∑ ( xi* − x ) 2
Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòîëáöàì
(ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà γ)
SS 2 = r ∑ ( x*i − x ) 2
Îñòàòî÷íàÿ âàðèàöèÿ
(ðàçëè÷èÿ âíóòðè âûáîðêè)
SS3 = ∑∑ ( xij − xi * − x* j + x )2
Ïîëíàÿ (îáùàÿ) âàðèàöèÿ
SS = ∑∑ ( xij − x )2
r
×èñëî ñòåïå- Äèñïåðñèÿ
íåé ñâîáîäû
r–1
s12 =
SS1
r −1
s22 =
SS2
t −1
s32 =
SS3
(r − 1)(t − 1)
s2 =
SS
rt − 1
i =1
t
t–1
i =1
r
t
i =1 j =1
r
t
i =1 j =1
(r – 1)
(t – 1)
rt – 1
Äëÿ îïðåäåëåíèÿ ñòåïåíè âëèÿíèÿ ôàêòîðîâ ñðàâíèâàþò äèñïåðñèè ïî ôàêòîðàì
ñ îñòàòî÷íîé äèñïåðñèåé. Íàïðèìåð, äëÿ ïðîâåðêè íóëåâîé ãèïîòåçû î ðàâåíñòâå
ñðåäíèõ ïî óðîâíÿì ôàêòîðà β (åñëè ýòà ãèïîòåçà ïðèíèìàåòñÿ, òî âëèÿíèå ôàêòîðà β
íåçíà÷èìî) âû÷èñëÿþòñÿ ñíà÷àëà êðèòåðèàëüíàÿ ñòàòèñòèêà T = s12 /s32 , à çàòåì —
98
Часть I. Основные понятия теории вероятностей и математической статистики
êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α (α — çàäàííûé óðîâåíü çíà÷èìîñòè) F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì
ñëó÷àå — îòêëîíÿåòñÿ. Àíàëîãè÷íî îïðåäåëÿåòñÿ ñòåïåíü âëèÿíèÿ ôàêòîðà γ.
 Excel äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç áåç ïîâòîðåíèé âûïîëíÿåò îäíîèìåííîå ñðåäñòâî èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.13). Âûïîëíåíèå ýòîãî àíàëèçà áåç ïðèìåíåíèÿ äàííîãî ñðåäñòâà ïîêàçàíî â ðàçäåëå 14.3.1.
Двухфакторный дисперсионный анализ с повторениями
Ýòà ðàçíîâèäíîñòü äèñïåðñèîííîãî àíàëèçà ïðåäïîëàãàåò, ÷òî èìååòñÿ íåñêîëüêî äâóìåðíûõ âûáîðîê òàêîãî æå âèäà, ÷òî è â äâóõôàêòîðíîì àíàëèçå áåç
ïîâòîðåíèé. Çäåñü âñå âûáîðî÷íûå çíà÷åíèÿ òàêæå ìîæíî ïðåäñòàâèòü â âèäå
òàáëèöû, êàê è â ñëó÷àå îäíîé âûáîðêè. Íî òåïåðü â êàæäîé ÿ÷åéêå ýòîé òàáëèöû, ñîîòâåòñòâóþùåé i-ìó óðîâíþ ôàêòîðà β è j-ìó óðîâíþ ôàêòîðà γ, áóäåò íàõîäèòüñÿ íå îäíî çíà÷åíèå xij, à m çíà÷åíèé xijk (k = 1, ..., m), m — êîëè÷åñòâî
âûáîðîê. Ïðåäïîëàãàåì, ÷òî îáúåìû âñåõ âûáîðîê îäèíàêîâû, ò.å. â êàæäîé
ÿ÷åéêå òàáëèöû ñîäåðæèòñÿ îäèíàêîâîå êîëè÷åñòâî çíà÷åíèé. Åñëè ýòî íå òàê,
òî ïðèâåäåííûå íèæå ôîðìóëû íåñêîëüêî óñëîæíÿþòñÿ [24].
Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ:
•
ñðåäíèå ïî êàæäîé ÿ÷åéêå xij * =
•
ñðåäíèå ïî ñòðîêàì xi ** =
•
ñðåäíèå ïî ñòîëáöàì x* j * =
•
îáùåå ñðåäíåå x =
1 m
∑ xijk ;
m k =1
1 t
∑ xij* ;
t j =1
1 r
∑ xij* ;
r i =1
1 r t
∑∑ xij* .
rt i =1 j =1
Ïîðÿäîê ïðîâåäåíèÿ äèñïåðñèîííîãî àíàëèçà â äàííîì ñëó÷àå òàêîé æå, êàê
è ïðåæäå: ñíà÷àëà âû÷èñëÿþòñÿ ñóììû êâàäðàòîâ, çàòåì âû÷èñëÿþòñÿ îöåíêè
äèñïåðñèé, äàëåå äëÿ ïðîâåðêè ãèïîòåç î âëèÿíèè ôàêòîðîâ âû÷èñëÿþòñÿ îòíîøåíèÿ äèñïåðñèé, êîòîðûå ñðàâíèâàþòñÿ ñ êðèòè÷åñêèìè çíà÷åíèÿìè, ïîëó÷åííûìè
êàê êâàíòèëè F-ðàñïðåäåëåíèÿ. Äèñïåðñèîííàÿ òàáëèöà èìååò ñëåäóþùèé âèä.
Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ
(êîìïîíåíòû
äèñïåðñèè)
Âàðèàöèÿ ìåæäó
ñðåäíèìè ïî ñòðîêàì
(ðàçëè÷èÿ ìåæäó
óðîâíÿìè ôàêòîðà β)
r
SS1 = mt ∑ ( xi** − x )2
×èñëî
ñòåïåíåé
ñâîáîäû
r–1
Äèñïåðñèÿ
s12 =
SS1
r −1
s22 =
SS2
t −1
i =1
Âàðèàöèÿ ìåæäó
ñðåäíèìè ïî ñòîëáöàì SS 2 = mr
(ðàçëè÷èÿ ìåæäó
óðîâíÿìè ôàêòîðà γ)
t
∑ (x
* j*
j =1
− x )2
t–1
Глава 3. Анализ статистических зависимостей
99
Îêîí÷àíèå òàáë.
Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ
(êîìïîíåíòû
äèñïåðñèè)
×èñëî
ñòåïåíåé
ñâîáîäû
Âçàèìîäåéñòâèå
ôàêòîðîâ β è γ
SS3 = m∑∑ ( xij * − xi** − x* j * + x ) 2
(r – 1)(t – 1)
Îñòàòî÷íàÿ âàðèàöèÿ
SS 4 = ∑∑∑ ( xijk − xij * ) 2
r
t
Äèñïåðñèÿ
s32 =
SS3
(r − 1)(t − 1)
s42 =
SS4
rt (m − 1)
s2 =
SS
rtm − 1
i =1 j =1
m
r
t
rt(m – 1)
k =1 i =1 j =1
Ïîëíàÿ (îáùàÿ)
âàðèàöèÿ
m
r
t
SS = ∑∑∑ ( xijk − x )2
k =1 i =1 j =1
rtm – 1
Êàê âèäíî èç ýòîé òàáëèöû, ïîÿâèëñÿ íîâûé èñòî÷íèê âàðèàöèè, à èìåííî —
ýôôåêò îò âçàèìîäåéñòâèÿ ôàêòîðîâ β è γ. Ýòîò ýôôåêò íå íàáëþäàåòñÿ â ñëó÷àå
îäíîé âûáîðêè, ïîñêîëüêó òàì ðàçíîñòè xijk − xij * ðàâíû íóëþ. Îáû÷íî íåÿâíî
ïðåäïîëàãàåòñÿ, ÷òî ýòî âçàèìîäåéñòâèå ìîæíî îïèñàòü êàê ïðîèçâåäåíèå δβiγj
è äèñïåðñèîííûé àíàëèç äîëæåí îïðåäåëèòü, íàñêîëüêî çíà÷èìî âåëè÷èíà δ îòëè÷àåòñÿ îò íóëÿ. Íåîáõîäèìî îòìåòèòü, ÷òî ñóùåñòâóþò è äðóãèå ìîäåëè âçàèìîäåéñòâèÿ ôàêòîðîâ [1].
 Excel äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ñ ïîâòîðåíèÿìè âûïîëíÿåò
îäíîèìåííîå ñðåäñòâî èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.12).
Ìíîãîôàêòîðíûé äèñïåðñèîííûé àíàëèç âûïîëíÿåòñÿ àíàëîãè÷íî äâóõôàêòîðíîìó: âû÷èñëÿþòñÿ ñíà÷àëà ñðåäíèå ïî êàæäîìó óðîâíþ âñåõ ôàêòîðîâ, çàòåì — ñóììû êâàäðàòîâ äëÿ êàæäîãî ôàêòîðà è âçàèìîäåéñòâèé âñåõ âîçìîæíûõ êîìáèíàöèé
ôàêòîðîâ, ïîñëå — ñòåïåíè ñâîáîäû è ñîîòâåòñòâóþùèå äèñïåðñèè. Äàëåå äëÿ ïðîâåðêè ãèïîòåç î âëèÿíèè ôàêòîðîâ âû÷èñëÿþòñÿ îòíîøåíèÿ äèñïåðñèé ôàêòîðîâ
èëè èõ âçàèìîäåéñòâèé ê îñòàòî÷íîé äèñïåðñèè (ýòî êðèòåðèàëüíûå ñòàòèñòèêè)
è íàõîäÿòñÿ êðèòè÷åñêèå çíà÷åíèÿ êàê êâàíòèëè F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ñòåïåíÿìè ñâîáîäû. Åñëè çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê ìåíüøå
êðèòè÷åñêèõ çíà÷åíèé, òî íóëåâûå ãèïîòåçû ïðèíèìàþòñÿ, â ïðîòèâíîì ñëó÷àå —
îòâåðãàþòñÿ. Ïîäðîáíî ìíîãîôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â [24].
100 Часть I. Основные понятия теории вероятностей и математической статистики
Часть II
Средства Excel для
статистического
анализа
В этой части...
Ãëàâà 4. Ñòàòèñòè÷åñêèå ôóíêöèè
Ãëàâà 5. Íàäñòðîéêà Ïàêåò àíàëèçà
Ãëàâà 6. Äîïîëíèòåëüíûå âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà
Ãëàâà 7. Ìîäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí
Â
ýòîé ÷àñòè îïèñàíû âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî
àíàëèçà. Ïðåäïîëàãàåòñÿ, ÷òî ÷èòàòåëü çíàêîì ñ îñíîâàìè ðàáîòû â ýòîé
ýëåêòðîííîé òàáëèöå õîòÿ áû â ñëåäóþùåì îáúåìå: îí ìîæåò ââîäèòü è ðåäàêòèðîâàòü äàííûå, ñîçäàâàòü ôîðìóëû, èñïîëüçîâàòü ôóíêöèè, ñòðîèòü äèàãðàììû
è ãðàôèêè, ôîðìàòèðîâàòü ðàáî÷èé ëèñò è ò.ï. Íåïîñðåäñòâåííî äëÿ ñòàòèñòè÷åñêîé îáðàáîòêè äàííûõ â Excel ïðåäóñìîòðåíû ìíîãî÷èñëåííûå ñòàòèñòè÷åñêèå
ôóíêöèè (îêîëî 80) è ñðåäñòâà íàäñòðîéêè Пакет анализа. Ñòàòèñòè÷åñêèå ôóíêöèè (ãëàâà 4) è ñðåäñòâà, ïðåäîñòàâëÿåìûå íàäñòðîéêîé Пакет анализа (ãëàâà 5),
â äàííîé ÷àñòè îïèñàíû äîñòàòî÷íî ïîëíî. Êðîìå ñòàòèñòè÷åñêèõ ôóíêöèé
è ñðåäñòâ ïàêåòà àíàëèçà, çäåñü ðàññìîòðåíû îáùèå ñðåäñòâà è íàäñòðîéêè Excel,
êîòîðûå òàêæå ìîæíî èñïîëüçîâàòü â ñòàòèñòè÷åñêîì àíàëèçå (ãëàâà 6). Ýòî
ôîðìóëû ìàññèâîâ, ñïåöèàëüíîãî âèäà äèàãðàììû è ãðàôèêè, à òàêæå íàäñòðîéêà Поиск решения.  ãëàâå 7 ìû êðàòêî îñòàíîâèìñÿ íà âîçìîæíîñòÿõ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí â Excel.
Глава
4
Статистические функции
Ê
ñòàòèñòè÷åñêèì ôóíêöèÿì Excel îáû÷íî îòíîñÿò òå ôóíêöèè, êîòîðûå
ïðèâåäåíû â ìàñòåðå ôóíêöèé (èëè â ñïðàâî÷íîé ñèñòåìå Excel) â êàòåãîðèè Статистические. Îäíàêî ýòà êàòåãîðèÿ ñîäåðæèò òàêæå ôóíêöèè, êîòîðûå
ñêîðåå ìîæíî îòíåñòè ê êàòåãîðèè ïðîñòî ìàòåìàòè÷åñêèõ (íàïðèìåð, ôóíêöèè МИН è МАКС) ëèáî èíôîðìàöèîííûõ ôóíêöèé (ôóíêöèè СЧЁТ è СЧЁТЗ).
Ñ äðóãîé ñòîðîíû, â äðóãèõ êàòåãîðèÿõ ôóíêöèé òàêæå èìåþòñÿ ôóíêöèè, êîòîðûå ìîæíî èñïîëüçîâàòü ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà
(íàïðèìåð, íåêîòîðûå ôóíêöèè äëÿ ìàòðè÷íûõ âû÷èñëåíèé). Ïîýòîìó ìû ðàçîáüåì êàòåãîðèþ ñòàòèñòè÷åñêèõ ôóíêöèé íà íåñêîëüêî ãðóïï ôóíêöèé, âûïîëíÿþùèõ îäíîòèïíûå äåéñòâèÿ (íàïðèìåð, âû÷èñëÿþùèå çíà÷åíèÿ ôóíêöèé
ðàñïðåäåëåíèé ëèáî âûïîëíÿþùèå òåñòû), âûäåëèâ ãðóïïó äîïîëíèòåëüíûõ
è âñïîìîãàòåëüíûõ ôóíêöèé. Ê ñîæàëåíèþ, ñïðàâî÷íûå ðàçäåëû Excel, ïîñâÿùåííûå ñòàòèñòè÷åñêèì ôóíêöèÿì, íàïèñàíû âåñüìà íåâíÿòíî, èìåþò ìíîãî
íåòî÷íîñòåé, à ïîðîé ïðîñòî ñîäåðæàò îøèáêè. Ïîýòîìó áóäåì îïèñûâàòü ýòè
ôóíêöèè ïî âîçìîæíîñòè ïîëíî.
4.1. Функции для определения экстремальных
значений выборки
 ýòó ãðóïïó ôóíêöèé âõîäÿò ñëåäóþùèå ôóíêöèè.
Ôóíêöèÿ
Íàçíà÷åíèå
ÌÀÊÑ
Âîçâðàùàåò ìàêñèìàëüíîå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ
ÌÀÊÑÀ
Âîçâðàùàåò íàèáîëüøåå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ. Íàðÿäó ñ ÷èñëîâûìè çíà÷åíèÿìè âûïîëíÿåò òàêæå ñðàâíåíèå
òåêñòîâûõ è ëîãè÷åñêèõ çíà÷åíèé
ÌÈÍ
Âîçâðàùàåò ìèíèìàëüíîå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ
ÌÈÍÀ
Âîçâðàùàåò íàèìåíüøåå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ.
Íàðÿäó ñ ÷èñëîâûìè çíà÷åíèÿìè âûïîëíÿåò òàêæå ñðàâíåíèå òåêñòîâûõ è ëîãè÷åñêèõ çíà÷åíèé
ÍÀÈÁÎËÜØÈÉ
Âîçâðàùàåò k-å íàèáîëüøåå çíà÷åíèå èç ìàññèâà äàííûõ
ÍÀÈÌÅÍÜØÈÉ
Âîçâðàùàåò k-å íàèìåíüøåå çíà÷åíèå èç ìàññèâà äàííûõ
102 Часть II. Средства Excel для статистического анализа
4.1.1. Функции МАКС, МАКСА, МИН, МИНА
Ýòè ôóíêöèè èìåþò ñëåäóþùèé ñèíòàêñèñ (äàëåå, åñëè áóäåò ïðèâîäèòüñÿ
ñèíòàêñèñ äëÿ ãðóïïû ôóíêöèé, â îïèñàíèè ñèíòàêñèñà áóäåì èñïîëüçîâàòü âìåñòî êîíêðåòíîãî íàçâàíèÿ ôóíêöèè ñëîâî ФУНКЦИЯ):
ФУНКЦИЯ(×èñëî1;×èñëî2;...)
Ôóíêöèè ìîãóò ñîäåðæàòü äî 30 àðãóìåíòîâ. Àðãóìåíòàìè ìîãóò áûòü êîíêðåòíûå ÷èñëà, àäðåñà äèàïàçîíîâ ëèáî ññûëêè íà îòäåëüíûå ÿ÷åéêè ðàáî÷åãî
ëèñòà.  äèàïàçîíàõ ïóñòûå ÿ÷åéêè è ÿ÷åéêè ñ òåêñòîì èãíîðèðóþòñÿ.  ôóíêöèÿõ МАКСА è МИНА àðãóìåíòû, ñîäåðæàùèå çíà÷åíèå ИСТИНА, èíòåðïðåòèðóþòñÿ êàê åäèíèöà, à àðãóìåíòû, ñîäåðæàùèå çíà÷åíèå ЛОЖЬ èëè òåêñò, èíòåðïðåòèðóþòñÿ êàê íóëü; â ôóíêöèÿõ МАКС è МИН òàêèå àðãóìåíòû èãíîðèðóþòñÿ.
4.1.2. Функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(Ìàññèâ;k)
Àðãóìåíò Массив — ññûëêà íà äèàïàçîí ÿ÷ååê, èç êîòîðîãî âûáèðàåòñÿ k-å íàèáîëüøåå (íàèìåíüøåå) ÷èñëîâîå çíà÷åíèå. Öåëîå ÷èñëî k çàäàåò ïîçèöèþ (íà÷èíàÿ
ñ íàèáîëüøåé â ôóíêöèè НАИБОЛЬШИЙ è ñ íàèìåíüøåé â ôóíêöèè НАИМЕНЬШИЙ).
Åñëè àðãóìåíò Массив íå çàäàí ëèáî åñëè ÷èñëî k ìåíüøå 0 èëè áîëüøå êîëè÷åñòâà
ÿ÷ååê â äèàïàçîíå Массив, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЧИСЛО!.
Ïîêàæåì, êàê ñ ïîìîùüþ ôóíêöèé НАИБОЛЬШИЙ è НАИМЕНЬШИЙ îïðåäåëèòü âûáîðî÷íîå çíà÷åíèå, êîòîðîìó ñîîòâåòñòâóåò çàäàííûé ðàíã (ðàíã — íîìåð
ïîçèöèè âûáîðî÷íîãî çíà÷åíèÿ â âàðèàöèîííîì ðÿäå, ïîñòðîåííîì ïî âûáîðêå;
î âàðèàöèîííîì ðÿäå è ðàíãàõ âûáîðî÷íûõ çíà÷åíèé ðå÷ü èäåò â ðàçäåëå 2.3.9).
Îòìåòèì, ÷òî äëÿ ðåøåíèÿ äàííîé çàäà÷è âàðèàöèîííûé ðÿä çàðàíåå íå ñòðîèòñÿ — îí ïîëó÷àåòñÿ â ðåçóëüòàòå âû÷èñëåíèé.
Ïóñòü âûáîðî÷íûå çíà÷åíèÿ ðàñïîëàãàþòñÿ â ñòîëáöå À (íà ðèñ. 4.1 âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû ñ ïîìîùüþ ôóíêöèè СЛЧИС, óìíîæåííîé íà 10).  îäíîì èç ñîñåäíèõ ñòîëáöîâ ââîäÿòñÿ íàòóðàëüíûå ÷èñëà îò 1 äî n (n — îáúåì âûáîðêè).  ÿ÷åéêó D2 ââîäèòñÿ ôîðìóëà =НАИМЕНЬШИЙ($A$2:$A$16;C2), êîòîðàÿ
çàòåì êîïèðóåòñÿ âíèç.  ðåçóëüòàòå ïîëó÷àåì âàðèàöèîííûé ðÿä, ÷èñëà
â ñòîëáöå Ñ ïîêàçûâàþò ðàíãè çíà÷åíèé ýòîãî ðÿäà. Àíàëîãè÷íîãî ðåçóëüòàòà
ìîæíî äîáèòüñÿ ñ ïîìîùüþ ôóíêöèè НАИБОЛЬШИЙ, äëÿ ÷åãî â ÿ÷åéêó ââîäèòñÿ
ôîðìóëà =НАИБОЛЬШИЙ($A$2:$A$16;16-C2), êîòîðàÿ çàòåì òàêæå êîïèðóåòñÿ
âíèç (çäåñü ÷èñëî 16 — ýòî ÷èñëî, íà 1 áîëüøåå îáúåìà âûáîðêè).
Îòìåòèì, ÷òî âûáðàòü íàèáîëüøèå èëè íàèìåíüøèå çíà÷åíèÿ èç âûáîðêè
(åñëè âûáîðî÷íûå çíà÷åíèÿ ðàñïîëîæåíû â îäíîì ñòîëáöå) ìîæíî òàêæå ñ ïîìîùüþ ñðåäñòâà Excel Автофильтр (êîìàíäà ДанныеÖФильтрÖАвтофильтр) èëè
Расширенный фильтр (êîìàíäà ДанныеÖФильтрÖРасширенный фильтр), ïðè÷åì
â ýòîì ñëó÷àå ìîæíî âûáðàòü íå îòäåëüíûå çíà÷åíèÿ, à íåñêîëüêî çíà÷åíèé, íàïðèìåð 5 íàèáîëüøèõ èëè 10 íàèìåíüøèõ çíà÷åíèé (ìîæíî êîëè÷åñòâî âûáèðàåìûõ çíà÷åíèé çàäàòü â âèäå ïðîöåíòà îò îáúåìà âûáîðêè). Íåäîñòàòêîì èñïîëüçîâàíèÿ ôèëüòðîâ ÿâëÿåòñÿ òî, ÷òî ýòî ñðåäñòâî íå “èíòåðàêòèâíî”; ïîýòîìó,
÷òîáû ñíîâà ïîëó÷èòü íóæíûå çíà÷åíèÿ ïðè èçìåíåíèè íåêîòîðûõ âûáîðî÷íûõ
çíà÷åíèé, ôèëüòð íåîáõîäèìî ïðèìåíèòü åùå ðàç — â îòëè÷èå îò ôóíêöèé, êîòîðûå àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ ïðè âíåñåíèè èçìåíåíèé â âûáîðêó.
Глава 4. Статистические функции
103
Ðèñ. 4.1. Ïîñòðîåíèå âàðèàöèîííîãî ðÿäà
4.2. Функции для работы с порядковыми
статистиками
 ýòîì ðàçäåëå ðàññìîòðèì ñëåäóþùèå ôóíêöèè, êîòîðûå ÿâíî èëè íåÿâíî ñâÿçàíû ñ ïîðÿäêîâûìè ñòàòèñòèêàìè è ðàíæèðîâàíèåì äàííûõ (î ïîðÿäêîâûõ ñòàòèñòèêàõ è âàðèàöèîííîì ðÿäå, êîòîðûé óïîìèíàåòñÿ íèæå, ðå÷ü èäåò â ðàçäåëå 2.3.9).
Ôóíêöèÿ
Íàçíà÷åíèå
ÊÂÀÐÒÈËÜ
Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò êâàðòèëè
ÌÅÄÈÀÍÀ
Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò ìåäèàíó
ÏÅÐÑÅÍÒÈËÜ
Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò ïðîöåíòèëè
ÏÐÎÖÅÍÒÐÀÍÃ
Ïî âûáîðêå âû÷èñëÿåò ïðîöåíòíûå ðàíãè âûáîðî÷íûõ çíà÷åíèé
ÐÀÍÃ
Ïî âûáîðêå âû÷èñëÿåò ðàíãè âûáîðî÷íûõ çíà÷åíèé
4.2.1. Функция КВАРТИЛЬ
Ðàññìîòðèì ñíà÷àëà ôóíêöèþ КВАРТИЛЬ. Íàïîìíèì, ÷òî êâàðòèëüþ ïîðÿäêà
ð (ð ïðèíèìàåò çíà÷åíèÿ 0,25, 0,5 è 0,75) ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð (ñì. ðàçäåë 1.2.3). Ôóíêöèÿ КВАРТИЛЬ âû÷èñëÿåò
êâàðòèëè ξ0,25, ξ0,5 è ξ0,75 íà îñíîâå âûáîðî÷íûõ çíà÷åíèé ñëåäóþùèì îáðàçîì.
Ïî âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä è îïðåäåëÿþòñÿ çíà÷åíèÿ, ïðèíèìàåìûå
çà êâàðòèëè ñîîòâåòñòâóþùåãî ïîðÿäêà, êîòîðûå äåëÿò âàðèàöèîííûé ðÿä íà ÷åòûðå ðàâíîâåëèêèå ÷àñòè (ðàâíîâåëèêèå ïî ÷èñëó âûáîðî÷íûõ çíà÷åíèé, ñîñòàâëÿþùèõ ýòè ÷àñòè ðÿäà).
104 Часть II. Средства Excel для статистического анализа
Ïóñòü õ(1) ≤ õ(2) ≤ ... ≤ õ(n) — âàðèàöèîííûé ðÿä, ïîñòðîåííûé ïî âûáîðêå õ1,
õ2, ..., xn îáúåìîì n. Òîãäà êâàðòèëü ξð âû÷èñëÿåòñÿ ïî ôîðìóëå ξð = õ(ðn) + (1 –
ð)(õ(ðn+1) – õ(ðn)), åñëè ïðîèçâåäåíèå ðn — öåëîå ÷èñëî. Åñëè ðn — äðîáíîå ÷èñëî,
òî ξð = õ([ðn]+1), ãäå [ðn] — öåëàÿ ÷àñòü ÷èñëà ðn.
Ñèíòàêñèñ ôóíêöèè:
КВАРТИЛЬ(Ìàññèâ;×àñòü)
Àðãóìåíò Массив — ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî
÷èñëîâûå çíà÷åíèÿ, ïî êîòîðûì îïðåäåëÿåòñÿ çíà÷åíèå êâàðòèëÿ. Àðãóìåíò
Часть ïðèíèìàåò öåëî÷èñëåííûå çíà÷åíèÿ îò 0 äî 4, è â çàâèñèìîñòè îò ýòîãî
çíà÷åíèÿ ôóíêöèÿ âîçâðàùàåò ñëåäóþùèå çíà÷åíèÿ: 0 — ìèíèìàëüíîå çíà÷åíèå
â âûáîðêå, 1 — êâàðòèëü ξ0,25, 2 — êâàðòèëü ξ0,5, 3 — êâàðòèëü ξ0,75, 4 — ìàêñèìàëüíîå çíà÷åíèå â âûáîðêå. Íà ðèñ. 4.2 ïîêàçàíû çíà÷åíèÿ ôóíêöèè КВАРТИЛЬ
ïðè ðàçëè÷íûõ âàðèàíòàõ çíà÷åíèé àðãóìåíòà Часть.
Ðèñ. 4.2. Ôóíêöèÿ КВАРТИЛЬ
Îòìåòèì, ÷òî ôóíêöèè МИН, МЕДИАНА è МАКС âîçâðàùàþò òî æå çíà÷åíèå,
÷òî è ôóíêöèÿ КВАРТИЛЬ, åñëè åå àðãóìåíò Часть ðàâåí 0, 2 èëè 4 ñîîòâåòñòâåííî.
4.2.2. Функция ПЕРСЕНТИЛЬ
Ýòà ôóíêöèÿ âû÷èñëÿåò ïðîöåíòèëè ξ0,01, ξ0,02, ..., ξ0,99, ò.å. êâàíòèëè ïîðÿäêà
îò 0,01 äî 0,99 (ñì. ðàçäåë 1.2.3). Ýòà ôóíêöèÿ âûïîëíÿåò âû÷èñëåíèÿ àíàëîãè÷íî ôóíêöèè КВАРТИЛЬ.
Ñèíòàêñèñ ôóíêöèè:
ПЕРСЕНТИЛЬ(Ìàññèâ;k)
Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî ÷èñëîâûå çíà÷åíèÿ, ïî êîòîðûì îïðåäåëÿåòñÿ çíà÷åíèå ïðîöåíòèëåé. Àðãóìåíò k çàäàåò ïîðÿäîê âû÷èñëÿåìîãî ïðîöåíòèëÿ. Îí ìîæåò ïðèíèìàòü çíà÷åíèÿ îò 0 äî 1 âêëþ÷èòåëüíî. Íà ðèñ. 4.3 ïîêàçàíû çíà÷åíèÿ ôóíêöèè
ПЕРСЕНТИЛЬ ïðè ðàçëè÷íûõ âàðèàíòàõ çíà÷åíèé àðãóìåíòà k.
Глава 4. Статистические функции
105
Ðèñ. 4.3. Ôóíêöèÿ ПЕРСЕНТИЛЬ
4.2.3. Функция МЕДИАНА
Ýòà ôóíêöèÿ âîçâðàùàåò ìåäèàíó — êâàíòèëü ïîðÿäêà 0,5. Ìåäèàíà â äàííîì ñëó÷àå îïðåäåëÿåòñÿ êàê ÷èñëî, êîòîðîå ÿâëÿåòñÿ ñåðåäèíîé âàðèàöèîííîãî
ðÿäà õ(1) ≤ õ(2) ≤ ... ≤ õ(n), ò.å. ïîëîâèíà ÷èñåë èìååò çíà÷åíèÿ, áîëüøèå ÷åì ìåäèàíà, à ïîëîâèíà — ìåíüøèå ÷åì ìåäèàíà. Åñëè n — íå÷åòíîå ÷èñëî
(n = 2k + 1), òî â êà÷åñòâå ìåäèàíû áåðåòñÿ ÷èñëî õ(k); åñëè æå n — ÷åòíîå ÷èñëî
(n = 2k), òî ìåäèàíà âû÷èñëÿåòñÿ êàê ñðåäíåå ÷èñåë õ(k–1) è õ(k).
Ñèíòàêñèñ ôóíêöèè:
МЕДИАНА(×èñëî1;×èñëî2;...)
Ôóíêöèÿ ìîæåò èìåòü 30 àðãóìåíòîâ Число. Ýòè àðãóìåíòû äîëæíû áûòü
÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ ÷èñëà. Åñëè â çàäàííîì äèàïàçîíå ÿ÷ååê èìåþòñÿ ÿ÷åéêè, ñîäåðæàùèå òåêñò, ëîãè÷åñêèå
çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, òî îíè èãíîðèðóþòñÿ; íî ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
4.2.4. Функция ПРОЦЕНТРАНГ
Äàííàÿ ôóíêöèÿ âû÷èñëÿåò òàê íàçûâàåìûé ïðîöåíòíûé ðàíã âûáîðî÷íûõ
çíà÷åíèé. Îí âû÷èñëÿåòñÿ ñëåäóþùèì îáðàçîì. Ïî âûáîðêå õ1, õ2, ..., xn ñòðîèòñÿ
âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Íîìåð r ÷ëåíà ðÿäà x(r) — ýòî ðàíã çíà÷åíèÿ
x(r). Ïðîöåíòíûé ðàíã ýòîãî çíà÷åíèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå (r – 1)/(n – 1), ãäå
n — îáúåì âûáîðêè. Ìîæíî ñ÷èòàòü, ÷òî äàííàÿ ôóíêöèÿ îáðàòíàÿ ê ôóíêöèè
ПЕРСЕНТИЛЬ, ãäå ïî çíà÷åíèþ ïîðÿäêà êâàíòèëÿ (÷òî ïðàêòè÷åñêè ñîâïàäàåò ñî
çíà÷åíèåì ïîðÿäêîâîãî ðàíãà) íàõîäèòñÿ ñîîòâåòñòâóþùàÿ ïðîöåíòèëü, ò.å. âûáîðî÷íîå çíà÷åíèå (åñëè ïðîöåíòèëü ñîâïàäàåò ñ âûáîðî÷íûì çíà÷åíèåì).
Ñèíòàêñèñ ôóíêöèè:
ПРОЦЕНТРАНГ(Ìàññèâ;õ;Ðàçìåðíîñòü)
106 Часть II. Средства Excel для статистического анализа
Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò х — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ
ïðîöåíòíûé ðàíã. Åñëè ýòî çíà÷åíèå íå ñîâïàäàåò ñ êàêèì-ëèáî âûáîðî÷íûì
çíà÷åíèåì, òî ôóíêöèÿ ПРОЦЕНТРАНГ äëÿ ýòîãî çíà÷åíèÿ âû÷èñëÿåò ðàíã êàê
ñðåäíåå ðàíãîâ òåõ ÷ëåíîâ âàðèàöèîííîãî ðÿäà, ìåæäó êîòîðûìè çàêëþ÷åíî
äàííîå çíà÷åíèå х. Íåîáÿçàòåëüíûé àðãóìåíò Размерность îïðåäåëÿåò êîëè÷åñòâî äåñÿòè÷íûõ çíàêîâ ïîñëå çàïÿòîé â âû÷èñëåííîì çíà÷åíèè ïðîöåíòíîãî ðàíãà. Åñëè ýòîò àðãóìåíò îïóùåí, òî ïî óìîë÷àíèþ ïðîöåíòíûé ðàíã çàïèñûâàåòñÿ
ñ òðåìÿ äåñÿòè÷íûìè çíàêàìè.
4.2.5. Функция РАНГ
Èç ñàìîãî íàçâàíèÿ ôóíêöèè РАНГ ïîíÿòíî, ÷òî äàííàÿ ôóíêöèÿ âû÷èñëÿåò
ðàíã âûáîðî÷íîãî çíà÷åíèÿ, ò.å. íîìåð r çíà÷åíèÿ x(r) âàðèàöèîííîãî ðÿäà õ(1) ≤
õ(2) ≤ ... ≤ õ(n). Îòìåòèì, ÷òî ôóíêöèÿ ìîæåò óïîðÿäî÷èòü âûáîðêó êàê ïî âîçðàñòàíèþ, òàê è ïî óáûâàíèþ (ñïîñîá óïîðÿäî÷èâàíèÿ çàäàåò àðãóìåíò ôóíêöèè
Порядок, î ÷åì ðå÷ü èäåò íèæå), è, êîíå÷íî, âîçâðàùàåìûå ôóíêöèåé çíà÷åíèÿ
áóäóò ðàçëè÷íû äëÿ ðàçíûõ ñïîñîáîâ óïîðÿäî÷èâàíèÿ âûáîðêè. Åñëè â âûáîðêå
åñòü ñîâïàäàþùèå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, à ïîñëåäóþùåìó çíà÷åíèþ ïðèñâàèâàåòñÿ ðàíã, çíà÷åíèå êîòîðîãî áóäåò áîëüøå ïðåäûäóùåãî ðàíãà íà êîëè÷åñòâî îäèíàêîâûõ âûáîðî÷íûõ çíà÷åíèé. Íàïðèìåð, åñëè
â âûáîðêå äâàæäû âñòðå÷àåòñÿ ÷èñëî 10, èìåþùåå ðàíã 5, òî ñëåäóþùåå ïî âåëè÷èíå ÷èñëî 11 áóäåò èìåòü ðàíã 7 è íè îäíî èç ÷èñåë íå áóäåò èìåòü ðàíã 6
(ïðèìåð âçÿò èç ñïðàâî÷íîé ñèñòåìû Excel).
Ñèíòàêñèñ ôóíêöèè:
РАНГ(×èñëî;Ìàññèâ;Ïîðÿäîê)
Àðãóìåíò Массив — ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî
âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò Число — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ
ðàíã. Åñëè ýòî çíà÷åíèå íå ñîâïàäàåò íè ñ îäíèì âûáîðî÷íûì çíà÷åíèåì, òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д!. Íåîáÿçàòåëüíûé àðãóìåíò Порядок
îïðåäåëÿåò ñïîñîá óïîðÿäî÷èâàíèÿ âûáîðêè. Åñëè Порядок ðàâåí 0 (íóëþ) èëè
îïóùåí, òî âûáîðêà óïîðÿäî÷èâàåòñÿ ïî óáûâàíèþ. Åñëè Порядок — ëþáîå íåíóëåâîå ÷èñëî, òî âûáîðêà óïîðÿäî÷èâàåòñÿ ïî âîçðàñòàíèþ.
Îòìåòèì, ÷òî ñ ïîìîùüþ äàííîé ôóíêöèè ìîæíî âû÷èñëèòü íå òîëüêî ðàíã
îäíîãî âûáîðî÷íîãî çíà÷åíèÿ, íî îäíîâðåìåííî ðàíãè âñåõ âûáîðî÷íûõ çíà÷åíèé. Äëÿ ýòîãî íàäî ïðèìåíèòü åå â ôîðìóëå ìàññèâà. Î ôîðìóëàõ ìàññèâà ïîäðîáíåå ïîãîâîðèì â ãëàâå 6, â ðàçäåëå 6.1, çäåñü æå ïðîñòî ïîêàæåì, êàê ïîäñ÷èòàòü âñå ðàíãè îäíîé âûáîðêè.
1. Ïóñòü âûáîðî÷íûå çíà÷åíèÿ çàïèñàíû â îäíîì ñòîëáöå À, êàê ïîêàçàíî íà
ðèñ. 4.4.
2. Âû÷èñëåííûå ðàíãè áóäóò çàïèñàíû â ñòîëáöå Â. Âûäåëèòå äèàïàçîí ÿ÷ååê
Â2:Â17 è â ïåðâóþ ÿ÷åéêó âûäåëåííîãî äèàïàçîíà ââåäèòå ôîðìóëó
=РАНГ(A2:A17;A2:A17;1) (ñì. ðèñ. 4.4).
Глава 4. Статистические функции
107
3. Íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter> (ââîä ôîðìóëû
ìàññèâà). Ðàíãè áóäóò âû÷èñëåíû äëÿ âñåé âûáîðêè, êàê ïîêàçàíî íà
ðèñ. 4.5. Îáðàòèòå âíèìàíèå íà ðàâíûå ðàíãè â ÿ÷åéêàõ Â10, Â11 è Â13;
âûáîðî÷íûå çíà÷åíèÿ â ÿ÷åéêàõ À10, À11 è À13 òàêæå îäèíàêîâû.
Ðèñ. 4.4. Ââîä ôîðìóëû ìàññèâà
Ðèñ. 4.5. Âû÷èñëåííûå ðàíãè
108 Часть II. Средства Excel для статистического анализа
4.3. Функции для вычисления средних
Ôóíêöèè ýòîé ãðóïïû âû÷èñëÿþò ñðåäíèå çíà÷åíèÿ: ñðåäíåå àðèôìåòè÷åñêîå,
ñðåäíåå ãåîìåòðè÷åñêîå è ñðåäíåå ãàðìîíè÷åñêîå.
Ôóíêöèÿ
Íàçíà÷åíèå
ÑÐÃÀÐÌ
Âîçâðàùàåò ñðåäíåå ãàðìîíè÷åñêîå ìíîæåñòâà äàííûõ
ÑÐÃÅÎÌ
Âîçâðàùàåò ñðåäíåå ãåîìåòðè÷åñêîå ìíîæåñòâà äàííûõ
ÑÐÇÍÀ×
Âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå ñâîèõ àðãóìåíòîâ
ÑÐÇÍÀ×À
Âû÷èñëÿåò ñðåäíåå àðèôìåòè÷åñêîå ñâîèõ àðãóìåíòîâ; ïîìèìî ÷èñåë, â ðàñ÷åòå ìîãóò ó÷àñòâîâàòü òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ
ÓÐÅÇÑÐÅÄÍÅÅ
Âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå, ðàññ÷èòàííîå ïîñëå îòáðàñûâàíèÿ êðàéíèõ çíà÷åíèé ìàññèâà äàííûõ
Âñå ïåðå÷èñëåííûå ôóíêöèè, êðîìå ôóíêöèè УРЕЗСРЕДНЕЕ, èìåþò ñëåäóþùèé ñèíòàêñèñ:
ФУНКЦИЯ(×èñëî1;×èñëî2;...)
Îíè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü èëè
íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, èëè ññûëêè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè èãíîðèðóþòñÿ, à ÿ÷åéêè ñ íóëåâûìè
çíà÷åíèÿìè çàñ÷èòûâàþòñÿ. Ôóíêöèÿ СРЗНАЧА èíòåðïðåòèðóåò ëîãè÷åñêîå çíà÷åíèå ИСТИНА êàê 1, à ëîãè÷åñêîå çíà÷åíèå ЛОЖЬ è òåêñòîâûå çíà÷åíèÿ — êàê
0. Äðóãèå ôóíêöèè ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ èãíîðèðóþò. Ôóíêöèè
СРГАМ è СРГЕОМ òàêæå òðåáóþò, ÷òîáû âñå ÷èñëîâûå çíà÷åíèÿ, êîòîðûå îíè
îáðàáàòûâàþò, áûëè ïîëîæèòåëüíûìè. Èíà÷å îíè âîçâðàùàþò îøèáêó #ЧИСЛО!.
4.3.1. Функция СРГАМ
Ýòà ôóíêöèÿ âû÷èñëÿåò ñðåäíåå ãàðìîíè÷åñêîå Í çíà÷åíèé õ1, õ2, ..., xn ïî
ôîðìóëå H =
n
n
1
∑
i =1 xi
. Ñðåäíåå ãàðìîíè÷åñêîå íå ïðåâûøàåò ñðåäíåãî ãåîìåòðè÷å-
ñêîãî, êîòîðîå, â ñâîþ î÷åðåäü, íå ïðåâûøàåò ñðåäíåãî àðèôìåòè÷åñêîãî.
4.3.2. Функция СРГЕОМ
Äàííàÿ ôóíêöèÿ âû÷èñëÿåò ñðåäíåå ãåîìåòðè÷åñêîå G çíà÷åíèé õ1, õ2, ..., xn
ïî ôîðìóëå G =
n
x1 x2 ⋅ ... ⋅ xn .
4.3.3. Функции СРЗНАЧ и СРЗНАЧА
Ýòè ôóíêöèè âû÷èñëÿþò ñðåäíåå àðèôìåòè÷åñêîå (âûáîðî÷íîå ñðåäíåå) x
çíà÷åíèé õ1, õ2, ..., xn ïî ôîðìóëå x =
1 n
∑ xi . Ðàçëè÷èå ìåæäó ôóíêöèÿìè
n i =1
СРЗНАЧ è СРЗНАЧА çàêëþ÷àåòñÿ òîëüêî â èíòåðïðåòàöèè ëîãè÷åñêèõ è òåêñòîâûõ
Глава 4. Статистические функции
109
çíà÷åíèé. Ôóíêöèÿ СРЗНАЧ èõ èãíîðèðóåò, à СРЗНАЧА ïðèñâàèâàåò èì ÷èñëîâûå çíà÷åíèÿ: çíà÷åíèå 1 — ëîãè÷åñêîìó çíà÷åíèþ ИСТИНА è çíà÷åíèå 0 — ëîãè÷åñêîìó çíà÷åíèþ ЛОЖЬ è òåêñòîâûì çíà÷åíèÿì.
4.3.4. Функция УРЕЗСРЕДНЕЕ
Ýòà ôóíêöèÿ âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå, ðàññ÷èòàííîå ïîñëå îòáðàñûâàíèÿ çàäàííîãî êîëè÷åñòâà êðàéíèõ çíà÷åíèé ìàññèâà äàííûõ.
Ñèíòàêñèñ ôóíêöèè:
УРЕЗСРЕДНЕЕ(Ìàññèâ;Äîëÿ)
Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî äàííûå. Àðãóìåíò Доля — ýòî äîëÿ òî÷åê äàííûõ, èñêëþ÷àåìûõ èç âû÷èñëåíèé, ò.å. êîëè÷åñòâî èñêëþ÷àåìûõ òî÷åê âû÷èñëÿåòñÿ êàê Доля×n, ãäå n —
îáùåå êîëè÷åñòâî òî÷åê äàííûõ. Äàííîå ïðîèçâåäåíèå îêðóãëÿåòñÿ ñ íåäîñòàòêîì äî áëèæàéøåãî ÷åòíîãî ÷èñëà è ïîëîâèíà ýòîãî ÷èñëà ïðåäñòàâëÿåò ñîáîé
ðàâíûå êîëè÷åñòâà îòáðàñûâàåìûõ íàèìåíüøèõ è íàèáîëüøèõ çíà÷åíèé èç ìàññèâà äàííûõ. Åñëè çíà÷åíèå àðãóìåíòà Доля îòðèöàòåëüíî èëè áîëüøå 1, òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.4. Функции для вычисления геометрических
характеристик распределения
 ýòó ãðóïïó ôóíêöèé âõîäÿò ñëåäóþùèå ôóíêöèè.
Ôóíêöèÿ
Íàçíà÷åíèå
ÑÊÎÑ
Âîçâðàùàåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè
ÝÊÑÖÅÑÑ
Âîçâðàùàåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(×èñëî1;×èñëî2;...)
Îíè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, ÷èñëîâûå ìàññèâû èëè ññûëêè íà äèàïàçîíû
ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè, à òàêæå ÿ÷åéêè, ñîäåðæàùèå ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ, èãíîðèðóþòñÿ, íî ÿ÷åéêè ñ íóëåâûìè
çíà÷åíèÿìè çàñ÷èòûâàþòñÿ.
4.4.1. Функция СКОС
Ýòà ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè ðàñïðåäåëåíèÿ
(î êîýôôèöèåíòå àñèììåòðèè è åãî çíà÷åíèè ðå÷ü èäåò â ðàçäåëå 1.2.3). Åñëè
åñòü âûáîðêà õ1, õ2, ..., xn (çàäàåòñÿ àðãóìåíòàìè Число), ôóíêöèÿ СКОС âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè ïî ñëåäóþùåé ôîðìóëå:
2
n
 xi − x 
n
β̂1 =

 ,
∑
(n − 1)(n − 2) i =1  sn 
110 Часть II. Средства Excel для статистического анализа
ãäå n — îáúåì âûáîðêè, x =
1 n
1 n
2
( xi − x )2 .
x
,
s
=
∑ i n n −1 ∑
n i =1
i =1
Åñëè n < 3 èëè sn = 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!.
4.4.2. Функция ЭКСЦЕСС
Ýòà ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà ðàñïðåäåëåíèÿ
(î êîýôôèöèåíòå ýêñöåññà è åãî çíà÷åíèè ðå÷ü èäåò â ðàçäåëå 1.2.3). Åñëè åñòü
âûáîðêà õ1, õ2, ..., xn (çàäàåòñÿ àðãóìåíòàìè Число), òî ôóíêöèÿ ЭКСЦЕСС âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà ïî ñëåäóþùåé ôîðìóëå:
4
β̂ 2 =
n
 xi − x 
3(n − 1) 2
n(n + 1)
,
−

∑
(n − 1)(n − 2)(n − 3) i =1  sn  (n − 3)(n − 3)
ãäå n — îáúåì âûáîðêè, x =
1 n
1 n
xi , sn2 =
∑
∑ ( xi − x )2 .
n i =1
n − 1 i =1
Åñëè n < 4 èëè sn = 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!.
4.5. Функции для вычисления выборочной
дисперсии и отклонения
 ýòó ãðóïïó âêëþ÷åíû ôóíêöèè, êîòîðûå âû÷èñëÿþò òó èëè èíóþ ìåðó ðàçáðîñà âûáîðî÷íûõ çíà÷åíèé îòíîñèòåëüíî ñðåäíåãî.
Ôóíêöèÿ
Íàçíà÷åíèå
ÄÈÑÏ
Âû÷èñëÿåò íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè
ÄÈÑÏÀ
Âû÷èñëÿåò íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè, ó÷èòûâàÿ ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ
ÄÈÑÏÐ
Âû÷èñëÿåò àñèìïòîòè÷åñêè íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè
ÄÈÑÏÐÀ
Âû÷èñëÿåò àñèìïòîòè÷åñêè íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè, ó÷èòûâàÿ ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ
ÊÂÀÄÐÎÒÊË
Âîçâðàùàåò ñóììó êâàäðàòîâ îòêëîíåíèé
ÑÐÎÒÊË
Âîçâðàùàåò ñðåäíåå çíà÷åíèå àáñîëþòíûõ âåëè÷èí îòêëîíåíèé òî÷åê äàííûõ îò ñðåäíåãî
ÑÒÀÍÄÎÒÊËÎÍ
Îöåíèâàåò ñòàíäàðòíîå îòêëîíåíèå ïî âûáîðêå
ÑÒÀÍÄÎÒÊËÎÍÀ
Îöåíèâàåò ñòàíäàðòíîå îòêëîíåíèå ïî âûáîðêå, â ðàñ÷åòå
òàêæå ó÷èòûâàþòñÿ òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ
ÑÒÀÍÄÎÒÊËÎÍÏ
Âû÷èñëÿåò ñòàíäàðòíîå îòêëîíåíèå ïî ãåíåðàëüíîé ñîâîêóïíîñòè
ÑÒÀÍÄÎÒÊËÎÍÏÀ
Âû÷èñëÿåò ñòàíäàðòíîå îòêëîíåíèå ïî ãåíåðàëüíîé ñîâîêóïíîñòè, â ðàñ÷åòå òàêæå ó÷èòûâàþòñÿ òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ
Глава 4. Статистические функции
111
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(×èñëî1;×èñëî2;...)
Ôóíêöèè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü
íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, ÷èñëîâûå ìàññèâû èëè ññûëêè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè èãíîðèðóþòñÿ,
à ÿ÷åéêè ñ íóëåâûìè çíà÷åíèÿìè çàñ÷èòûâàþòñÿ. Ôóíêöèè ДИСПА, ДИСПРА,
СТАНДОТКЛОНА è СТАНДОТКЛОНПА èíòåðïðåòèðóþò ëîãè÷åñêîå çíà÷åíèå
ИСТИНА êàê 1, à ëîãè÷åñêîå çíà÷åíèå ЛОЖЬ è òåêñòîâûå çíà÷åíèÿ — êàê 0.
Äðóãèå ôóíêöèè ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ èãíîðèðóþò.
4.5.1. Функции ДИСП и ДИСПА
Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íóþ äèñïåðñèþ ïî âûáîðêå õ1, õ2, ..., xn
(êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå
sn2 =
1 n
1 n
( xi − x )2 , ãäå x = ∑ xi .
∑
n − 1 i =1
n i =1
Ýòî íåñìåùåííàÿ îöåíêà íåèçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
4.5.2. Функции ДИСПР и ДИСПРА
Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íóþ äèñïåðñèþ ïî âûáîðêå õ1, õ2, ..., xn
(êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå
Sn2 =
1 n
1 n
( xi − x ) 2 , ãäå x = ∑ xi .
∑
n i =1
n i =1
Ýòî àñèìïòîòè÷åñêè íåñìåùåííàÿ îöåíêà íåèçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ
ãåíåðàëüíîé ñîâîêóïíîñòè.
4.5.3. Функция КВАДРОТКЛ
Ýòà ôóíêöèÿ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число)
âû÷èñëÿåò ñóììó êâàäðàòîâ îòêëîíåíèé âûáîðî÷íûõ çíà÷åíèé îò âûáîðî÷íîãî
n
ñðåäíåãî, ò.å. âû÷èñëÿåò âåëè÷èíó
∑ (x
i
− x )2 , ãäå x =
i =1
1 n
∑ xi .
n i =1
Çíà÷åíèå, âîçâðàùàåìîå ýòîé ôóíêöèåé, ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ
âûáîðî÷íîé äèñïåðñèè èëè âûáîðî÷íîãî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ.
4.5.4. Функции СТАНДОТКЛОН и СТАНДОТКЛОНА
Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå (ñòàíäàðòíîå)
îòêëîíåíèå ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число)
ïî ôîðìóëå
sn =
1 n
1 n
( xi − x ) 2 , ãäå x = ∑ xi .
∑
n − 1 i =1
n i =1
112 Часть II. Средства Excel для статистического анализа
4.5.5. Функции СТАНДОТКЛОНП и СТАНДОТКЛОНПА
Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå (ñòàíäàðòíîå)
îòêëîíåíèå ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî
ôîðìóëå
Sn =
1 n
1 n
( xi − x ) 2 , ãäå x = ∑ xi .
∑
n i =1
n i =1
4.5.6. Функция СРОТКЛ
Ýòà ôóíêöèÿ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число)
âû÷èñëÿåò ñðåäíåå àðèôìåòè÷åñêîå ìîäóëåé îòêëîíåíèé âûáîðî÷íûõ çíà÷åíèé
1 n
1 n
| xi − x | , ãäå x = ∑ xi .
∑
n i =1
n i =1
Çíà÷åíèå, âîçâðàùàåìîå ýòîé ôóíêöèåé, ïîêàçûâàåò (íàðÿäó ñî ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèåì) ìåðó ðàññåèâàíèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ.
îò âûáîðî÷íîãî ñðåäíåãî, ò.å. âåëè÷èíó
4.6. Функции для вычисления значений функций
распределения
Ýòî, ïî-âèäèìîìó, ñàìàÿ îáøèðíàÿ ãðóïïà ñòàòèñòè÷åñêèõ ôóíêöèé.  íåå
âõîäÿò òàêèå ôóíêöèè.
Ôóíêöèÿ
Íàçíà÷åíèå
FÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ôóíêöèè F-ðàñïðåäåëåíèÿ
ÁÅÒÀÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ôóíêöèè áåòà-ðàñïðåäåëåíèÿ
ÁÈÍÎÌÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ
ÂÅÉÁÓËË
Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî
ÃÀÌÌÀÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ãàììà-ðàñïðåäåëåíèÿ
ÃÈÏÅÐÃÅÎÌÅÒ
Âîçâðàùàåò çíà÷åíèÿ ãèïåðãåîìåòðè÷åñêîãî ðàñïðåäåëåíèÿ
ËÎÃÍÎÐÌÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÍÎÐÌÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÍÎÐÌÑÒÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÎÒÐÁÈÍÎÌÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ îòðèöàòåëüíîãî áèíîìèàëüíîãî ðàñïðåäåëåíèÿ
ÏÓÀÑÑÎÍ
Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ïóàññîíà
ÑÒÜÞÄÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà
ÕÈ2ÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ χ2
ÝÊÑÏÐÀÑÏ
Âîçâðàùàåò çíà÷åíèÿ ýêñïîíåíöèàëüíîãî ðàñïðåäåëåíèÿ
Глава 4. Статистические функции
113
4.6.1. Функция FРАСП
Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç. Îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà) ñ (m, n) ñòåïåíÿìè ñâîáîäû
(ñì. ðàçäåë 1.5.7)1. ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè âû÷èñëèòü çíà÷åíèå ôóíêöèè
F-ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî ïðèìåíèòü ôîðìóëó =1 – FРАСП(u;m;n) (m è n —
çàäàííûå çíà÷åíèÿ ñòåïåíåé ñâîáîäû), êàê ïîêàçàíî íà ðèñ. 4.6.
Ñèíòàêñèñ ôóíêöèè:
FРАСП(õ;Ñòåïåíü_ñâîáîäû1;Ñòåïåíü_ñâîáîäû2)
Çäåñü x — ýòî çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ, Степень_свободы1
è Степень_свободы2 — çíà÷åíèÿ ñòåïåíåé ñâîáîäû F-ðàñïðåäåëåíèÿ. Åñëè êàêîåëèáî èç ýòèõ çíà÷åíèé íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî ëèáî åñëè çíà÷åíèÿ ñòåïåíåé ñâîáîäû
ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
Ðèñ. 4.6. Ãðàôèêè ôóíêöèé FРАСП и 1 – FРАСП
4.6.2. Функция БЕТАРАСП
Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè áåòà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè
α è β, α è β > 0 (ñì. ðàçäåë 1.5.9).
Ñèíòàêñèñ ôóíêöèè:
БЕТАРАСП(õ;Àëüôà;Áåòà;À;Â)
1
Îòìåòèì, ÷òî â ñïðàâî÷íîé ñèñòåìå Excel ïðè îïèñàíèè ýòîé ôóíêöèè îøèáî÷íî óêàçàíî,
÷òî îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ < õ) (Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ Fðàñïðåäåëåíèå). Ýòà îøèáêà ïîâòîðÿåòñÿ â áîëüøèíñòâå êíèã, ñîäåðæàùèõ îïèñàíèå ñòàòèñòè÷åñêèõ ôóíêöèé.
114 Часть II. Средства Excel для статистического анализа
Àðãóìåíò x — ýòî çíà÷åíèå èç èíòåðâàëà îò A äî B, äëÿ êîòîðîãî âû÷èñëÿåòñÿ
ôóíêöèÿ. Альфа è Бета — ïàðàìåòðû ðàñïðåäåëåíèÿ. Íåîáÿçàòåëüíûå àðãóìåíòû A è В — ñîîòâåòñòâåííî íèæíÿÿ è âåðõíÿÿ ãðàíèöû èíòåðâàëà èçìåíåíèÿ x.
Åñëè àðãóìåíòû A è B îïóùåíû, òî ïî óìîë÷àíèþ ïðèíèìàåòñÿ, ÷òî A = 0 è B = 1.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ БЕТАРАСП
âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè Альфа èëè Бета ≤ 0 ëèáî åñëè x < A,
x > B èëè A = B, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.3. Функция БИНОМРАСП
Íàïîìíèì (ñì. ðàçäåë 1.4.3), ÷òî áèíîìèàëüíîå ðàñïðåäåëåíèå ÷àñòî ðàññìàòðèâàþò êàê ìîäåëü ñëó÷àéíûõ ýêñïåðèìåíòîâ, ñîñòîÿùèõ èç n íåçàâèñèìûõ
îäèíàêîâûõ èñïûòàíèé, â ðåçóëüòàòå êàæäîãî èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Òîãäà ñëó÷àéíàÿ
âåëè÷èíà, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1” â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå
ðàñïðåäåëåíèå. Ôóíêöèÿ БИНОМРАСП ïîçâîëÿåò âû÷èñëÿòü êàê çíà÷åíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè ëþáûõ n, p è k, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ F(x).
Ñèíòàêñèñ ôóíêöèè:
БИНОМРАСП(×èñëî_óñïåõîâ;×èñëî_èñïûòàíèé; Âåðîÿòíîñòü_óñïåõà; Èíòåãðàëüíàÿ)
Çäåñü àðãóìåíò Число_успехов — ýòî êîëè÷åñòâî èñïûòàíèé k, â êîòîðûõ ïðîèçîøåë
èñõîä
“1”.
Число_испытаний —
êîëè÷åñòâî
èñïûòàíèé
n.
Вероятность_успеха — âåðîÿòíîñòü p èñõîäà “1”. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1),
òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ, ò.å. âåðîÿòíîñòü òîãî,
÷òî ÷èñëî èñõîäîâ “1” íå ìåíåå çíà÷åíèÿ àðãóìåíòà Число_успехов; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ÷èñëî èñõîäîâ “1” â òî÷íîñòè ðàâíî çíà÷åíèþ àðãóìåíòà Число_успехов.
Åñëè çíà÷åíèÿ àðãóìåíòîâ Число_успехов è Число_испытаний íå ÿâëÿþòñÿ öåëûìè ÷èñëàìè, òî â êà÷åñòâå àðãóìåíòîâ áåðåòñÿ öåëàÿ ÷àñòü ýòèõ ÷èñåë. Åñëè
ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Число_успехов îòðèöàòåëüíî èëè
áîëüøå çíà÷åíèÿ àðãóìåíòà Число_испытаний, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ЧИСЛО!. Ôóíêöèÿ âîçâðàùàåò òàêóþ æå îøèáêó, åñëè çíà÷åíèå àðãóìåíòà Вероятность_успеха íå ïðèíàäëåæèò èíòåðâàëó (0, 1).
4.6.4. Функция ВЕЙБУЛЛ
Äàííàÿ ôóíêöèÿ ìîæåò âû÷èñëÿòü êàê çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè, òàê
è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî (ñì. ðàçäåë 1.5.11).
Ñèíòàêñèñ ôóíêöèè:
ВЕЙБУЛЛ(x;Àëüôà;Áåòà;Èíòåãðàëüíàÿ)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Альфа è Бета — íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè.
Глава 4. Статистические функции
115
Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ îòðèöàòåëüíû, òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.5. Функция ГАММАРАСП
Äàííàÿ ôóíêöèÿ ìîæåò âû÷èñëÿòü êàê çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè, òàê
è çíà÷åíèÿ ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ (ñì. ðàçäåë 1.5.10).
Ñèíòàêñèñ ôóíêöèè:
ГАММАРАСП(x;Àëüôà;Áåòà;Èíòåãðàëüíàÿ)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Альфа è Бета —
íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА
(èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò
àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè
ïëîòíîñòè âåðîÿòíîñòè.
Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ îòðèöàòåëüíû, òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.6. Функция ГИПЕРГЕОМЕТ
Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âåðîÿòíîñòè Ð(Õ = k), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ
èìååò ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè N, n è ð (N ≥ n ≥ 0,
0 < p < 1) (ñì. ðàçäåë 1.4.6).
Ñèíòàêñèñ ôóíêöèè:
ГИПЕРГЕОМЕТ(×èñëî_óñïåõîâ_â_âûáîðêå;Ðàçìåð_âûáîðêè;×èñëî_óñïåõîâ_â_ñîâ
îêóïíîñòè;Ðàçìåð_ñîâîêóïíîñòè)
Àðãóìåíò Число_успехов_в_выборке — ýòî çíà÷åíèå k, àðãóìåíò Размер_выборки — çíà÷åíèå n, Число_успехов_в_совокупности — çíà÷åíèå ðN,
Размер_совокупности — ýòî çíà÷åíèå N.
Ôóíêöèÿ ГИПЕРГЕОМЕТ âûïîëíÿåò âû÷èñëåíèÿ ïî ôîðìóëå
P(X = k ) =
k
C Np
C Nn −(1k− p )
C Nn
, k = 0, 1, 2, ..., n ,
ãäå Cnk — áèíîìèàëüíûé êîýôôèöèåíò.
Âñå àðãóìåíòû ôóíêöèè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ, íå ïðåâûøàþùèõ çàäàííûõ çíà÷åíèé àðãóìåíòîâ. Åñëè êàêîé-ëèáî àðãóìåíò íå ÿâëÿåòñÿ
÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Число_успехов_в_выборке îòðèöàòåëüíî èëè ïðåâîñõîäèò ìåíüøåå èç
÷èñåë Размер_выборки è Число_успехов_в_совокупности, ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЧИСЛО!. Åñëè àðãóìåíò Размер_выборки îòðèöàòåëüíî èëè
ïðåâîñõîäèò çíà÷åíèå àðãóìåíòà Размер_совокупности, ôóíêöèÿ òàêæå âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Òàêèå æå îãðàíè÷åíèÿ íàêëàäûâàþòñÿ íà
àðãóìåíò
Число_успехов_в_совокупности.
Çíà÷åíèå
àðãóìåíòà
Размер_совокупности äîëæíî áûòü ïîëîæèòåëüíûì ÷èñëîì, èíà÷å ôóíêöèÿ
âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
116 Часть II. Средства Excel для статистического анализа
4.6.7. Функция ЛОГНОРМРАСП
Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî
ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8).
Ñèíòàêñèñ ôóíêöèè:
ЛОГНОРМРАСП(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíò Среднее — ýòî ïàðàìåòð m, à Стандартное_отклонение — ïàðàìåòð σ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x èëè Стандартное_отклонение îòðèöàòåëüíî èëè
ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.8. Функция НОРМРАСП
Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.4).
Ñèíòàêñèñ ôóíêöèè:
НОРМРАСП(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå;Èíòåãðàëüíàÿ)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíòû
Среднее è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ ñîîòâåòñòâåííî. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè.
Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение îòðèöàòåëüíî èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
Åñëè Среднее = 0 è Стандартное_отклонение = 1, òî ôóíêöèÿ âîçâðàùàåò òå
æå çíà÷åíèÿ, ÷òî è ôóíêöèÿ НОРМСТРАСП.
4.6.9. Функция НОРМСТРАСП
Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ äëÿ ñòàíäàðòíîãî
íîðìàëüíîãî ðàñïðåäåëåíèÿ (ïàðàìåòðû m = 0 è σ2 = 1) (ñì. ðàçäåë 1.5.4).
Ñèíòàêñèñ ôóíêöèè:
НОРМСТРАСП(x)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Åñëè àðãóìåíò x íå
ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!.
4.6.10. Функция ОТРБИНОМРАСП
Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ = k), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ
èìååò îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ïàñêàëÿ) ñ ïàðàìåòðàìè r è ð (0 < p < 1) (ñì. ðàçäåë 1.4.7). Ýòà âåðîÿòíîñòü âû÷èñëÿåòñÿ ïî ôîðìóëå
P(X = k ) = Crk+ k −1 p r (1 − p) r , k = 0, 1, 2, ... ,
ãäå Cnk — áèíîìèàëüíûé êîýôôèöèåíò.
Глава 4. Статистические функции
117
Ñèíòàêñèñ ôóíêöèè:
ОТРБИНОМРАСП(×èñëî_k;×èñëî_r;Âåðîÿòíîñòü)
Àðãóìåíò Число_k ïðèíèìàåò çíà÷åíèå k, àðãóìåíò Число_r — çíà÷åíèå ïàðàìåòðà r è Вероятность — çíà÷åíèå âåðîÿòíîñòè ð.
Çíà÷åíèÿ ïåðâûõ äâóõ àðãóìåíòîâ ôóíêöèè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ, íå ïðåâûøàþùèõ çàäàííûõ çíà÷åíèé àðãóìåíòîâ. Åñëè êàêîé-ëèáî àðãóìåíò íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Åñëè ñóììà ïåðâûõ äâóõ àðãóìåíòîâ
ìåíüøå 1, ôóíêöèÿ âîçâðàùàåò òî æå çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.11. Функция ПУАССОН
Ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ïóàññîíà ñ ïàðàìåòðîì λ, λ > 0
(ñì. ðàçäåë 1.4.4). Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ äëÿ îïèñàíèÿ ñëó÷àéíîãî ÷èñëà ïîÿâëåíèÿ îïðåäåëåííûõ ñîáûòèé â ôèêñèðîâàííûé ïðîìåæóòîê âðåìåíè èëè â ôèêñèðîâàííîé îáëàñòè ïðîñòðàíñòâà.
Ñèíòàêñèñ ôóíêöèè:
Пуассон(õ;Ñðåäíåå;Èíòåãðàëüíàÿ)
Àðãóìåíò x — êîëè÷åñòâî ñîáûòèé. Àðãóìåíò Среднее — çíà÷åíèå ïàðàìåòðà λ.
Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âû÷èñëÿåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ, ò.å. âåðîÿòíîñòü òîãî, ÷òî ÷èñëî ñëó÷àéíûõ ñîáûòèé áóäåò îò 0 äî x
âêëþ÷èòåëüíî; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ñîáûòèé áóäåò â òî÷íîñòè x.
Åñëè x — íå öåëîå ÷èñëî, òî â êà÷åñòâå àðãóìåíòà áåðåòñÿ öåëàÿ ÷àñòü ýòîãî
÷èñëà. Åñëè ïåðâûå äâà àðãóìåíòà ôóíêöèè íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ
âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x è Среднее îòðèöàòåëüíû èëè ðàâíû 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.12. Функция СТЬЮДРАСП
Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç.  çàâèñèìîñòè îò çíà÷åíèÿ àðãóìåíòà Хвосты îíà âû÷èñëÿåò ëèáî âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå
Ñòüþäåíòà ñ n ñòåïåíÿìè ñâîáîäû (ñì. ðàçäåë 1.5.6), ëèáî âåðîÿòíîñòü 1 –
Ð(|Õ| ≤ õ) = Ð(Õ ≤ –õ) + Ð(Õ ≥ õ). (Â ñèëó ñèììåòðèè ðàñïðåäåëåíèÿ Ñòüþäåíòà
âî âòîðîì ñëó÷àå çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé, áóäåò â äâà ðàçà áîëüøå
÷åì çíà÷åíèå, âîçâðàùàåìîå â ïåðâîì ñëó÷àå.) ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè
âû÷èñëèòü çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî ïðèìåíèòü ôîðìóëó =1 – СТЬЮДРАСП(u;n;1) (n — çàäàííîå çíà÷åíèå ñòåïåíè ñâîáîäû, 1 — çíà÷åíèå àðãóìåíòà Хвосты).
Ñèíòàêñèñ ôóíêöèè:
СТЬЮДРАСП(õ;Ñòåïåíü_ñâîáîäû;Õâîñòû)
Çäåñü x — íåîòðèöàòåëüíîå çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ,
Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû ðàñïðåäåëåíèÿ. Àðãóìåíò Хвосты
118 Часть II. Средства Excel для статистического анализа
ìîæåò ïðèíèìàòü çíà÷åíèå 1 èëè 2: åñëè ýòîò àðãóìåíò ðàâåí 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≥ õ); åñëè æå àðãóìåíò ðàâåí 2, òî ôóíêöèÿ
âîçâðàùàåò çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≤ –õ) + Ð(Õ ≥ õ). Åñëè êàêîå-ëèáî èç çíà÷åíèé ïîñëåäíèõ äâóõ àðãóìåíòîâ íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî ëèáî åñëè çíà÷åíèå ñòåïåíè ñâîáîäû ìåíüøå 1 èëè çíà÷åíèå àðãóìåíòà Хвосты âûõîäèò çà èíòåðâàë (1, 3), òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.13. Функция ХИ2РАСП
Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç. Îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû (ñì. ðàçäåë 1.5.5). ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè âû÷èñëèòü çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî
ïðèìåíèòü ôîðìóëó =1 – ХИ2РАСП(u;n) (n — çàäàííîå çíà÷åíèå ñòåïåíåé ñâîáîäû).
Ñèíòàêñèñ ôóíêöèè:
ХИ2РАСП(õ;Ñòåïåíü_ñâîáîäû)
Çäåñü x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ, Степень_свободы —
çíà÷åíèå ñòåïåíåé ñâîáîäû ðàñïðåäåëåíèÿ. Åñëè çíà÷åíèå àðãóìåíòà
Степень_свободы íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî, ëèáî åñëè çíà÷åíèå ñòåïåíåé ñâîáîäû
ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.6.14. Функция ЭКСПРАСП
Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ äëÿ ýêñïîíåíöèàëüíîãî (ïîêàçàòåëüíîãî) ðàñïðåäåëåíèÿ ñ ïàðàìåòðîì λ,
λ > 0 (ñì. ðàçäåë 1.5.3).
Ñèíòàêñèñ ôóíêöèè:
ЭКСПРАСП(x;Ëÿìáäà;Èíòåãðàëüíàÿ)
Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíò Лямбда — ïàðàìåòð ðàñïðåäåëåíèÿ λ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå
çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå
ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè.
Åñëè ïåðâûå äâà àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà х îòðèöàòåëüíî ëèáî åñëè
çíà÷åíèå àðãóìåíòà Лямбда ìåíüøå èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7. Функции, обратные к функциям
распределения
 ýòó ãðóïïó âõîäÿò ôóíêöèè, âû÷èñëÿþùèå çíà÷åíèÿ ôóíêöèé, îáðàòíûõ
ê ôóíêöèÿì ðàñïðåäåëåíèÿ.
Глава 4. Статистические функции
119
Ôóíêöèÿ
Íàçíà÷åíèå
FÐÀÑÏÎÁÐ
Âîçâðàùàåò îáðàòíîå çíà÷åíèå äëÿ F-ðàñïðåäåëåíèÿ
ÁÅÒÀÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ áåòà-ðàñïðåäåëåíèÿ
ÃÀÌÌÀÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ãàììà-ðàñïðåäåëåíèÿ
ÊÐÈÒÁÈÍÎÌ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ
ËÎÃÍÎÐÌÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÍÎÐÌÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÍÎÐÌÑÒÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ
ÑÒÜÞÄÐÀÑÏÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà
ÕÈ2ÎÁÐ
Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ χ2
Ýòè ôóíêöèè èìåþò îáÿçàòåëüíûé àðãóìåíò Вероятность (è, êîíå÷íî, àðãóìåíòû, çàäàþùèå ïàðàìåòðû ðàñïðåäåëåíèÿ), â ñîîòâåòñòâèè ñ êîòîðûì âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè. Îáðàùàåì âíèìàíèå íà òî, ÷òî íå âñå èç ýòèõ ôóíêöèé âû÷èñëÿþò çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ. Åñëè
îïðåäåëåíèå çíà÷åíèÿ îáðàòíîé ôóíêöèè ýêâèâàëåíòíî ðåøåíèþ óðàâíåíèÿ
Ð(Õ ≤ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ äàííîå ðàñïðåäåëåíèå, p —
çàäàííàÿ âåðîÿòíîñòü, à u — èñêîìàÿ âåëè÷èíà (ò.å. u = F–1(p), F–1 — ôóíêöèÿ,
îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ F(u) = Ð(Õ ≤ u)), òî íåêîòîðûå ôóíêöèè èç
ýòîé ãðóïïû ðåøàþò óðàâíåíèå Ð(Õ ≥ u) = p. ×òîáû â ýòîì ñëó÷àå íàéòè çíà÷åíèå îáðàòíîé ôóíêöèè, íåîáõîäèìî âû÷èñëèòü ñòàòèñòè÷åñêóþ ôóíêöèþ ýòîãî
òèïà ñ àðãóìåíòîì Вероятность = 1 – ð. Òàêèå ôóíêöèè óäîáíî èñïîëüçîâàòü äëÿ
ïîñòðîåíèÿ êðèòè÷åñêèõ îáëàñòåé êðèòåðèåâ ïðîâåðêè ãèïîòåç. Ôóíêöèè,
âû÷èñëÿþùèå
çíà÷åíèÿ
îáðàòíûõ
ôóíêöèé,
óäîáíî
ïðèìåíÿòü
äëÿ
ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ çàäàííîå ðàñïðåäåëåíèå.
4.7.1. Функция FРАСПОБР
Ýòî ôóíêöèÿ, âû÷èñëÿþùàÿ êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà) ñ (m, n) ñòåïåíÿìè ñâîáîäû (m, n ≥ 1) (ñì. ðàçäåë 1.5.7).
Ñèíòàêñèñ ôóíêöèè:
FРАСПОБР(Âåðîÿòíîñòü;Ñòåïåíü_ñâîáîäû1;Ñòåïåíü_ñâîáîäû2)
Àðãóìåíò
Вероятность —
ýòî
çíà÷åíèå
âåðîÿòíîñòè
p.
Àðãóìåíòû
Степень_свободы1 è Степень_свободы2 — çíà÷åíèÿ ñòåïåíåé ñâîáîäû, ò.å. ïàðàìåòðû m è n. Åñëè çíà÷åíèå êàêîãî-ëèáî èç ïîñëåäíèõ àðãóìåíòîâ íå ÿâëÿåòñÿ
öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà.
120 Часть II. Средства Excel для статистического анализа
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò
èíòåðâàëó
(0, 1)
ëèáî
åñëè
çíà÷åíèÿ
àðãóìåíòîâ
Степень_свободы1
è Степень_свободы2 ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.2. Функция БЕТАОБР
Äàííàÿ ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áåòàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α è β (α > 0, β > 0) (ñì. ðàçäåë 1.5.9).
Ñèíòàêñèñ ôóíêöèè:
БЕТАОБР(Âåðîÿòíîñòü;Àëüôà;Áåòà;A;B)
Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Альфа è Бета —
íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Íåîáÿçàòåëüíûå àðãóìåíòû A è B
çàäàþò ñîîòâåòñòâåííî íèæíþþ è âåðõíþþ ãðàíèöû èíòåðâàëà èçìåíåíèÿ ñëó÷àéíîé âåëè÷èíû. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ íå çàäàíû, òî ïî óìîë÷àíèþ
ïðèíèìàåòñÿ, ÷òî A = 0 è B = 1.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ Альфа è Бета ìåíüøå èëè
ðàâíû 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1),
òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.3. Функция ГАММАОБР
Ýòà ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ãàììàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α è λ (α > 0, λ > 0) (ñì. ðàçäåë 1.5.10).
Ñèíòàêñèñ ôóíêöèè:
ГАММАОБР(Âåðîÿòíîñòü;Àëüôà;Áåòà)
Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Альфа è Бета —
íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ, ïðè ýòîì ïàðàìåòð Бета ðàâåí 1/λ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ Альфа è Бета ìåíüøå èëè
ðàâíû 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1),
òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.4. Функция ЛОГНОРМОБР
Ýòà ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8).
Ñèíòàêñèñ ôóíêöèè:
ЛОГНОРМОБР(Âåðîÿòíîñòü;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå)
Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Среднее
è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение
ìåíüøå èëè ðàâíî 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
Глава 4. Статистические функции
121
4.7.5. Функция НОРМОБР
Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî
ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.4).
Ñèíòàêñèñ ôóíêöèè:
НОРМОБР(Âåðîÿòíîñòü;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå)
Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Среднее
è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение
ìåíüøå èëè ðàâíî 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.6. Функция НОРМСТОБР
Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî
íîðìàëüíîãî ðàñïðåäåëåíèÿ (â ýòîì ñëó÷àå m = 0 è σ2 = 1) (ñì. ðàçäåë 1.5.4).
Ñèíòàêñèñ ôóíêöèè:
НОРМ`СТОБР(Âåðîÿòíîñòü)
Àðãóìåíò Вероятность — çíà÷åíèå âåðîÿòíîñòè p.
Åñëè àðãóìåíò íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè
#ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1),
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.7. Функция СТЬЮДРАСПОБР
Ýòî ôóíêöèÿ, âû÷èñëÿþùàÿ êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ n ñòåïåíÿìè ñâîáîäû (n ≥ 1)
(ñì. ðàçäåë 1.5.6).
Ñèíòàêñèñ ôóíêöèè:
СТЬЮДРАСПОБР(Âåð`îÿòíîñòü;Ñòåïåíü_ñâîáîäû)
Àðãóìåíò
Вероятность —
ýòî
çíà÷åíèå
âåðîÿòíîñòè
p.
Àðãóìåíò
Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû, ò.å. ïàðàìåòð n. Åñëè çíà÷åíèå
ýòîãî àðãóìåíòà íå ÿâëÿåòñÿ öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò
èíòåðâàëó (0, 1) ëèáî åñëè çíà÷åíèå àðãóìåíòà Степень_свободы ìåíüøå 1 èëè
áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.8. Функция ХИ2ОБР
Ôóíêöèÿ âû÷èñëÿåò êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû (n ≥ 1) (ñì. ðàçäåë 1.5.5).
Ñèíòàêñèñ ôóíêöèè:
ХИ2ОБР(Âåðîÿòíîñòü;Ñòåïåíü_ñâîáîäû)
Àðãóìåíò
Вероятность —
ýòî
çíà÷åíèå
âåðîÿòíîñòè
p.
Àðãóìåíò
Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû, ò.å. ïàðàìåòð n. Åñëè çíà÷åíèå
ýòîãî àðãóìåíòà íå ÿâëÿåòñÿ öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà.
122 Часть II. Средства Excel для статистического анализа
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò
èíòåðâàëó (0, 1) ëèáî åñëè çíà÷åíèå àðãóìåíòà Степень_свободы ìåíüøå 1 èëè
áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.7.9. Функция КРИТБИНОМ
Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áèíîìèàëüíîãî
ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p (0 < p < 1, n ≥ 1). Íàïîìíèì (ñì. ðàçäåë 1.4.3), ÷òî áèíîìèàëüíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ ñëó÷àéíûõ ýêñïåðèìåíòîâ, ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé, è â ðåçóëüòàòå
êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0”. Òîãäà ñëó÷àéíàÿ âåëè÷èíà Õ, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ
“1” â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Ôóíêöèÿ КРИТБИНОМ âû÷èñëÿåò íàèìåíüøåå çíà÷åíèå k, ïðè êîòîðîì Ð(Õ = k) ≥ α (α — çàäàííîå ÷èñëî).
Ñèíòàêñèñ ôóíêöèè:
КРИТБИНОМ(×èñëî_èñïûòàíèé;Âåðîÿòíîñòü;Àëüôà)
Àðãóìåíò Число_испытаний — êîëè÷åñòâî íåçàâèñèìûõ èñïûòàíèé n. Åñëè çíà÷åíèå ýòîãî àðãóìåíòà — íå öåëîå ÷èñëî, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. Àðãóìåíò Вероятность — âåðîÿòíîñòü p èñõîäà “1” â êàæäîì èñïûòàíèè, ò.å. ïàðàìåòð ðàñïðåäåëåíèÿ. Àðãóìåíò Альфа — çíà÷åíèå âåðîÿòíîñòè α.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå Число_испытаний îòðèöàòåëüíî ëèáî
åñëè çíà÷åíèÿ àðãóìåíòîâ Вероятность è Альфа âûõîäÿò çà èíòåðâàë (0, 1), òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.8. Функции для проверки статистических
критериев
Ôóíêöèè ýòîé ãðóïïû âûïîëíÿþò ðàñ÷åòû äëÿ ðàçëè÷íûõ ñòàòèñòè÷åñêèõ
êðèòåðèåâ.
Ôóíêöèÿ
Íàçíà÷åíèå
ZÒÅÑÒ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìàòåìàòè÷åñêîãî
îæèäàíèÿ íîðìàëüíî ðàñïðåäåëåííîé ãåíåðàëüíîé ñîâîêóïíîñòè
ÒÒÅÑÒ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê (êðèòåðèé Ñòüþäåíòà)
ÔÒÅÑÒ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ðàâåíñòâå (íåðàâåíñòâå) äèñïåðñèé äâóõ âûáîðîê
ÕÈ2ÒÅÑÒ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè âûáîðêè
îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé (êðèòåðèé χ2)
Глава 4. Статистические функции
123
4.8.1. Функция ZТЕСТ
Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåííîé ïî íîðìàëüíîìó çàêîíó, ïðè èçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ. ×òîáû ïîÿñíèòü âû÷èñëåíèÿ, âûïîëíÿåìûå ôóíêöèåé ZТЕСТ, íàïîìíèì ñòàòèñòè÷åñêóþ ìîäåëü
è ïðîâåðÿåìûå ãèïîòåçû (ñì. ðàçäåë 2.4.1).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ è ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è èçâåñòíîé äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: µ = m0
Í0: µ ≤ m0
Í0: µ ≥ m0
Í1: µ ≠ m0
Í1: µ > m0
Í1: µ < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Ôóíêöèÿ ZТЕСТ ñíà÷àëà âû÷èñëÿåò çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè
T=
n ( x − m0 )
1 n
, ãäå x = ∑ xi , à çàòåì — âåðîÿòíîñòü ZТЕСТ = 1 – F(T), ãäå F —
n i =1
σ
ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
Ñëó÷àé à). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
α/2 ≤ ZТЕСТ ≤ 1 – α/2, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè ZТЕСТ ≤ 1 – α.
Ñëó÷àé â). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè α ≤ ZТЕСТ.
Ñèíòàêñèñ ôóíêöèè:
ZТЕСТ(Ìàññèâ;x;Ñèãìà)
Àðãóìåíò Массив — ìàññèâ äàííûõ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., õn. Àðãóìåíò x — ïðîâåðÿåìîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ (ò.å. çíà÷åíèå m0). Íåîáÿçàòåëüíûé àðãóìåíò Сигма — çíà÷åíèå ñòàíäàðòíîãî îòêëîíåíèÿ σ ãåíåðàëüíîé ñîâîêóïíîñòè. Åñëè ýòîò àðãóìåíò
îïóùåí, òî èñïîëüçóåòñÿ âûáîðî÷íîå ñòàíäàðòíîå îòêëîíåíèå. (Íî ïîñêîëüêó
â ýòîì ñëó÷àå âñå ðàâíî èñïîëüçóåòñÿ ôóíêöèÿ ðàñïðåäåëåíèÿ íîðìàëüíîãî çàêîíà, â òàêîì âàðèàíòå ôóíêöèþ ZТЕСТ ìîæíî èñïîëüçîâàòü òîëüêî ïðè äîñòàòî÷íî áîëüøîì îáúåìå âûáîðêè.)
Åñëè àðãóìåíò Массив ïóñò, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
4.8.2. Функция ТТЕСТ
Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå)
íåèçâåñòíûõ ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, ðàñïðåäåëåííûõ ïî íîðìàëüíîìó çàêîíó, ïðè÷åì ôóíêöèÿ ðàáîòàåò êàê äëÿ çàâèñèìûõ âûáîðîê, òàê è äëÿ íåçàâèñèìûõ è ïðè óñëîâèÿõ ðàâåíñòâà è íåðàâåíñòâà
äèñïåðñèé âûáîðîê.
×òîáû ïîÿñíèòü âû÷èñëåíèÿ, âûïîëíÿåìûå ôóíêöèåé ТТЕСТ, ïðèâåäåì ñîîòâåòñòâóþùèå ñòàòèñòè÷åñêèå ìîäåëè è ïðîâåðÿåìûå ãèïîòåçû (ñì. ðàçäåë 2.4.2).
Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Äâóìåðíàÿ âûáîðêà (õ1, y1), (õ2, y2), ..., (õn, ón)
îáúåìîì n èçâëå÷åíà èç äâóìåðíîé íîðìàëüíîé ñîâîêóïíîñòè ñ íåèçâåñòíûìè
124 Часть II. Средства Excel для статистического анализа
ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2 êîìïîíåíòîâ âûáîðêè.
Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 1 àðãóìåíòà Тип.
Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ
ñ ðàâíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 2 àðãóìåíòà Тип.
Ñòàòèñòè÷åñêàÿ ìîäåëü 3. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ
ñ íåðàâíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 3 àðãóìåíòà Тип.
Âî âñåõ ñòàòèñòè÷åñêèõ ìîäåëÿõ ïðîâåðÿþòñÿ ñëåäóþùèå ãèïîòåçû.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Í1: µ1 > µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Ñèíòàêñèñ ôóíêöèè:
ТТЕСТ(Ìàññèâ1,Ìàññèâ2,Õâîñòû,Òèï)
Àðãóìåíò Массив1 ïðåäñòàâëÿåò ïåðâóþ âûáîðêó õ1, õ2, ..., õn, àðãóìåíò Массив2 — âòîðóþ âûáîðêó y1, y2, ..., ym. Çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1 äëÿ
ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé è ðàâíî 2 äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå. Àðãóìåíò Тип äîëæåí èìåòü çíà÷åíèå 1 äëÿ ñòàòèñòè÷åñêîé ìîäåëè 1, çíà÷åíèå 2 äëÿ ìîäåëè 2 è çíà÷åíèå 3 äëÿ ìîäåëè 3.
 çàâèñèìîñòè îò ñòàòèñòè÷åñêîé ìîäåëè ôóíêöèÿ ТТЕСТ âûïîëíÿåò òàêèå
âû÷èñëåíèÿ.
Ñòàòèñòè÷åñêàÿ ìîäåëü 1 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 1). Âû÷èñëÿþòñÿ n
ðàçíîñòåé d1 = x1 – y1, d2 = x2 – y2, ..., dn = xn – yn è ïî íèì îïðåäåëÿþòñÿ ñðåäíåå d =
1 n
1 n
2
d
è
âûáîðî÷íàÿ
äèñïåðñèÿ
ðàçíîñòåé
S
=
∑ i
∑ (di − d )2 . Ïî âû÷èñn
n i =1
n i =1
ëåííîìó çíà÷åíèþ êðèòåðèàëüíîé ñòàòèñòèêè T =
d
Sn / n
ôóíêöèÿ ТТЕСТ âîç-
âðàùàåò çíà÷åíèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 –
F(T) + F(–T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α. Íàïîìíèì, ÷òî
äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, à äëÿ
ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Парный двухвыборочный t-тест для
средних èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.9).
Ñòàòèñòè÷åñêàÿ ìîäåëü 2 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 2). Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x =
1 n
∑ xi ,
n i =1
Глава 4. Статистические функции
125
S x2 =
1 n
∑ ( xi − x )2 ,
n i =1
y=
1 m
1 m
2
y
,
S
=
( yi − y ) 2 . Ïî âû÷èñëåííîìó çíà÷åíèþ
∑ i y m∑
m i =1
i =1
êðèòåðèàëüíîé ñòàòèñòèêè T =
n + m − 2( x − y )
n+m
(n − 1) S x2 + (m − 1) S y2
nm
ôóíêöèÿ ТТЕСТ âîç-
âðàùàåò çíà÷åíèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 –
F(T) + F(–T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû.
Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест
с одинаковыми дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.7).
Ñòàòèñòè÷åñêàÿ ìîäåëü 3 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 3). Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè:
S x2 =
1 n
∑ ( xi − x )2 ,
n i =1
y=
x=
1 n
∑ xi ,
n i =1
1 m
1 m
yi , S y2 = ∑ ( yi − y ) 2 . Ïî âû÷èñëåííîìó çíà÷åíèþ
∑
m i =1
m i =1
êðèòåðèàëüíîé ñòàòèñòèêè T =
x−y
S / n + S y2 / m
2
x
ôóíêöèÿ ТТЕСТ âîçâðàùàåò çíà÷å-
íèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 – F(T) + F(–T), åñëè
çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñî ñòåïåíüþ ñâîáîäû k, êîòîðàÿ ðàññ÷èòûâàåòñÿ ïî ôîðìóëå k =
( S x2 / n + S y2 / m)2
2
2
( S x2 / n) 2 ( S y / m)
+
n −1
m −1
.
Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α.
 Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с различными
дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.8).
Íà àðãóìåíòû ôóíêöèè ТТЕСТ íàêëàäûâàþòñÿ ñëåäóþùèå îãðàíè÷åíèÿ. Åñëè
Тип = 1 (ïàðíûé êðèòåðèé), òî Массив1 è Массив2 äîëæíû ïðåäñòàâëÿòü âûáîðêè îäèíàêîâûõ îáúåìîâ, èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
 ñëó÷àå äðîáíûõ çíà÷åíèé àðãóìåíòîâ Хвосты è Тип áåðåòñÿ öåëàÿ ÷àñòü ýòèõ
çíà÷åíèé. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ íå ÿâëÿþòñÿ ÷èñëàìè, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè àðãóìåíò Хвосты èìååò çíà÷åíèå, îòëè÷íîå îò 1 è 2, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.8.3. Функция ФТЕСТ
Ýòà ôóíêöèÿ ðåàëèçóåò êðèòåðèé Ôèøåðà ïðîâåðêè ðàâåíñòâà äèñïåðñèé äâóõ
íåçàâèñèìûõ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé
(ñì. ðàçäåë 2.4.2). Íàïîìíèì, ÷òî ýòîò êðèòåðèé ðåàëèçóåòñÿ ïðè âûïîëíåíèè
ñëåäóþùåé ñòàòèñòè÷åñêîé ìîäåëè.
126 Часть II. Средства Excel для статистического анализа
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1
è µ2 ñîîòâåòñòâåííî.
Ïðè çàäàííîì óðîâíå çíà÷èìîñòè α ïðîâåðÿåòñÿ íóëåâàÿ ãèïîòåçà Í0: σ12 = σ22
ïðîòèâ àëüòåðíàòèâíîé ãèïîòåçû Í1: σ12 ≠ σ22.
Ñèíòàêñèñ ôóíêöèè:
ФТЕСТ(Ìàññèâ1,Ìàññèâ2)
Àðãóìåíò Массив1 ïðåäñòàâëÿåò ïåðâóþ âûáîðêó õ1, õ2, ..., õn, àðãóìåíò Массив2 — âòîðóþ âûáîðêó y1, y2, ..., ym.
Ôóíêöèÿ âûïîëíÿåò ñëåäóþùèå âû÷èñëåíèÿ. Äëÿ êàæäîé âûáîðêè âû÷èñëÿþòñÿ ñíà÷àëà âûáîðî÷íûå äèñïåðñèè S x2 =
òåì — èõ îòíîøåíèå F =
1 n
1 m
( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 , à çà∑
n i =1
m i =1
S x2
, êîòîðîå ÿâëÿåòñÿ êðèòåðèàëüíîé ñòàòèñòèêîé.
S y2
Ôóíêöèÿ ФТЕСТ âîçâðàùàåò çíà÷åíèå 1 – F(F), ãäå F(õ) — ôóíêöèÿ Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1 (î F-ðàñïðåäåëåíèè
ðå÷ü èäåò â ðàçäåëå 1.5.7).
Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé,
áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α.
Åñëè îáúåì âûáîðêè, çàäàâàåìîé àðãóìåíòîì Массив1 èëè Массив2, ìåíüøå
äâóõ ëèáî åñëè äèñïåðñèÿ îäíîé èç âûáîðîê ðàâíà íóëþ, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ДЕЛ/0!.
Ýòîò êðèòåðèé òàêæå ðåàëèçóåò ñðåäñòâî Двухвыборочный F-тест для
дисперсий èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.10).
4.8.4. Функция ХИ2ТЕСТ
Ýòà ôóíêöèÿ ÿâëÿåòñÿ ÷àñòüþ êðèòåðèÿ χ2 ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé. Ïðèâåäåì ñòàòèñòè÷åñêóþ ìîäåëü äëÿ ýòîãî êðèòåðèÿ (ñì. ðàçäåë 2.4.3).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u) è çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ íåèçâåñòíî.
Ïðîâåðÿåòñÿ íóëåâàÿ ãèïîòåçà Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u) (çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì) ïðîòèâ
àëüòåðíàòèâíîé ãèïîòåçû Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
×òîáû ïðîâåðèòü ýòè ãèïîòåçû, åùå äî ïðèìåíåíèÿ ôóíêöèè ХИ2ТЕСТ íåîáõîäèìî ïðîâåñòè ñëåäóþùèå âû÷èñëåíèÿ.
1. Îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé ðàçáèòü íà k íåïåðåñåêàþùèõñÿ
èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 = (õ(2), õ(3)), ..., ∆k = (õ(k), õ(k+1)).
2. Ïîäñ÷èòàòü, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé ïîïàëî â êàæäûé èíòåðâàë ∆i.
Ïîëó÷àåì ðÿä ÷èñåë n1, n2, ..., nk.
Глава 4. Статистические функции
127
3. Â ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå νi = n[F(x(i+1)) –
F(x(i))] âû÷èñëèòü îæèäàåìîå çíà÷åíèå ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé
â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i) è x(i+1) — ãðàíèöû èíòåðâàëà ∆i.
Èòàê, èìåþòñÿ äâà ìàññèâà äàííûõ: {n1, n2, ..., nk} è {ν1, ν2, ..., νk}.
Äàëåå âñòóïàåò â ðàáîòó ôóíêöèÿ ХИ2ТЕСТ. Ïî çàäàííûì ìàññèâàì {n1, n2,
k
..., nk} è {ν1, ν2, ..., νk} îíà âû÷èñëÿåò êðèòåðèàëüíóþ ñòàòèñòèêó T = ∑
i =1
(ni − ν i ) 2
νi
è çàòåì âîçâðàùàåò âåðîÿòíîñòü Ð(Õ > T), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû.
Åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ХИ2ТЕСТ áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, òî ãèïîòåçà Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Îáðàùàåì âíèìàíèå, ÷òî ôóíêöèÿ ХИ2ТЕСТ èñïîëüçóåò ðàñïðåäåëåíèå χ2 ñ (k – 1)
ñòåïåíüþ ñâîáîäû, à íå ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Ïîýòîìó êðèòåðèé, âûïîëíÿåìûé ñ ïîìîùüþ ýòîé ôóíêöèè, èìååò áîëüøóþ âåðîÿòíîñòü îøèáêè âòîðîãî
ðîäà, ò.å. áîëüøóþ âåðîÿòíîñòü ïðèíÿòü íóëåâóþ ãèïîòåçó, åñëè îíà íåâåðíà.
Ñèíòàêñèñ ôóíêöèè:
ХИ2ТЕСТ(Ôàêòè÷åñêèé_èíòåðâàë;Îæèäàåìûé_èíòåðâàë)
Àðãóìåíò Фактический_интервал — ýòî ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèõ ÷èñëà n1, n2, ..., nk. Àðãóìåíò Ожидаемый_интервал — ìàññèâ èëè ññûëêà íà
äèàïàçîí ÿ÷ååê, ñîäåðæàùèõ ÷èñëà ν1, ν2, ..., νk. Åñëè àðãóìåíòû ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà ÷èñåë, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ êðèòåðèÿ χ2 ïîêàçàíà â ãëàâå 9, â ðàçäåëå 9.3.
4.9. Функции для построения уравнения
регрессии и прогнозирования
Ôóíêöèè ýòîé ãðóïïû âåñüìà ïîëåçíû ïðè ïðîâåäåíèè ðåãðåññèîííîãî àíàëèçà.
Ôóíêöèÿ
Íàçíà÷åíèå
ËÃÐÔÏÐÈÁË
Âîçâðàùàåò ïàðàìåòðû êðèâîé, ïîëó÷åííîé â ðåçóëüòàòå ýêñïîíåíöèàëüíîé àïïðîêñèìàöèè
Âîçâðàùàåò ìàññèâ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè, ïîëó÷åííûé â ðåçóëüòàòå àïïðîêñèìàöèè èñõîäíûõ äàííûõ ìåòîäîì
íàèìåíüøèõ êâàäðàòîâ
Âîçâðàùàåò íàêëîí ïðÿìîé ëèíåéíîé ðåãðåññèè
Âîçâðàùàåò îòðåçîê, îòñåêàåìûé íà îñè ïðÿìîé ëèíåéíîé ðåãðåññèè
Âîçâðàùàåò ïðåäñêàçàííîå çíà÷åíèå ôóíêöèè â òî÷êå X íà îñíîâå ëèíåéíîé ðåãðåññèè äëÿ ìàññèâîâ èçâåñòíûõ çíà÷åíèé X è Y
èëè èíòåðâàëîâ äàííûõ
Ðàññ÷èòûâàåò ïðîãíîçèðóåìûé ýêñïîíåíöèàëüíûé ðîñò íà îñíîâàíèè èìåþùèõñÿ äàííûõ
Âîçâðàùàåò äëÿ êàæäîãî çíà÷åíèÿ X ñòàíäàðòíóþ îøèáêó ïðåäñêàçàííûõ çíà÷åíèé Y (ò.å. âû÷èñëåííûõ çíà÷åíèé ôóíêöèè ðåãðåññèè)
Âîçâðàùàåò çíà÷åíèå â ñîîòâåòñòâèè ñ ëèíåéíîé ôóíêöèåé ðåãðåññèè
ËÈÍÅÉÍ
ÍÀÊËÎÍ
ÎÒÐÅÇÎÊ
ÏÐÅÄÑÊÀÇ
ÐÎÑÒ
ÑÒÎØYX
ÒÅÍÄÅÍÖÈß
128 Часть II. Средства Excel для статистического анализа
Êàæäàÿ èç ýòèõ ôóíêöèé èìååò íå ìåíåå äâóõ àðãóìåíòîâ, îäèí èç êîòîðûõ
çàäàåò ìàññèâ çíà÷åíèé íåçàâèñèìîé ïåðåìåííîé Õ, à âòîðîé — ìàññèâ çíà÷åíèé çàâèñèìîé ïåðåìåííîé Y.  íåêîòîðûõ ôóíêöèÿõ ìîæíî çàäàâàòü íå òîëüêî îäíîìåðíûé ìàññèâ ïåðåìåííîé Õ, íî è äâóìåðíûé, ò.å. èìååòñÿ âîçìîæíîñòü èññëåäîâàòü çàâèñèìîñòü ìåæäó âåêòîðíîé ïåðåìåííîé Õ è ñêàëÿðíîé Y
è ñòðîèòü ìíîæåñòâåííóþ ðåãðåññèþ. Ôóíêöèè ЛГРФПРИБЛ è РОСТ ðàáîòàþò
ñ ýêñïîíåíöèàëüíîé ðåãðåññèåé, îñòàëüíûå — ñ ëèíåéíîé. Ïðè ïîñòðîåíèè
óðàâíåíèé ðåãðåññèè âñå ôóíêöèè èñïîëüçóþò ìåòîä íàèìåíüøèõ êâàäðàòîâ
(ñì. ðàçäåë 3.4). Îòìåòèì, ÷òî äðóãèå ñðåäñòâà Excel, â ÷àñòíîñòè íàäñòðîéêà
Пакет анализа (ñì. ãëàâó 5) è ñðåäñòâà ïîñòðîåíèÿ äèàãðàìì (ñì. ãëàâó 6),
èìåþò çíà÷èòåëüíî áîëüøèå âîçìîæíîñòè äëÿ ïîñòðîåíèÿ è âèçóàëèçàöèè ðåãðåññèîííûõ çàâèñèìîñòåé.
4.9.1. Функция ЛИНЕЙН
Ïðèìåíÿÿ ìåòîä íàèìåíüøèõ êâàäðàòîâ, äàííàÿ ôóíêöèÿ ðàññ÷èòûâàåò êîýôôèöèåíòû ëèíåéíîé (îòíîñèòåëüíî ýòèõ êîýôôèöèåíòîâ) ðåãðåññèè, êîòîðàÿ íàèëó÷øèì îáðàçîì àïïðîêñèìèðóåò èìåþùèåñÿ äàííûå. Èòàê, èìååòñÿ ìàññèâ ñî
çíà÷åíèÿìè ïåðåìåííîé Õ: îäíîìåðíûé {õ1, õ2, ..., õn} (n — êîëè÷åñòâî íàáëþäåíèé), åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y òîëüêî îò îäíîé ïåðåìåííîé,
ëèáî äâóìåðíûé {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,}, åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y îò k ïåðåìåííûõ (ò.å. ïåðåìåííàÿ Õ â ýòîì ñëó÷àå ÿâëÿåòñÿ âåêòîðîì, ñîñòîÿùèì èç k êîìïîíåíòîâ: Õ = (Õ1, Õ2, ..., Õk)). Çàäàí
òàêæå ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Ïî ýòèì äàííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b
â ñëó÷àå îäíîìåðíîé ïåðåìåííîé Õ èëè Ŷ = m1X1 + m2X2 + ... + mkÕk + b â ñëó÷àå, êîãäà Õ = (Õ1, Õ2, ..., Õk). Ôóíêöèÿ ЛИНЕЙН ïî ìàññèâàì èñõîäíûõ äàííûõ
âû÷èñëÿåò êîýôôèöèåíòû mi è b, à òàêæå ìîæåò âû÷èñëèòü íåêîòîðûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ýòèõ êîýôôèöèåíòîâ è âñåãî óðàâíåíèÿ ðåãðåññèè â öåëîì.
Äàííóþ ôóíêöèþ ìîæíî òàêæå èñïîëüçîâàòü äëÿ ïîñòðîåíèÿ óðàâíåíèÿ ïîëèíîìèàëüíîé ðåãðåññèè. Åñëè ìàññèâ çíà÷åíèé Õ èìååò ñòðóêòóðó {õ1, õ2, ...,
õn, õ12, õ22, ..., õn2, ..., õ1k, õ2k, ..., õnk,}, òî â ýòîì ñëó÷àå ñòðîèòñÿ ïîëèíîìèàëüíàÿ ðåãðåññèÿ Ŷ = m1X + m2X2 + ... + mkÕk + b.
Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b
(íå ìåíåå äâóõ çíà÷åíèé), ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû
ìàññèâà (ñ èñïîëüçîâàíèåì äëÿ ââîäà êîìáèíàöèè êëàâèø <Ctrl+Shift+Enter>),
â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå
òîëüêî êîýôôèöèåíòà mk.
Ñèíòàêñèñ ôóíêöèè:
ЛИНЕЙН(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Êîíñòàíòà;Ñòàòèñòèêà)
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Y. Íåîáÿçàòåëüíûé àðãóìåíò Значения_X —
ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Õ.
Åñëè äàííûé àðãóìåíò îïóùåí, ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ Значения_Y . Åñëè ìàññèâ
Значения_Y ðàñïîëîæåí â îäèí ñòîëáåö, òî êàæäûé ñòîëáåö ìàññèâà Значения_X
èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àíàëîãè÷íî, åñëè ìàññèâ
Глава 4. Статистические функции
129
Значения_Y ðàñïîëîæåí â îäíó ñòðîêó, òî êàæäàÿ ñòðîêà ìàññèâà Значения_X
èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi.
Àðãóìåíò Константа — ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, äîëæåí
ëè êîýôôèöèåíò b áûòü ðàâíûì 0. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå
ИСТИНА, 1 èëè îïóùåí, òî êîýôôèöèåíò b âû÷èñëÿåòñÿ êàê îáû÷íî. Åñëè
àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî b ïîëàãàåòñÿ ðàâíûì 0 è çíà÷åíèÿ
êîýôôèöèåíòîâ mi ïîäáèðàþòñÿ òàê, ÷òîáû óðàâíåíèå ðåãðåññèè èìåëî âèä
Ŷ = m1X1 + m2X2 + ... + mkÕk.
Àðãóìåíò Статистика ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò,
òðåáóåòñÿ ëè ðàññ÷èòûâàòü äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ðåãðåññèè. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА èëè 1, òî ôóíêöèÿ ðàññ÷èòûâàåò è âûâîäèò ýòè äîïîëíèòåëüíûå õàðàêòåðèñòèêè (ñì. òàáëèöó, ïðèâåäåííóþ íèæå; îïèñàíèå è ïîÿñíåíèÿ ê ýòèì õàðàêòåðèñòèêàì äàíû â ðàçäåëå 3.4.3).
Åñëè àðãóìåíò Статистика èìååò çíà÷åíèå ЛОЖЬ, 0 èëè îïóùåí, òî ôóíêöèÿ âîçâðàùàåò òîëüêî çíà÷åíèÿ êîýôôèöèåíòîâ mi è b.
Таблица. Статистические характеристики, рассчитываемые функцией ЛИНЕЙН
Õàðàêòåðèñòèêà
Îïèñàíèå
s1, s2, ..., sk
Ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ äëÿ êîýôôèöèåíòîâ m1,
m2, ..., mk
sb
Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äëÿ êîýôôèöèåíòà b (sb =
#Н/Д, åñëè àðãóìåíò Константа èìååò çíà÷åíèå ЛОЖЬ)
R2
Êîýôôèöèåíò äåòåðìèíàöèè. Ñðàâíèâàþòñÿ ôàêòè÷åñêèå
çíà÷åíèÿ Y è çíà÷åíèÿ Ŷ , ïîëó÷àåìûå èç óðàâíåíèÿ
ðåãðåññèè; ïî ðåçóëüòàòàì ñðàâíåíèÿ âû÷èñëÿåòñÿ
êîýôôèöèåíò äåòåðìèíàöèè, íîðìèðîâàííûé îò 0 äî 1.
Åñëè îí ðàâåí 1, òî íåò ðàçëè÷èÿ ìåæäó ôàêòè÷åñêèì
è ðàñ÷åòíûìè çíà÷åíèÿìè Y.  ïðîòèâîïîëîæíîì ñëó÷àå,
åñëè êîýôôèöèåíò äåòåðìèíàöèè ðàâåí 0, óðàâíåíèå
ðåãðåññèè ïëîõî îïèñûâàåò çíà÷åíèÿ Y
sε
Îñòàòî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå
F
Êðèòåðèàëüíàÿ ñòàòèñòèêà äëÿ ïðîâåðêè çíà÷èìîñòè óðàâíåíèÿ ðåãðåññèè
df
Ñòåïåíü ñâîáîäû
SS1
Ñóììà êâàäðàòîâ ðåãðåññèè
SS2
Ñóììà êâàäðàòîâ îñòàòêîâ
Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b
(íå ìåíåå äâóõ çíà÷åíèé), à òàêæå äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (åñëè àðãóìåíò Статистика ðàâåí ИСТИНА). Ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû ìàññèâà, â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå òîëüêî êîýôôèöèåíòà mk.  âûõîäíîì ìàññèâå äàííûå ðàñïîëàãàþòñÿ ñëåäóþùèì îáðàçîì.
130 Часть II. Средства Excel для статистического анализа
mk
mk–1
...
m2
m1
b
sk
sk–1
...
s2
s1
sb
R
2
sε
F
df
SS1
SS2
Îñòàëüíûå ÿ÷åéêè ýòîãî ìàññèâà çàïîëíÿþòñÿ çíà÷åíèÿìè #Н/Д.
Ðàññìîòðèì ïðèìåð ïðèìåíåíèÿ ôóíêöèè ЛИНЕЙН. Ïóñòü, êàê ïîêàçàíî íà
ðèñ. 4.7, ìàññèâ çíà÷åíèé ïåðåìåííîé Õ ðàñïîëîæåí â ñòîëáöàõ À è Â, à ìàññèâ
çíà÷åíèé ïåðåìåííîé Y — â ñòîëáöå Ñ. Òàêèì îáðàçîì, ïåðåìåííàÿ Õ — äâóìåðíàÿ, èìååò êîìïîíåíòû Õ1 è Õ2. Âûäåëèì äèàïàçîí Å2:G6, â êîòîðîì áóäóò
ñîäåðæàòüñÿ
ðåçóëüòàòû
âû÷èñëåíèé.
Ââîäèì
ôîðìóëó
=ЛИНЕЙН(C2:C17;A2:B17;;1) (ñì. ðèñ. 4.7). Çàòåì íàæèìàåì êîìáèíàöèþ êëàâèø
<Ctrl+Shift+Enter> (ââîä ôîðìóëû ìàññèâà). Ðåçóëüòàò ïîêàçàí íà ðèñ. 4.8 (äëÿ
óäîáñòâà èíòåðïðåòàöèè ðåçóëüòàòîâ äîáàâëåíû ïîäïèñè ê ÿ÷åéêàì).
Ðèñ. 4.7. Ââîä ôîðìóëû
4.9.2. Функции НАКЛОН и ОТРЕЗОК
Ýòè ôóíêöèè âû÷èñëÿþò êîýôôèöèåíòû óðàâíåíèÿ ëèíåéíîé ðåãðåññèè
Ŷ = mX + b, ïîäñ÷èòàííûå ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ (ñì. ðàçäåë 3.4.2):
ôóíêöèÿ НАКЛОН âû÷èñëÿåò êîýôôèöèåíò m, ôóíêöèÿ ОТРЕЗОК — êîýôôèöèåíò b. (×òîáû ñðàçó âû÷èñëèòü îáà êîýôôèöèåíòà, ñëåäóåò âîñïîëüçîâàòüñÿ
ôóíêöèåé ЛИНЕЙН.)
Глава 4. Статистические функции
131
Ðèñ. 4.8. Ðåçóëüòàòû âû÷èñëåíèé
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X)
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ).
Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè
çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, òî ôóíêöèè
âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д.
4.9.3. Функция СТОШYX
Ôóíêöèÿ ñî ñòðàííûì íàçâàíèåì СТОШYX (êñòàòè, ïîñëåäíèå áóêâû â ýòîì
íàçâàíèè — ýòî íå ðóññêîå ìîëîäåöêîå “ÓÕ-Õ!”, à ñïîêîéíûå ëàòèíñêèå áóêâû
“èãðåê” è “èêñ”) âû÷èñëÿåò ñòàíäàðòíóþ îøèáêó ðåãðåññèè èëè êîðåíü êâàäðàòíûé èç ñðåäíåé ñóììû îñòàòêîâ (ñì. ðàçäåë 3.4.3). Ýòó æå âåëè÷èíó âû÷èñëÿåò
ôóíêöèÿ ЛИНЕЙН ñðåäè ñâîèõ äîïîëíèòåëüíûõ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê
ïîä íàçâàíèåì sε — îñòàòî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå.
Ïóñòü èìååòñÿ ìàññèâ {õ1, õ2, ..., õn} çíà÷åíèé Õ è ìàññèâ {ó1, ó2, ..., ón} çíà÷åíèé Y, ïî êîòîðûì ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b. Îñòàòêàìè íàçûâàþòñÿ ðàçíîñòè di = yi – yˆ i =
yi – mxi – b.
sY =
Ñòàíäàðòíàÿ
îøèáêà
ðåãðåññèè
âû÷èñëÿåòñÿ
ïî
ôîðìóëå
1
n
∑ ( yi − yˆi )2 . Ýòà âåëè÷èíà õàðàêòåðèçóåò òî÷íîñòü àïïðîêñèìàöèè
n − 2 i =1
èñõîäíûõ äàííûõ ëèíåéíîé ôóíêöèåé.
Ñèíòàêñèñ ôóíêöèè:
СТОШYX(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X)
132 Часть II. Средства Excel для статистического анализа
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ).
Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè
çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, òî ôóíêöèè
âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д.
4.9.4. Функция ПРЕДСКАЗ
Ïóñòü èìååòñÿ ìàññèâ {õ1, õ2, ..., õn} çíà÷åíèé Õ è ìàññèâ {ó1, ó2, ..., ón} çíà÷åíèé Y, ïî êîòîðûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b. Äàííàÿ ôóíêöèÿ âû÷èñëÿåò çíà÷åíèå ŷ = mx +
b äëÿ çàäàííîãî çíà÷åíèÿ õ, ò.å. “ïðåäñêàçûâàåò” çíà÷åíèå ïåðåìåííîé Y, îòêóäà
è íàçâàíèå ôóíêöèè.
Ñèíòàêñèñ ôóíêöèè:
ПРЕДСКАЗ(õ;Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X)
Àðãóìåíò х — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè. Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí
ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ
(èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ).
Åñëè àðãóìåíò x íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå
ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ,
ó÷èòûâàþòñÿ. Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д.
Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà
çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà
х íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà
(íàæàâ êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>) ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }.
4.9.5. Функция ТЕНДЕНЦИЯ
Ýòà ôóíêöèÿ, ïîäîáíî ïðåäûäóùåé ôóíêöèè, âû÷èñëÿåò â ñîîòâåòñòâèè ñ ïîñòðîåííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ óðàâíåíèåì ðåãðåññèè çíà÷åíèå Ŷ
äëÿ êîíêðåòíîãî çíà÷åíèÿ X. Íî â îòëè÷èå îò ôóíêöèè ПРЕДСКАЗ ôóíêöèÿ
ТЕНДЕНЦИЯ ìîæåò ðàáîòàòü êàê ñ ìíîæåñòâåííîé ëèíåéíîé ðåãðåññèåé, òàê
è ñ ïîëèíîìèàëüíîé ðåãðåññèåé, ÷òî çàâèñèò îò ñòðóêòóðû ñîäåðæèìîãî âõîäíîãî
ìàññèâà çíà÷åíèé ïåðåìåííîé Õ.
Ïóñòü çàäàí ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Åñëè ìàññèâ
çíà÷åíèé ïåðåìåííîé Õ ÿâëÿåòñÿ äâóìåðíûì ìàññèâîì âèäà {õ11, õ12, ..., õ1n,
õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,}, òî â ýòîì ñëó÷àå èññëåäóåòñÿ çàâèñèìîñòü
ïåðåìåííîé Y îò k ïåðåìåííûõ Õ1, Õ2, ..., Õk è ñòðîèòñÿ ìíîæåñòâåííàÿ ëèíåéíàÿ ðåãðåññèÿ Ŷ = m1X1 + m2X2 + ... + mkÕk + b. Åñëè æå äàííûé ìàññèâ èìååò
ñòðóêòóðó {õ1, õ2, ..., õn, õ12, õ22, ..., õn2, ..., õ1k, õ2k, ..., õnk,}, òî â ýòîì ñëó÷àå
Глава 4. Статистические функции
133
ñòðîèòñÿ ïîëèíîìèàëüíàÿ ðåãðåññèÿ Ŷ = m1X + m2X2 + ... + mkÕk + b. Ôóíêöèÿ
ТЕНДЕНЦИЯ ïî çàäàííûì çíà÷åíèÿì (õ1, õ2, ..., õk) è ïî óðàâíåíèþ ìíîæåñòâåííîé ëèíåéíîé ðåãðåññèè èëè ïî çíà÷åíèÿì (õ, õ2, ..., õk) è ïî óðàâíåíèþ ïîëèíîìèàëüíîé ðåãðåññèè âû÷èñëÿåò çíà÷åíèå ŷ .
Åñëè èñõîäíûé ìàññèâ çíà÷åíèé Õ ñîâïàäàåò ïî ðàçìåðó ñ ìàññèâîì çíà÷åíèé Y,
òî ôóíêöèÿ ТЕНДЕНЦИЯ äëÿ âû÷èñëåíèÿ íîâîãî çíà÷åíèÿ ŷ èñïîëüçóåò îáû÷íóþ
ëèíåéíóþ ðåãðåññèþ è â ýòîì ñëó÷àå îíà íå îòëè÷àåòñÿ îò ôóíêöèè ПРЕДСКАЗ.
Ñèíòàêñèñ ôóíêöèè:
ТЕНДЕНЦИЯ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Íîâûå_çíà÷åíèÿ_x;Êîíñòàíòà)
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò
Новые_значения_x — çíà÷åíèÿ, äëÿ êîòîðûõ âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè.
Åñëè àðãóìåíò Значения_X îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ àðãóìåíòà Значения_Y .
Åñëè îïóùåí àðãóìåíò Новые_значения_x, òî ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî
îí ñîâïàäàåò ñ àðãóìåíòîì Значения_X.
Àðãóìåíò Константа ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè îí èìååò çíà÷åíèå
ИСТИНА èëè 1 ëèáî îïóùåí, òî êîýôôèöèåíò óðàâíåíèÿ ðåãðåññèè b âû÷èñëÿåòñÿ êàê îáû÷íî; åñëè æå îí èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî êîýôôèöèåíò b ïîëàãàåòñÿ ðàâíûì 0 è çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âû÷èñëÿþòñÿ
ñ ó÷åòîì ýòîãî óñëîâèÿ.
Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà
çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà
х íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà
(íàæàâ êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>) ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }.
4.9.6. Функция ЛГРФПРИБЛ
Ïðèìåíÿÿ ìåòîä íàèìåíüøèõ êâàäðàòîâ, äàííàÿ ôóíêöèÿ ðàññ÷èòûâàåò êîýôôèöèåíòû ýêñïîíåíöèàëüíîé ðåãðåññèè, ò.å. ïî èñõîäíûì äàííûì ñòðîèò
ôóíêöèè âèäà Ŷ = b0mX (åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y òîëüêî îò
îäíîé ïåðåìåííîé Õ) è Ŷ = b0 ⋅ m1 1 ⋅ m2
X
X2
⋅ ... ⋅ mk
Xk
(åñëè ïåðåìåííàÿ Y çàâèñèò îò k
ïåðåìåííûõ Õ1, Õ2, ..., Õk). Âèä ýêñïîíåíöèàëüíîé ðåãðåññèè, êîýôôèöèåíòû
êîòîðîé mi è b0 âû÷èñëÿåò ôóíêöèÿ ЛГРФПРИБЛ, îïðåäåëÿåòñÿ ñòðóêòóðîé ìàññèâà çíà÷åíèé ïåðåìåííîé Õ: îäíîìåðíûé ìàññèâ {õ1, õ2, ..., õn} äëÿ ðåãðåññèè
ïåðâîãî âèäà, äâóìåðíûé ìàññèâ {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ...,
õkn,} äëÿ ðåãðåññèè âòîðîãî âèäà. Îäíèì èç àðãóìåíòîâ ôóíêöèè ÿâëÿåòñÿ òàêæå
ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Ôóíêöèÿ ЛГРФПРИБЛ ïî
ìàññèâàì èñõîäíûõ äàííûõ âû÷èñëÿåò êîýôôèöèåíòû mi è b0, à òàêæå ìîæåò
âû÷èñëèòü íåêîòîðûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ýòèõ êîýôôèöèåíòîâ
è âñåãî óðàâíåíèÿ ðåãðåññèè â öåëîì.
Ñèíòàêñèñ ôóíêöèè:
ЛГРФПРИБЛ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Êîíñòàíòà;Ñòàòèñòèêà)
134 Часть II. Средства Excel для статистического анализа
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Y. Íåîáÿçàòåëüíûé àðãóìåíò Значения_X —
ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Õ.
Åñëè äàííûé àðãóìåíò îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ
÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ Значения_Y . Åñëè ìàññèâ
Значения_Y ðàñïîëîæåí â îäèí ñòîëáåö, òî êàæäûé ñòîëáåö ìàññèâà Значения_X
èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àíàëîãè÷íî, åñëè ìàññèâ Значения_Y ðàñïîëîæåí â îäíó ñòðîêó, òî êàæäàÿ ñòðîêà ìàññèâà
Значения_X èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi.
Àðãóìåíò Константа — ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, äîëæåí ëè
êîýôôèöèåíò b0 áûòü ðàâíûì 1. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА, 1
èëè îïóùåí, òî êîýôôèöèåíò b0 âû÷èñëÿåòñÿ êàê îáû÷íî. Åñëè àðãóìåíò èìååò
çíà÷åíèå ЛОЖЬ èëè 0, òî b0 ïîëàãàåòñÿ ðàâíûì 1 è çíà÷åíèÿ êîýôôèöèåíòîâ mi
âû÷èñëÿþòñÿ ñ ó÷åòîì ýòîãî óñëîâèÿ.
Àðãóìåíò Статистика ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò,
òðåáóåòñÿ ëè ðàññ÷èòûâàòü äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ðåãðåññèè. Åñëè îí èìååò çíà÷åíèå ИСТИНА èëè 1, òî ôóíêöèÿ ðàññ÷èòûâàåò è âûâîäèò ýòè äîïîëíèòåëüíûå õàðàêòåðèñòèêè (ñì. òàáëèöó â îïèñàíèè ôóíêöèè
ЛИНЕЙН; îïèñàíèå è ïîÿñíåíèÿ ê ýòèì õàðàêòåðèñòèêàì äàíû â ðàçäåëå 3.4.3).
Åñëè àðãóìåíò Статистика èìååò çíà÷åíèå ЛОЖЬ, 0 èëè îïóùåí, òî ôóíêöèÿ âîçâðàùàåò òîëüêî çíà÷åíèÿ êîýôôèöèåíòîâ mi è b0.
Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b0
(íå ìåíåå äâóõ çíà÷åíèé), à òàêæå äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (åñëè àðãóìåíò Статистика ðàâåí ИСТИНА). Ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû ìàññèâà, â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå òîëüêî êîýôôèöèåíòà mk.  âûõîäíîì ìàññèâå äàííûå ðàñïîëàãàþòñÿ òàê æå, êàê è â âûõîäíîì ìàññèâå ôóíêöèè ЛИНЕЙН
(ñì. ðàçäåë 4.9.1).
4.9.7. Функция РОСТ
Ýòà ôóíêöèÿ ÿâëÿåòñÿ àíàëîãîì ôóíêöèè ТЕНДЕНЦИЯ äëÿ ýêñïîíåíöèàëüíîé
ðåãðåññèè. Îíà âû÷èñëÿåò â ñîîòâåòñòâèè ñ ïîñòðîåííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ óðàâíåíèåì ðåãðåññèè çíà÷åíèå Ŷ äëÿ êîíêðåòíîãî çíà÷åíèÿ X. Íî â îòëè÷èå
îò ôóíêöèè ТЕНДЕНЦИЯ ýòà ôóíêöèÿ ðàáîòàåò ñ ýêñïîíåíöèàëüíîé ðåãðåññèåé.
Ïóñòü çàäàí ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Åñëè ìàññèâ çíà÷åíèé ïåðåìåííîé Õ ÿâëÿåòñÿ äâóìåðíûì ìàññèâîì âèäà {õ11, õ12, ..., õ1n, õ21, õ22,
..., õ2n, ..., õk1, õk2, ..., õkn,}, òî â ýòîì ñëó÷àå èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y
îò k ïåðåìåííûõ Õ1, Õ2, ..., Õk è ñòðîèòñÿ ýêñïîíåíöèàëüíàÿ ðåãðåññèÿ âèäà
Ŷ = b0 ⋅ m1 1 ⋅ m2
X
X2
⋅ ... ⋅ mk
Xk
. Ôóíêöèÿ РОСТ ïî çàäàííûì çíà÷åíèÿì (õ1, õ2, ..., õk) è ïî
óðàâíåíèþ ðåãðåññèè âû÷èñëÿåò çíà÷åíèå ŷ . Åñëè èñõîäíûé ìàññèâ çíà÷åíèé Õ
ñîâïàäàåò ïî ðàçìåðó ñ ìàññèâîì çíà÷åíèé Y, òî ôóíêöèÿ РОСТ äëÿ âû÷èñëåíèÿ
íîâîãî çíà÷åíèÿ ŷ èñïîëüçóåò ýêñïîíåíöèàëüíóþ ðåãðåññèþ âèäà Ŷ = b0mX.
Ñèíòàêñèñ ôóíêöèè:
РОСТ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Íîâûå_çíà÷åíèÿ_x;Êîíñòàíòà)
Глава 4. Статистические функции
135
Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò
Новые_значения_x — çíà÷åíèÿ, äëÿ êîòîðûõ âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè.
Åñëè àðãóìåíò Значения_X îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ àðãóìåíòà Значения_Y .
Åñëè îïóùåí àðãóìåíò Новые_значения_x, òî ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî
îí ñîâïàäàåò ñ àðãóìåíòîì Значения_X.
Àðãóìåíò Константа ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè îí èìååò çíà÷åíèå
ИСТИНА èëè 1 ëèáî îïóùåí, òî êîýôôèöèåíò óðàâíåíèÿ ðåãðåññèè b0 âû÷èñëÿåòñÿ êàê îáû÷íî; åñëè æå îí èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî êîýôôèöèåíò b0 ïîëàãàåòñÿ ðàâíûì 1 è çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âû÷èñëÿþòñÿ
ñ ó÷åòîì ýòîãî óñëîâèÿ.
Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà
çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà
Новые_значения_x íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }.
4.10. Функции для вычисления ковариации
и коэффициента корреляции
 ýòó ãðóïïó âõîäÿò ñëåäóþùèå ôóíêöèè.
Ôóíêöèÿ
Íàçíà÷åíèå
ÊÎÂÀÐ
Âîçâðàùàåò êîâàðèàöèþ, ò.å. ñðåäíåå ïðîèçâåäåíèé îòêëîíåíèé
äëÿ êàæäîé ïàðû òî÷åê äàííûõ
ÊÎÐÐÅË
Âîçâðàùàåò êîýôôèöèåíò êîððåëÿöèè ìåæäó äâóìÿ íàáîðàìè äàííûõ
ÏÈÐÑÎÍ
Âîçâðàùàåò êîýôôèöèåíò êîððåëÿöèè Ïèðñîíà
ÊÂÏÈÐÑÎÍ
Âîçâðàùàåò êâàäðàò êîýôôèöèåíòà êîððåëÿöèè Ïèðñîíà
ÔÈØÅÐ
Âîçâðàùàåò ïðåîáðàçîâàíèå Ôèøåðà
ÔÈØÅÐÎÁÐ
Âîçâðàùàåò ôóíêöèþ, îáðàòíóþ ïðåîáðàçîâàíèþ Ôèøåðà
4.10.1. Функция КОВАР
Ôóíêöèÿ ïî äâóìåðíîé âûáîðêå (ïàðíûì íàáëþäåíèÿì) âû÷èñëÿåò âûáîðî÷íóþ êîâàðèàöèþ, êîòîðàÿ ÿâëÿåòñÿ îöåíêîé êîâàðèàöèè äâóìåðíîãî ðàñïðåäåëåíèÿ ñëó÷àéíîãî âåêòîðà (Õ, Y). Íàïîìíèì (ñì. ðàçäåë 1.3), ÷òî êîâàðèàöèÿ îïðåäåëÿåòñÿ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ïðîèçâåäåíèÿ (X – MX)(Y – MY),
ò.å. cov(X, Y) = M[(X – MX)(Y – MY)].
Åñëè èìåþòñÿ ïàðíûå íàáëþäåíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) — çíà÷åíèÿ
äâóìåðíîé âûáîðêè îáúåìîì n, òî âûáîðî÷íàÿ êîâàðèàöèÿ âû÷èñëÿåòñÿ ïî
ôîðìóëå cov(X, Y) =
1 n
1 n
1 n
( xi − x )( yi − y ) , ãäå x = ∑ xi è y = ∑ yi .
∑
n i =1
n i =1
n i =1
136 Часть II. Средства Excel для статистического анализа
Ñèíòàêñèñ ôóíêöèè:
КОВАР(Ìàññèâ1;Ìàññèâ2)
Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà äëÿ âû÷èñëåíèÿ êîâàðèàöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ.
Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè
ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè
èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè
#Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ДЕЛ/0!.
4.10.2. Функция КОРРЕЛ
Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè r, ò.å.
îöåíêó êîýôôèöèåíòà êîððåëÿöèè ρ ñëó÷àéíûõ âåëè÷èí X è Y: ρ =
cov(X, Y)
DX ⋅ DY
(ñì. ðàçäåë 1.3). Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè r âû÷èñëÿåòñÿ ïî ôîðìóëå r =
cov(X, Y)
, ãäå cov(X, Y) — âûáîðî÷íàÿ êîâàðèàöèÿ (ñì. ôóíêöèþ
SX S Y
1 n
1 n
1 n
1 n
( xi − x ) 2 , x = ∑ xi è SY =
( yi − y )2 , y = ∑ yi .
∑
∑
n i =1
n i =1
n i =1
n i =1
Ñèíòàêñèñ ôóíêöèè:
КОРРЕЛ(Ìàññèâ1;Ìàññèâ2)
Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé
ìàññèâ äàííûõ.
Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè
ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè
èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè
#Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ДЕЛ/0!.
КОВАР), S X =
4.10.3. Функция ПИРСОН
Ýòà ôóíêöèÿ, êàê è ôóíêöèÿ КОРРЕЛ, âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò
êîððåëÿöèè, ïðè÷åì ðåçóëüòàòû âû÷èñëåíèé îáåèõ ôóíêöèé ñîâïàäàþò
(êîíå÷íî, íà îäíîì è òîì æå íàáîðå äàííûõ). Íî â òàêîì ñëó÷àå âûáîðî÷íûé
Глава 4. Статистические функции
137
êîýôôèöèåíò êîððåëÿöèè íàçûâàåòñÿ êîýôôèöèåíòîì êîððåëÿöèè Ïèðñîíà2. Èñòîðè÷åñêè òàê ñëîæèëîñü, ÷òî “îáû÷íûé” âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè
âû÷èñëÿåòñÿ ïî ôîðìóëàì, ïðèâåäåííûì â îïèñàíèè ôóíêöèé КОВАР è КОРРЕЛ.
Êîýôôèöèåíò êîððåëÿöèè Ïèðñîíà âû÷èñëÿåòñÿ ïî àíàëîãè÷íûì ôîðìóëàì, íî
ñ èñïîëüçîâàíèåì
è sY2 =
íåñìåùåííûõ
îöåíîê
äèñïåðñèé
sX2 =
1 n
∑ ( xi − x )2
n − 1 i =1
1 n
∑ ( yi − y )2 ; â ýòîì ñëó÷àå îöåíêà êîâàðèàöèè âû÷èñëÿåòñÿ ïî ôîðìón − 1 i =1
1 n
∑ ( xi − x )( yi − y ) . Î÷åâèäíî, ÷òî ðåçóëüòàòû âû÷èñëåíèé â îáîn − 1 i =1
èõ ñëó÷àÿõ áóäóò îäèíàêîâû, íî “òðàäèöèÿ — åñòü òðàäèöèÿ”.
Ñèíòàêñèñ ôóíêöèè:
ëå cov(X, Y) =
ПИРСОН(Ìàññèâ1;Ìàññèâ2)
Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè
ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ.
Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè
ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè
èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè
#Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ДЕЛ/0!.
4.10.4. Функция КВПИРСОН
Ôóíêöèÿ âû÷èñëÿåò êâàäðàò êîýôôèöèåíòà êîððåëÿöèè Ïèðñîíà. Ýòà âåëè÷èíà íîñèò íàçâàíèå êîýôôèöèåíòà äåòåðìèíàöèè R2 è ïîêàçûâàåò ïðè ïîñòðîåíèè ëèíåéíîé ðåãðåññèè ñòåïåíü òî÷íîñòè àïïðîêñèìàöèè âûáîðî÷íûõ äàííûõ
ïðÿìîé ëèíèåé (ñì. îïèñàíèå ôóíêöèè ЛИНЕЙН è ðàçäåë 3.4.3).
Ñèíòàêñèñ ôóíêöèè:
КВПИРСОН(Ìàññèâ1;Ìàññèâ2)
Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè
ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ3.
2
Êàðë Ïèðñîí (Karl Pearson, 1857–1936) — àíãëèéñêèé ìàòåìàòèê, áèîëîã, ôèëîñîô, ÷ëåí
Ëîíäîíñêîãî êîðîëåâñêîãî îáùåñòâà, ïðîôåññîð Ëîíäîíñêîãî óíèâåðñèòåòà. Ðàçðàáîòàë ìíîãèå ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè.
3
Îòìåòèì, ÷òî â ñïðàâî÷íîé ñèñòåìå Excel ïðè îïèñàíèè ýòîé ôóíêöèè Массив1 îáîçíà÷àåòñÿ êàê Значения_Y, à Массив2 — êàê Значения_Х, ò.å. ïðåäïîëàãàåòñÿ íåðàâíîçíà÷íîñòü ýòèõ
àðãóìåíòîâ. Íà ñàìîì äåëå íå ñóùåñòâåííî, êàêîé àðãóìåíò ïðåäñòàâëÿåò çíà÷åíèÿ ïåðåìåííîé Õ, à êàêîé — çíà÷åíèÿ ïåðåìåííîé Y. Ïîýêñïåðèìåíòèðóéòå è óáåäèòåñü â ýòîì ñàìè.
138 Часть II. Средства Excel для статистического анализа
Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè
ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè
èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè
#Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå
îøèáêè #ДЕЛ/0!.
4.10.5. Функции ФИШЕР и ФИШЕРОБР
Ýòè ôóíêöèè îáû÷íî èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ êîððåëÿöèè èëè äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç
î çíà÷èìîñòè âûáîðî÷íûõ êîýôôèöèåíòîâ êîððåëÿöèè (ñì. ðàçäåë 3.2.1). Èìåííî ïî ýòîé ïðè÷èíå äàííûå ôóíêöèè âêëþ÷åíû â îäíó ãðóïïó ôóíêöèé, íî, êîíå÷íî, èõ ìîæíî èñïîëüçîâàòü è â äðóãèõ ñèòóàöèÿõ. Ïðàêòè÷åñêîå èñïîëüçîâàíèå ýòèõ ôóíêöèé ïîêàçàíî â ãëàâå 13.
Ôóíêöèÿ ФИШЕР ïî çàäàííîìó àðãóìåíòó õ âû÷èñëÿåò çíà÷åíèå Z =
1 1+ x
ln
.
2 1− x
Ôóíêöèÿ ФИШЕРОБР îáðàòíàÿ ê ôóíêöèè ФИШЕР. Îíà ïî çàäàííîìó àðãóìåíòó
õ âû÷èñëÿåò çíà÷åíèå y =
e2 x − 1
.
e2 x + 1
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(õ)
Åñëè àðãóìåíò х íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå
îøèáêè #ЗНАЧ!. Àðãóìåíò х ôóíêöèè ФИШЕР äîëæåí áûòü èç èíòåðâàëà (–1, 1),
èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.11. Дополнительные функции
 ýòó ãðóïïó âîøëè ôóíêöèè, êîòîðûå áûëî òðóäíî ïîìåñòèòü â êàêóþ-ëèáî èç
ïðèâåäåííûõ âûøå ãðóïï ôóíêöèé. Ïîýòîìó îíè íåñêîëüêî “ðàçíîøåðñòíûå”, íî
âñå êàê-òî ñâÿçàíû ñ âû÷èñëåíèåì âåðîÿòíîñòåé.  ñëåäóþùåì ðàçäåëå ñîáðàíû âñå
îñòàëüíûå ôóíêöèè, êîòîðûå åùå îñòàëèñü â êàòåãîðèè ñòàòèñòè÷åñêèõ ôóíêöèé.
Ôóíêöèÿ
Íàçíà÷åíèå
ÂÅÐÎßÒÍÎÑÒÜ
Âîçâðàùàåò âåðîÿòíîñòü òîãî, ÷òî çàäàííûå çíà÷åíèÿ íàõîäÿòñÿ âíóòðè îïðåäåëåííîãî èíòåðâàëà
ÄÎÂÅÐÈÒ
Âîçâðàùàåò äîâåðèòåëüíûé èíòåðâàë äëÿ ñðåäíåãî ãåíåðàëüíîé ñîâîêóïíîñòè
ÌÎÄÀ
Âîçâðàùàåò ìîäó (íàèáîëåå ÷àñòî âñòðå÷àþùååñÿ çíà÷åíèå)
íàáîðà äàííûõ
×ÀÑÒÎÒÀ
Âîçâðàùàåò ìàññèâ ÷èñåë, ðàâíûõ êîëè÷åñòâó âûáîðî÷íûõ
çíà÷åíèé, ïîïàäàþùèõ â çàäàííîå ìíîæåñòâî èíòåðâàëîâ
Глава 4. Статистические функции
139
4.11.1. Функция ВЕРОЯТНОСТЬ
Ýòà ôóíêöèÿ ðàáîòàåò ñ ïðîèçâîëüíûì äèñêðåòíûì ðàñïðåäåëåíèåì. Äëÿ åå
ðàáîòû íåîáõîäèìî èìåòü ìàññèâ çíà÷åíèé xi è ìàññèâ âåðîÿòíîñòåé pi, ñ êîòîðûìè ïðèíèìàþòñÿ ýòè çíà÷åíèÿ, ò.å. âåðîÿòíîñòíóþ òàáëèöó ñëåäóþùåãî âèäà.
Çíà÷åíèÿ xi
Âåðîÿòíîñòè pi
õ1
p1
õ2
p2
xn
pn
...
...
Ôóíêöèÿ íå òðåáóåò, ÷òîáû çíà÷åíèÿ xi áûëè îòñîðòèðîâàíû â ïîðÿäêå âîçðàñòàíèÿ èëè íå èìåëè îäèíàêîâûõ çíà÷åíèé. Íåîáõîäèìî òîëüêî, ÷òîáû ñóììà
âñåõ âåðîÿòíîñòåé pi ðàâíÿëàñü 1.
Ôóíêöèÿ ВЕРОЯТНОСТЬ ïî çàäàííîìó çíà÷åíèþ õ îïðåäåëÿåò âåðîÿòíîñòü ýòîãî
çíà÷åíèÿ; åñëè ñðåäè çíà÷åíèé xi íåò çíà÷åíèÿ, ñîâïàäàþùåãî ñ çàäàííûì çíà÷åíèåì
õ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå 0. Ìîæíî òàêæå çàäàòü èíòåðâàë [a, b] —
è ôóíêöèÿ îïðåäåëèò, ñêîëüêî çíà÷åíèé xi ïîïàäàåò â ýòîò èíòåðâàë è âåðíåò âåðîÿòíîñòü, ðàâíóþ ñóììå âåðîÿòíîñòåé òåõ xi, êîòîðûå ïîïàäàþò â ýòîò èíòåðâàë.
Ñèíòàêñèñ ôóíêöèè:
ВЕРОЯТНОСТЬ(Èíòåðâàë_Õ;Èíòåðâàë_Ð;à;b)
Àðãóìåíò Интервал_Х — èíòåðâàë ÷èñëîâûõ çíà÷åíèé xi. Àðãóìåíò Интервал_Р — èíòåðâàë âåðîÿòíîñòåé, ñîîòâåòñòâóþùèõ çíà÷åíèÿì â àðãóìåíòå
Интервал_Х. Àðãóìåíò а — íèæíÿÿ ãðàíèöà èíòåðâàëà [a, b], äëÿ êîòîðîãî âû÷èñëÿåòñÿ âåðîÿòíîñòü. Íåîáÿçàòåëüíûé àðãóìåíò b —âåðõíÿÿ ãðàíèöà èíòåðâàëà [a, b]. Åñëè àðãóìåíò b íå çàäàí, òî àðãóìåíò а ñ÷èòàåòñÿ òåì çíà÷åíèåì õ,
äëÿ êîòîðîãî íàõîäèòñÿ âåðîÿòíîñòü.
Åñëè ëþáîå çíà÷åíèå â àðãóìåíòå Интервал_Р ìåíüøå 0 èëè áîëüøå 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Òàêîå æå çíà÷åíèå îøèáêè ôóíêöèÿ
âîçâðàùàåò â ñëó÷àå, åñëè ñóììà çíà÷åíèé â àðãóìåíòå Интервал_Р íå ðàâíà 1.
Åñëè Интервал_Х è Интервал_Р ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà çíà÷åíèé, òî
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
4.11.2. Функция ДОВЕРИТ
Äàííàÿ ôóíêöèÿ èñïîëüçóåòñÿ ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå, ïðè óñëîâèè, ÷òî äèñïåðñèÿ σ2 ýòîãî ðàñïðåäåëåíèÿ èçâåñòíà.
Íàïîìíèì (ñì. ðàçäåë 2.3.6), ÷òî äëÿ òî÷å÷íîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî
îæèäàíèÿ m èñïîëüçóåòñÿ ñòàòèñòèêà x =
1 n
∑ xi , à äîâåðèòåëüíûé èíòåðâàë äëÿ m
n i =1

σ

n
ñ äîâåðèòåëüíûì óðîâíåì ð îïðåäåëÿåòñÿ êàê  x − k
,x +k
σ 
 , ãäå n — îáúåì
n
1+ p 
–1
 , Ô — ôóíêöèÿ, îá 2 
âûáîðêè, çíà÷åíèå k íàõîäèòñÿ ïî ôîðìóëå k = Ф −1 
ðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ôóíêöèÿ
ДОВЕРИТ ïî çàäàííûì çíà÷åíèÿì α = 1 – ð, σ è n âû÷èñëÿåò âåëè÷èíó k
140 Часть II. Средства Excel для статистического анализа
σ
n
.
Ñèíòàêñèñ ôóíêöèè:
ДОВЕРИТ(Àëüôà;Ñòàíä_îòêëîíåíèå;Ðàçìåð)
Àðãóìåíò Альфа — óðîâåíü çíà÷èìîñòè, ñâÿçàííûé ñ äîâåðèòåëüíûì óðîâíåì ð
ñîîòíîøåíèåì ð = 1 – Альфа. Àðãóìåíò Станд_отклонение — èçâåñòíîå ñòàíäàðòíîå îòêëîíåíèå σ ãåíåðàëüíîé ñîâîêóïíîñòè. Размер — îáúåì âûáîðêè n. Åñëè
çíà÷åíèå ýòîãî àðãóìåíòà — íåöåëîå ÷èñëî, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà.
Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè Альфа ìåíüøå 0 èëè áîëüøå 1, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЧИСЛО!. Ýòî æå çíà÷åíèå ôóíêöèÿ âîçâðàùàåò â ñëó÷àå, åñëè
çíà÷åíèå Станд_отклонение îòðèöàòåëüíî èëè çíà÷åíèå àðãóìåíòà Размер ìåíüøå 1.
4.11.3. Функция МОДА
Äàííàÿ ôóíêöèÿ èìååò ìàëî îáùåãî ñ íàõîæäåíèåì ìîäû, ò.å. íàèáîëüøåãî
çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè íåïðåðûâíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 1.2.3).
Ïîýòîìó îíà íå âêëþ÷åíà â ãðóïïó ôóíêöèé, âû÷èñëÿþùèõ ãåîìåòðè÷åñêèå õàðàêòåðèñòèêè ðàñïðåäåëåíèÿ. Ôóíêöèÿ МОДА ñðåäè çàäàííîãî íàáîðà ÷èñëîâûõ
çíà÷åíèé {õ1, õ2, ..., õn} íàõîäèò çíà÷åíèå, êîòîðîå ïîâòîðÿåòñÿ íàèáîëåå ÷àñòî.
Åñëè îäèíàêîâûõ çíà÷åíèé íåò, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
Åñëè íåñêîëüêî çíà÷åíèé ïîâòîðÿþòñÿ îäíî è òî æå êîëè÷åñòâî ðàç, òî âûâîäèòñÿ ïåðâîå òàêîå çíà÷åíèå.
Ñèíòàêñèñ ôóíêöèè:
МОДА(×èñëî1;×èñëî2;...)
Ôóíêöèÿ ìîæåò èìåòü äî 30 àðãóìåíòîâ Число. Ýòè àðãóìåíòû ìîãóò áûòü
÷èñëàìè, èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû. Ìîæíî
èñïîëüçîâàòü îäèí ìàññèâ èëè îäíó ññûëêó íà äèàïàçîí âìåñòî àðãóìåíòîâ, ðàçäåëÿåìûõ òî÷êîé ñ çàïÿòîé.
Åñëè àðãóìåíò, ÿâëÿÿñü ìàññèâîì èëè ññûëêîé, ñîäåðæèò òåêñò, ëîãè÷åñêèå
çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå
íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ.
4.11.4. Функция ЧАСТОТА
Ýòà ôóíêöèÿ ÷àñòî èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ ãèñòîãðàìì (ñì. ðàçäåë 8.3).
Ôóíêöèÿ ïîäñ÷èòûâàåò, ñêîëüêî çíà÷åíèé èç çàäàííîãî ìàññèâà çíà÷åíèé {õ1, õ2,
..., õn} ïîïàäàåò â èíòåðâàëû (–∞, a1], (a1, a2], ..., (ak–1, ak], (ak, +∞) (òàêèå èíòåðâàëû ÷àñòî íàçûâàþò êàðìàíàìè). Èíòåðâàëû çàäàþòñÿ íàáîðîì ÷èñåë {a1, a2,
..., ak–1, ak}. Õîòÿ ôóíêöèÿ ýòîãî íå òðåáóåò, íî ëîãè÷íî, ÷òîáû âûïîëíÿëîñü
óñëîâèå a1 < a2 < ... < ak–1 < ak. Èòàê, ôóíêöèÿ ЧАСТОТА âîçâðàùàåò ìàññèâ
÷èñåë ðàçìåðîì k + 1. Ïîýòîìó îíà äîëæíà ïðèìåíÿòüñÿ êàê ôîðìóëà ìàññèâà
ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, ñîñòîÿùåìó íå ìåíåå ÷åì èç k + 1 ÿ÷åéêè. Åñëè
åå ïðèìåíèòü â îäíîé ÿ÷åéêå, òî îíà âåðíåò òîëüêî êîëè÷åñòâî çíà÷åíèé õi, ïîïàâøèõ â èíòåðâàë (–∞, a1].
Ñèíòàêñèñ ôóíêöèè:
ЧАСТОТА(Ìàññèâ_äàííûõ;Ìàññèâ_èíòåðâàëîâ)
Àðãóìåíò Массив_данных — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé
çíà÷åíèÿ {õ1, õ2, ..., õn}. Åñëè Массив_данных íå ñîäåðæèò çíà÷åíèé, òî ôóíêöèÿ
Глава 4. Статистические функции
141
âîçâðàùàåò ìàññèâ íóëåé. Àðãóìåíò Массив_интервалов — ìàññèâ èëè ññûëêà íà
äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ãðàíèö èíòåðâàëîâ {a1, a2, ..., ak–1, ak}.
Ôóíêöèÿ èãíîðèðóåò ïóñòûå ÿ÷åéêè, à òàêæå òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ.
4.12. Вспомогательные функции
Ðàññìîòðèì ïîñëåäíèå ôóíêöèè êàòåãîðèè Статистические, êîòîðûå âûïîëíÿþò âñïîìîãàòåëüíûå âû÷èñëåíèÿ.
Ôóíêöèÿ
Íàçíà÷åíèå
ÃÀÌÌÀÍËÎÃ
Âîçâðàùàåò íàòóðàëüíûé ëîãàðèôì ãàììà-ôóíêöèè
ÍÎÐÌÀËÈÇÀÖÈß
Âîçâðàùàåò íîðìàëèçîâàííóþ âåëè÷èíó
ÏÅÐÅÑÒ
Âîçâðàùàåò ÷èñëî ïåðåñòàíîâîê äëÿ çàäàííîãî ÷èñëà îáúåêòîâ
ÑרÒ
Ïîäñ÷èòûâàåò êîëè÷åñòâî ÷èñåë â ñïèñêå àðãóìåíòîâ
ÑרÒÇ
Ïîäñ÷èòûâàåò êîëè÷åñòâî íåïóñòûõ çíà÷åíèé â ñïèñêå àðãóìåíòîâ
4.12.1. Функция ГАММАНЛОГ
∞
Çíà÷åíèÿ ãàììà-ôóíêöèè Ýéëåðà Γ( x) = ∫ e − u u x −1du ÷àñòî èñïîëüçóþòñÿ â ñòà0
òèñòè÷åñêèõ ðàñ÷åòàõ, ïîñêîëüêó îíà ó÷àñòâóåò â ôîðìóëàõ âû÷èñëåíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ ìíîãèõ ðàñïðåäåëåíèé, íàïðèìåð
ðàñïðåäåëåíèÿ Ñòüþäåíòà, ðàñïðåäåëåíèÿ χ2, F-ðàñïðåäåëåíèÿ è äð. Ïîñêîëüêó
çíà÷åíèå ôóíêöèè Ã(õ) áûñòðî ðàñòåò ïðè âîçðàñòàíèè çíà÷åíèÿ õ (íàïðèìåð,
åñëè õ — íàòóðàëüíîå ÷èñëî, Ã(õ) = (õ – 1)!), òî íà ïðàêòèêå óäîáíåå èñïîëüçîâàòü ëîãàðèôì îò ýòîé ôóíêöèè. Ôóíêöèÿ ГАММАНЛОГ è âû÷èñëÿåò íàòóðàëüíûé ëîãàðèôì îò ôóíêöèè Ã(õ). ×òîáû ïîëó÷èòü çíà÷åíèå ñàìîé ôóíêöèè, ñëåäóåò ïðèìåíèòü ôîðìóëó
= EXP(ГАММАНЛОГ(х))
Ñèíòàêñèñ ôóíêöèè:
ГАММАНЛОГ(х)
Àðãóìåíò x — ýòî çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Åñëè x íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x ìåíüøå
èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
4.12.2. Функция НОРМАЛИЗАЦИЯ
Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå µ è äèñïåðñèþ
σ2, òî ñëó÷àéíàÿ âåëè÷èíà Y = (Õ – µ)/σ èìååò òî æå ðàñïðåäåëåíèå, ÷òî è ñëó÷àéíàÿ âåëè÷èíà Õ, íî ñ ìàòåìàòè÷åñêèì îæèäàíèåì 0 è äèñïåðñèåé σ2 = 1. Òàêàÿ îïåðàöèÿ, ïðåîáðàçîâàíèå Y = (Õ – µ)/σ, íàçûâàåòñÿ íîðìàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ. Äàííàÿ ôóíêöèÿ è âûïîëíÿåò òàêóþ îïåðàöèþ.
Ñèíòàêñèñ ôóíêöèè:
НОРМАЛИЗАЦИЯ(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå)
142 Часть II. Средства Excel для статистического анализа
Àðãóìåíò x — íîðìàëèçóåìîå çíà÷åíèå. Àðãóìåíò Среднее — çàäàâàåìîå ìàòåìàòè÷åñêîå îæèäàíèå µ. Àðãóìåíò Стандартное_отклонение — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå σ.
Åñëè Стандартное_отклонение ìåíüøå èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò
çíà÷åíèå îøèáêè #ЧИСЛО!.
4.12.3. Функция ПЕРЕСТ
Ôóíêöèÿ âû÷èñëÿåò êîëè÷åñòâî ïåðåñòàíîâîê äëÿ çàäàííîãî ÷èñëà k îáúåêòîâ, êîòîðûå âûáèðàþòñÿ èç îáùåãî ÷èñëà n îáúåêòîâ. Ïåðåñòàíîâêà — ýòî ëþáîå ìíîæåñòâî èëè ïîäìíîæåñòâî îáúåêòîâ, êîòîðûå îòëè÷àþòñÿ ëèáî ñîñòàâîì
îáúåêòîâ, ëèáî èõ ïîðÿäêîì. Ïåðåñòàíîâêè îòëè÷àþòñÿ îò ñî÷åòàíèé, äëÿ êîòîðûõ âíóòðåííèé ïîðÿäîê íå èìååò çíà÷åíèÿ. Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé â êîìáèíàòîðíûõ çàäà÷àõ. ×èñëî ïåðåñòàíîâîê îáû÷íî
îáîçíà÷àåòñÿ êàê Ðk,n è âû÷èñëÿåòñÿ ïî ôîðìóëå
Pk , n =
n!
= n(n − 1)(n − 2)...(n − k + 1)
(n − k )!
Ñèíòàêñèñ ôóíêöèè:
ПЕРЕСТ(×èñëî;×èñëî_âûáðàííûõ)
Àðãóìåíò Число — öåëîå ÷èñëî n, çàäàþùåå êîëè÷åñòâî îáúåêòîâ. Àðãóìåíò
Число_выбранных — öåëîå ÷èñëî k, çàäàþùåå êîëè÷åñòâî îáúåêòîâ â êàæäîé ïåðåñòàíîâêå.
Åñëè àðãóìåíòû íå ÿâëÿþòñÿ öåëûìè ÷èñëàìè, òî áåðåòñÿ öåëàÿ ÷àñòü ýòèõ ÷èñåë. Åñëè àðãóìåíòû íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ îòðèöàòåëüíû, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ýòî æå çíà÷åíèå îøèáêè ôóíêöèÿ âîçâðàùàåò â òîì ñëó÷àå,
åñëè çíà÷åíèå àðãóìåíòà Число ìåíüøå çíà÷åíèÿ àðãóìåíòà Число_выбранных.
4.12.4. Функции СЧЁТ и СЧЁТЗ
Ýòè ôóíêöèè ïîäñ÷èòûâàþò êîëè÷åñòâî ÷èñåë (ôóíêöèÿ СЧЁТ) è êîëè÷åñòâî
íåïóñòûõ ÿ÷ååê (ôóíêöèÿ СЧЁТЗ) â çàäàííîì äèàïàçîíå ÿ÷ååê.
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(Çíà÷åíèå1;Çíà÷åíèå2;...)
Ôóíêöèè ìîãóò èìåòü äî 30 àðãóìåíòîâ Значение, êîòîðûå ìîãóò áûòü çíà÷åíèÿìè, ìàññèâàìè, èìåíàìè èëè àäðåñàìè äèàïàçîíîâ.
Îòìåòèì, ÷òî â Excel èìåþòñÿ ôóíêöèè СЧЁТЕСЛИ è СЧИТАТЬПУСТОТЫ, êîòîðûå òàêæå ìîæíî èñïîëüçîâàòü äëÿ ïîäñ÷åòà êîëè÷åñòâà çíà÷åíèé.
4.13. Функции для генерирования равномерно
распределенных случайных чисел
Ýòè ôóíêöèè íå âõîäÿò â êàòåãîðèþ Статистические (îíè âõîäÿò â êàòåãîðèþ
Математические), ÷àñòî èñïîëüçóþòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí (ñì. ãëàâó 7) è áåç íèõ îïèñàíèå ñòàòèñòè÷åñêèõ ôóíêöèé Excel áûëî áû íå ïîëíûì.
Глава 4. Статистические функции
143
Ôóíêöèÿ
Íàçíà÷åíèå
ÑË×ÈÑ
Ãåíåðèðóåò ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1]
ñëó÷àéíûå ÷èñëà
ÑËÓ×ÌÅÆÄÓ
Ãåíåðèðóåò öåëûå ÷èñëà, ðàâíîìåðíî ðàñïðåäåëåííûå íà çàäàííîì èíòåðâàëå
4.13.1. Функция СЛЧИС
Ýòà ôóíêöèÿ âîçâðàùàåò ÷èñëà, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå
[0, 1]. Åå ñèíòàêñèñ — СЛЧИС(), ò.å. îíà íå èìååò àðãóìåíòîâ. Îíà ÷àñòî èñïîëüçóåòñÿ äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë ìåòîäîì îáðàòíîé ôóíêöèè (ñì. ãëàâó 7), à òàêæå â èìèòàöèîííîì ìîäåëèðîâàíèè.
Ôóíêöèþ СЛЧИС ìîæíî èñïîëüçîâàòü â ôîðìóëàõ ìàññèâîâ äëÿ ãåíåðèðîâàíèÿ äèàïàçîíîâ ñëó÷àéíûõ ÷èñåë. Íà
ðèñ. 4.9 ïîêàçàí ïðîöåññ ñîçäàíèÿ äèàïàçîíà ñëó÷àéíûõ
÷èñåë. Ñíà÷àëà âûäåëÿåòñÿ äèàïàçîí ÿ÷ååê, çàòåì, íå ñíèìàÿ âûäåëåíèÿ, ââîäèòñÿ ôîðìóëà =СЛЧИС() è ïîñëå ýòîãî
íàæèìàåòñÿ êîìáèíàöèÿ êëàâèø <Ctrl+Shift+Enter>.
Íåîáõîäèìî îòìåòèòü, ÷òî ôîðìóëû, ñîäåðæàùèå ôóíêöèþ СЛЧИС, ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà, íàïðèìåð ïðè ââîäå ëþáîãî çíà÷åíèÿ â ÿ÷åéêó
èëè ïðè óäàëåíèè ÷åãî-ëèáî. Ýòî ñâîéñòâî äàííîé ôóíêöèè
ïîëåçíî, íàïðèìåð, â èìèòàöèîííîì ìîäåëèðîâàíèè. Îäíàêî â äðóãèõ ñëó÷àÿõ îíî ìîæåò ñèëüíî çàìåäëÿòü ðàáîòó
â Excel èëè áûòü ïðîñòî èçëèøíèì. ×òîáû çàôèêñèðîâàòü
çíà÷åíèÿ, âû÷èñëÿåìûå ñ ïîìîùüþ ôóíêöèè СЛЧИС, íàäî âûäåëèòü äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ,
è ñêîïèðîâàòü åãî (êîìàíäà ПравкаÖКопировать). Çàòåì,
íå ñíèìàÿ âûäåëåíèÿ äèàïàçîíà, ñëåäóåò âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка, â îòêðûâøåìñÿ äèàÐèñ. 4.9.
Ñîçäàíèå ëîãîâîì îêíå Специальная вставка óñòàíîâèòü ïåðåêëþ÷àäèàïàçîíà ñî ñëó- òåëü Значения, êàê ïîêàçàíî íà ðèñ. 4.10, è ùåëêíóòü íà
êíîïêå ОК.  ÿ÷åéêè âûäåëåííîãî äèàïàçîíà âìåñòî ôîð÷àéíûìè ÷èñëàìè
ìóë áóäóò çàïèñàíû ÷èñëîâûå çíà÷åíèÿ.
Ïðèìåíåíèå ôóíêöèè СЛЧИС äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, êîòîðûå
èìåþò ðàñïðåäåëåíèÿ, îòëè÷íûå îò ðàâíîìåðíîãî, ïîêàçàíî â ãëàâå 7.
4.13.2. Функция СЛУЧМЕЖДУ
Ýòà ôóíêöèÿ ãåíåðèðóåò öåëî÷èñëåííûå çíà÷åíèÿ, ïîä÷èíÿþùèåñÿ äèñêðåòíîìó ðàâíîìåðíîìó ðàñïðåäåëåíèþ (ñì. ðàçäåë 1.4.1). Îòìåòèì, ÷òî îíà äîñòóïíà
òîëüêî òîãäà, êîãäà ïîäêëþ÷åíà íàäñòðîéêà Пакет анализа.
Ñèíòàêñèñ ôóíêöèè:
СЛУЧМЕЖДУ(Íèæíÿÿ_ãðàíèöà;Âåðõíÿÿ_ãðàíèöà)
144 Часть II. Средства Excel для статистического анализа
Ðèñ. 4.10. Ïðåîáðàçîâàíèå ôîðìóë â ÷èñëîâûå çíà÷åíèÿ
Àðãóìåíò Нижняя_граница çàäàåò íèæíþþ ãðàíèöó èíòåðâàëà èçìåíåíèÿ ñëó÷àéíîé âåëè÷èíû, àðãóìåíò Верхняя_граница — âåðõíþþ ãðàíèöó ýòîãî èíòåðâàëà. Åñëè çíà÷åíèÿ àðãóìåíòîâ äðîáíûå, îíè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ. Åñëè çíà÷åíèå àðãóìåíòà Нижняя_граница áîëüøå çíà÷åíèÿ àðãóìåíòà
Верхняя_граница, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
Ýòà ôóíêöèÿ “íå ðàáîòàåò” â ôîðìóëàõ ìàññèâîâ. Ïîýòîìó, ÷òîáû ñãåíåðèðîâàòü äèàïàçîí çíà÷åíèé, ñíà÷àëà íàäî ââåñòè ôîðìóëó =СЛУЧМЕЖДУ(-10;10) â ïåðâóþ ÿ÷åéêó, à çàòåì ñêîïèðîâàòü åå âî âñå îñòàëüíûå ÿ÷åéêè äèàïàçîíà. (Ïðèâåäåííàÿ ôîðìóëà áóäåò ãåíåðèðîâàòü öåëûå ÷èñëà èç èíòåðâàëà îò –10 äî 10.)
Êàê è â ñëó÷àå ñ ôóíêöèåé СЛЧИС, ôîðìóëû, ñîäåðæàùèå ôóíêöèþ
СЛУЧМЕЖДУ, ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà. Ïîýòîìó,
÷òîáû çàôèêñèðîâàòü çíà÷åíèÿ, ïîëó÷åííûå ñ ïîìîùüþ ýòîé ôóíêöèè, ñëåäóåò
ïðåîáðàçîâàòü ôîðìóëû â çíà÷åíèÿ, êàê îïèñàíî â ïðåäûäóùåì ðàçäåëå.
Глава 4. Статистические функции
145
Глава
5
Надстройка Пакет анализа
Â
ñîñòàâ Microsoft Excel âõîäèò íàäñòðîéêà Пакет анализа, êîòîðàÿ ñîäåðæèò
19 ñòàòèñòè÷åñêèõ ïðîöåäóð è îêîëî 50 ôóíêöèé. Ôóíêöèè â îñíîâíîì îòíîñÿòñÿ ê êàòåãîðèÿì èíæåíåðíûõ è ôèíàíñîâûõ è ïîýòîìó çäåñü íå ðàññìàòðèâàþòñÿ. Ñòàòèñòè÷åñêèå ïðîöåäóðû, ñîäåðæàùèåñÿ â íàäñòðîéêå Пакет
анализа, ïðåäîñòàâëÿþò øèðîêèé ñïåêòð ñðåäñòâ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà
íà÷èíàÿ îò ïðîñòîé îïèñàòåëüíîé ñòàòèñòèêè èëè ñãëàæèâàíèÿ äàííûõ è çàêàí÷èâàÿ àíàëèçîì Ôóðüå è ïðîâåäåíèåì ðàçëè÷íûõ òåñòîâ. Ïîëíûé ñïèñîê ýòèõ
ñðåäñòâ è èõ êðàòêîå îïèñàíèå ïðåäñòàâëåíû â òàáë. 5.1 (íàçâàíèÿ ñðåäñòâ ïðèâîäÿòñÿ â ñîîòâåòñòâèè ñî ñïèñêîì èç äèàëîãîâîãî îêíà Анализ данных).
Таблица 5.1. Статистические средства надстройки Пакет анализа
Ñðåäñòâî
Îïèñàíèå
Îäíîôàêòîðíûé äèñïåðñèîííûé àíàëèç
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå
ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ èëè áîëåå âûáîðîê
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç áåç ïîâòîðåíèé
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç íà îñíîâå
îäíîé âûáîðêè
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ñ ïîâòîðåíèÿìè
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç íà îñíîâå
íåñêîëüêèõ âûáîðîê
Êîððåëÿöèÿ
Âû÷èñëÿåò êîððåëÿöèîííóþ ìàòðèöó
Êîâàðèàöèÿ
Âû÷èñëÿåò ìàòðèöó êîâàðèàöèé
Îïèñàòåëüíàÿ ñòàòèñòèêà
Ñîçäàåò îò÷åò, ñîäåðæàùèé ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ïðåäñòàâëåííîé âûáîðêè
Ýêñïîíåíöèàëüíîå ñãëàæèâàíèå
Ðåàëèçóåò ìåòîä ýêñïîíåíöèàëüíîãî ñãëàæèâàíèÿ
äàííûõ
Äâóõâûáîðî÷íûé F-òåñò äëÿ
äèñïåðñèé
Ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ äèñïåðñèé äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé
Àíàëèç Ôóðüå
Ðåàëèçóåò ìåòîä áûñòðîãî ïðåîáðàçîâàíèÿ Ôóðüå
(ÁÏÔ) äëÿ àíàëèçà äàííûõ
Ãèñòîãðàììà
Èñïîëüçóåòñÿ äëÿ àíàëèçà ðàñïðåäåëåíèÿ âûáîðî÷íûõ äàííûõ è ïîñòðîåíèÿ ãèñòîãðàìì
Ñêîëüçÿùåå ñðåäíåå
Èñïîëüçóåòñÿ äëÿ ñãëàæèâàíèÿ äàííûõ
Ãåíåðàöèÿ ñëó÷àéíûõ ÷èñåë
Ãåíåðèðóåò ñëó÷àéíûå ÷èñëà, èìåþùèå çàäàííîå
ðàñïðåäåëåíèå
Ðàíã è ïåðñåíòèëü
Èñïîëüçóåòñÿ äëÿ âû÷èñëåíèÿ ðàíãîâ è êâàíòèëåé
Îêîí÷àíèå òàáë. 5.1
Ñðåäñòâî
Îïèñàíèå
Ðåãðåññèÿ
Èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ ëèíåéíîé ðåãðåññèè
Âûáîðêà
Ñîçäàåò ñëó÷àéíóþ âûáîðêó, ðàññìàòðèâàÿ âõîäíîé
äèàïàçîí çíà÷åíèé êàê ãåíåðàëüíóþ ñîâîêóïíîñòü
Ïàðíûé äâóõâûáîðî÷íûé tòåñò äëÿ ñðåäíèõ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå
ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóìåðíîé âûáîðêè
äàííûõ
Äâóõâûáîðî÷íûé t-òåñò ñ
îäèíàêîâûìè äèñïåðñèÿìè
Ñëóæèò äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóõ âûáîðîê. Ïðåäïîëàãàåòñÿ ðàâåíñòâî äèñïåðñèé ãåíåðàëüíûõ ñîâîêóïíîñòåé
Äâóõâûáîðî÷íûé t-òåñò ñ
ðàçíûìè äèñïåðñèÿìè
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå
ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóõ âûáîðîê. Íå
òðåáóåò ïðåäïîëîæåíèÿ î ðàâåíñòâå äèñïåðñèé ãåíåðàëüíûõ ñîâîêóïíîñòåé
Äâóõâûáîðî÷íûé z-òåñò äëÿ
ñðåäíèõ
Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàçëè÷èè
ìåæäó ìàòåìàòè÷åñêèìè îæèäàíèÿì äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé
Îòìåòèì, ÷òî ýòè ñðåäñòâà èìåþò îïðåäåëåííûå îãðàíè÷åíèÿ è èíîãäà óäîáíåå
âîñïîëüçîâàòüñÿ ñòàòèñòè÷åñêèìè ôóíêöèÿìè èëè äðóãèìè ñðåäñòâàìè Excel.
Ïðåèìóùåñòâîì ôóíêöèé ïåðåä äàííûìè ñðåäñòâàìè ÿâëÿåòñÿ òî, ÷òî ôóíêöèè
àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ ïðè ëþáûõ èçìåíåíèÿõ, ñäåëàííûõ â âûáîðêå,
òîãäà êàê ýòè ñðåäñòâà íåîáõîäèìî âûïîëíÿòü çàíîâî, åñëè âûáîðêà èçìåíèëàñü.
 “îïðàâäàíèå” ýòèõ ñðåäñòâ ñêàæåì, ÷òî îíè ñîõðàíÿþò óñòàíîâêè, ñäåëàííûå
ïîëüçîâàòåëåì ïðè ïîñëåäíåì ïðèìåíåíèè ñðåäñòâà, íî òîëüêî â òå÷åíèå îäíîãî
ñåàíñà ðàáîòû ñ Excel.
Ñðåäñòâà, êîòîðûå âêëþ÷åíû â íàäñòðîéêó Пакет анализа, äîñòóïíû ÷åðåç êîìàíäó СервисÖАнализ данных. (Åñëè êîìàíäû Анализ данных íåò â ìåíþ Сервис, ïîäêëþ÷èòå ýòó íàäñòðîéêó. Äëÿ ýòîãî âûïîëíèòå êîìàíäó СервисÖНадстройки è â îòêðûâøåìñÿ äèàëîãîâîì îêíå Надстройки â ñïèñêå Доступные надстройки óñòàíîâèòå
ôëàæîê íàïðîòèâ îïöèè Пакет анализа.) Êîìàíäà СервисÖАнализ данных îòêðûâàåò
îäíîèìåííîå äèàëîãîâîå îêíî, â ñïèñêå Инструменты анализа êîòîðîãî ñëåäóåò âûáðàòü íåîáõîäèìîå ñðåäñòâî (ðèñ. 5.1). Ïîñëå âûáîðà êàêîãî-ëèáî ñðåäñòâà (è ïîñëåäóþùåãî ùåë÷êà íà êíîïêå ОК) îòêðûâàåòñÿ äèàëîãîâîå îêíî ýòîãî ñðåäñòâà.
 áîëüøèíñòâå òàêèõ äèàëîãîâûõ îêîí (íà ðèñ. 5.2 äëÿ ïðèìåðà ïîêàçàíî
äèàëîãîâîå îêíî ñðåäñòâà Описательная статистика) âûäåëåíû îáëàñòè Входные
данные è Параметры вывода. Â îáëàñòè Входные данные óêàçûâàåòñÿ äèàïàçîí
ÿ÷ååê, â êîòîðîì ñîäåðæàòñÿ äàííûå (ïîëå Входной интервал), óêàçûâàåòñÿ,
ñãðóïïèðîâàíû ëè äàííûå, è åñëè ñãðóïïèðîâàíû, òî ïî ñòîëáöàì èëè ïî ñòðîêàì (ïåðåêëþ÷àòåëè по столбцам è по строкам). Åñëè çàäàåòñÿ âõîäíîé äèàïàçîí
äàííûõ âìåñòå ñ çàãîëîâêàìè, òî óñòàíàâëèâàåòñÿ ôëàæîê îïöèè Метки в первой
строке (столбце). (Åñëè çàãîëîâêè íå çàäàþòñÿ, òî äàííûì àâòîìàòè÷åñêè ïðèñâàèâàþòñÿ çàãîëîâêè Столбец1, Столбец2 è ò.ä. èëè Строка1, Строка2 è ò.ä.
â çàâèñèìîñòè îò òîãî, ðàñïîëîæåíû äàííûå â ñòîëáöàõ èëè â ñòðîêàõ.) Â íåêîòîðûõ
Глава 5. Надстройка Пакет анализа
147
äèàëîãîâûõ îêíàõ â îáëàñòè Входные данные íåîáõîäèìî óêàçàòü íåñêîëüêî
âõîäíûõ äèàïàçîíîâ (íàïðèìåð, â îêíå Регрессия) ëèáî äîïîëíèòåëüíûå ïàðàìåòðû äëÿ ïðîâåäåíèÿ âûáðàííîé ñòàòèñòè÷åñêîé ïðîöåäóðû, íàïðèìåð äîâåðèòåëüíûé óðîâåíü äëÿ ïðîâåäåíèÿ òåñòîâ.
Ðèñ. 5.1. Äèàëîãîâîå îêíî Анализ данных ñî ñïèñêîì
èíñòðóìåíòîâ ñòàòèñòè÷åñêîãî àíàëèçà
Ðèñ. 5.2. Äèàëîãîâîå îêíî ñðåäñòâà
Описательная статистика
 îáëàñòè Параметры вывода, êàê ïðàâèëî, íàäî óêàçàòü, êóäà áóäóò âûâîäèòüñÿ ðåçóëüòàòû ðàñ÷åòîâ. Ïðåäóñìîòðåíî òðè âîçìîæíîñòè: íà òåêóùèé ðàáî÷èé ëèñò (ïåðåêëþ÷àòåëü Выходной интервал), ïðè ýòîì íåîáõîäèìî óêàçàòü âûõîäíîé èíòåðâàë (äîñòàòî÷íî óêàçàòü àäðåñ îäíîé ÿ÷åéêè, êîòîðàÿ îïðåäåëÿåò
âåðõíèé ëåâûé óãîë âûõîäíîãî äèàïàçîíà); íà íîâûé ðàáî÷èé ëèñò òåêóùåé ðàáî÷åé êíèãè íà÷èíàÿ ñ ÿ÷åéêè À1 (ïåðåêëþ÷àòåëü Новый рабочий лист), ïðè ýòîì
ìîæíî ñðàçó çàäàòü èìÿ ýòîìó ëèñòó; â íîâóþ ðàáî÷óþ êíèãó (ïåðåêëþ÷àòåëü
Новая рабочая книга), â ýòîì ñëó÷àå àâòîìàòè÷åñêè îòêðûâàåòñÿ íîâàÿ ðàáî÷àÿ
êíèãà. Òàêæå â ýòîé îáëàñòè ÷àñòî èìåþòñÿ îïöèè, êîòîðûå óêàçûâàþò, ÷òî
148 Часть II. Средства Excel для статистического анализа
èìåííî íåîáõîäèìî âûâåñòè èç âîçìîæíîãî íàáîðà âûõîäíûõ ðåçóëüòàòîâ
(íàïðèìåð, ãðàôèêè ëèáî äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè).
 íåêîòîðûõ äèàëîãîâûõ îêíàõ èìåþòñÿ äðóãèå îáëàñòè, â êîòîðûõ ñîäåðæàòñÿ îïöèè, íåîáõîäèìûå äëÿ ðàáîòû äàííîãî ñðåäñòâà. Ýòè îïöèè áóäóò ïðèâåäåíû ïðè îïèñàíèè êîíêðåòíûõ ñðåäñòâ. Îïöèè îáëàñòåé Входные данные
è Параметры вывода áóäåì óïîìèíàòü òîëüêî òîãäà, êîãäà îíè áóäóò îòëè÷àòüñÿ
îò îïèñàííûõ âûøå.
Ïåðåéäåì ê îïèñàíèþ êîíêðåòíûõ ñðåäñòâ ñòàòèñòè÷åñêîãî àíàëèçà, ïðè ýòîì
áóäåì íàçûâàòü èõ òàê, êàê îíè íàçâàíû â ñïèñêå äèàëîãîâîãî îêíà Анализ
данных. Îïèøåì èõ â ïîðÿäêå “îò ïðîñòîãî ê ñëîæíîìó” (äðóãèìè ñëîâàìè,
â òîì ïîðÿäêå, êîòîðûé áîëüøå íðàâèòñÿ àâòîðó).
5.1. Описательная статистика
Ýòî ñðåäñòâî (âìåñòå ñî ñðåäñòâîì Гистограмма, êîòîðîå áóäåò îïèñàíî â ñëåäóþùåì ðàçäåëå) ÿâëÿåòñÿ, ïî-âèäèìîìó, íàèáîëåå ÷àñòî èñïîëüçóåìûì èç âñåãî
ïàêåòà àíàëèçà, ïîñêîëüêó áûñòðî è ïðîñòî âû÷èñëÿåò îñíîâíûå ñòàòèñòè÷åñêèå
õàðàêòåðèñòèêè îäíîìåðíûõ âûáîðîê. Íà ðèñ. 5.3 ïîêàçàí ðàáî÷èé ëèñò, ñîäåðæàùèé òðè ðÿäà äàííûõ (òðè íåçàâèñèìûå âûáîðêè, èìåþùèå ðàçíûå ðàñïðåäåëåíèÿ) è äèàëîãîâîå îêíî Описательная статистика.
Ðèñ. 5.3. Òðè âûáîðêè è äèàëîãîâîå îêíî Описательная статистика
Îòìåòèì, ÷òî â äàííîì ñëó÷àå èìåþòñÿ âûáîðêè ðàçíûõ ðàçìåðîâ. Ñðåäñòâî
Описательная статистика ïðàâèëüíî îïðåäåëÿåò ðàçìåðû âûáîðîê, èãíîðèðóÿ
ïóñòûå ÿ÷åéêè. Íà ðèñ. 5.4 ïîêàçàí ðàáî÷èé ëèñò ñ ðåçóëüòàòàìè ðàñ÷åòîâ.
 òàáë. 5.2 ïåðå÷èñëåíû âû÷èñëÿåìûå ñðåäñòâîì Описательная статистика
ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðîê, à òàêæå ôóíêöèè, êîòîðûå âîçâðàùàþò
òå æå ñàìûå õàðàêòåðèñòèêè.
Глава 5. Надстройка Пакет анализа
149
Ðèñ. 5.4. Ðåçóëüòàòû ðàáîòû ñðåäñòâà Описательная статистика
Таблица 5.2. Значения, вычисляемые средством Описательная статистика
Çíà÷åíèå
Îïèñàíèå
Ñðåäíåå
Âûáîðî÷íîå ñðåäíåå x =
1 n
∑ xi . Ôóíêöèÿ СРЗНАЧ
n i =1
Ñòàíäàðòíàÿ Îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ âûáîðî÷íîãî ñðåäíåãî;
îøèáêà
n
1
âû÷èñëÿåòñÿ ïî ôîðìóëå
( xi − x ) 2
n(n − 1)
∑
i =1
Ìåäèàíà
Çíà÷åíèå ìåäèàíû, ò.å. êâàíòèëÿ ïîðÿäêà 0,5. Ôóíêöèÿ МЕДИАНА
Ìîäà
Çíà÷åíèå ìîäû. Âû÷èñëÿåòñÿ òàê æå, êàê è ôóíêöèåé МОДА
(ñì. ðàçäåë 4.11.3), — åñëè íåò îäèíàêîâûõ âûáîðî÷íûõ çíà÷åíèé,
òî âîçâðàùàåòñÿ çíà÷åíèå îøèáêè #Н/Д
Ñòàíäàðòíîå
îòêëîíåíèå
Îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ãåíåðàëüíîé ñîâîêóïíî-
Äèñïåðñèÿ
âûáîðêè
ñòè sn =
1 n
∑ ( xi − x )2 . Ôóíêöèÿ СТАНДОТКЛОН
n − 1 i =1
Îöåíêà äèñïåðñèè ãåíåðàëüíîé ñîâîêóïíîñòè sn =
2
1 n
( xi − x )2 .
∑
n − 1 i =1
Ôóíêöèÿ ДИСП
Ýêñöåññ
Âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà (ñì. ðàçäåë 2.3.4). Ôóíêöèÿ
ЭКСЦЕСС
Àñèììåòðè÷- Âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè (ñì. ðàçäåë 2.3.4). Ôóíêöèÿ
íîñòü
СКОС
150 Часть II. Средства Excel для статистического анализа
Îêîí÷àíèå òàáë. 5.2
Çíà÷åíèå
Îïèñàíèå
Èíòåðâàë
Ðàçìàõ âûáîðêè. Âû÷èñëÿåòñÿ êàê ðàçíîñòü ìåæäó ìàêñèìàëüíûì
è ìèíèìàëüíûì âûáîðî÷íûìè çíà÷åíèÿìè
Ìèíèìóì
Ìèíèìàëüíîå âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ МИН
Ìàêñèìóì
Ìàêñèìàëüíîå âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ МАКС
Ñóììà
Ñóììà âûáîðî÷íûõ çíà÷åíèé. Ôóíêöèÿ СУММ
Ñ÷åò
Îáúåì âûáîðêè. Ôóíêöèÿ СЧЁТ
Íàèáîëüøèé Ê-å íàèáîëüøåå çíà÷åíèå. Åñëè Ê = 1, òî âûâîäèòñÿ ìàêñèìàëüíîå
(Ê)
âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ НАИБОЛЬШИЙ
Íàèìåíüøèé Ê-å íàèìåíüøåå çíà÷åíèå. Åñëè Ê = 1, òî âûâîäèòñÿ ìèíèìàëüíîå
(Ê)
âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ НАИМЕНЬШИЙ
Óðîâåíü íàäåæíîñòè
(Õ%)
Ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî
îæèäàíèÿ ñ äîâåðèòåëüíûì óðîâíåì Õ%; äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ êàê âûáîðî÷íîå ñðåäíåå ïëþñ-ìèíóñ äàííîå çíà÷åíèå. Ãðàíèöà âû÷èñëÿåòñÿ ñ ïîìîùüþ ðàñïðåäåëåíèÿ Ñòüþäåíòà (ñì. ðàçäåë 2.3.6), ò.å.
çäåñü íåÿâíî èñïîëüçóåòñÿ ïðåäïîëîæåíèå î íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîýòîìó ê äàííîìó ïîêàçàòåëþ
ñëåäóåò îòíîñèòüñÿ îñòîðîæíî, îñîáåííî ïðè ìàëûõ âûáîðêàõ
5.1.1. Опции диалогового окна Описательная статистика
Óñòàíîâêà ôëàæêà îïöèè Итоговая статистика óêàçûâàåò, ÷òî â èòîãîâîì îò÷åòå ýòîãî ñðåäñòâà áóäóò âû÷èñëåíû âñå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè,
çà èñêëþ÷åíèåì ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà äëÿ ñðåäíåãî è Ê-õ íàèáîëüøèõ è íàèìåíüøèõ çíà÷åíèé, äëÿ êîòîðûõ èìåþòñÿ îòäåëüíûå îïöèè
Уровень надежности, К-ый наименьший è К-ый наибольший. Åñëè ôëàæîê îïöèè
Итоговая статистика íå óñòàíîâëåí, òî âûâîäèòñÿ òîëüêî òî, ÷òî çàäàåòñÿ ñ ïîìîùüþ îïöèé Уровень надежности, К-ый наименьший è К-ый наибольший.
Îïöèÿ Уровень надежности óêàçûâàåò, íàäî ëè âû÷èñëÿòü ãðàíèöó äîâåðèòåëüíîãî èíòåðâàëà äëÿ ñðåäíåãî.  ïîëå ââîäà ðÿäîì ñ ýòîé îïöèåé çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü â ïðîöåíòàõ.
 ïîëÿõ ââîäà ðÿäîì ñ îïöèÿìè К-ый наибольший è К-ый наименьший óêàçûâàþòñÿ ïîðÿäêè âûâîäèìûõ íàèáîëüøåãî è íàèìåíüøåãî çíà÷åíèé. Åñëè ýòè ïîðÿäêè ðàâíû 1, òî âûâîäÿòñÿ ñîîòâåòñòâåííî ìàêñèìàëüíîå è ìèíèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ.
5.2. Гистограмма
Ýòî ñðåäñòâî ïîëåçíî äëÿ ïåðâè÷íîãî àíàëèçà ðàñïðåäåëåíèÿ âûáîðêè è ïîñòðîåíèÿ ãèñòîãðàìì (ñòîëáöîâûõ äèàãðàìì ýìïèðè÷åñêèõ ïëîòíîñòåé âåðîÿòíîñòåé).  êà÷åñòâå èñõîäíûõ äàííûõ íóæíî óêàçàòü âõîäíîé äèàïàçîí, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, è èíòåðâàë êàðìàíîâ. Èíòåðâàë êàðìàíîâ îïðåäåëÿåò
ãðàíèöû äëÿ ñòîëáöîâ ãèñòîãðàììû. Ñðåäñòâî Гистограмма ïîäñ÷èòûâàåò ÷èñëî
âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â êàæäûé êàðìàí (ýòè ÷èñëà â âûõîäíûõ äàííûõ
Глава 5. Надстройка Пакет анализа
151
íàçûâàþòñÿ Частота), è ïî ýòèì ÷èñëàì ñòðîèò ãèñòîãðàììó. Äàëåå ïîñëåäîâàòåëüíî ñóììèðóþòñÿ ÷àñòîòû (ïîäñ÷èòûâàþòñÿ òàê íàçûâàåìûå íàêàïëèâàþùèå
ñóììû), ýòè ñóììû äåëÿòñÿ íà îáúåì âûáîðêè è óìíîæàþòñÿ íà 100. Ïîëó÷àåòñÿ
òî, ÷òî çäåñü íàçûâàåòñÿ Интегральный процент. Íà ñàìîì äåëå, åñëè óáðàòü ïðîöåíòû (ò.å. íàêàïëèâàþùèå ñóììû íîðìèðîâàòü íå íà 100%, à íà 1), ýòî ïðîñòî
ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ. Ñðåäñòâî Гистограмма ïðåäîñòàâëÿåò âîçìîæíîñòü âûâåñòè çíà÷åíèÿ èíòåãðàëüíîãî ïðîöåíòà â âèäå ãðàôèêà.  êà÷åñòâå
äîïîëíèòåëüíîé âîçìîæíîñòè ïðåäóñìîòðåíà ñîðòèðîâêà ÷àñòîò ïî óáûâàíèþ
è ïîñòðîåíèå ãèñòîãðàììû ïî ýòèì îòñîðòèðîâàííûì ÷àñòîòàì.
5.2.1. Опции диалогового окна Гистограмма
Äèàëîãîâîå îêíî Гистограмма ïîêàçàíî íà ðèñ. 5.5. Â îáëàñòè Входные данные
çàäàþòñÿ àäðåñ äèàïàçîíà ÿ÷ååê ñ âûáîðî÷íûìè çíà÷åíèÿìè (ïîëå ââîäà Входной
интервал) è àäðåñ äèàïàçîíà, ñîäåðæàùåãî ãðàíèöû êàðìàíîâ (ïîëå ââîäà Интервал
карманов). Ãðàíèöû êàðìàíîâ äîëæíû áûòü ïðåäñòàâëåíû â ïîðÿäêå âîçðàñòàíèÿ.
Ïðè ïîäñ÷åòå êîëè÷åñòâà ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàðìàíû â ÷èñëî ïîïàâøèõ â äàííûé êàðìàí âêëþ÷àþòñÿ çíà÷åíèÿ, ðàâíûå íèæíåé ãðàíèöå êàðìàíà
è ìåíüøèå âåðõíåé ãðàíèöû êàðìàíà. Åñëè íå óêàçûâàòü èíòåðâàë ãðàíèö êàðìàíîâ, áóäóò àâòîìàòè÷åñêè ñîçäàíû ðàâíîâåëèêèå èíòåðâàëû, êîëè÷åñòâî êîòîðûõ
îïðåäåëÿåòñÿ ïî ôîðìóëå Ñòåðäæåññà k = [1 + 3,22 ln(n)] ([õ] — öåëàÿ ÷àñòü ÷èñëà
õ). (Áîëåå ïîäðîáíî î ïîñòðîåíèè èíòåðâàëîâ ðå÷ü èäåò â ðàçäåëå 8.3.2.)
Ðèñ. 5.5. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Гистограмма
Ðàññìîòðèì îïöèè Парето (отсортированная гистограмма), Интегральный
процент è Вывод графика èç îáëàñòè Параметры вывода.
Åñëè óñòàíîâëåí òîëüêî ôëàæîê îïöèè Парето (отсортированная гистограмма),
òî âûâîäÿòñÿ òàáëèöà ÷àñòîò è òàáëèöà îòñîðòèðîâàííûõ â ïîðÿäêå óáûâàíèÿ
÷àñòîò. Åñëè òàêæå óñòàíîâëåí ôëàæîê îïöèè Вывод графика, âûâîäèòñÿ ãèñòîãðàììà îòñîðòèðîâàííûõ ÷àñòîò, êàê ïîêàçàíî íà ðèñ. 5.6.
152 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.6. Îòñîðòèðîâàííàÿ ãèñòîãðàììà
Åñëè óñòàíîâëåí òîëüêî ôëàæîê îïöèè Интегральный процент, òî âûâîäèòñÿ
òàáëèöà, ñîäåðæàùàÿ ÷àñòîòû è çíà÷åíèÿ èíòåãðàëüíîãî ïðîöåíòà. Åñëè åùå óñòàíîâëåí ôëàæîê îïöèè Вывод графика, ýòè äàííûå òàêæå îòîáðàæàþòñÿ ãðàôè÷åñêè, êàê ïîêàçàíî íà ðèñ. 5.7.
Ðèñ. 5.7. Ãèñòîãðàììà ÷àñòîò è ãðàôèê èíòåãðàëüíîãî ïðîöåíòà
Åñëè óñòàíîâëåíû ôëàæêè îïöèé Парето (отсортированная гистограмма)
è Интегральный процент, òî âûâîäÿòñÿ äâå òàáëèöû: îäíà ñîäåðæèò íåîòñîðòèðîâàííûå ÷àñòîòû è èíòåãðàëüíûå ïðîöåíòû, âòîðàÿ — îòñîðòèðîâàííûå ÷àñòîòû
è ñîîòâåòñòâóþùèå èíòåãðàëüíûå ïðîöåíòû (ðèñ. 5.8). Åñëè òàêæå óñòàíîâëåí
ôëàæîê îïöèè Вывод графика, âûâîäÿòñÿ ãèñòîãðàììà è ãðàôèê èíòåãðàëüíîãî
ïðîöåíòà, ïîñòðîåííûå ïî îòñîðòèðîâàííûì ÷àñòîòàì.
Глава 5. Надстройка Пакет анализа
153
Ðèñ. 5.8. Âûõîäíûå äàííûå (äâå òàáëèöû)
Íàêîíåö, åñëè óñòàíîâëåí ôëàæîê òîëüêî îïöèè Вывод графика, âûâîäÿòñÿ
òàáëèöà ÷àñòîò (íå îòñîðòèðîâàííàÿ) è ãèñòîãðàììà.
5.3. Генерация случайных чисел
Ýòî ñðåäñòâî ïðåäíàçíà÷åíî äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ ÷èñåë,
èìåþùèõ çàäàííîå ðàñïðåäåëåíèå, ò.å. äëÿ ïîëó÷åíèÿ ñëó÷àéíûõ âûáîðîê. Ñðåäñòâî èìååò âîçìîæíîñòü ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà, èìåþùèå ñëåäóþùèå
ðàñïðåäåëåíèÿ.
•
Ðàâíîìåðíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë â çàäàííîì èíòåðâàëå, äëÿ ÷åãî íåîáõîäèìî óêàçàòü
âåðõíþþ è íèæíþþ ãðàíèöû èíòåðâàëà.
•
Íîðìàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ íîðìàëüíîìó ðàñïðåäåëåíèþ. Çàäàåòñÿ ìàòåìàòè÷åñêîå îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå.
•
Áåðíóëëè. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïðèíèìàþùèõ òîëüêî çíà÷åíèå 0 èëè 1, â çàâèñèìîñòè îò çàäàííîé âåðîÿòíîñòè óñïåõà (èñõîäà “1”). (Î ðàñïðåäåëåíèè Áåðíóëëè ðå÷ü èäåò â ðàçäåëå 1.4.2.)
•
Áèíîìèàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ðàâíàÿ
êîëè÷åñòâó èñõîäîâ “1” â n íåçàâèñèìûõ èñïûòàíèÿõ.  ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.3). Çäåñü íåîáõîäèìî çàäàòü ÷èñëî èñïûòàíèé n è âåðîÿòíîñòü p.
•
Ïóàññîíà. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà ñ çàäàííûì ïàðàìåòðîì λ. (Î ðàñïðåäåëåíèè Ïóàññîíà ðå÷ü èäåò â ðàçäåëå 1.4.4.)
•
Ìîäåëüíîå. Ïðè âûáîðå ýòîãî ðàñïðåäåëåíèÿ íà ñàìîì äåëå ãåíåðèðóþòñÿ
íå ñëó÷àéíûå ÷èñëà, à ïîâòîðÿþùàÿñÿ ïîñëåäîâàòåëüíîñòü ÷ëåíîâ àðèôìåòè÷åñêîé ïðîãðåññèè, ïðè÷åì ÷ëåíû ïðîãðåññèè òàêæå ìîãóò ïîâòîðÿòüñÿ
çàäàííîå ÷èñëî ðàç. Äëÿ ýòîãî ðàñïðåäåëåíèÿ çàäàþòñÿ èíòåðâàë èçìåíåíèÿ
154 Часть II. Средства Excel для статистического анализа
÷ëåíîâ àðèôìåòè÷åñêîé ïðîãðåññèè, øàã ïðîãðåññèè, ÷èñëî ïîâòîðåíèé
÷ëåíîâ ïðîãðåññèè è ÷èñëî ïîâòîðåíèé ýòîé ïîñëåäîâàòåëüíîñòè ÷èñåë.
•
Äèñêðåòíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ çàäàííîìó äèñêðåòíîìó ðàñïðåäåëåíèþ. Äëÿ çàäàíèÿ ýòîãî ðàñïðåäåëåíèÿ íåîáõîäèìî óêàçàòü äèàïàçîí ÿ÷ååê, ñîñòîÿùèé èç äâóõ ñòîëáöîâ:
â ïåðâîì ñòîëáöå ñîäåðæàòñÿ çíà÷åíèÿ, à âî âòîðîì — âåðîÿòíîñòè êàæäîãî
çíà÷åíèÿ. Ñóììà âåðîÿòíîñòåé âî âòîðîì ñòîëáöå äîëæíà áûòü ðàâíà 1.
5.3.1. Опции диалогового окна Генерация случайных чисел
Äèàëîãîâîå îêíî Генерация случайных чисел ïðè çàäàíèè ðàçëè÷íûõ ðàñïðåäåëåíèé èìååò ðÿä îäèíàêîâûõ ýëåìåíòîâ, íî íàëè÷èå íåêîòîðûõ äðóãèõ îïöèé
çàâèñèò îò âûáðàííîãî òèïà ðàñïðåäåëåíèÿ. Âûáîð ðàñïðåäåëåíèÿ îñóùåñòâëÿåòñÿ â ðàñêðûâàþùåìñÿ ñïèñêå Распределение.
Ðàññìîòðèì ñíà÷àëà îáùèå ýëåìåíòû âñåõ äèàëîãîâûõ îêîí Генерация
случайных чисел.
 ïîëå ââîäà Число переменных óêàçûâàåòñÿ êîëè÷åñòâî ãåíåðèðóåìûõ âûáîðîê. Êàæäàÿ âûáîðêà ðàñïîëàãàåòñÿ â îòäåëüíîì ñòîëáöå. Ìàêñèìàëüíîå êîëè÷åñòâî âûáîðîê — 256 (ïî êîëè÷åñòâó ñòîëáöîâ â ðàáî÷åì ëèñòå Excel). Åñëè ýòî
÷èñëî íå ââåäåíî, òî áóäåò ñãåíåðèðîâàíà îäíà ñëó÷àéíàÿ âûáîðêà, èëè, åñëè
â ïîëå Выходной интервал óêàçàí äèàïàçîí ÿ÷ååê, â êîòîðîì áóäóò ðàñïîëàãàòüñÿ
ñãåíåðèðîâàííûå çíà÷åíèÿ, áóäóò çàïîëíåíû âñå ñòîëáöû ýòîãî äèàïàçîíà.
 ïîëå ââîäà Число случайных чисел çàäàåòñÿ êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ò.å. îáúåì ãåíåðèðóåìûõ âûáîðîê), îäíî è òî æå äëÿ âñåõ âûáîðîê. Åñëè
ýòî ÷èñëî íå ââåäåíî, òî áóäåò ñãåíåðèðîâàíî îäíî çíà÷åíèå, èëè, åñëè â ïîëå
Выходной интервал óêàçàí äèàïàçîí ÿ÷ååê, â êîòîðîì áóäóò ðàñïîëàãàòüñÿ ñãåíåðèðîâàííûå çíà÷åíèÿ, áóäóò çàïîëíåíû âñå ñòðîêè ýòîãî äèàïàçîíà.
 áîëüøèíñòâå äèàëîãîâûõ îêîí Генерация случайных чисел (êðîìå îêîí äëÿ
ìîäåëüíîãî è äèñêðåòíîãî ðàñïðåäåëåíèé) èìååòñÿ ïîëå ââîäà Случайное
рассеивание. ×èñëî, ââåäåííîå â ýòî ïîëå, çàäàåò íà÷àëüíîå çíà÷åíèå, êîòîðîå áóäåò èñïîëüçîâàíî â àëãîðèòìå ãåíåðàöèè ñëó÷àéíûõ ÷èñåë. Îáû÷íî ýòî ïîëå îñòàâëÿþò ïóñòûì. Îäíàêî, ÷òîáû ãåíåðèðîâàòü îäèíàêîâûå ïîñëåäîâàòåëüíîñòè ñëó÷àéíûõ ÷èñåë, íåîáõîäèìî ââåñòè ÷èñëî èç äèàïàçîíà îò 1 äî 32 767 (äîïóñêàþòñÿ
òîëüêî öåëûå ÷èñëà). Òîãäà â áóäóùåì ìîæíî ïîëó÷èòü òîò æå íàáîð âûáîðî÷íûõ
çíà÷åíèé, åñëè â ýòî ïîëå ñíîâà ââåñòè òî æå ñàìîå íà÷àëüíîå çíà÷åíèå.
Âñå äèàëîãîâûå îêíà Генерация случайных чисел èìåþò îáëàñòü Параметры;
îïöèè ýòîé îáëàñòè çàâèñÿò îò òèïà âûáðàííîãî ðàñïðåäåëåíèÿ. Íàçíà÷åíèå
áîëüøèíñòâà ýòèõ îïöèé î÷åâèäíî, íî íåêîòîðûå òðåáóþò ïîÿñíåíèé.
Ðàâíîìåðíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.9.
Çäåñü â îáëàñòè Параметры íàäî çàäàòü òîëüêî âåðõíþþ è íèæíþþ ãðàíèöû,
â ïðåäåëàõ êîòîðûõ ñîñðåäîòî÷åíî ðàñïðåäåëåíèå.
Íîðìàëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.10.
 îáëàñòè Параметры çàäàþòñÿ çíà÷åíèÿ ñðåäíåãî (ìàòåìàòè÷åñêîãî îæèäàíèÿ) è ñòàíäàðòíîå (ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå). Äëÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ ñðåäíåå ðàâíî 0, à ñòàíäàðòíîå îòêëîíåíèå — 1.
Глава 5. Надстройка Пакет анализа
155
Ðèñ. 5.9. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë
Ðèñ. 5.10. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
íîðìàëüíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë
Ðàñïðåäåëåíèå Áåðíóëëè. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
äàííîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.11.
Çäåñü â îáëàñòè Параметры çàäàåòñÿ òîëüêî îäèí ïàðàìåòð — âåðîÿòíîñòü p.
Áèíîìèàëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел
äëÿ ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.12.
Äëÿ ýòîãî ðàñïðåäåëåíèÿ çàäàþòñÿ çíà÷åíèÿ âåðîÿòíîñòè ð è êîëè÷åñòâî èñïûòàíèé n.
156 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.11. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàñïðåäåëåíèå
Áåðíóëëè
Ðèñ. 5.12. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
ñëó÷àéíûõ ÷èñåë, èìåþùèõ áèíîìèàëüíîå ðàñïðåäåëåíèå
Ðàñïðåäåëåíèå Ïóàññîíà. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
äàííîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.13.
Çäåñü â îáëàñòè Параметры çàäàåòñÿ òîëüêî îäèí ïàðàìåòð Лямбда.
Ìîäåëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
ýòîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.14.
Глава 5. Надстройка Пакет анализа
157
Ðèñ. 5.13. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàñïðåäåëåíèå
Ïóàññîíà
Ðèñ. 5.14. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ
çàäàííûõ ÷èñåë (ìîäåëüíîå ðàñïðåäåëåíèå)
Çäåñü çàäàþòñÿ íèæíÿÿ è âåðõíÿÿ ãðàíèöû ÷èñåë, øàã ïðîãðåññèè, ÷èñëî ïîâòîðåíèé çíà÷åíèé â ïîñëåäîâàòåëüíîñòè è ÷èñëî ïîâòîðåíèé ïîñëåäîâàòåëüíîñòè. Íà ðèñ. 5.15 ïîêàçàíû ñãåíåðèðîâàííûå ÷èñëà ñ ìîäåëüíûì ðàñïðåäåëåíèåì, ïàðàìåòðû êîòîðîãî çàäàíû íà ðèñ. 5.14.
158 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.15. Ñãåíåðèðîâàííûå ÷èñëà
Äèñêðåòíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ
ýòîãî òèïà ðàñïðåäåëåíèÿ âìåñòå ñ íåîáõîäèìûìè âõîäíûìè äàííûìè ïîêàçàíî
íà ðèñ. 5.16.
Ðèñ. 5.16. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ çàäàííîå äèñêðåòíîå ðàñïðåäåëåíèå
Глава 5. Надстройка Пакет анализа
159
Ðèñ. 5.17. Ñãåíåðèðîâàííûå ÷èñëà
Äëÿ çàäàíèÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ
â ïîëå Входной интервал значений и вероятностей íåîáõîäèìî óêàçàòü àäðåñ äèàïàçîíà
ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû è ñîîòâåòñòâóþùèå èì âåðîÿòíîñòè. Äèàïàçîí äîëæåí ñîñòîÿòü èç äâóõ ñòîëáöîâ: ëåâîãî, ñîäåðæàùåãî çíà÷åíèÿ, è ïðàâîãî, ñîäåðæàùåãî
âåðîÿòíîñòè,
êàê
ïîêàçàíî
íà
ðèñ. 5.16. Ñóììà âåðîÿòíîñòåé äîëæíà áûòü
ðàâíà 1. Íà ðèñ. 5.17 ïðåäñòàâëåíû ñãåíåðèðîâàííûå ÷èñëà ñ ðàñïðåäåëåíèåì, ïàðàìåòðû êîòîðîãî çàäàíû íà ðèñ. 5.16.
 çàêëþ÷åíèå îòìåòèì, ÷òî â Excel èìåþòñÿ è äðóãèå ñðåäñòâà ãåíåðèðîâàíèÿ ñëó÷àéíûõ âûáîðîê, íàïðèìåð ôóíêöèè СЛЧИС
è СЛУЧМЕЖДУ (ñì. ðàçäåë 4.13). Ïîäðîáíî çàäà÷à ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ âåëè÷èí ðàññìîòðåíà â ãëàâå 7.
5.4. Выборка
Ýòî ñðåäñòâî èç èñõîäíîãî ÷èñëîâîãî ìíîæåñòâà âûáèðàåò óêàçàííîå êîëè÷åñòâî ÷èñåë, ïðè÷åì ëèáî ñëó÷àéíûì îáðàçîì, ëèáî ñ çàäàííûì ïåðèîäîì
(íàïðèìåð, êàæäîå âòîðîå èëè êàæäîå äåñÿòîå ÷èñëî). Òàêóþ îïåðàöèþ âûáîðà
÷èñëîâûõ çíà÷åíèé èç çàäàííîãî ìíîæåñòâà ìîæíî òðàêòîâàòü êàê ñîçäàíèå âûáîðêè çàäàííîãî îáúåìà, åñëè èñõîäíîå ìíîæåñòâî ðàññìàòðèâàòü êàê ãåíåðàëüíóþ ñîâîêóïíîñòü. Ïîäîáíàÿ îïåðàöèÿ ÷àñòî ñîñòàâëÿåò îäèí èç ýòàïîâ ïðåäâàðèòåëüíîé îáðàáîòêè äàííûõ. Íàïðèìåð, åñëè èñõîäíàÿ âûáîðêà ñëèøêîì âåëèêà äëÿ îáðàáîòêè èëè ïîñòðîåíèÿ äèàãðàìì ëèáî åñëè èñõîäíûå äàííûå
ñîäåðæàò ïåðèîäè÷åñêóþ ñîñòàâëÿþùóþ, òî ìîæíî ñîçäàòü âûáîðêó, ñîäåðæàùóþ çíà÷åíèÿ òîëüêî èç îòäåëüíûõ ÷àñòåé ïåðèîäà.
5.4.1. Опции диалогового окна Выборка
Äèàëîãîâîå îêíî Выборка ïîêàçàíî íà ðèñ. 5.18. Àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé èñõîäíûé íàáîð ÷èñëîâûõ çíà÷åíèé, çàäàåòñÿ â ïîëå Входной
интервал. Åñëè ýòîò äèàïàçîí ñîñòîèò èç íåñêîëüêèõ ñòîëáöîâ, òî çíà÷åíèÿ ñíà÷àëà áóäóò èçâëåêàòüñÿ èç ïåðâîãî ñòîëáöà, çàòåì èç âòîðîãî ñòîëáöà è ò.ä. Ñðåäñòâî Выборка îòêàæåòñÿ ðàáîòàòü (âûâåäåò ñîîòâåòñòâóþùåå îêíî ïðåäóïðåæäåíèÿ), åñëè ñðåäè èñõîäíûõ äàííûõ èìåþòñÿ íå÷èñëîâûå çíà÷åíèÿ.
 îáëàñòè Метод выборки íåîáõîäèìî óêàçàòü, êàêèì ñïîñîáîì áóäóò âûáèðàòüñÿ çíà÷åíèÿ èç èñõîäíîãî ìíîæåñòâà. Åñëè óñòàíîâëåí ïåðåêëþ÷àòåëü
Периодический, òî èç èñõîäíîãî ìíîæåñòâà áóäåò âûáðàíî êàæäîå n-å çíà÷åíèå;
÷èñëî n çàäàåòñÿ â ïîëå ââîäà Период. Êîëè÷åñòâî âûáðàííûõ çíà÷åíèé áóäåò
ðàâíî êîëè÷åñòâó çíà÷åíèé â èñõîäíîì äèàïàçîíå, äåëåííîìó íà çíà÷åíèå â ïîëå
Период. Åñëè óñòàíîâëåí ïåðåêëþ÷àòåëü Случайный, çíà÷åíèÿ èç èñõîäíîãî
ìíîæåñòâà âûáèðàþòñÿ ñëó÷àéíûì îáðàçîì; êîëè÷åñòâî âûáèðàåìûõ çíà÷åíèé
çàäàåòñÿ â ïîëå Число выборок.
160 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.18. Äèàëîãîâîå îêíî Выборка
5.5. Ранг и персентиль
Ýòî ñðåäñòâî ïîçâîëÿåò ñîçäàòü òàáëèöó, ñîäåðæàùóþ ïîðÿäêîâûé è ïðîöåíòíûé ðàíãè äëÿ êàæäîãî çíà÷åíèÿ â çàäàííîì íàáîðå äàííûõ, ïðè ýòîì çíà÷åíèÿ
óïîðÿäî÷èâàþòñÿ â ïîðÿäêå óáûâàíèÿ. Íà ðèñ. 5.19 ïîêàçàíû äèàëîãîâîå îêíî
Ранг и персентиль è èñõîäíûå äàííûå, íà ðèñ. 5.20 — ðåçóëüòàò ïðèìåíåíèÿ ýòîãî ñðåäñòâà. Èòîãîâàÿ òàáëèöà ñîäåðæèò ïîðÿäêîâûé íîìåð âûáîðî÷íîãî çíà÷åíèÿ, ñòîëáåö âûáîðî÷íûõ çíà÷åíèé, îòñîðòèðîâàííûõ â ïîðÿäêå óáûâàíèÿ, ñòîëáåö ðàíãîâ è ñòîëáåö ïðîöåíòíûõ ðàíãîâ ýòèõ çíà÷åíèé, ïðè÷åì íàèáîëüøåìó
çíà÷åíèþ ïðèñâàèâàåòñÿ ðàíã 1 è ïðîöåíòíûé ðàíã 100%, à íàèìåíüøåìó —
íàèáîëüøèé ðàíã è ïðîöåíòíûé ðàíã, ðàâíûé 0%.
Åñëè èìååòñÿ ãðóïïà ñîâïàäàþùèõ çíà÷åíèé, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ðàíãó ïåðâîãî ÷èñëà èç ãðóïïû ñîâïàäàþùèõ çíà÷åíèé. Çíà÷åíèþ, ñëåäóþùåìó çà ýòîé ãðóïïîé, ïðèñâàèâàåòñÿ ðàíã, áîëüøèé ðàíãà ñîâïàäàþùèõ çíà÷åíèé íà ÷èñëî ýòèõ îäèíàêîâûõ çíà÷åíèé. Ïðîöåíòíûé ðàíã Ti äëÿ
âûáîðî÷íîãî çíà÷åíèÿ xi ðàññ÷èòûâàåòñÿ ïî ôîðìóëå Ti =
n − Ri
⋅100% , ãäå Ri —
n −1
ðàíã çíà÷åíèÿ xi, ðàññ÷èòàííûé ïðè óñëîâèè óïîðÿäî÷èâàíèÿ äàííûõ ïî óáûâàíèþ, n — îáúåì âûáîðêè.
5.6. Двухвыборочный z"тест для средних
Ýòî ñðåäñòâî ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå, ïðè èçâåñòíûõ äèñïåðñèÿõ ýòèõ ðàñïðåäåëåíèé
(ñì. ðàçäåë 2.4.2). Ïóñòü èìåþòñÿ äâå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è y1,
y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m, èçâëå÷åííûå èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2. Ïðîâåðÿåòñÿ íóëåâàÿ
Глава 5. Надстройка Пакет анализа
161
Ðèñ. 5.19. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Ранг и персентиль
Ðèñ. 5.20. Ðåçóëüòàò âû÷èñëåíèé
ãèïîòåçà Í0: µ1 – µ2 = δ (δ çàäàíî). Z-òåñò ïîçâîëÿåò ïðîâåðèòü ãèïîòåçó Í0 ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1:
µ1 < µ2 + δ. Êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå
162 Часть II. Средства Excel для статистического анализа
z=
x − y −δ
σ12 σ12
+
n m
,
ãäå x è y — âûáîðî÷íûå ñðåäíèå ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê.
Äëÿ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé êðèòåðèàëüíàÿ ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ïîýòîìó
ïðè çàäàííîì óðîâíå çíà÷èìîñòè α êðèòè÷åñêàÿ îáëàñòü ñòðîèòñÿ íà îñíîâå
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ — âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 –
α äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ëèáî êâàíòèëü t ïîðÿäêà 1 – α/2 äëÿ ïðîâåðêè ãèïîòåç íåðàâåíñòâà. Íóëåâàÿ ãèïîòåçà î ðàâåíñòâå ïðèíèìàåòñÿ, åñëè
|z| < t (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ ïðèíèìàåòñÿ, åñëè z < t; è ïðè êîíêóðèðóþùåé ãèïîòåçå Í1:
µ1 < µ2 + δ íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà –t < z.
Ðàññìîòðèì ïðèìåð. Èìååòñÿ äâå âûáîðêè1 îáúåìîì ñîîòâåòñòâåííî 50 è 20
çíà÷åíèé, ïîêàçàííûå íà ðèñ. 5.21. Îáå èìåþò íîðìàëüíîå ðàñïðåäåëåíèå, ïåðâàÿ — ñòàíäàðòíîå (ò.å. µ1 = 0 è σ12 = 1), à äëÿ âòîðîé — µ2 = 1 è σ22 = 2. Ïðîâåðèì ñ ïîìîùüþ ñðåäñòâà Двухвыборочный z-тест для средних íóëåâóþ ãèïîòåçó,
÷òî µ2 – µ1 = 1,5 äëÿ ðàçíûõ ñëó÷àåâ êîíêóðèðóþùèõ ãèïîòåç. Çàïîëíåííîå äèàëîãîâîå îêíî äëÿ ýòîãî ïðèìåðà òàêæå ïîêàçàíî íà ðèñ. 5.21.
Ðèñ. 5.21. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухвыборочный z-тест для средних
Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå
Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå
ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал переменной 2
1
Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел.
Глава 5. Надстройка Пакет анализа
163
óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. Â ïîëÿõ ââîäà Дисперсия переменной 1
è Дисперсия переменной 2 ââîäÿòñÿ çíà÷åíèÿ äèñïåðñèé ñîîòâåòñòâåííî ïåðâîé
è âòîðîé âûáîðîê.  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный z-тест для средних ïîêàçàí íà ðèñ. 5.22.
Ðèñ. 5.22. Ðåçóëüòàò âû÷èñëåíèé
 èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Среднее — âûáîðî÷íûå ñðåäíèå âûáîðîê.
•
Известная дисперсия — äèñïåðñèè âûáîðîê, êîòîðûå óêàçàíû â äèàëîãîâîì îêíå.
•
Наблюдения — îáúåìû âûáîðîê.
•
Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå.
•
z — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
P(Z<=z) одностороннее — âåðîÿòíîñòü P(Õ≤z), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, z — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
z критическое одностороннее — çíà÷åíèå êâàíòèëÿ ïîðÿäêà 1 – α/2.
•
P(Z<=z) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|z|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, z — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
z критическое двухстороннее — çíà÷åíèå êâàíòèëÿ ïîðÿäêà 1 – α.
Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íåò îñíîâàíèé îòâåðãàòü
íóëåâóþ ãèïîòåçó ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ.
Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ZТЕСТ (ñì. ðàçäåë 4.8.1) âû÷èñëÿåò âåðîÿòíîñòü
P(Z<=z) двухстороннее.
164 Часть II. Средства Excel для статистического анализа
5.7. Двухвыборочный t"тест с одинаковыми
дисперсиями
Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå)
ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè
â ïðåäïîëîæåíèè, ÷òî äèñïåðñèè ðàâíû. Ýòîò êðèòåðèé, íàçûâàåìûé t-òåñòîì
èëè òåñòîì Ñòüþäåíòà, ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2.
Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ (µ1 è µ2 — íåèçâåñòíûå
ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå
îêíî Двухвыборочный t-тест с одинаковыми дисперсиями ïîêàçàíû íà ðèñ. 5.23. Âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ îäíîé è òîé æå äèñïåðñèåé, ðàâíîé 1, è ìàòåìàòè÷åñêèìè îæèäàíèÿìè 0 è 1 ñîîòâåòñòâåííî2. Ïðîâåðèì ãèïîòåçó, ÷òî µ2 – µ1 = 2 (íà ñàìîì äåëå µ2 – µ1 = 1).
Ðèñ. 5.23. Èñõîäíûå äàííûå
с одинаковыми дисперсиями
è
äèàëîãîâîå
îêíî
Двухвыборочный t-тест
Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå
Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå
ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал
переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü
èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ
t-тест
çíà÷èìîñòè α.
Ðåçóëüòàò
âû÷èñëåíèé
ñðåäñòâà
Двухвыборочный
с одинаковыми дисперсиями ïîêàçàí íà ðèñ. 5.24.
2
Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел.
Глава 5. Надстройка Пакет анализа
165
Ðèñ. 5.24. Ðåçóëüòàò âû÷èñëåíèé
 èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè.
•
Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê.
•
Наблюдения — îáúåìû âûáîðîê.
•
Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå.
•
Объединенная дисперсия — “ñðåäíÿÿ” îöåíêà äèñïåðñèè; ðàññ÷èòûâàåòñÿ
ïî ôîðìóëå s 2 =
(n − 1) s12 + (m − 1) s22
, ãäå n è m — îáúåìû âûáîðîê, si2 —
n+m−2
îöåíêè äèñïåðñèé (èõ çíà÷åíèÿ ïðèâîäÿòñÿ â ñòðîêå Дисперсия).
•
df — число степеней свободы; вычисляется как n + m – 2.
•
t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t =
n + m − 2( x − y − δ)
n+m
(n − 1) s12 + (m − 1) s22
nm
, èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ df
ñòåïåíÿìè ñâîáîäû.
•
P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
166 Часть II. Средства Excel для статистического анализа
•
P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì
ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ
ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ
ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t.
Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò îòâåðãíóòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ.
Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 2 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее.
5.8. Двухвыборочный t"тест с различными
дисперсиями
Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå)
ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè è ðàçëè÷íûìè
äèñïåðñèÿìè. Ýòîò êðèòåðèé òàêæå íàçûâàåòñÿ t-òåñòîì èëè òåñòîì Ñòüþäåíòà
äëÿ íåðàâíûõ äèñïåðñèé, ëèáî êðèòåðèåì Ôèøåðà–Áåðåíñà è ïîäðîáíî îïèñûâàåòñÿ â ðàçäåëå 2.4.2.
Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå
ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ (µ1
è µ2 — íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Ïîâòîðèì òåñò íà ïðèìåðå äàííûõ èç ïðåäûäóùåãî ðàçäåëà, ò.å. âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ îäíîé è òîé æå äèñïåðñèåé, ðàâíîé 1,
è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî 0 è 1. Ïðîâåðèì ãèïîòåçó, ÷òî
µ2 – µ1 = 2 (íà ñàìîì äåëå µ2 – µ1 = 1). Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Двухвыборочный t-тест с различными дисперсиями ïîêàçàíû íà ðèñ. 5.25.
Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå
Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå
ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал
переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü
èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ
çíà÷èìîñòè α.
Ðåçóëüòàò
âû÷èñëåíèé
ñðåäñòâà
Двухвыборочный
t-тест
с различными дисперсиями ïîêàçàí íà ðèñ. 5.26.
 èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè.
•
Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê.
Глава 5. Надстройка Пакет анализа
167
Ðèñ. 5.25. Èñõîäíûå äàííûå
с различными дисперсиями
è
äèàëîãîâîå
îêíî
Двухвыборочный t-тест
Ðèñ. 5.26. Ðåçóëüòàò âû÷èñëåíèé
•
Наблюдения — îáúåìû âûáîðîê.
•
Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå.
168 Часть II. Средства Excel для статистического анализа
•
df — число степеней свободы; вычисляется по формуле
 s12 s22 
 + 
 n m
2
( s12 n) 2 ( s22 m)2
+
n −1
m −1
, где
s12 и s22 — несмещенные оценки дисперсий (их значения приводятся в строке
Дисперсия), n и m — объемы соответственно первой и второй выборок.
•
t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t =
x − y −δ
s12 s22
+
n m
, èìååò ðàñïðåäåëåíèå, áëèçêîå ê ðàñïðåäåëåíèþ Ñòüþ-
äåíòà ñ df ñòåïåíÿìè ñâîáîäû.
•
P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
•
P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì
ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ
ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ
ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t.
Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò îòâåðãíóòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ.
Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 3 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее.
5.9. Парный двухвыборочный t"тест для средних
Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå)
ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ çàâèñèìûõ âûáîðîê, èìåþùèõ
íîðìàëüíûå ðàñïðåäåëåíèÿ. Ýòîò êðèòåðèé òàêæå íàçûâàåòñÿ t-òåñòîì èëè òåñòîì Ñòüþäåíòà äëÿ ïàðíûõ íàáëþäåíèé è ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2.
Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå
ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ
(µ1 è µ2 — íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Ðàññìîòðèì
ïðèìåð, êîãäà âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî 0 è 1.
Глава 5. Надстройка Пакет анализа
169
Ïðîâåðèì ãèïîòåçó, ÷òî µ2 – µ1 = 1,5 (íà ñàìîì äåëå µ2 – µ1 = 1). Èñõîäíûå
äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Парный двухвыборочный t-тест для
средних ïîêàçàíû íà ðèñ. 5.27.
Ðèñ. 5.27. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Парный двухвыборочный t-тест
для средних
Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå
Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå
ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал
переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü
èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ
çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Парный двухвыборочный t-тест для
средних ïîêàçàí íà ðèñ. 5.28.
 èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè.
•
Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê.
•
Наблюдения — îáúåìû âûáîðîê.
•
Корреляция Пирсона — âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè; âû÷èñëÿåòñÿ
n
∑ ( x − x )( y
i
ïî ôîðìóëå r =
i
− y)
i =1
n
.
n
∑ (x − x) ⋅ ∑ ( y
2
i
i =1
•
i
− y)
2
i =1
Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå.
170 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.28. Ðåçóëüòàò âû÷èñëåíèé
•
df — число степеней свободы, равное n – 1.
•
t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t =
d −δ
, ãäå d =
1 n
1 n
( xi − yi ) , Sn2 = ∑ ( xi − yi − d ) 2 , è èìååò ðàñ∑
n i =1
n i =1
Sn / n
ïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
•
P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà,
èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
•
P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû.
Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì
ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ
ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ
ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t.
Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò ïðèíÿòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ.
Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 1 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее.
Глава 5. Надстройка Пакет анализа
171
5.10. Двухвыборочный F"тест для дисперсий
Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé Ôèøåðà ïðîâåðêè ðàâåíñòâà äèñïåðñèé äâóõ
íåçàâèñèìûõ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé
ñ äèñïåðñèÿìè ñîîòâåòñòâåííî σ12 è σ 22 . Êðèòåðèé ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2.
Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: σ12 = σ 22 ïðîòèâ êîíêóðèðóþùåé ãèïîòåçû Í1: σ12 ≠ σ 22 .
Ðàññìîòðèì ïðèìåð, êîãäà âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ ðàâíûìè äèñïåðñèÿìè 1,5. Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Двухвыборочный F-тест для дисперсий ïîêàçàíû íà ðèñ. 5.29.
Ðèñ. 5.29. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухвыборочный F-тест для дисперсий
Îòìåòèì, ÷òî ïåðâîé (â ïîëå Входной интервал 1) äîëæíà çàäàâàòüñÿ âûáîðêà,
èìåþùàÿ áîëüøóþ äèñïåðñèþ.  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный F-тест для дисперсий
ïîêàçàí íà ðèñ. 5.30.
 èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè.
•
Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê.
•
Наблюдения — îáúåìû âûáîðîê.
•
df — числа степеней свободы, равные n – 1 è m – 1; n è m — îáúåìû âûáîðîê.
•
F — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, âû÷èñëÿåìîé ïî ôîðìóëå
F=
S x2
,
S y2
ãäå
S x2 =
1 n
∑ ( xi − x )2 ,
n i =1
S y2 =
1 m
∑ ( yi − y )2 ,
m i =1
è
èìåþùåé
F-
ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1 (î Fðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7).
172 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.30. Ðåçóëüòàò âû÷èñëåíèé
•
P(F<=f) одностороннее — âåðîÿòíîñòü P(Õ≤F), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñ df ñòåïåíÿìè ñâîáîäû, F — ïîäñ÷èòàííîå
çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè.
•
F критическое одностороннее — çíà÷åíèå êâàíòèëÿ t ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñ df ñòåïåíÿìè ñâîáîäû.
Íóëåâàÿ ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè F < t (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ). Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò ïðèíÿòü.
Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ФТЕСТ (ñì. ðàçäåë 4.8.3) âû÷èñëÿåò óäâîåííóþ âåðîÿòíîñòü P(F<=f) одностороннее.
5.11. Однофакторный дисперсионный анализ
Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé íåñêîëüêèõ íåçàâèñèìûõ âûáîðîê, ïîñòðîåííûé íà îñíîâå äèñïåðñèîííîãî àíàëèçà. Îäíîôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.4.2. Çäåñü ïîêàæåì ïðèìåíåíèå ñðåäñòâà Однофакторный дисперсионный
анализ è îïèøåì åãî âûõîäíûå äàííûå.
Íà ðèñ. 5.31 ïîêàçàíû òðè âûáîðêè, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå
ñ ìàòåìàòè÷åñêèìè îæèäàíèÿìè 0, 0,5 è 1 è ñðåäíåêâàäðàòè÷åñêèìè îòêëîíåíèÿìè
1, 2 è 3 ñîîòâåòñòâåííî. Îáúåìû âûáîðîê — 50, 40 è 30 çíà÷åíèé. (Âûáîðêè ñãåíåðèðîâàíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел.) Íà ðèñ. 5.31 òàêæå
ïîêàçàíî çàïîëíåííîå äèàëîãîâîå îêíî Однофакторный дисперсионный анализ.
Îáðàùàåì âíèìàíèå, ÷òî âñå òðè âûáîðêè çàäàþòñÿ â âèäå îäíîãî äèàïàçîíà ÿ÷ååê.  ñëó÷àå, êîãäà âûáîðêè èìåþò ðàçíûå ðàçìåðû, äèàïàçîí çàäàåòñÿ â ñîîòâåòñòâèè ñ íàèáîëüøåé âûáîðêîé è íåèçáåæíî ñîäåðæèò ïóñòûå ÿ÷åéêè. Íî
ñðåäñòâî ïðàâèëüíî îïðåäåëÿåò îáúåìû âûáîðîê. Òàêæå îòìåòèì, ÷òî â äàííîì
ñëó÷àå ðåçóëüòàòû àíàëèçà áóäóò âûâîäèòüñÿ íà îòäåëüíûé ðàáî÷èé ëèñò ñ èìåíåì Результаты, êîòîðûé àâòîìàòè÷åñêè âñòàâèòñÿ â òåêóùóþ ðàáî÷óþ êíèãó.
Глава 5. Надстройка Пакет анализа
173
Ðèñ. 5.31. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Однофакторный дисперсионный анализ
Íà ðèñ. 5.32 ïîêàçàíû ðåçóëüòàòû, âûâîäèìûå ñðåäñòâîì Однофакторный
дисперсионный анализ. Îíè ïðåäñòàâëåíû â âèäå äâóõ òàáëèö, îçàãëàâëåííûõ
ИТОГИ è Дисперсионный анализ.  òàáëèöå ИТОГИ âûâîäÿòñÿ îñíîâíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðîê: â ñòîëáöå Счет — îáúåìû âûáîðîê, â ñòîëáöå Сумма — ñóììû âûáîðî÷íûõ çíà÷åíèé, â ñòîëáöàõ Среднее è Дисперсия —
ñîîòâåòñòâåííî âûáîðî÷íûå ñðåäíèå è äèñïåðñèè.
Ðèñ. 5.32. Ðåçóëüòàò âû÷èñëåíèé
Çíà÷åíèÿ â ïåðâûõ ÷åòûðåõ ñòîëáöàõ òàáëèöû Дисперсионный анализ ïîâòîðÿþò çíà÷åíèÿ èç äèñïåðñèîííîé òàáëèöû (ñì. ðàçäåë 3.4.2).  ñòîëáöå SS ïðèâåäåíû ñóììû êâàäðàòîâ (ìåæãðóïïîâàÿ, âíóòðèãðóïïîâàÿ è ïîëíàÿ); â ñòîëáöå df —
174 Часть II. Средства Excel для статистического анализа
çíà÷åíèÿ ñòåïåíåé ñâîáîäû, à â ñòîëáöå MS — äèñïåðñèè, ìåæãðóïïîâàÿ è âíóòðèãðóïïîâàÿ.  ñòîëáöå F çàïèñàíî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, â ñòîëáöå РЗначение — çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñ df ñòåïåíÿìè ñâîáîäû (î F-ðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7).  ñòîëáöå F критическое ïðèâîäèòñÿ êðèòè÷åñêîå çíà÷åíèå t, ðàññ÷èòàííîå â ñîîòâåòñòâèè ñ çàäàííûì óðîâíåì çíà÷èìîñòè (ïàðàìåòð Альфа). Ôîðìóëû äëÿ âû÷èñëåíèÿ âñåõ ïåðå÷èñëåííûõ çíà÷åíèé ïðèâåäåíû â ðàçäåëå 3.4.2.
Íóëåâàÿ ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé âñåõ âûáîðîê ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ F критическое.  íàøåì ïðèìåðå
ýòó ãèïîòåçó ñëåäóåò îòâåðãíóòü.
5.12. Двухфакторный дисперсионный анализ
с повторениями
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.5.3. Çäåñü ðàññìîòðèì ñòðóêòóðó âõîäíûõ äàííûõ äëÿ ðàáîòû ñ ýòèì ñðåäñòâîì è îïèøåì âûõîäíûå ðåçóëüòàòû. Ñòðóêòóðà âõîäíûõ äàííûõ ïðåäñòàâëåíà íà ðèñ. 5.33
(îáîçíà÷åíèÿ è ïîÿñíåíèÿ ïðèâåäåíû â ðàçäåëå 3.5.3): â ñòðîêå 1 ïîêàçàíû îáîçíà÷åíèÿ óðîâíåé ôàêòîðà β; â ñòîëáöå À — îáîçíà÷åíèÿ óðîâíåé ôàêòîðà γ;
â äàííîì ñëó÷àå èìååòñÿ òðè âûáîðêè, ïîýòîìó ïîä îáùèì îáîçíà÷åíèåì óðîâíåé
ôàêòîðà γ çàïèñàíû òðè ñòðîêè ÷èñëîâûõ äàííûõ. Òàêèì îáðàçîì, â äèàïàçîíå,
íàïðèìåð, Ñ8:Ñ10 ñîäåðæàòñÿ âûáîðî÷íûå çíà÷åíèÿ, ñîîòâåòñòâóþùèå âòîðîìó
óðîâíþ ôàêòîðà β è òðåòüåìó óðîâíþ ôàêòîðà γ.
Ðèñ. 5.33. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухфакторный дисперсионный
анализ с повторениями
Äèàëîãîâîå îêíî ðàññìàòðèâàåìîãî çäåñü ñðåäñòâà ïîêàçàíî íà ðèñ. 5.33.
 ïîëå Входной интервал óêàçûâàåòñÿ äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âõîäíûå
äàííûå, âêëþ÷àÿ çàãîëîâêè.  ïîëå Число строк для выборки óêàçûâàåòñÿ êî-
Глава 5. Надстройка Пакет анализа
175
ëè÷åñòâî ðàññìàòðèâàåìûõ âûáîðîê, â äàííîì ñëó÷àå ââåäåíî ÷èñëî 3.  ïîëå
Альфа, êàê îáû÷íî, óêàçûâàåòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè.
Íà ðèñ. 5.34 ïîêàçàíû âûõîäíûå ðåçóëüòàòû ðàáîòû äàííîãî ñðåäñòâà, âûâåäåííûå íà îòäåëüíûé ðàáî÷èé ëèñò. Âûõîäíûå ðåçóëüòàòû ñãðóïïèðîâàíû â íåñêîëüêî
òàáëèö.  ïåðâîé òàáëèöå, îçàãëàâëåííîé ИТОГИ è ñîñòîÿùåé èç íåñêîëüêèõ ïîäòàáëèö (ïî êîëè÷åñòâó óðîâíåé ôàêòîðà γ), ïðèâîäÿòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè
âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèõ êàæäîìó ñî÷åòàíèþ óðîâíåé ôàêòîðà β
è ôàêòîðà γ: êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ñòðîêà Счет), ñóììà âûáîðî÷íûõ
çíà÷åíèé (ñòðîêà Сумма), âûáîðî÷íîå ñðåäíåå (ñòðîêà Среднее) è âûáîðî÷íàÿ äèñïåðñèÿ (ñòðîêà Дисперсия). Íà ðèñ. 5.34 ïîêàçàíà òàêàÿ ïîäòàáëèöà äëÿ ïåðâîãî
óðîâíÿ ôàêòîðà γ (òàáëèöà îáîçíà÷åíà êàê Гамма 1), äðóãèå ïîäîáíûå ïîäòàáëèöû,
ñîîòâåòñòâóþùèå äðóãèì óðîâíÿì ôàêòîðà γ, íà ýòîì ðèñóíêå íå ïîêàçàíû.
 ñòîëáöå Итого ïîäòàáëèö âûâîäÿòñÿ òàêèå æå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè
âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèå îäíîìó óðîâíþ ôàêòîðà γ: êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, âûáîðî÷íîå ñðåäíåå è âûáîðî÷íàÿ äèñïåðñèÿ (âû÷èñëÿåòñÿ ïî
âñåì çíà÷åíèÿì äàííîãî óðîâíÿ îòíîñèòåëüíî îáùåãî ñðåäíåãî).  êîíöå òàáëèöû
ИТОГИ âûâîäèòñÿ ïîäòàáëèöà Итого, â êîòîðîé ïðèâåäåíû òå æå õàðàêòåðèñòèêè,
íî ïîäñ÷èòàííûå ïî âûáîðî÷íûì çíà÷åíèÿì äëÿ êàæäîãî óðîâíÿ ôàêòîðà β.
Ðèñ. 5.34. Âûõîäíûå ðåçóëüòàòû ðàáîòû
дисперсионный анализ с повторениями
ñðåäñòâà
Двухфакторный
 íèæíåé ÷àñòè âûõîäíûõ ðåçóëüòàòîâ ïðèâåäåíà äèñïåðñèîííàÿ òàáëèöà
(îáîçíà÷åíèÿ è âû÷èñëÿþùèå ôîðìóëû äàíû â ðàçäåëå 3.5.3). Çäåñü â ïåðâîì
ñòîëáöå, îáîçíà÷åííîì SS, âûâåäåíû ñóììû êâàäðàòîâ: ñîîòâåòñòâåííî SS1, SS2,
SS3, SS4 è â ñòðîêå Итого — SS. Â ñòîëáöå df ïðèâåäåíû ñòåïåíè ñâîáîäû ñóìì
êâàäðàòîâ, à â ñòîëáöå MS — çíà÷åíèÿ ñîîòâåòñòâóþùèõ äèñïåðñèé.  ñòîëáöå F
âû÷èñëåíû çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê, ò.å. îòíîøåíèÿ äèñïåðñèé s12 ,
s22 , s32 ê äèñïåðñèè s42 .
176 Часть II. Средства Excel для статистического анализа
 ñòîëáöå Р-Значение âû÷èñëÿþòñÿ âåðîÿòíîñòè Ð(Õ ≥ F), ãäå Õ — ñëó÷àéíàÿ
âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ
ïðèâåäåíû â ñòîëáöå df: ïåðâîå çíà÷åíèå ñòåïåíè ñâîáîäû — èç ñîîòâåòñòâóþùåé
ñòðîêè ýòîãî ñòîëáöà, à âòîðîå — âñåãäà èç ÷åòâåðòîé ñòðîêè, F — çíà÷åíèå èç
ñòîëáöà F. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå F43 (ñì. ðèñ. 5.34), ìîæíî âû÷èñëèòü
ïî ôîðìóëå Excel =FРАСП(E43;C43;C46). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè âåðîÿòíîñòü áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè
âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ.
 ñòîëáöå F критическое âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ, ñîîòâåòñòâóþùèå çàäàííîìó â äèàëîãîâîì îêíå Двухфакторный дисперсионный анализ
с повторениями óðîâíþ çíà÷èìîñòè α. Ýòè çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè
ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþòñÿ òàê æå, êàê ïðè âû÷èñëåíèè âåðîÿòíîñòåé èç ñòîëáöà Р-Значение. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå G43 (ñì. ðèñ. 5.34) ìîæíî âû÷èñëèòü ïî ôîðìóëå
Excel =FРАСПОБР(0,05;C43;C46). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè çíà÷åíèå
â ýòîì ñòîëáöå áîëüøå çíà÷åíèÿ â ñòîëáöå F òîé æå ñòðîêè, òî íóëåâàÿ ãèïîòåçà
îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Çäåñü
ïðèíèìàþòñÿ âñå òðè íóëåâûå ãèïîòåçû îá îòñóòñòâèè âëèÿíèÿ ôàêòîðîâ β è γ
è èõ âçàèìíîãî âëèÿíèÿ. Îäíàêî çíà÷åíèå â ñòîëáöå F òðåòüåé ñòðîêè
(ñîîòâåòñòâóåò âçàèìíîìó âëèÿíèþ ôàêòîðîâ) çíà÷èòåëüíî áîëüøå àíàëîãè÷íûõ
çíà÷åíèé äëÿ îòäåëüíûõ ôàêòîðîâ, è íà ýòî íåîáõîäèìî îáðàòèòü âíèìàíèå.
5.13. Двухфакторный дисперсионный анализ
без повторений
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.5.3. Ñòðóêòóðà
âõîäíûõ äàííûõ ïîêàçàíà íà ðèñ. 5.35 (îáîçíà÷åíèÿ è ïîÿñíåíèÿ äàíû â ðàçäåëå 3.5.3): â ñòðîêå 1 ïðèâîäÿòñÿ îáîçíà÷åíèÿ óðîâíåé ôàêòîðà β; â ñòîëáöå À —
îáîçíà÷åíèÿ óðîâíåé ôàêòîðà γ; â äèàïàçîíå, îáîçíà÷åííîì ýòèìè çàãîëîâêàìè,
ââåäåíû ÷èñëîâûå äàííûå.
Äèàëîãîâîå îêíî ýòîãî ñðåäñòâà ïîêàçàíî íà ðèñ. 5.35. Â ïîëå Входной
интервал óêàçûâàåòñÿ äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âõîäíûå äàííûå; åñëè â ýòîò
äèàïàçîí âêëþ÷åíû çàãîëîâêè ñòðîê è ñòîëáöîâ, òî ñëåäóåò óñòàíîâèòü ôëàæîê
îïöèè Метки.  ïîëå Альфа óêàçûâàåòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè.
Íà ðèñ. 5.36 ïðåäñòàâëåíû âûõîäíûå ðåçóëüòàòû ðàáîòû äàííîãî ñðåäñòâà,
âûâåäåííûå íà îòäåëüíûé ðàáî÷èé ëèñò. Âûõîäíûå ðåçóëüòàòû ñãðóïïèðîâàíû
â äâå òàáëèöû.  ïåðâîé òàáëèöå, îçàãëàâëåííîé ИТОГИ, ïðèâîäÿòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèõ êàæäîìó óðîâíþ
ôàêòîðà β (ãðóïïèðîâêà ïî ñòîëáöàì) è êàæäîìó óðîâíþ ôàêòîðà γ (ãðóïïèðîâêà
ïî ñòðîêà): êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ñòîëáåö Счет), ñóììà âûáîðî÷íûõ
çíà÷åíèé (ñòîëáåö Сумма), âûáîðî÷íîå ñðåäíåå (ñòîëáåö Среднее) è âûáîðî÷íàÿ
äèñïåðñèÿ (ñòîëáåö Дисперсия).
 íèæíåé ÷àñòè âûõîäíûõ ðåçóëüòàòîâ ïðèâåäåíà äèñïåðñèîííàÿ òàáëèöà
(îáîçíà÷åíèÿ è âû÷èñëÿþùèå ôîðìóëû äàíû â ðàçäåëå 3.5.3). Çäåñü â ïåðâîì
Глава 5. Надстройка Пакет анализа
177
ñòîëáöå, îáîçíà÷åííîì SS, âûâåäåíû ñóììû êâàäðàòîâ: ñîîòâåòñòâåííî SS1, SS2,
SS3 è â ñòðîêå Итого — SS.  ñòîëáöå df ïðèâåäåíû ñòåïåíè ñâîáîäû ñóìì êâàäðàòîâ, à â ñòîëáöå MS — çíà÷åíèÿ ñîîòâåòñòâóþùèõ äèñïåðñèé.  ñòîëáöå F âû÷èñëåíû çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê, ò.å. îòíîøåíèÿ äèñïåðñèé s12 è s22
ê äèñïåðñèè s32 .
Ðèñ. 5.35. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухфакторный дисперсионный анализ без повторений
Ðèñ. 5.36. Âûõîäíûå ðåçóëüòàòû ðàáîòû ñðåäñòâà Двухфакторный дисперсионный анализ без повторений
178 Часть II. Средства Excel для статистического анализа
 ñòîëáöå Р-Значение âû÷èñëÿþòñÿ âåðîÿòíîñòè Ð(Õ ≥ F), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ ïðèâåäåíû â ñòîëáöå df: ïåðâîå çíà÷åíèå ñòåïåíè ñâîáîäû — èç ñîîòâåòñòâóþùåé ñòðîêè
ýòîãî ñòîëáöà, à âòîðîå — âñåãäà èç òðåòüåé ñòðîêè, F — çíà÷åíèå èç ñòîëáöà F. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå Å18 (ñì. ðèñ. 5.36) ìîæíî âû÷èñëèòü ïî ôîðìóëå Excel
=FРАСП(D18;C18;C20). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì
âëèÿíèè ôàêòîðîâ: åñëè âåðîÿòíîñòü áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ.
 ñòîëáöå F критическое âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ, ñîîòâåòñòâóþùèå çàäàííîìó â äèàëîãîâîì îêíå Двухфакторный дисперсионный анализ без
повторений óðîâíþ çíà÷èìîñòè α. Ýòè çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþòñÿ òàê æå, êàê ïðè âû÷èñëåíèè âåðîÿòíîñòåé èç ñòîëáöà Р-Значение. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå G18 (ñì. ðèñ. 5.36) ìîæíî âû÷èñëèòü ïî ôîðìóëå
Excel =FРАСПОБР(0,05;C18;C20). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè çíà÷åíèå
â ýòîì ñòîëáöå áîëüøå çíà÷åíèÿ â ñòîëáöå F òîé æå ñòðîêè, òî íóëåâàÿ ãèïîòåçà
îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Çäåñü
ïðèíèìàþòñÿ îáå íóëåâûå ãèïîòåçû îá îòñóòñòâèè âëèÿíèÿ ôàêòîðîâ β è γ.
5.14. Корреляция
Ýòî ñðåäñòâî âû÷èñëÿåò êîððåëÿöèîííóþ ìàòðèöó êîìïîíåíòîâ ìíîãîìåðíîé
âûáîðêè. Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû ðàâíû åäèíèöå, à âíåäèàãîíàëüíûå — êîýôôèöèåíòàì êîððåëÿöèè ñîîòâåòñòâóþùèõ êîìïîíåíòîâ (î êîýôôèöèåíòàõ êîððåëÿöèè ðå÷ü èäåò â ðàçäåëå 1.2.5). Íà ðèñ. 5.37 ïîêàçàíû ìíîãîìåðíàÿ âûáîðêà, èìåþùàÿ ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïðè÷åì ïåðâàÿ
ïàðà êîìïîíåíòîâ çàâèñèìà ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5. Ñ òàêèì æå êîýôôèöèåíòîì êîððåëÿöèè çàâèñèìû òðåòèé è ÷åòâåðòûé êîìïîíåíòû âûáîðêè.
Ïåðâàÿ è âòîðàÿ ïàðà êîìïîíåíòîâ ìåæäó ñîáîé íåçàâèñèìû.
Ðèñ. 5.37. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Корреляция
Глава 5. Надстройка Пакет анализа
179
Âíåäèàãîíàëüíûå ýëåìåíòû êîððåëÿöèîííîé ìàòðèöû ðàññ÷èòûâàþòñÿ ïî
ñòàíäàðòíûì ôîðìóëàì: êîýôôèöèåíò êîððåëÿöèè rxy ìåæäó êîìïîíåíòàìè õ
è ó ìíîãîìåðíîé âûáîðêè âû÷èñëÿåòñÿ êàê
n
∑ ( x − x )( y
i
rxy =
i
− y)
, ãäå x =
i =1
n
n
∑ (x − x) ⋅ ∑ ( y
2
i
i
i =1
− y )2
1 n
1 n
xi , y = ∑ yi , n — îáúåì âûáîðêè.
∑
n i =1
n i =1
i =1
Îòìåòèì, ÷òî ýòè æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ КОРРЕЛ (ñì. ðàçäåë 4.10.2).
Íà ðèñ. 5.38 ïîêàçàí ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Корреляция. Ïîñêîëüêó êîððåëÿöèîííàÿ ìàòðèöà ñèììåòðè÷íà, âûâîäèòñÿ òîëüêî íèæíÿÿ åå
ïîëîâèíà.
Ðèñ. 5.38. Ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Корреляция
5.15. Ковариация
Ýòî ñðåäñòâî âû÷èñëÿåò êîâàðèàöèîííóþ ìàòðèöó êîìïîíåíòîâ ìíîãîìåðíîé
âûáîðêè. Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû ðàâíû âûáîðî÷íûì äèñïåðñèÿì,
à âíåäèàãîíàëüíûå — êîâàðèàöèÿì ñîîòâåòñòâóþùèõ êîìïîíåíòîâ (î êîâàðèàöèÿõ ðå÷ü èäåò â ðàçäåëå 1.2.5). Íà ðèñ. 5.39 ïîêàçàíà ìíîãîìåðíàÿ âûáîðêà,
èìåþùàÿ ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïðè÷åì ïåðâàÿ ïàðà êîìïîíåíòîâ çàâèñèìà ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5. Ñ òàêèì æå êîýôôèöèåíòîì
êîððåëÿöèè çàâèñèìû òðåòèé è ÷åòâåðòûé êîìïîíåíòû âûáîðêè. Ïåðâàÿ è âòîðàÿ ïàðû êîìïîíåíòîâ ìåæäó ñîáîé íåçàâèñèìû.
Âíåäèàãîíàëüíûå ýëåìåíòû êîâàðèàöèîííîé ìàòðèöû ðàññ÷èòûâàþòñÿ ïî
ôîðìóëàì: êîâàðèàöèÿ cov(X, Y) ìåæäó êîìïîíåíòàìè õ è ó ìíîãîìåðíîé âûáîðêè âû÷èñëÿåòñÿ êàê
n
cov(X, Y) = ∑ ( xi − x )( yi − y ) , ãäå x =
i =1
1 n
1 n
xi , y = ∑ yi , n — îáúåì âûáîðêè.
∑
n i =1
n i =1
Îòìåòèì, ÷òî ýòè æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ КОВАР (ñì. ðàçäåë 4.10.1).
Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû — âûáîðî÷íûå äèñïåðñèè — âû÷èñëÿþòñÿ ïî
180 Часть II. Средства Excel для статистического анализа
ñòàíäàðòíûì ôîðìóëàì Sn2 =
1 n
∑ ( xi − x )2 . Âûáîðî÷íóþ äèñïåðñèþ òàêæå âû÷èñn i =1
ëÿþò ôóíêöèè ДИСПР è ДИСПРА (ñì. ðàçäåë 4.5.2).
Ðèñ. 5.39. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Ковариация
Íà ðèñ. 5.40 ïîêàçàí ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Ковариация. Ïîñêîëüêó
êîâàðèàöèîííàÿ ìàòðèöà ñèììåòðè÷íà, âûâîäèòñÿ òîëüêî íèæíÿÿ åå ïîëîâèíà.
Ðèñ. 5.40. Ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Ковариация
5.16. Регрессия
Çàäà÷è ðåãðåññèîííîãî àíàëèçà îïèñàíû â ðàçäåëå 3.4. Ïîêàæåì, ÷òî äëÿ
ïðîâåäåíèÿ ðåãðåññèîííîãî àíàëèçà ìîæåò ñäåëàòü ñðåäñòâî Регрессия.  îòäåëüíûõ òàáëèöàõ îíî âû÷èñëÿåò (ðèñ. 5.42 è 5.43) ñëåäóþùåå:
•
ìåòîäîì íàèìåíüøèõ êâàäðàòîâ — êîýôôèöèåíòû ëèíåéíîé (îòíîñèòåëüíî
ýòèõ êîýôôèöèåíòîâ) ôóíêöèè ðåãðåññèè; âèä ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé èñõîäíûõ äàííûõ (ïîäðîáíåå îá ýòîì ðå÷ü èäåò íèæå);
Глава 5. Надстройка Пакет анализа
181
•
êîýôôèöèåíò äåòåðìèíàöèè è ñâÿçàííûå ñ íèì âåëè÷èíû (òàáëèöà
Регрессионная статистика);
•
äèñïåðñèîííóþ òàáëèöó è êðèòåðèàëüíóþ ñòàòèñòèêó äëÿ ïðîâåðêè çíà÷èìîñòè ðåãðåññèè (òàáëèöà Дисперсионный анализ);
•
äëÿ êàæäîãî êîýôôèöèåíòà ðåãðåññèè — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå
è äðóãèå åãî ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè, ïîçâîëÿþùèå ïðîâåðèòü çíà÷èìîñòü ýòîãî êîýôôèöèåíòà è ïîñòðîèòü äëÿ íåãî äîâåðèòåëüíûå èíòåðâàëû;
•
çíà÷åíèÿ ôóíêöèè ðåãðåññèè è îñòàòêè — ðàçíîñòè ìåæäó èñõîäíûìè
çíà÷åíèÿìè ïåðåìåííîé Y è âû÷èñëåííûìè çíà÷åíèÿìè ôóíêöèè ðåãðåññèè (òàáëèöà Вывод остатка);
•
âåðîÿòíîñòè, ñîîòâåòñòâóþùèå óïîðÿäî÷åííûì ïî âîçðàñòàíèþ çíà÷åíèÿì
ïåðåìåííîé Y (òàáëèöà Вывод вероятности).
Êðîìå òîãî, ñðåäñòâî Регрессия ñòðîèò òðè òèïà ãðàôèêîâ, êîòîðûå áóäóò ïîêàçàíû íèæå.
Ïóñòü âõîäíîé èíòåðâàë Õ ñîñòîèò èç k äèàïàçîíîâ-ñòîëáöîâ, ñîäåðæàùèõ
çíà÷åíèÿ {xi1}, {xi2}, ..., {xik} ïåðåìåííûõ Õ1, Õ2, ..., Õk.  êàæäîì äèàïàçîíå ñîäåðæèòñÿ îäèíàêîâîå êîëè÷åñòâî çíà÷åíèé. Âõîäíîé èíòåðâàë Y, ñîñòîÿùèé èç
îäíîãî äèàïàçîíà-ñòîëáöà, äîëæåí ñîäåðæàòü òàêîå æå êîëè÷åñòâî çíà÷åíèé.
Ñðåäñòâî Регрессия âû÷èñëÿåò êîýôôèöèåíòû ôóíêöèè ðåãðåññèè âèäà
Y = m1X1 + m2X2 + ... + mkÕk + b.
Ýòî óðàâíåíèå ëèíåéíîé ìíîæåñòâåííîé ðåãðåññèè, åñëè ïåðåìåííûå Xi íåçàâèñèìû. Íà îñíîâå äàííîãî óðàâíåíèÿ, èñïîëüçóÿ ñîîòâåòñòâóþùèå çíà÷åíèÿ ïåðåìåííûõ Xi, ìîæíî ïîëó÷èòü ìíîæåñòâî äðóãèõ óðàâíåíèé ðåãðåññèè. Íàïðèìåð,
åñëè â êà÷åñòâå ïåðåìåííûõ Xi âçÿòü çíà÷åíèÿ îäíîé ïåðåìåííîé Õ â ñòåïåíè i
(ò.å. Xi = Õi), ïîëó÷èì óðàâíåíèå ïîëèíîìèàëüíîé ðåãðåññèè
Y = m1X + m2X2 + ... + mkÕk + b.
Íà ðèñ. 5.41 ïîêàçàí ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè: âõîäíîé èíòåðâàë
Õ ñîñòîèò èç ïÿòè ñòîëáöîâ.  ïåðâîì ñòîëáöå ïðåäñòàâëåíû çíà÷åíèÿ ïåðåìåííîé Õ1, âî âòîðîì — êâàäðàòû çíà÷åíèé ïåðåìåííîé Õ1, â òðåòüåì — çíà÷åíèÿ
âòîðîé ïåðåìåííîé Õ2, â ÷åòâåðòîì — êâàäðàòû çíà÷åíèé ïåðåìåííîé Õ2, â ïÿòîì — ïðîèçâåäåíèÿ çíà÷åíèé ïåðåìåííûõ Õ1 è Õ2. Òàêèì îáðàçîì, â äàííîì ñëó÷àå Регрессия áóäåò âû÷èñëÿòü çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âèäà
Y = m1X1 + m2X12 + m3Õ2 + m4X22 + m5X1X2 + b.
Îòìåòèì, ÷òî çíà÷åíèÿ çàâèñèìîé ïåðåìåííîé Y â ñòîëáöå F ïîëó÷åíû ïî ôîðìóëå
Y = X1 – 2X12 + 0,5Õ2 – X22 + 5X1X2 + ε.
Çäåñü ñëó÷àéíàÿ ïåðåìåííàÿ ε èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
(Î ìîäåëèðîâàíèè ñëó÷àéíûõ âåëè÷èí ðå÷ü èäåò â ãëàâå 7.)
Äèàëîãîâîå îêíî ñðåäñòâà Регрессия ïîêàçàíî íà ðèñ. 5.41. Â ïîëå Входной
интервал Y ââîäèòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî çíà÷åíèÿ çàâèñèìîé ïåðåìåííîé Y. Äèàïàçîí äîëæåí ñîñòîÿòü èç îäíîãî ñòîëáöà.  ïîëå Входной
интервал Х ââîäèòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî çíà÷åíèÿ ïåðåìåííîé Õ.
Äèàïàçîí äîëæåí ñîñòîÿòü èç îäíîãî èëè íåñêîëüêèõ ñòîëáöîâ, íî íå áîëåå ÷åì
èç 16 ñòîëáöîâ. Åñëè óêàçàííûå â ïîëÿõ Входной интервал Y è Входной
182 Часть II. Средства Excel для статистического анализа
интервал Х äèàïàçîíû âêëþ÷àþò çàãîëîâêè ñòîëáöîâ, òî íåîáõîäèìî óñòàíîâèòü
ôëàæîê îïöèè Метки — ýòè çàãîëîâêè áóäóò èñïîëüçîâàíû â âûõîäíûõ òàáëèöàõ, ñãåíåðèðîâàííûõ ñðåäñòâîì Регрессия.
Ðèñ. 5.41. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Регрессия
Ôëàæîê îïöèè Константа - ноль ñëåäóåò óñòàíîâèòü, åñëè â óðàâíåíèè ðåãðåññèè êîíñòàíòà b ïðèíóäèòåëüíî ïîëàãàåòñÿ ðàâíîé íóëþ. Îïöèÿ Уровень
надежности óñòàíàâëèâàåòñÿ òîãäà, êîãäà íåîáõîäèìî ïîñòðîèòü äîâåðèòåëüíûå
èíòåðâàëû äëÿ êîýôôèöèåíòîâ ðåãðåññèè ñ äîâåðèòåëüíûì óðîâíåì, îòëè÷íûì
îò 0,95, êîòîðûé èñïîëüçóåòñÿ ïî óìîë÷àíèþ. Ïîñëå óñòàíîâêè ôëàæêà îïöèè
Уровень надежности ñòàíîâèòñÿ äîñòóïíûì ïîëå ââîäà, â êîòîðîì ââîäèòñÿ íîâîå
çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ.
 îáëàñòè Остатки èìåþòñÿ ÷åòûðå îïöèè: Остатки, Стандартизованные
остатки, График остатков è График подбора. Åñëè óñòàíîâëåíà õîòÿ áû îäíà èç
íèõ, òî â âûõîäíûõ ðåçóëüòàòàõ ïîÿâèòñÿ òàáëèöà Вывод остатка, â êîòîðîé áóäóò âûâåäåíû çíà÷åíèÿ ôóíêöèè ðåãðåññèè è îñòàòêè — ðàçíîñòè ìåæäó èñõîäíûìè çíà÷åíèÿìè ïåðåìåííîé Y è âû÷èñëåííûìè çíà÷åíèÿìè ôóíêöèè ðåãðåññèè. Çíà÷åíèÿ ýòîé òàáëèöû è âîçìîæíîñòè êàæäîé èç îïöèé ïîêàçàíû íèæå.
 îáëàñòè Нормальная вероятность èìååòñÿ îäíà îïöèÿ — График нормальной
вероятности; åå óñòàíîâêà ïîðîæäàåò â âûõîäíûõ ðåçóëüòàòàõ òàáëèöó Вывод
вероятности è ïðèâîäèò ê ïîñòðîåíèþ ñîîòâåòñòâóþùåãî ãðàôèêà.
Íà ðèñ. 5.42–5.44 ïîêàçàíû ÷àñòè ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè
ñðåäñòâà Регрессия, êîòîðûå ïîëó÷åíû íà îñíîâå èñõîäíûõ äàííûõ, ïðèâåäåííûõ
íà ðèñ. 5.41. Ðàññìîòðèì ïîäðîáíåå ýòè ðåçóëüòàòû.
 òàáëèöå Регрессионная статистика ïðèâîäÿòñÿ ñëåäóþùèå äàííûå.
•
Множественный R — êîðåíü èç êîýôôèöèåíòà äåòåðìèíàöèè R2, ïðèâåäåííîãî â ñëåäóþùåé ñòðîêå. Äðóãîå íàçâàíèå ýòîãî ïîêàçàòåëÿ — èíäåêñ êîððåëÿöèè, èëè ìíîæåñòâåííûé êîýôôèöèåíò êîððåëÿöèè (ñì. ðàçäåë 3.3.1).
Глава 5. Надстройка Пакет анализа
183
Ðèñ. 5.42. Âåðõíÿÿ ÷àñòü ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè
Ðèñ. 5.43. Íèæíÿÿ ÷àñòü ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè
•
R-квадрат — êîýôôèöèåíò äåòåðìèíàöèè R2; âû÷èñëÿåòñÿ êàê îòíîøåíèå
ðåãðåññèîííîé ñóììû êâàäðàòîâ (ÿ÷åéêà Ñ12) ê ïîëíîé ñóììå êâàäðàòîâ
(ÿ÷åéêà Ñ14). (Î êîýôôèöèåíòå äåòåðìèíàöèè ðå÷ü èäåò â ðàçäåëå 3.4.3.)
•
Нормированный R-квадрат âû÷èñëÿåòñÿ ïî ôîðìóëå
(n − 1) R 2 − k
, ãäå n —
n − k −1
êîëè÷åñòâî çíà÷åíèé ïåðåìåííîé Y, k — êîëè÷åñòâî ñòîëáöîâ âî âõîäíîì
èíòåðâàëå ïåðåìåííîé Õ.
•
Стандартная ошибка — êîðåíü èç îñòàòî÷íîé äèñïåðñèè (ÿ÷åéêà D13).
•
Наблюдения — êîëè÷åñòâî çíà÷åíèé ïåðåìåííîé Y.
Дисперсионная таблица ñîîòâåòñòâóåò àíàëîãè÷íîé òàáëèöå èç ðàçäåëà 3.4.3. Â
ñòîëáöå SS ïðèâîäÿòñÿ ñóììû êâàäðàòîâ, â ñòîëáöå df — ÷èñëî ñòåïåíåé ñâîáîäû, â ñòîëáöå MS — äèñïåðñèè. Ñòðîêà Регрессия ñîîòâåòñòâóåò îäíîèìåííîé
184 Часть II. Средства Excel для статистического анализа
ñòðîêå èç òàáëèöû â ðàçäåëå 3.4.3, ñòðîêà Остаток — ñòðîêå Остатки è ñòðîêà
Итого — ñòðîêå Полная. Â äèñïåðñèîííîé òàáëèöå èç ðàçäåëà 3.4.3 ïðèâåäåíû
ôîðìóëû, ïî êîòîðûì âû÷èñëÿåò ñîîòâåòñòâóþùèå çíà÷åíèÿ ñðåäñòâî Регрессия.
 ñòîëáöå F âû÷èñëåíî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè äëÿ ïðîâåðêè çíà÷èìîñòè ðåãðåññèè. Ýòî çíà÷åíèå âû÷èñëÿåòñÿ êàê îòíîøåíèå ðåãðåññèîííîé
äèñïåðñèè ê îñòàòî÷íîé (ÿ÷åéêè D12 è D13).  ñòîëáöå Значимость F âû÷èñëÿåòñÿ âåðîÿòíîñòü ïîëó÷åííîãî çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè. (Ýòó âåðîÿòíîñòü ñ ïîìîùüþ ôîðìóë Excel ìîæíî âû÷èñëèòü êàê =FРАСП(E12;B12;B13).) Åñëè ýòà âåðîÿòíîñòü ìåíüøå, íàïðèìåð, 0,05 (çàäàííîãî óðîâíÿ çíà÷èìîñòè), òî
ãèïîòåçà î íåçíà÷èìîñòè ðåãðåññèè (ò.å. ãèïîòåçà î òîì, ÷òî âñå êîýôôèöèåíòû
ôóíêöèè ðåãðåññèè ðàâíû íóëþ) îòâåðãàåòñÿ è ñ÷èòàåòñÿ, ÷òî ðåãðåññèÿ çíà÷èìà.
 äàííîì ïðèìåðå ðåãðåññèÿ çíà÷èìà ïðàêòè÷åñêè ñ ëþáûì óðîâíåì çíà÷èìîñòè.
Ðèñ. 5.44. Ãðàôèêè, âûâîäèìûå ñðåäñòâîì Регрессия
 ñëåäóþùåé òàáëèöå (ñì. ðèñ. 5.43), â ñòîëáöå Коэффициенты, çàïèñàíû âû÷èñëåííûå çíà÷åíèÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè, ïðè ýòîì â ñòðîêå Yпересечение çàïèñàíî çíà÷åíèå ñâîáîäíîãî ÷ëåíà b.  ñòîëáöå Стандартная
ошибка âû÷èñëåíû ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ êîýôôèöèåíòîâ (î âû÷èñëåíèè äèñïåðñèé êîýôôèöèåíòîâ ðå÷ü èäåò â ðàçäåëå 3.4.4).  ñòîëáöå tстатистика çàïèñàíû îòíîøåíèÿ çíà÷åíèé êîýôôèöèåíòîâ ê èõ ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèÿì. Ýòî çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòîâ ðåãðåññèè.  ñòîëáöå P-Значение âû÷èñëÿþòñÿ óðîâíè çíà÷èìîñòè, ñîîòâåòñòâóþùèå çíà÷åíèÿì êðèòåðèàëüíûõ ñòàòèñòèê.
(Èõ ìîæíî âû÷èñëèòü ñ ïîìîùüþ ôîðìóëû Excel =СТЬЮДРАСП(ABS(D17);14;2),
íàïðèìåð, äëÿ çíà÷åíèÿ â ÿ÷åéêå Å17; âòîðîé àðãóìåíò â ôóíêöèè СТЬЮДРАСП
âû÷èñëÿåòñÿ êàê n – k – 1.) Åñëè âû÷èñëåííûé óðîâåíü çíà÷èìîñòè ìåíüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè (íàïðèìåð, 0,05), òî ïðèíèìàåòñÿ ãèïîòåçà î çíà÷èìîì îòëè÷èè êîýôôèöèåíòà îò íóëÿ; â ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà
î íåçíà÷èìîì îòëè÷èè êîýôôèöèåíòà îò íóëÿ.  äàííîì ïðèìåðå òîëüêî êîýôôèöèåíò b íåçíà÷èìî îòëè÷àåòñÿ îò íóëÿ.
Глава 5. Надстройка Пакет анализа
185
 ñòîëáöàõ Нижние 95% è Верхние 95% ïðèâîäÿòñÿ ãðàíèöû äîâåðèòåëüíûõ èíòåðâàëîâ ñ äîâåðèòåëüíûì óðîâíåì 0,95. Ýòè ãðàíèöû âû÷èñëÿþòñÿ ïî ôîðìóëàì
Нижние 95% = Коэффициент – Стандартная ошибка × tα;
Верхние 95% = Коэффициент + Стандартная ошибка × tα.
Çäåñü tα — êâàíòèëü ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ
ñâîáîäû.  äàííîì ñëó÷àå α = 0,95. Àíàëîãè÷íî âû÷èñëÿþòñÿ ãðàíèöû äîâåðèòåëüíûõ èíòåðâàëîâ â ñòîëáöàõ Нижние 90,0% è Верхние 90,0%. Îòìåòèì, ÷òî åñëè â äèàëîãîâîì îêíå Регрессия íå óñòàíàâëèâàòü îïöèþ Уровень надежности, òî
áóäóò ïîâòîðåíû ñòîëáöû Нижние 95% è Верхние 95%.
Ðàññìîòðèì òàáëèöó Вывод остатка èç âûõîäíûõ ðåçóëüòàòîâ ñðåäñòâà
Регрессия. Íàïîìíèì, ÷òî ýòà òàáëèöà ïîÿâëÿåòñÿ â âûõîäíûõ ðåçóëüòàòàõ
òîëüêî òîãäà, êîãäà óñòàíîâëåíà õîòÿ áû îäíà îïöèÿ â îáëàñòè Остатки äèàëîãîâîãî îêíà Регрессия.  ñòîëáöå Наблюдение ïðèâîäÿòñÿ ïîðÿäêîâûå íîìåðà çíà÷åíèé ïåðåìåííîé Y.  ñòîëáöå Предсказанное Y âû÷èñëÿþòñÿ çíà÷åíèÿ ôóíêöèè ðåãðåññèè yˆi = f ( xi ) äëÿ òåõ çíà÷åíèé ïåðåìåííîé Õ, êîòîðûì ñîîòâåòñòâóåò
ïîðÿäêîâûé íîìåð i â ñòîëáöå Наблюдение.  ñòîëáöå Остатки ñîäåðæàòñÿ ðàçíîñòè (îñòàòêè) ε i = yi − yˆ i , à â ñòîëáöå Стандартные остатки — íîðìèðîâàííûå îñòàòêè, êîòîðûå âû÷èñëÿþòñÿ êàê îòíîøåíèÿ εi/sε, ãäå sε — ñðåäíåêâàäðàòè÷åñêîå
îòêëîíåíèå îñòàòêîâ. Êâàäðàò âåëè÷èíû sε âû÷èñëÿåòñÿ ïî ôîðìóëå
sε2 =
1 n
(ε i − ε)2 , ãäå ε — ñðåäíåå îñòàòêîâ. Çäåñü âåëè÷èíó sε2 ìîæíî âû÷èñ∑
n − 1 i =1
ëèòü êàê îòíîøåíèå äâóõ çíà÷åíèé èç äèñïåðñèîííîé òàáëèöû: ñóììû êâàäðàòîâ
îñòàòêîâ (ÿ÷åéêà Ñ13) è ñòåïåíè ñâîáîäû èç ñòðîêè Итого (ÿ÷åéêà Â14).
Ïî çíà÷åíèÿì òàáëèöû Вывод остатка ñðåäñòâî Регрессия ñòðîèò äâà òèïà
ãðàôèêîâ: ãðàôèêè îñòàòêîâ è ãðàôèêè ïîäáîðà (åñëè óñòàíîâëåíû ñîîòâåòñòâóþùèå îïöèè â îáëàñòè Остатки äèàëîãîâîãî îêíà Регрессия). Íà ðèñ. 5.45 ïîêàçàíû îáðàçöû ýòèõ ãðàôèêîâ (ãðàôèêè íåìíîãî ïåðåôîðìàòèðîâàíû ïî ñðàâíåíèþ ñ îðèãèíàëàìè). Îíè ñòðîÿòñÿ äëÿ êàæäîãî êîìïîíåíòà ïåðåìåííîé Õ
â îòäåëüíîñòè. Íà ãðàôèêàõ îñòàòêîâ îòîáðàæàþòñÿ îñòàòêè, ò.å. ðàçíîñòè ìåæäó
èñõîäíûìè çíà÷åíèÿìè Y è âû÷èñëåííûìè ïî ôóíêöèè ðåãðåññèè äëÿ êàæäîãî
çíà÷åíèÿ êîìïîíåíòà ïåðåìåííîé Õ. Íà ãðàôèêàõ ïîäáîðà îòîáðàæàþòñÿ êàê
èñõîäíûå çíà÷åíèÿ Y, òàê è âû÷èñëåííûå çíà÷åíèÿ ôóíêöèè ðåãðåññèè äëÿ êàæäîãî çíà÷åíèÿ êîìïîíåíòà ïåðåìåííîé Õ. (Íà ãðàôèêàõ ïîäáîðà, ïðåäñòàâëåííûõ íà ðèñ. 5.45, ýòè çíà÷åíèÿ ïðàêòè÷åñêè ñîâïàäàþò.)
Ïîñëåäíåé òàáëèöåé âûõîäíûõ ðåçóëüòàòîâ ñðåäñòâà Регрессия ÿâëÿåòñÿ òàáëèöà Вывод вероятности (ñì. ðèñ. 5.43). Îíà ïîÿâëÿåòñÿ, åñëè â äèàëîãîâîì îêíå
Регрессия óñòàíîâëåíà îïöèÿ График нормальной вероятности. Çíà÷åíèÿ â ñòîëáöå Персентиль âû÷èñëÿþòñÿ ñëåäóþùèì îáðàçîì.
Âû÷èñëÿåòñÿ
øàã
h = (1/n)×100%, ïåðâîå çíà÷åíèå ðàâíî h/2, ïîñëåäíåå ðàâíî 100 – h/2. Íà÷èíàÿ
ñî âòîðîãî çíà÷åíèÿ êàæäîå ïîñëåäóþùåå çíà÷åíèå ðàâíî ïðåäûäóùåìó, ê êîòîðîìó ïðèáàâëåí øàã h.  ñòîëáöå Y ïðèâåäåíû çíà÷åíèÿ ïåðåìåííîé Y, óïîðÿäî÷åííûå ïî âîçðàñòàíèþ. Ïî äàííûì ýòîé òàáëèöû ñòðîèòñÿ òàê íàçûâàåìûé ãðàôèê íîðìàëüíîãî ðàñïðåäåëåíèÿ (ðèñ. 5.46). Îí ïîçâîëÿåò âèçóàëüíî îöåíèòü
ñòåïåíü ëèíåéíîñòè çàâèñèìîñòè ìåæäó ïåðåìåííûìè Õ è Y.
186 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.45. Ïðèìåðû ãðàôèêîâ îñòàòêîâ è ïîäáîðà
Ðèñ. 5.46. Ãðàôèê íîðìàëüíîãî ðàñïðåäåëåíèÿ
5.17. Скользящее среднее
Ìåòîä ñêîëüçÿùåãî ñðåäíåãî — îäèí èç íàèáîëåå øèðîêî èñïîëüçóåìûõ ñïîñîáîâ ñãëàæèâàíèÿ çíà÷åíèé âðåìåííîãî ðÿäà. Ìåòîä îñíîâàí íà ëîêàëüíîì óñðåäíåíèè, êîãäà çà íîâîå çíà÷åíèå âðåìåííîãî ðÿäà áåðåòñÿ ñðåäíåå k ïîñëåäîâàòåëüíûõ çíà÷åíèé, áëèæàéøèõ ê çàìåíÿåìîìó çíà÷åíèþ.
Ïóñòü èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn è çàäàíî ÷èñëî k íàáëþäåíèé, ïî êîòîðûì áóäåò ïðîâîäèòüñÿ óñðåäíåíèå. Çíà÷åíèå ñêîëüçÿùåãî ñðåäíåãî äëÿ çíà÷åíèÿ t âû÷èñëÿåòñÿ ïî ôîðìóëå yt =
1 k −1
∑ yt −i . Îòìåòèì, ÷òî ïî ýòîé
k i =0
Глава 5. Надстройка Пакет анализа
187
ôîðìóëå âûïîëíÿåò âû÷èñëåíèÿ ñðåäñòâî Скользящее среднее, íî ñóùåñòâóþò
è äðóãèå ñïîñîáû âû÷èñëåíèÿ ñêîëüçÿùåãî ñðåäíåãî.
Íà ðèñ. 5.47 ïîêàçàíû èñõîäíûå äàííûå, äëÿ êîòîðûõ áóäóò âû÷èñëÿòüñÿ
ñêîëüçÿùèå ñðåäíèå, è äèàëîãîâîå îêíî Скользящее среднее. Â ïîëå ââîäà
Входной интервал â êà÷åñòâå èñõîäíûõ äàííûõ çàäàí äèàïàçîí Â1:Â17. Ïîñêîëüêó ýòîò äèàïàçîí ñîäåðæèò çàãîëîâîê, óñòàíîâëåí ôëàæîê îïöèè Метки в первой
строке.  ïîëå Интервал ââîäèòñÿ ÷èñëî k — êîëè÷åñòâî çíà÷åíèé, ïî êîòîðûì
ïîäñ÷èòûâàåòñÿ ñêîëüçÿùåå ñðåäíåå. Åñëè ýòîò ïàðàìåòð íå çàäàí, òî ïî óìîë÷àíèþ èñïîëüçóåòñÿ çíà÷åíèå 3.
Åñëè óñòàíîâëåí ôëàæîê îïöèé Вывод графика, òî áóäåò ïîñòðîåí ãðàôèê, îòîáðàæàþùèé èñõîäíûå çíà÷åíèÿ yi è ñãëàæåííûå ñêîëüçÿùèì ñðåäíèì çíà÷åíèÿ
(ðèñ. 5.48). Åñëè òàêæå óñòàíîâëåí ôëàæîê îïöèè Стандартные погрешности, òî
ê çíà÷åíèÿì âû÷èñëåííûõ ñðåäíèõ áóäåò äîáàâëåí ñòîëáåö, â êîòîðîì áóäóò çàïèñàíû ñòàíäàðòíûå ïîãðåøíîñòè, âû÷èñëÿåìûå êàê ñóììà êâàäðàòîâ ðàçíîñòåé ìåæäó èñõîäíûìè è ðàñ÷åòíûìè k çíà÷åíèÿ yi, äåëåííàÿ íà ÷èñëî k. Ôîðìóëà Excel,
ïî êîòîðîé ïîäñ÷èòûâàþòñÿ ñòàíäàðòíûå ïîãðåøíîñòè, ïîêàçàíà íà ðèñ. 5.48.
Ðèñ. 5.47. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Скользящее среднее
5.18. Экспоненциальное сглаживание
Ýêñïîíåíöèàëüíîå ñãëàæèâàíèå, êàê è ñêîëüçÿùåå ñðåäíåå (ñì. ðàçäåë 5.17),
èñïîëüçóåòñÿ äëÿ âûðàâíèâàíèÿ (ñãëàæèâàíèÿ) çíà÷åíèé âðåìåííûõ ðÿäîâ. Åñëè
èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn, òî ñãëàæåííûå çíà÷åíèÿ âû÷èñëÿþòñÿ ïî ôîðìóëå yˆt +1 = αyt + (1 − α) yˆt , ãäå yˆ t — ñãëàæåííîå çíà÷åíèå äëÿ ïðåäûäóùåãî t, α — ïîñòîÿííàÿ ñãëàæèâàíèÿ, òàêæå íàçûâàåìàÿ ôàêòîðîì çàòóõàíèÿ (ýòî ÷èñëî èç èíòåðâàëà (0, 1)).
188 Часть II. Средства Excel для статистического анализа
Ðèñ. 5.48. Ðåçóëüòàòû âû÷èñëåíèé
Íà ðèñ. 5.49 ïîêàçàíû ðàáî÷èé ëèñò Excel ñ èñõîäíûìè äàííûìè (äàííûå âçÿòû èç ïðèìåðà ïðåäûäóùåãî ðàçäåëà) è äèàëîãîâîå îêíî Экспоненциальное
сглаживание. Â ïîëå Входной интервал óêàçûâàåòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî
çíà÷åíèÿ yi. Åñëè ýòîò äèàïàçîí âêëþ÷àåò çàãîëîâîê, òî íàäî óñòàíîâèòü ôëàæîê
îïöèè Метки. Â ïîëå Фактор затухания çàäàåòñÿ ïîñòîÿííàÿ ñãëàæèâàíèÿ; åñëè îíà
íå çàäàíà, òî ïî óìîë÷àíèþ èñïîëüçóåòñÿ çíà÷åíèå 0,3. Óñòàíîâêà ôëàæêîâ îïöèé
Вывод графика è Стандартные погрешности ïðèâîäèò ê ïîñòðîåíèþ ãðàôèêà, íà êîòîðîì áóäóò îòîáðàæàòüñÿ èñõîäíûå è ñãëàæåííûå çíà÷åíèÿ (ðèñ. 5.50), è ê âûâîäó äîïîëíèòåëüíîãî ñòîëáöà ñî çíà÷åíèÿìè ïîãðåøíîñòåé. Ýòè ïîãðåøíîñòè âû÷èñëÿþòñÿ êàê ñóììà êâàäðàòîâ ðàçíîñòåé ìåæäó òðåìÿ ïîñëåäîâàòåëüíûìè èñõîäíûìè è ðàñ÷åòíûìè çíà÷åíèÿìè, äåëåííàÿ íà ÷èñëî 3. Ôîðìóëà Excel, ïî
êîòîðîé ïîäñ÷èòûâàþòñÿ ñòàíäàðòíûå ïîãðåøíîñòè, ïîêàçàíà íà ðèñ. 5.50.
5.19. Анализ Фурье
Äàííîå ñðåäñòâî âûïîëíÿåò äèñêðåòíîå ïðåîáðàçîâàíèå Ôóðüå. Ýòî ïðåîáðàçîâàíèå èñïîëüçóåòñÿ â àíàëèçå ëèíåéíûõ ñèñòåì è ïðèìåíÿåòñÿ ê âðåìåííûì ðÿäàì äëÿ âûÿâëåíèÿ ïåðèîäè÷åñêèõ (ñïåêòðàëüíûõ) ñîñòàâëÿþùèõ òàêèõ ðÿäîâ.
Åñëè èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn, òî ïðÿìîå äèñêðåòíîå ïðån
îáðàçîâàíèå Ôóðüå âûïîëíÿåòñÿ â ñîîòâåòñòâèè ñ ôîðìóëîé Yk = ∑ y j e
−i
2π
jk
n
, k = 0,
j =1
1, ..., n – 1. Ðåçóëüòàòû ïðåîáðàçîâàíèÿ Yk ÿâëÿþòñÿ êîìïëåêñíûìè ÷èñëàìè, ìîäóëü êîòîðûõ ðàâåí àìïëèòóäå k-é ñïåêòðàëüíîé ñîñòàâëÿþùåé (k-é ãàðìîíèêè),
à àðãóìåíò êîìïëåêñíîãî ÷èñëà Yk ðàâåí ôàçå ýòîé ãàðìîíèêè. Àíàëîãè÷íî îïðån −1
äåëÿåòñÿ îáðàòíîå äèñêðåòíîå ïðåîáðàçîâàíèå Ôóðüå ( y j = ∑ Yk e
i
2π
jk
n
), êîòîðîå ïðå-
k =0
îáðàçóåò ñïåêòðàëüíîå ïðåäñòàâëåíèå âðåìåííîãî ðÿäà â äåéñòâèòåëüíîå.
Глава 5. Надстройка Пакет анализа
189
Ðèñ. 5.49. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Экспоненциальное сглаживание
Ðèñ. 5.50. Ðåçóëüòàòû âû÷èñëåíèé
Ñðåäñòâî Анализ Фурье âûïîëíÿåò êàê ïðÿìîå òàê è îáðàòíîå ïðåîáðàçîâàíèÿ
ìåòîäîì áûñòðîãî ïðåîáðàçîâàíèÿ Ôóðüå (ÁÏÔ). Ïðèìåíåíèå ìåòîäà ÁÏÔ äèêòóåò óñëîâèå, ÷òîáû êîëè÷åñòâî èñõîäíûõ çíà÷åíèé êàê äëÿ ïðÿìîãî, òàê è äëÿ
îáðàòíîãî ïðåîáðàçîâàíèé, áûëî ðàâíî íåêîòîðîé ïîëîæèòåëüíîé ñòåïåíè ÷èñëà 2. Ìàêñèìàëüíîå ÷èñëî çíà÷åíèé, êîòîðîå ìîæåò îáðàáîòàòü ñðåäñòâî Анализ
Фурье, ñîñòàâëÿåò 4096 (= 212). Äëÿ ïðèìåíåíèÿ îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå
èñõîäíûå çíà÷åíèÿ äîëæíû áûòü â ôîðìàòå êîìïëåêñíûõ ÷èñåë x + yi èëè
x + yj (i è j — îáîçíà÷åíèå ìíèìîé åäèíèöû). Åñëè x ÿâëÿåòñÿ îòðèöàòåëüíûì
÷èñëîì, ïåðåä íèì ñòàâèòñÿ àïîñòðîô (').
190 Часть II. Средства Excel для статистического анализа
Íà ðèñ. 5.51 ïîêàçàíû ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè è äèàëîãîâîå îêíî
Анализ Фурье. Ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå ïîêàçàí íà ðèñ. 5.52.
Ïåðâîå çíà÷åíèå (ÿ÷åéêà Ñ2) ðàâíî ñóììå èñõîäíûõ äàííûõ.
Ðèñ. 5.51. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Анализ Фурье
Ðèñ. 5.52. Ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå
Íà ðèñ. 5.53 ïîêàçàíû ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè (ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå) äëÿ îáðàòíîãî ïðåîáðàçîâàíèÿ è äèàëîãîâîå îêíî
Анализ Фурье, â êîòîðîì óñòàíîâëåí ôëàæîê îïöèè Инверсия. Ðåçóëüòàò îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå ïîêàçàí íà ðèñ. 5.54; îí ñîâïàäàåò ñ ïåðâîíà÷àëüíûìè äàííûìè èç ñòîëáöà B.
Глава 5. Надстройка Пакет анализа
191
Ðèñ. 5.53. Èñõîäíûå äàííûå äëÿ îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå è äèàëîãîâîå
îêíî Анализ Фурье
Ðèñ. 5.54. Ðåçóëüòàò îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå
192 Часть II. Средства Excel для статистического анализа
Глава
6
Дополнительные возможности
Excel для проведения
статистического анализа
Â
ýòîé ãëàâå îïèñàíû ñðåäñòâà Excel îáùåãî íàçíà÷åíèÿ, êîòîðûå íå âñåãäà
ðàññìàòðèâàþòñÿ â “ñòàíäàðòíîì” ó÷åáíîì êóðñå ïî ýëåêòðîííûì òàáëèöàì
ëèáî ðàññìàòðèâàþòñÿ íåäîñòàòî÷íî ïîëíî. Çäåñü ïðèâåäåíû ôîðìóëû ìàññèâîâ —
ìîùíîå ñðåäñòâî äëÿ ïðîâåäåíèÿ âû÷èñëåíèé, íåêîòîðûå âîçìîæíîñòè ïîñòðîåíèÿ äèàãðàìì, ïîëåçíûå äëÿ âèçóàëèçàöèè ñòàòèñòè÷åñêèõ äàííûõ, íàäñòðîéêà Поиск решения — ñðåäñòâî äëÿ ðåøåíèÿ îïòèìèçàöèîííûõ çàäà÷, êîòîðîå ìîæíî ïðèìåíèòü è ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà, à òàêæå
äðóãèå âîçìîæíîñòè Excel.
6.1. Массивы и формулы массивов
 ýòîì ðàçäåëå ðàññìîòðåíû äâà îñíîâíûõ ïîíÿòèÿ, êîòîðûå çà÷àñòóþ çíà÷èòåëüíî óïðîùàþò ïðîâåäåíèå âû÷èñëåíèé â Excel. Ýòî ìàññèâ è ôîðìóëà ìàññèâà. Ìàññèâ — íàáîð ÿ÷ååê èëè çíà÷åíèé, êîòîðûå îáðàáàòûâàþòñÿ êàê åäèíàÿ
ãðóïïà. Ýëåìåíòû ìàññèâà ìîãóò ñîäåðæàòüñÿ â ãðóïïå ÿ÷ååê èëè áûòü ïîèìåíîâàííîé êîíñòàíòîé (ñì. äàëåå). Ôîðìóëà ìàññèâà — ôîðìóëà, â êîòîðîé èñïîëüçóåòñÿ îäèí èëè íåñêîëüêî ìàññèâîâ íåïîñðåäñòâåííî èëè â êà÷åñòâå àðãóìåíòîâ ôóíêöèé è êîòîðàÿ âîçâðàùàåò îäíî èëè íåñêîëüêî çíà÷åíèé. Íàïîìíèì,
÷òî íåêîòîðûå ñòàòèñòè÷åñêèå ôóíêöèè ðàöèîíàëüíî èñïîëüçîâàòü èìåííî â âèäå
ôîðìóë ìàññèâîâ, íàïðèìåð ôóíêöèþ РАНГ (ñì. ðàçäåë 4.2.5).
Èòàê, ìàññèâ — ýòî íåêîòîðûé ïîèìåíîâàííûé íàáîð ýëåìåíòîâ. Â Excel ìàññèâû
ìîãóò áûòü îäíî- èëè äâóìåðíûìè. Îäíîìåðíûé ìàññèâ ìîæåò áûòü ãðóïïîé ÿ÷ååê,
êîòîðûå ðàçìåùåíû â îäíîé ñòðîêå (ãîðèçîíòàëüíûé ìàññèâ) èëè â îäíîì ñòîëáöå
(âåðòèêàëüíûé ìàññèâ). Äâóìåðíûé ìàññèâ ðàçìåùàåòñÿ â íåñêîëüêèõ ñòðîêàõ
è ñòîëáöàõ. Îòìåòèì, ÷òî â ìàññèâàõ êîíñòàíò íåëüçÿ èñïîëüçîâàòü ññûëêè íà
ÿ÷åéêè, èìåíà äèàïàçîíîâ èëè ôîðìóëû, íî ìîæíî èñïîëüçîâàòü òåêñòîâûå çíà÷åíèÿ, çàêëþ÷åííûå â êàâû÷êè, è ëîãè÷åñêèå çíà÷åíèÿ ИСТИНА è ЛОЖЬ.
Îïåðàöèè íàä ìàññèâàìè ïðîèçâîäÿòñÿ ñ ïîìîùüþ ôîðìóë ìàññèâîâ. ×òîáû
ñîçäàòü ôîðìóëó ìàññèâà, âûïîëíèòå ñëåäóþùèå äåéñòâèÿ.
1. Âûäåëèòå ÿ÷åéêó (åñëè ôîðìóëà ìàññèâà âîçâðàùàåò òîëüêî îäíî çíà÷åíèå)
èëè äèàïàçîí ÿ÷ååê (åñëè ôîðìóëà ìàññèâà âîçâðàùàåò íåñêîëüêî çíà÷åíèé).
2. Ââåäèòå ôîðìóëó.
3. Íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>.
Excel ïîìåñòèò ôîðìóëó ìàññèâà âî âñå âûäåëåííûå ÿ÷åéêè è àâòîìàòè÷åñêè
çàêëþ÷èò ôîðìóëû â ôèãóðíûå ñêîáêè, ÷òîáû ïîä÷åðêíóòü, ÷òî ýòî ôîðìóëû
ìàññèâà.
Ðàññìîòðèì ïðèìåð.  ïàðíîì òåñòå Ñòüþäåíòà íåîáõîäèìî âû÷èñëèòü ñðåäíèå çíà÷åíèÿ ðàçíîñòåé ïàðíûõ íàáëþäåíèé (îá ýòîì òåñòå ðå÷ü èäåò â ðàçäåëå 2.4.2). Ïóñòü äâóìåðíûé ìàññèâ âûáîðî÷íûõ
çíà÷åíèé ðàñïîëàãàåòñÿ â ñòîëáöàõ À è Â, êàê
ïîêàçàíî íà ðèñ. 6.1.  ñòîëáöå Ñ áóäóò âûâåäåíû ðàçíîñòè. Äëÿ èõ âû÷èñëåíèÿ ìîæíî ïðèìåíèòü ôîðìóëó =А2–В2, êîòîðàÿ çàïèñûâàåòñÿ
â ÿ÷åéêå Ñ2, è çàòåì ñêîïèðîâàòü åå âíèç íà
äèàïàçîí Ñ3:Ñ51 (èìååòñÿ 50 íàáëþäåíèé).
 ðåçóëüòàòå áóäåò ïîëó÷åí äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ðàçíîñòè ïàðíûõ íàáëþäåíèé. Òî æå
ñàìîå ìîæíî ñäåëàòü ñ ïîìîùüþ ôîðìóëû ìàññèâà. Âûäåëèòå äèàïàçîí Ñ2:Ñ51, ââåäèòå ôîðìóëó =А2:А51–В2:В51 (ðèñ. 6.2) è íàæìèòå êëàâèøè <Ctrl+Shift+Enter>. Ðåçóëüòàò ïîêàçàí íà
ðèñ. 6.3.
Åùå ðàç ïîä÷åðêíåì, ÷òî ôîðìóëà ìàññèâà
ââîäèòñÿ
ïóòåì
íàæàòèÿ
êëàâèø
<Ctrl+Shift+Enter>. Excel àâòîìàòè÷åñêè çàêëþ÷àåò ôîðìóëû â ôèãóðíûå ñêîáêè — âðó÷íóþ èõ ââîäèòü íåëüçÿ, ýòî áóäåò îøèáêîé
è Excel íå ïðèìåò òàêóþ ôîðìóëó.
Ïîêà ïðåèìóùåñòâ ôîðìóë ìàññèâîâ ïî ñðàâíåíèþ
ñ îáû÷íûìè ôîðìóëàìè íå âèäíî (çà èñÐèñ. 6.1. Èñõîäíûå äàííûå
êëþ÷åíèåì, âîçìîæíî, âðåìåíè, ñýêîíîìëåííîãî íà êîïèðîâàíèè ôîðìóëû). Òåïåðü âû÷èñëèì ñðåäíåå ýòèõ ðàçíîñòåé, äëÿ ÷åãî
âîñïîëüçóåìñÿ ñòàíäàðòíîé ôóíêöèåé СРЗНАЧ, êàê ïîêàçàíî íà ðèñ. 6.4. Ñ ïîìîùüþ ôîðìóëû ìàññèâà ýòî æå çíà÷åíèå ìîæíî ïîëó÷èòü, íå èñïîëüçóÿ âû÷èñëåííûå ðàçíîñòè! Äëÿ ýòîãî ñëåäóåò ïðèìåíèòü ôîðìóëó =СРЗНАЧ(А2:А51–
В2:В51), êîòîðàÿ ââîäèòñÿ òîëüêî â îäíó ÿ÷åéêó (à íå â äèàïàçîí ÿ÷ååê), íî ïî
çàâåðøåíèè åå ââîäà âñå ðàâíî íåîáõîäèìî íàæàòü êîìáèíàöèþ êëàâèø
<Ctrl+Shift+Enter>. Ðåçóëüòàò ïðèìåíåíèÿ ýòîé ôîðìóëû ïîêàçàí íà ðèñ. 6.5.
Ïîñëåäíÿÿ ôîðìóëà óæå äåìîíñòðèðóåò ïðåèìóùåñòâà ôîðìóë ìàññèâîâ, ïîñêîëüêó îíà èñêëþ÷èëà íåîáõîäèìîñòü âûïîëíÿòü ïðîìåæóòî÷íûå âû÷èñëåíèÿ
äëÿ íàõîæäåíèÿ ðàçíîñòåé.  ýòîé ôîðìóëå èñïîëüçóþòñÿ äâà ìàññèâà. Îíà âû÷èñëÿåò ðàçíîñòè ïàð çíà÷åíèé ÿ÷ååê äèàïàçîíîâ À2:À51 è Â2:Â51 è ñîçäàåò
â ïàìÿòè êîìïüþòåðà íîâûé âðåìåííûé ìàññèâ, â êîòîðûé çàïèñûâàåòñÿ ðåçóëüòàò ïîïàðíûõ âû÷èòàíèé. Ôóíêöèÿ СРЗНАЧ âû÷èñëÿåò ñðåäíåå çíà÷åíèå ýëåìåíòîâ íîâîãî ìàññèâà è îòîáðàæàåò åãî â ÿ÷åéêå.  ñóùíîñòè, ôîðìóëà âûïîëíèëà öèêëè÷åñêèå âû÷èñëåíèÿ, êîòîðûå çàòðóäíèòåëüíî íàïðÿìóþ ðåàëèçîâàòü
íà ðàáî÷åì ëèñòå Excel. Ïðèâåäåííûå íèæå ïðèìåðû ïîêàæóò äðóãèå äîñòîèíñòâà ôîðìóë ìàññèâîâ.
194 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.2. Ñîçäàíèå ôîðìóëû ìàññèâà
Ðèñ. 6.3. Âû÷èñëåíèå ôîðìóëû ìàññèâà
Ðèñ. 6.4. Ðåçóëüòàò âû÷èñëåíèÿ îáû÷íîé ôîðìóëû
Ðèñ. 6.5. Ðåçóëüòàò âû÷èñëåíèÿ ôîðìóëû ìàññèâà
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 195
6.1.1. Редактирование формул массивов
Ñäåëàåì íåñêîëüêî îáùèõ çàìå÷àíèé î ðåäàêòèðîâàíèè ôîðìóë ìàññèâîâ. Åñëè
ôîðìóëà ìàññèâà ïîìåùåíà â íåñêîëüêî ÿ÷ååê, ñëåäóåò ðåäàêòèðîâàòü âñå ÿ÷åéêè
äèàïàçîíà êàê îäíó ÿ÷åéêó, ïîñêîëüêó íåëüçÿ èçìåíèòü òîëüêî îäèí ýëåìåíò, ñîäåðæàùèé ôîðìóëó ìàññèâà. Åñëè ïîïûòàòüñÿ ñäåëàòü ýòî, Excel âûäàñò îêíî ñ ñîîáùåíèåì Нельзя изменить часть массива. ×òîáû îòðåäàêòèðîâàòü ôîðìóëó ìàññèâà, âûäåëèòå âñå ÿ÷åéêè ìàññèâà è àêòèâèçèðóéòå ñòðîêó ôîðìóë (ùåëêíèòå íà
íåé èëè íàæìèòå <F2>). Ïðè ðåäàêòèðîâàíèè ôîðìóëû Excel óäàëÿåò ôèãóðíûå
ñêîáêè. Çàêîí÷èâ ðåäàêòèðîâàíèå ôîðìóëû, íàæìèòå <Ctrl+Shift+Enter>, ÷òîáû
âíåñòè èçìåíåíèÿ. Òåïåðü ñîäåðæèìîå âñåõ ÿ÷ååê ìàññèâà áóäåò ñîîòâåòñòâîâàòü
âíåñåííûì èçìåíåíèÿì. (Ñîâåò. ×òîáû áûñòðî âûäåëèòü âåñü ìàññèâ, ïåðåéäèòå
ê îäíîé èç ÿ÷ååê äèàïàçîíà ìàññèâà è íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+/>, ãäå
êëàâèøà </> — ýòî êëàâèøà íà äîïîëíèòåëüíîé öèôðîâîé êëàâèàòóðå.)
Ñ ôîðìóëàìè ìàññèâîâ íåëüçÿ äåëàòü ñëåäóþùåå.
•
Èçìåíÿòü ñîäåðæèìîå îäíîé èç ÿ÷ååê, â êîòîðûõ íàõîäèòñÿ ôîðìóëà ìàññèâà.
•
Ïåðåìåùàòü îòäåëüíûå ÿ÷åéêè, íà êîòîðûå ðàñïðîñòðàíÿåòñÿ ôîðìóëà
ìàññèâà (ìîæíî ïåðåìåùàòü òîëüêî âñå ÿ÷åéêè ñ ôîðìóëîé ìàññèâà ñðàçó).
•
Óäàëÿòü îòäåëüíûå ÿ÷åéêè, íà êîòîðûå ðàñïðîñòðàíÿåòñÿ ôîðìóëà ìàññèâà
(ìîæíî óäàëèòü òîëüêî âåñü ìàññèâ öåëèêîì).
•
Âñòàâëÿòü íîâûå ÿ÷åéêè â ìàññèâ; ýòî îòíîñèòñÿ òàêæå ê âñòàâêå íîâûõ
ñòðîê èëè ñòîëáöîâ, êîòîðûå äîáàâëÿþò íîâûå ÿ÷åéêè ê ìàññèâó.
Íåëüçÿ èçìåíèòü ôîðìóëó ìàññèâà â îòäåëüíîé åãî ÿ÷åéêå; òåì íå ìåíåå,
ìîæíî ôîðìàòèðîâàòü âåñü ìàññèâ èëè îòäåëüíûå åãî ÷àñòè.
6.1.2. Массивы констант
 ïðèâåäåííîì âûøå ïðèìåðå â êà÷åñòâå ìàññèâîâ èñïîëüçîâàëèñü äèàïàçîíû
ÿ÷ååê. Îäíàêî â ôîðìóëàõ ìîæíî òàêæå èñïîëüçîâàòü ìàññèâ êîíñòàíò. Òàêîé ìàññèâ ìîæíî ââåñòè íåïîñðåäñòâåííî â ôîðìóëó (íàïðèìåð, êàê àðãóìåíò ôóíêöèè)
èëè îïðåäåëèòü çàðàíåå ñ ïîìîùüþ äèàëîãîâîãî îêíà Присвоение имени. Ìàññèâû
êîíñòàíò ìîæíî èñïîëüçîâàòü â ôîðìóëàõ âìåñòî ññûëêè íà äèàïàçîíû ÿ÷ååê.
×òîáû èñïîëüçîâàòü ìàññèâ êîíñòàíò, â ôîðìóëó ìàññèâà íåîáõîäèìî ââåñòè íàáîð
çíà÷åíèé è çàêëþ÷èòü åãî â ôèãóðíûå ñêîáêè. Ëèáî ñëåäóåò âîñïîëüçîâàòüñÿ èìåíåì ìàññèâà, åñëè îíî åìó áûëî ïðåäâàðèòåëüíî ïðèñâîåíî.
Ìàññèâ êîíñòàíò ìîæåò áûòü êàê îäíî-, òàê è äâóìåðíûì. Îäíîìåðíûå ìàññèâû ìîãóò áûòü âåðòèêàëüíûìè èëè ãîðèçîíòàëüíûìè. Ýëåìåíòû îäíîìåðíîãî
ãîðèçîíòàëüíîãî ìàññèâà îòäåëÿþòñÿ îäèí îò äðóãîãî òî÷êîé ñ çàïÿòîé, íàïðèìåð {1;2;3;4;5}. Ýëåìåíòû îäíîìåðíîãî âåðòèêàëüíîãî ìàññèâà îòäåëÿþòñÿ äâîåòî÷èåì. Íàïðèìåð, âîò êàê îïðåäåëÿåòñÿ øåñòèýëåìåíòíûé âåðòèêàëüíûé ìàññèâ: {1:2:3:4:5:6}.  äâóìåðíîì ìàññèâå ýëåìåíòû îäíîé ñòðîêè òàêæå îòäåëÿþòñÿ
òî÷êîé ñ çàïÿòîé, à ñòðîêè îòäåëÿþòñÿ îäíà îò äðóãîé äâîåòî÷èåì. Âîò ïðèìåð
ìàññèâà ðàçìåðíîñòüþ 3×4 (òðè ñòðîêè, êàæäàÿ èç êîòîðûõ çàíèìàåò ÷åòûðå
ñòîëáöà): {1;2;3;4:5;6;7;8:9;10;11;12}.
Íà ðèñ. 6.6 ïîêàçàíî, êàê ìîæíî ñîçäàòü ïîèìåíîâàííûé ìàññèâ êîíñòàíò ñ ïîìîùüþ äèàëîãîâîãî îêíà Присвоение имени (ýòî îêíî îòêðûâàåòñÿ ñ ïîìîùüþ êîìàíäû
ВставкаÖИмяÖПрисвоить).
196 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.6. Ñîçäàíèå ìàññèâà êîíñòàíò â äèàëîãîâîì îêíå Присвоение имени
Способы использования массивов констант
Êàê ãîâîðèëîñü âûøå, ïðè çàäàíèè ôóíêöèé ìàññèâû êîíñòàíò ìîãóò èñïîëüçîâàòüñÿ â êà÷åñòâå îäíîãî èç àðãóìåíòîâ, íàïðèìåð =СУММ(А1:А10;{1;3;5;7;}). Çäåñü
ñóììèðóþòñÿ çíà÷åíèÿ, ñîäåðæàùèåñÿ â äèàïàçîíå À1:À10, è çíà÷åíèÿ 1, 3, 5, 7.
Âìåñòî íàáîðà çíà÷åíèé, çàêëþ÷åííîãî â ôèãóðíûå ñêîáêè, ìîæíî óêàçàòü èìÿ
ìàññèâà, åñëè îíî ñîçäàíî çàðàíåå. Ïóñòü èìåíåì ìàññèâà áóäåò Масс_конст (î äîïóñòèìûõ èìåíàõ ìàññèâîâ ñêàçàíî íèæå), íàïðèìåð =СУММ(А1:А10;Масс_конст).
Ââîäèòü òàêèå ôóíêöèè, êàê ôîðìóëû ìàññèâîâ, íåò íåîáõîäèìîñòè.
Íà ðèñ. 6.7 ïðèâåäåíî íåñêîëüêî ïðîñòûõ ïðèìåðîâ èñïîëüçîâàíèÿ ìàññèâîâ
êîíñòàíò íåïîñðåäñòâåííî â ôîðìóëàõ. Îòìåòèì, ÷òî âñå ýòè ôîðìóëû ââîäèëèñü, êàê ôîðìóëû ìàññèâîâ (ïðåäâàðèòåëüíî áûë âûäåëåí íåîáõîäèìûé äèàïàçîí ÿ÷ååê), õîòÿ çàêëþ÷èòåëüíûå ôèãóðíûå ñêîáêè â ðåæèìå îòîáðàæåíèÿ ôîðìóë Excel íå ïîêàçûâàåò.
×òîáû ïåðåíåñòè ìàññèâ êîíñòàíò íà ðàáî÷èé ëèñò Excel, âûäåëèòå íåîáõîäèìûé äèàïàçîí ÿ÷ååê, ââåäèòå ôîðìóëó òèïà ={1;3;5;7} èëè =Масс_конст (åñëè
Масс_конст
—
èìÿ
ñóùåñòâóþùåãî
ìàññèâà)
è
íàæìèòå
êëàâèøè
<Ctrl+Shift+Enter>. Ïðè ýòîì ñëåäóåò ïîìíèòü î ðàçìåðíîñòè è îðèåíòàöèè ìàññèâà. Íàïðèìåð, ìàññèâ {1;3;5;7} — ãîðèçîíòàëüíûé ìàññèâ (ïîñêîëüêó çäåñü äëÿ
îòäåëåíèÿ ýëåìåíòîâ ìàññèâà îäèí îò äðóãîãî èñïîëüçîâàíû òî÷êà ñ çàïÿòîé),
è åñëè áóäåò âûäåëåí âåðòèêàëüíûé äèàïàçîí ÿ÷ååê, òî â ýòîò äèàïàçîí áóäåò
çàïèñàíî òîëüêî ÷èñëî 1 èç ýòîãî ìàññèâà.
6.1.3. Поименованные массивы и диапазоны
Èñïîëüçîâàíèå â ôîðìóëàõ àäðåñîâ äèàïàçîíîâ ÿ÷ååê î÷åíü óòîìèòåëüíî
è ÷àñòî ïðèâîäèò ê ñîçäàíèþ ôîðìóë, êîòîðûå òðóäíî ÷èòàòü è ïîíèìàòü
(îñîáåííî ÷åðåç íåêîòîðîå âðåìÿ). Excel ïîçâîëÿåò ïðèñâàèâàòü ÿ÷åéêàì, äèàïàçîíàì è ìàññèâàì ñîäåðæàòåëüíûå èìåíà. Íàïðèìåð, äèàïàçîí ìîæíî íàçâàòü
Выборка èëè Стат_характеристики. Èñïîëüçîâàíèå ïîäîáíûõ èìåí (ïî ñðàâíåíèþ
ñ àäðåñàìè ÿ÷ååê èëè äèàïàçîíîâ) äàåò î÷åâèäíûå ïðåèìóùåñòâà. Íàïðèìåð, ñîäåðæàòåëüíîå èìÿ äèàïàçîíà çàïîìíèòü íàìíîãî ëåã÷å, ÷åì àäðåñ ÿ÷åéêè. Êðîìå
òîãî, ïðè ââåäåíèè àäðåñîâ ÿ÷ååê è äèàïàçîíîâ ëåã÷å îøèáèòüñÿ, ÷åì ïðè ââåäåíèè èìåí, à ïðè âûáîðå èìåíè ÿ÷åéêè èëè äèàïàçîíà ýòî èìÿ ïîÿâëÿåòñÿ â ïîëå
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 197
Имя â ñòðîêå ôîðìóë. Ïðèìåíåíèå èìåí çíà÷èòåëüíî óïðîùàåò ïðîöåññ ñîçäàíèÿ
ôîðìóë — èìÿ ÿ÷åéêè èëè äèàïàçîíà ìîæíî âñòàâèòü â ôîðìóëó, èñïîëüçîâàâ
êîìàíäó ВставкаÖИмяÖВставить èëè âûáðàâ ñîîòâåòñòâóþùåå èìÿ â ïîëå Имя.
Íàêîíåö, èìåíà äåëàþò ôîðìóëû áîëåå ïîíÿòíûìè è ïðîñòûìè â èñïîëüçîâàíèè.
Ðèñ. 6.7. Ïðèìåðû èñïîëüçîâàíèÿ ìàññèâîâ êîíñòàíò
Допустимые имена диапазонов и массивов
Õîòÿ Excel äîñòàòî÷íî “ëèáåðàëüíà” â îòíîøåíèè èìåí äèàïàçîíîâ è ìàññèâîâ, ñóùåñòâóþò íåêîòîðûå ïðàâèëà èõ âûáîðà.
•
 èìåíàõ íå äîëæíî áûòü íèêàêèõ ïðîáåëîâ; äëÿ ëó÷øåãî âîñïðèÿòèÿ
èìåíè ìîæåòå âîñïîëüçîâàòüñÿ ñèìâîëîì ïîä÷åðêèâàíèÿ èëè òî÷êîé, íàïðèìåð Среднее_выборки1 èëè Среднее.выборки1.
•
Ìîæíî èñïîëüçîâàòü ëþáûå êîìáèíàöèè áóêâ è öèôð, íî èìÿ íå äîëæíî
íà÷èíàòüñÿ ñ öèôðû (íàïðèìåð, 3-йРезультат) èëè áûòü ïîõîæèì íà àäðåñ
ÿ÷åéêè (íàïðèìåð, А5).
•
Èìåíà äîëæíû ñîäåðæàòü íå áîëüøå 255 ñèìâîëîâ.
•
 êà÷åñòâå èìåíè ìîæíî èñïîëüçîâàòü îäèíî÷íûå áóêâû (çà èñêëþ÷åíèåì
R è C), íî ýòî íå ðåêîìåíäóåòñÿ äåëàòü, âåäü ñìûñë ñîñòîèò èìåííî â òîì,
÷òîáû äàâàòü ñîäåðæàòåëüíûå èìåíà.
 Excel åñòü íåñêîëüêî èìåí äëÿ âíóòðåííåãî óïîòðåáëåíèÿ. È õîòÿ ìîæíî
ñîçäàâàòü èìåíà, çàìåùàþùèå âíóòðåííèå èìåíà Excel, ëó÷øå ýòîãî íå äåëàòü.
Ïîýòîìó
ñëåäóåò
èçáåãàòü
èìåí
Область_печати,
Заголовки_печати,
Область_консолидации è Имя_листа.
198 Часть II. Средства Excel для статистического анализа
Создание имен
Ñóùåñòâóåò íåñêîëüêî ñïîñîáîâ ñîçäàíèÿ èìåí.
Èñïîëüçîâàíèå äèàëîãîâîãî îêíà Присвоение имени. ×òîáû ñîçäàòü èìÿ äëÿ
ÿ÷åéêè èëè äèàïàçîíà, ñíà÷àëà âûäåëèòå ýòó ÿ÷åéêó èëè äèàïàçîí. Çàòåì âûïîëíèòå êîìàíäó ВставкаÖИмяÖПрисвоить (èëè âîñïîëüçóéòåñü êîìáèíàöèåé
êëàâèø <Ctrl+F3>). Â ðåçóëüòàòå Excel îòîáðàçèò äèàëîãîâîå îêíî Присвоение
имени, ïîêàçàííîå íà ðèñ. 6.6.
Ââåäèòå èìÿ â ïîëå ââîäà Имя èëè âîñïîëüçóéòåñü èìåíåì, êîòîðîå ïðåäëîæèò ïðîãðàììà (åñëè îíà åãî, êîíå÷íî, ïðåäëîæèò).  òåêñòîâîì ïîëå Формула
ïîÿâèòñÿ àäðåñ àêòèâíîé èëè âûáðàííîé ÿ÷åéêè (èëè âûäåëåííîãî äèàïàçîíà).
Óáåäèòåñü â òîì, ÷òî ýòî ïðàâèëüíûé àäðåñ, à çàòåì ùåëêíèòå íà êíîïêå OK,
÷òîáû äîáàâèòü èìÿ è çàêðûòü äèàëîãîâîå îêíî. Âñå ââåäåííûå ðàíåå èìåíà îòîáðàæàþòñÿ â ñïèñêå ýòîãî äèàëîãîâîãî îêíà.
Èñïîëüçîâàíèå ïîëÿ Имя. Ñóùåñòâóåò è áîëåå áûñòðûé ñïîñîá — ñîçäàíèå
èìåíè ñ ïîìîùüþ ïîëÿ Имя â ñòðîêå ôîðìóë. Âûäåëèòå ÿ÷åéêó (èëè äèàïàçîí),
êîòîðîé íóæíî ïðèñâîèòü èìÿ, à çàòåì ùåëêíèòå íà ýòîì ïîëå è ââåäèòå èìÿ.
Íàæìèòå êëàâèøó <Enter>, è èìÿ áóäåò ñîçäàíî. Ïîëå Имя — ýòî ðàñêðûâàþùèéñÿ ñïèñîê, â êîòîðîì ñîäåðæàòñÿ âñå èìåíà, èñïîëüçóþùèåñÿ â äàííîé ðàáî÷åé êíèãå. Åñëè âûáðàòü ÿ÷åéêó (èëè äèàïàçîí), êîòîðîé ïðèñâîåíî èìÿ, ýòî
èìÿ ïîÿâèòñÿ â ïîëå Имя. ×òîáû âûáðàòü ÿ÷åéêó (èëè äèàïàçîí), êîòîðîé ïðèñâîåíî èìÿ, ùåëêíèòå íà ïîëå Имя è âûáåðèòå èç ñïèñêà íóæíîå èìÿ.  ðåçóëüòàòå Excel âûäåëèò ñîîòâåòñòâóþùóþ ÿ÷åéêó èëè äèàïàçîí.
Àâòîìàòè÷åñêîå ñîçäàíèå èìåí. ×àñòî âîçíèêàåò íåîáõîäèìîñòü èñïîëüçîâàòü
òåêñò, ñîäåðæàùèéñÿ â ðàáî÷åé òàáëèöå, äëÿ ñîçäàíèÿ èìåí ÿ÷ååê èëè äèàïàçîíîâ. Íà ðèñ. 6.8 ïðèâåäåí ïðèìåð òàêîé òàáëèöû.  äàííîì ñëó÷àå ìîæåò ïîíàäîáèòüñÿ èñïîëüçîâàòü òåêñò èç ÿ÷ååê A1 è Â1 äëÿ ñîçäàíèÿ èìåí ñîîòâåòñòâóþùèõ çíà÷åíèé ñòîëáöîâ À è B. Excel ïîçâîëÿåò ýòî ñäåëàòü ëåãêî è ïðîñòî.
Ðèñ. 6.8. Ñîçäàíèå èìåí íà îñíîâå òåêñòà, ðàñïîëîæåííîãî â ñîñåäíèõ ÿ÷åéêàõ
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 199
×òîáû ñîçäàòü èìåíà ñ ïîìîùüþ òåêñòà, ðàñïîëîæåííîãî â ñîñåäíèõ ÿ÷åéêàõ,
ñíà÷àëà âûäåëèòå ýòîò òåêñò è ÿ÷åéêè, êîòîðûå íóæíî íàçâàòü (ýòî ìîãóò áûòü êàê
îòäåëüíûå ÿ÷åéêè, òàê è äèàïàçîíû). Çàòåì âûáåðèòå êîìàíäó ВставкаÖ
ИмяÖСоздать èëè íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+F3>. Â ðåçóëüòàòå Excel îòîáðàçèò äèàëîãîâîå îêíî Создать имена, ïîêàçàííîå íà ðèñ. 6.8. Ôëàæîê îïöèè
â ýòîì äèàëîãîâîì îêíå óñòàíîâëåí íà îñíîâàíèè ïðîâåäåííîãî ïðîãðàììîé Excel
àíàëèçà âûäåëåííîãî äèàïàçîíà. Íàïðèìåð, åñëè ïðîãðàììà îáíàðóæèëà òåêñò â ïåðâîé ñòðîêå âûáðàííîãî ìíîæåñòâà ÿ÷ååê, òî îíà ïðåäëîæèò ñîçäàòü èìåíà íà îñíîâå
òåêñòà â âåðõíåé ñòðîêå (îïöèÿ в строке выше). Åñëè äîãàäêà Excel íåâåðíà, âû ìîæåòå âûáðàòü äðóãóþ îïöèþ. Ùåëêíèòå íà êíîïêå OK, è èìåíà áóäóò ñîçäàíû.
Переопределение имен
Ïîñëå îïðåäåëåíèÿ èìåíè ìîæåò ïîíàäîáèòüñÿ èçìåíèòü ÿ÷åéêó (èëè äèàïàçîí),
ê êîòîðîé îíî îòíîñèòñÿ. Äëÿ ýòîãî ìîæíî âîñïîëüçîâàòüñÿ äèàëîãîâûì îêíîì
Присвоение имени. Âûáåðèòå êîìàíäó ВставкаÖИмяÖПрисвоить, ùåëêíèòå íà èìåíè,
êîòîðîå íåîáõîäèìî ïåðåîïðåäåëèòü, è èçìåíèòå àäðåñ ÿ÷åéêè èëè äèàïàçîíà â ïîëå
ðåäàêòèðîâàíèÿ Формула. Òî æå ñàìîå ìîæíî ñäåëàòü äðóãèì ñïîñîáîì: ùåëêíóòü íà
ïîëå Формула è âûáðàòü íîâóþ ÿ÷åéêó (èëè äèàïàçîí) â ðàáî÷åì ëèñòå, óêàçàâ íà íåå
ìûøüþ. Excel àâòîìàòè÷åñêè èñïðàâëÿåò àäðåñà ÿ÷ååê, èìåþùèõ èìåíà.
6.1.4. Примеры использования формул массивов
 ýòîì ðàçäåëå ïðåäñòàâëåíî íåñêîëüêî ïðèìåðîâ, êîòîðûå äåìîíñòðèðóþò
èñïîëüçîâàíèå ôîðìóë ìàññèâîâ è ïîèìåíîâàííûõ äèàïàçîíîâ è ìàññèâîâ è êîòîðûå ìîãóò áûòü ïîëåçíûìè ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà.
Использование условных выражений
Äîïóñòèì, èìååòñÿ îäíîìåðíàÿ âûáîðêà è íåîáõîäèìî ïîäñ÷èòàòü êîëè÷åñòâî,
ñóììó è ñðåäíåå âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áîëüøå âûáîðî÷íîãî ñðåäíåãî
âñåé âûáîðêè, è àíàëîãè÷íûå âåëè÷èíû äëÿ çíà÷åíèé, êîòîðûå ìåíüøå âûáîðî÷íîãî ñðåäíåãî âñåé âûáîðêè. Ñ ïîìîùüþ ôîðìóë ìàññèâîâ òàêèå âû÷èñëåíèÿ
âûïîëíÿþòñÿ îòíîñèòåëüíî ïðîñòî. Ïóñòü äèàïàçîí âûáîðî÷íûõ çíà÷åíèé èìååò
èìÿ Данные. Ôîðìóëû è ðåçóëüòàòû âû÷èñëåíèé ïîêàçàíû íà ðèñ. 6.9.
Ê ñîæàëåíèþ, òàêèå âû÷èñëåíèÿ íåëüçÿ âûïîëíèòü ñ ïîìîùüþ ôóíêöèé
СУММЕСЛИ è СЧЁТЕСЛИ, ïîñêîëüêó îíè íå ïîääåðæèâàþò â êà÷åñòâå àðãóìåíòîâ, çàäàþùèõ óñëîâèÿ îòáîðà çíà÷åíèé, ôîðìóë ìàññèâîâ. Íî èõ ìîæíî èñïîëüçîâàòü ñ ïðîñòûìè (áåç ôîðìóë) óñëîâèÿìè îòáîðà. Íàïðèìåð, åñëè íàäî
ïîäñ÷èòàòü ñóììó òîëüêî ïîëîæèòåëüíûõ çíà÷åíèé èç äèàïàçîíà Данные, òî
âïîëíå ïîäîéäåò ôîðìóëà =СУММЕСЛИ(Данные;”>0”;Данные), ââåäåííàÿ, êàê
ôîðìóëà ìàññèâà.
Суммирование k#х чисел в выборке
Ñëåäóþùèé ïðèìåð íåìíîãî ñëîæíåå, ÷åì ïðåäûäóùèé. Ïðåäïîëîæèì, åñòü
âûáîðêà è â íåé íåîáõîäèìî âû÷èñëèòü ñóììó âñåõ òðåòüèõ ÷èñåë (â îáùåì ñëó÷àå k-õ ÷èñåë), ò.å. ñëîæèòü ïåðâîå, ÷åòâåðòîå, ñåäüìîå è ò.ä. ÷èñëà, à òàêæå âû÷èñëèòü èõ ñðåäíåå. Ýòî ìîæíî ñäåëàòü, ïðåäâàðèòåëüíî ïðèìåíèâ ñðåäñòâî
Выборка èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.4), êîòîðîå âûâåäåò â îòäåëüíûé ìàññèâ
ýòè òðåòüè ÷èñëà. Çàòåì îñòàíåòñÿ òîëüêî ïîäñ÷èòàòü ñóììó è ñðåäíåå ÷èñåë. Íî
200 Часть II. Средства Excel для статистического анализа
ýòî æå ìîæíî ñäåëàòü ñ ïîìîùüþ ôîðìóëû ìàññèâà. Ïðåäïîëîæèì, â ÿ÷åéêå
ñ èìåíåì Период íàõîäèòñÿ ÷èñëî k, äèàïàçîí âûáîðî÷íûõ çíà÷åíèé èìååò èìÿ
Выборка, âûáîðî÷íûå çíà÷åíèÿ ïðîíóìåðîâàíû è èõ íîìåðà íàõîäÿòñÿ â äèàïàçîíå Номер, êàê ïîêàçàíî íà ðèñ. 6.10.
Ðèñ. 6.9. Èñïîëüçîâàíèå óñëîâíûõ âûðàæåíèé â ôîðìóëàõ ìàññèâîâ
Ðèñ. 6.10. Äëÿ ñóììèðîâàíèÿ k-õ âûáîðî÷íûõ çíà÷åíèé è âû÷èñëåíèÿ èõ ñðåäíåãî èñïîëüçóþòñÿ ôîðìóëû ìàññèâîâ
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 201
×òîáû âû÷èñëèòü ñóììó k-õ âûáîðî÷íûõ çíà÷åíèé, èñïîëüçóåòñÿ ôîðìóëà
ìàññèâà
{=ЕСЛИ(Период=0;0;СУММ(ЕСЛИ(ОСТАТ(Номер;Период)=0;Выборка;0)))}.
Äëÿ îïðåäåëåíèÿ çíà÷åíèé ýëåìåíòîâ âûáîðêè, ïîäëåæàùèõ ñóììèðîâàíèþ,
â ôîðìóëå èñïîëüçóåòñÿ ôóíêöèÿ ОСТАТ. Îíà âîçâðàùàåò îñòàòîê îò äåëåíèÿ
ïåðâîãî ñâîåãî àðãóìåíòà íà âòîðîé àðãóìåíò. (Çíà÷åíèÿ, âîçâðàùàåìûå ýòîé
ôóíêöèåé, ïîêàçàíû íà ðèñ. 6.10 â ñòîëáöå J.) Åñëè ôóíêöèÿ ОСТАТ âîçâðàùàåò
0, òî ÷èñëî âêëþ÷àåòñÿ â ìàññèâ ñóììèðîâàíèÿ. Îáðàòèòå âíèìàíèå, ÷òî ñëó÷àé,
êîãäà Период ðàâåí 0, ðàññìîòðåí îòäåëüíî, ïîñêîëüêó ôóíêöèÿ ОСТАТ âîçâðàùàåò îøèáêó, åñëè åå âòîðîé àðãóìåíò ðàâåí 0.
Àíàëîãè÷íî ðàáîòàåò ôîðìóëà âû÷èñëåíèÿ ñðåäíåãî
{=ЕСЛИ(Период=0;0;СРЗНАЧ(ЕСЛИ(ОСТАТ(Номер;Период)=0;Выборка;0)))}.
Ïðèâåäåííûå ôîðìóëû èñïîëüçóþò ìàññèâ íîìåðîâ âûáîðî÷íûõ çíà÷åíèé.
Ìîæíî îòêàçàòüñÿ îò ýòîãî ìàññèâà è äëÿ îòáîðà âûáîðî÷íûõ çíà÷åíèé (òî÷íåå,
äëÿ îïðåäåëåíèÿ èõ ïîñëåäîâàòåëüíûõ íîìåðîâ â âûáîðêå) ïðèìåíèòü ôóíêöèþ
СТРОКА, êîòîðàÿ âîçâðàùàåò íîìåð ñòðîêè, ñîäåðæàùåé åå àðãóìåíò. Îäíàêî
â ýòîì ñëó÷àå ôîðìóëû çíà÷èòåëüíî óñëîæíÿþòñÿ, ïîñêîëüêó íåîáõîäèìî ëèáî
õðàíèòü àäðåñ ïåðâîé ÿ÷åéêè ìàññèâà Выборка îòäåëüíî, ëèáî íàõîäèòü åãî
â ïðîöåññå âû÷èñëåíèé.
Вычисление рангов
 Excel äëÿ âû÷èñëåíèÿ ðàíãîâ âûáîðî÷íûõ çíà÷åíèé ñóùåñòâóþò ôóíêöèÿ РАНГ
(ñì. ðàçäåë 4.2.5) è ñðåäñòâî Ранг и персентиль (ñì. ðàçäåë 5.5). Ñïîñîá, êîòîðûì
ýòè ôóíêöèÿ è ñðåäñòâî óñòàíàâëèâàþò ðàíãè, íå âñåãäà óñòðàèâàåò, ïîñêîëüêó îäèíàêîâûì çíà÷åíèÿì îíè ïðèñâàèâàþò îäèíàêîâûå ðàíãè, ðàâíûå ðàíãó ïåðâîãî çíà÷åíèÿ ýòîé ãðóïïû çíà÷åíèé. Íàïðèìåð, åñëè åñòü äâà îäèíàêîâûõ çíà÷åíèÿ, ïðè÷åì
ïåðâîìó èç íèõ ïðèïèñûâàåòñÿ ðàíã, íàïðèìåð, 5, òîãäà îáîèì çíà÷åíèÿì óñòàíàâëèâàåòñÿ òîò æå ðàíã 5. Îäíàêî èíîãäà íåîáõîäèìî ïðèñâàèâàòü êàæäîìó èç îäèíàêîâûõ çíà÷åíèé ñðåäíèé ðàíã, â äàííîì ñëó÷àå — 5,5. Íàïðèìåð, òàêèå ðàíãè âû÷èñëÿþòñÿ â êðèòåðèè Óèëêîêñîíà–Ìàííà–Óèòíè äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé (ñì. ðàçäåë 2.4.2).
Íà ðèñ. 6.11 ïîêàçàíû âûáîðêà è äâà ìåòîäà ðàíæèðîâàíèÿ âûáîðî÷íûõ çíà÷åíèé.  ñòîëáöàõ C, D, E ðàíãè ïîäñ÷èòàíû ñ ïîìîùüþ ñðåäñòâà Ранг
и персентиль è çàòåì îòñîðòèðîâàíû â ïîðÿäêà âîçðàñòàíèÿ çíà÷åíèé ñòîëáöà
Точка (ñòîëáåö Процент, òàêæå ãåíåðèðóåìûé ýòèì ñðåäñòâîì, óäàëåí). Â ñòîëáöå
G äëÿ âû÷èñëåíèÿ ðàíãîâ èñïîëüçóåòñÿ ôîðìóëà ìàññèâà, êîòîðàÿ â ÿ÷åéêå G2
èìååò ñëåäóþùèé âèä:
{=ЕСЛИ((СУММ(ЕСЛИ(Выборка=A2;1)))=1;(СУММ(ЕСЛИ(Выборка>=A2;1;0)));(СУММ(
ЕСЛИ(Выборка>=A2;1)))-((СУММ(ЕСЛИ(Выборка=A2;1)))-1)*0,5)}.
Ýòà ôîðìóëà ââåäåíà â ÿ÷åéêó G2 êàê ôîðìóëà ìàññèâà è çàòåì ñêîïèðîâàíà
â ÿ÷åéêè, ðàñïîëîæåííûå íèæå. Ôîðìóëà, íà ïåðâûé âçãëÿä, êàæåòñÿ äîâîëüíî
ñëîæíîé, íî, ðàçáèâ åå íà îòäåëüíûå ÷àñòè, â íåé íåòðóäíî ðàçîáðàòüñÿ.
Íà ðèñóíêå îòìå÷åíû ðàíãè îäèíàêîâûõ çíà÷åíèé, âû÷èñëÿåìûå ñðåäñòâîì
Ранг и персентиль è äàííîé ôîðìóëîé ìàññèâà.
 çàêëþ÷åíèå îòìåòèì, ÷òî îñíîâíîå ïðåèìóùåñòâî èñïîëüçîâàíèÿ ôîðìóë ìàññèâîâ ïî ñðàâíåíèþ ñî ñðåäñòâàìè ïàêåòà àíàëèçà (òèïà Ранг и персентиль) çàêëþ-
202 Часть II. Средства Excel для статистического анализа
÷àåòñÿ â òîì, ÷òî ýòè ôîðìóëû äèíàìè÷íû è ñðàçó âûäàþò çíà÷åíèÿ ïðè èçìåíåíèè âõîäíûõ äàííûõ. Êðîìå òîãî, ôîðìóëû ìàññèâîâ ÷àñòî èñêëþ÷àþò íåîáõîäèìîñòü èñïîëüçîâàíèÿ ïðîìåæóòî÷íûõ ôîðìóë (ñì. ïðèìåð èç ïðåäûäóùåãî ðàçäåëà). È, â êîíöå êîíöîâ, îíè ïîçâîëÿþò âûïîëíÿòü âû÷èñëåíèÿ, êîòîðûå òðóäíî èëè íåâîçìîæíî ñäåëàòü ïî-äðóãîìó. Êîíå÷íî, ôîðìóëû ìàññèâîâ èìåþò
è ñâîè íåäîñòàòêè, ñðåäè êîòîðûõ îòìåòèì òðóäíîñòü èõ ïîíèìàíèÿ è òî, ÷òî
ôîðìóëû ìàññèâîâ íåëüçÿ ýêñïîðòèðîâàòü â ôîðìàòû äðóãèõ ïðîãðàìì ýëåêòðîííûõ òàáëèö, íàïðèìåð ïðîãðàììû Lotus 1-2-3.
Ðèñ. 6.11. Ðàíæèðîâàíèå äàííûõ ñ ïîìîùüþ ôîðìóëû ìàññèâà
Çàêîí÷èì ðàçäåë, ïîñâÿùåííûé ìàññèâàì è ôîðìóëàì ìàññèâîâ, îïèñàíèåì
ôóíêöèé Excel, ïîçâîëÿþùèõ ðàáîòàòü ñ ìàòðèöàìè (ò.å. ñ òåìè æå ìàññèâàìè),
à òàêæå ôóíêöèé ñóììèðîâàíèÿ, â ÷àñòíîñòè ñóììèðîâàíèÿ ïðîèçâåäåíèé çíà÷åíèé äâóõ ìàññèâîâ, êîòîðûå ÷àñòî èñïîëüçóþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà äëÿ âûïîëíåíèÿ ñàìûõ ðàçíîîáðàçíûõ âû÷èñëåíèé.
6.1.5. Матричные вычисления
Ôóíêöèè äëÿ ðàáîòû ñ ìàòðèöàìè ñëåäóþùèå.
Ôóíêöèÿ
Íàçíà÷åíèå
ÌÎÁÐ
Âîçâðàùàåò îáðàòíóþ ìàòðèöó
ÌÎÏÐÅÄ
Âîçâðàùàåò îïðåäåëèòåëü ìàòðèöû
ÌÓÌÍÎÆ
Âîçâðàùàåò ïðîèçâåäåíèå ìàòðèö
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 203
Ñèíòàêñèñ ôóíêöèé:
ФУНКЦИЯ(Ìàññèâ1;Ìàññèâ2)
Ôóíêöèè МОБР è МОПРЕД èìåþò ïî îäíîìó àðãóìåíòó Массив, à ôóíêöèÿ
МУМНОЖ — äâà. Àðãóìåíò Массив ìîæåò áûòü çàäàí êàê äèàïàçîí ÿ÷ååê, êàê ìàññèâ êîíñòàíò èëè êàê èìÿ äèàïàçîíà èëè ìàññèâà. Åñëè êàêàÿ-ëèáî èç ÿ÷ååê â ìàññèâå ïóñòà èëè ñîäåðæèò òåêñò, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЗНАЧ!.
 ôóíêöèÿõ МОБР è МОПРЕД àðãóìåíò Массив äîëæåí èìåòü ðàâíîå êîëè÷åñòâî ñòðîê è ñòîëáöîâ, ïîñêîëüêó ýòè ôóíêöèè ðàáîòàþò òîëüêî ñ êâàäðàòíûìè ìàòðèöàìè. Åñëè Массив èìååò íåðàâíîå ÷èñëî ñòðîê è ñòîëáöîâ, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè îïðåäåëèòåëü îáðàùàåìîé ìàòðèöû ðàâåí
íóëþ, òî â ýòîì ñëó÷àå ôóíêöèÿ МОБР âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.
Ôóíêöèÿ МУМНОЖ âûïîëíÿåò óìíîæåíèå ìàòðèö ñòàíäàðòíûì îáðàçîì
è òðåáóåò äâóõ àðãóìåíòîâ: îäíîé ìàòðèöû ðàçìåðîì n×k (n — êîëè÷åñòâî ñòðîê,
k — êîëè÷åñòâî ñòîëáöîâ) è âòîðîé ìàòðèöû ðàçìåðîì k×m (çäåñü òàêæå k — êîëè÷åñòâî ñòðîê, à m — êîëè÷åñòâî ñòîëáöîâ). Ðåçóëüòèðóþùàÿ ìàòðèöà áóäåò
èìåòü ðàçìåð n×m. Òàêèì îáðàçîì, êîëè÷åñòâî ñòîëáöîâ àðãóìåíòà Массив1
äîëæíî áûòü òàêèì æå, êàê êîëè÷åñòâî ñòðîê àðãóìåíòà Массив2. Åñëè ýòî óñëîâèå íå âûïîëíÿåòñÿ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!.
Ôóíêöèè МОБР è МУМНОЖ äîëæíû ââîäèòüñÿ, êàê ôîðìóëû ìàññèâîâ, ò.å.
ñ èñïîëüçîâàíèåì êîìáèíàöèè êëàâèø <Ctrl+Shift+Enter> (ïðåäâàðèòåëüíî ñëåäóåò âûäåëèòü äèàïàçîí ÿ÷ååê, â êîòîðîì áóäåò âûâåäåí ðåçóëüòàò âû÷èñëåíèé).
Âñå òðè ôóíêöèè, êîòîðûå çäåñü ðàññìàòðèâàþòñÿ, ïðîèçâîäÿò âû÷èñëåíèÿ
ñ òî÷íîñòüþ äî 16 çíà÷àùèõ öèôð, ÷òî ìîæåò ïðèâåñòè ê íåáîëüøèì ÷èñëåííûì
îøèáêàì îêðóãëåíèÿ. Ïîýòîìó ÷èñëà, çíà÷åíèÿ êîòîðûõ èìåþò ïîðÿäîê 1E–16
èëè ìåíüøå, ìîæíî ñ÷èòàòü íóëåâûìè.
Íà ðèñ. 6.12 ïîêàçàíû ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé
è ôîðìóëû, ïî êîòîðûì íàõîäèòñÿ ýòî ðåøåíèå. Òàêóþ ñõåìó âû÷èñëåíèé ìîæíî èñïîëüçîâàòü, íàïðèìåð, äëÿ íàõîæäåíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè (ñì. ðàçäåë 3.4). Ïåðåìíîæåíèå ìàòðèöû ñèñòåìû è îáðàòíîé ê íåé ìàòðèöû
ñäåëàíî äëÿ òîãî, ÷òîáû îöåíèòü òî÷íîñòü âû÷èñëåíèé, ïîñêîëüêó ðåçóëüòàòîì
ýòîãî ïðîèçâåäåíèÿ ìàòðèö äîëæíà áûòü åäèíè÷íàÿ ìàòðèöà, âíåäèàãîíàëüíûå
ýëåìåíòû êîòîðîé ðàâíû íóëþ.
6.1.6. Функции суммирования
 Excel èìååòñÿ áîãàòûé àðñåíàë ôóíêöèé ñóììèðîâàíèÿ, ìíîãèå èç êîòîðûõ
ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê âûáîðîê.
Ìû íå áóäåì îïèñûâàòü “èçâåñòíûå” ôóíêöèè ñóììèðîâàíèÿ СУММ
è СУММЕСЛИ; ðàññìîòðèì äðóãèå, “ìåíåå èçâåñòíûå”, ôóíêöèè.
Функция СУММКВ
Ôóíêöèÿ âû÷èñëÿåò ñóììó êâàäðàòîâ ñâîèõ àðãóìåíòîâ, ò.å. âû÷èñëÿåò ñóììó
âèäà
∑x
2
i
, ãäå xi — çíà÷åíèÿ ìàññèâà. Åå ìîæíî èñïîëüçîâàòü, íàïðèìåð, ïðè
i
âû÷èñëåíèè âûáîðî÷íîé äèñïåðñèè èëè ñóìì êâàäðàòîâ â äèñïåðñèîííîì àíàëèçå (ñì. ðàçäåë 3.5).
204 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.12. Ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé
Ñèíòàêñèñ ôóíêöèè:
СУММКВ(×èñëî1;×èñëî2;...)
Ìîæåò èìåòü äî 30 àðãóìåíòîâ Число.  êà÷åñòâå àðãóìåíòîâ ìîæíî èñïîëüçîâàòü ìàññèâû è ññûëêè íà ìàññèâû. Åñëè ñðåäè àðãóìåíòîâ èìåþòñÿ òåêñòîâûå
èëè ëîãè÷åñêèå çíà÷åíèÿ, òî îíè èãíîðèðóþòñÿ.
Функция СУММКВРАЗН
Ôóíêöèÿ âû÷èñëÿåò ñóììó êâàäðàòîâ ïîïàðíûõ ðàçíîñòåé çíà÷åíèé äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà
∑ (x − y )
i
i
2
, ãäå xi è yi — çíà÷åíèÿ ìàññèâîâ.
i
Ñèíòàêñèñ ôóíêöèè:
СУММКВРАЗН(Ìàññèâ_x;Ìàññèâ_y)
Àðãóìåíòû Массив — ÷èñëà, ìàññèâû èëè ññûëêè íà äèàïàçîíû ÿ÷ååê. Åñëè àðãóìåíò Массив ñîäåðæèò òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå
çíà÷åíèÿ, ó÷èòûâàþòñÿ.
Åñëè àðãóìåíòû Массив_x è Массив_y ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
Функция СУММПРОИЗВ
Ôóíêöèÿ ïåðåìíîæàåò ñîîòâåòñòâóþùèå ýëåìåíòû çàäàííûõ ìàññèâîâ è âîçâðàùàåò ñóììó ýòèõ ïðîèçâåäåíèé, ò.å. âû÷èñëÿåò ñóììó âèäà
∑x y z
i
i i
, ãäå xi, yi
i
è zi — çíà÷åíèÿ ìàññèâîâ.
Ñèíòàêñèñ ôóíêöèè:
СУММПРОИЗВ(Ìàññèâ1;Ìàññèâ2;Ìàññèâ3;...)
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 205
Ôóíêöèÿ ìîæåò èìåòü äî 30 àðãóìåíòîâ. Àðãóìåíòû Массив äîëæíû èìåòü îäíó
è òó æå ðàçìåðíîñòü, ò.å., åñëè õîòÿ áû îäèí àðãóìåíò ÿâëÿåòñÿ îòäåëüíûì ÷èñëîì, òî âñå îñòàëüíûå àðãóìåíòû äîëæíû áûòü ÷èñëàìè. Åñëè æå àðãóìåíò
Массив1 ÿâëÿåòñÿ ìàññèâîì èëè ññûëêîé íà äèàïàçîí ÿ÷ååê, âñå îñòàëüíûå àðãóìåíòû äîëæíû èìåòü òàêóþ æå ðàçìåðíîñòü, ÷òî è àðãóìåíò Массив1.  ïðîòèâíîì ñëó÷àå ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Íå÷èñëîâûå ýëåìåíòû àðãóìåíòîâ òðàêòóþòñÿ êàê íóëåâûå. Åñëè çàäàí òîëüêî îäèí àðãóìåíò,
âîçâðàùàåòñÿ ñóììà ýëåìåíòîâ ýòîãî àðãóìåíòà.
Функция СУММРАЗНКВ
Ôóíêöèÿ âîçâðàùàåò ñóììó ïîïàðíûõ ðàçíîñòåé êâàäðàòîâ ñîîòâåòñòâóþùèõ
çíà÷åíèé äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà
∑ (x
2
i
− yi2 ) , ãäå xi è yi —
i
çíà÷åíèÿ ìàññèâîâ.
Ñèíòàêñèñ ôóíêöèè:
СУММРАЗНКВ(Ìàññèâ_x;Ìàññèâ_y)
Àðãóìåíòû ôóíêöèè äîëæíû áûòü ÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå ÷èñëà. Òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ, à òàêæå ïóñòûå ÿ÷åéêè â ìàññèâàõ è äèàïàçîíàõ èãíîðèðóþòñÿ. Åñëè àðãóìåíòû Массив_x
è Массив_y èìåþò ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
Функция СУММСУММКВ
Âîçâðàùàåò ñóììó ïîïàðíûõ ñóìì êâàäðàòîâ ñîîòâåòñòâóþùèõ ýëåìåíòîâ
äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà
∑ (x
2
i
+ yi2 ) , ãäå xi è yi — çíà÷åíèÿ
i
ìàññèâîâ.
Ñèíòàêñèñ ôóíêöèè:
СУММСУММКВ(Ìàññèâ_x;Ìàññèâ_y)
Àðãóìåíòû ôóíêöèè äîëæíû áûòü ÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû
ÿ÷ååê, ñîäåðæàùèå ÷èñëà. Òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ, à òàêæå ïóñòûå ÿ÷åéêè
â ìàññèâàõ è äèàïàçîíàõ èãíîðèðóþòñÿ. Åñëè àðãóìåíòû Массив_x è Массив_y èìåþò
ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.
Ðàçëè÷èå
ìåæäó
îäèíàêîâûìè
ôîðìóëàìè
=СУММСУММКВ(Х;Y)
è =СУММКВ(Х) + СУММКВ(Y) ïðîÿâëÿåòñÿ òîëüêî òîãäà, êîãäà â ìàññèâå Х èëè Y
èìåþòñÿ ýëåìåíòû, êîòîðûå èãíîðèðóþòñÿ ôóíêöèÿìè (ò.å. òåêñòîâûå, ëîãè÷åñêèå èëè ïóñòûå ÿ÷åéêè).  ïåðâîé ôîðìóëå èç ñóììû èñêëþ÷àåòñÿ ïàðà ýëåìåíòîâ, ïðèíàäëåæàùèõ ìàññèâàì Х è Y, åñëè õîòÿ áû îäèí èç íèõ èãíîðèðóåòñÿ. Âî âòîðîé ôîðìóëå ïîäîáíûå èñêëþ÷åíèÿ èç ñóìì ïðîèñõîäÿò íåçàâèñèìî.
6.2. Диаграммы
Ïðåäïîëàãàÿ, ÷òî ÷èòàòåëü çíàêîì ñ îñíîâàìè ïîñòðîåíèÿ è ïðèìåíåíèÿ äèàãðàìì è ãðàôèêîâ â Excel, çäåñü ìû ðàññìîòðèì òîëüêî íåêîòîðûå èõ âîçìîæíîñòè, à èìåííî — äîáàâëåíèå ëèíèé òðåíäà, äîáàâëåíèå ïëàíîê ïîãðåøíîñòåé
è ñîçäàíèå ãèñòîãðàìì ðàñïðåäåëåíèé.
206 Часть II. Средства Excel для статистического анализа
6.2.1. Линии тренда
Äîáàâëÿÿ ëèíèþ òðåíäà ê ïîñòðîåííîìó ãðàôèêó èçìåíåíèÿ äàííûõ, ìîæíî
îöåíèòü äèíàìèêó èçìåíåíèÿ ýòèõ äàííûõ. Ëèíèÿ òðåíäà — ýòî óðàâíåíèå ðåãðåññèè (ñì. ðàçäåë 3.4), êîòîðîå ñòðîèòñÿ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ íà îñíîâàíèè ñóùåñòâóþùèõ ðÿäîâ äàííûõ è ìîæåò áûòü ýêñòðàïîëèðîâàíî çà èíòåðâàë èñõîäíûõ äàííûõ.
Ëèíèè òðåíäà ìîãóò áûòü äîáàâëåíû òîëüêî ê îïðåäåëåííûì òèïàì äèàãðàìì: ê äèàãðàììàì ñ îáëàñòÿìè, ãèñòîãðàììàì, ãðàôèêàì, ëèíåé÷àòûì è òî÷å÷íûì äèàãðàììàì.
Äëÿ äîáàâëåíèÿ ê äèàãðàììå ëèíèè òðåíäà âûïîëíèòå ñëåäóþùèå äåéñòâèÿ.
1. Âûäåëèòå äèàãðàììó èëè ðÿä äàííûõ, ê êîòîðûì íåîáõîäèìî äîáàâèòü
ëèíèþ òðåíäà.
2. Èç ìåíþ Диаграмма âûáåðèòå êîìàíäó Добавить линию тренда, è îòêðîåòñÿ
äèàëîãîâîå îêíî Линия тренда (ðèñ. 6.13).
3. Íà âêëàäêå Тип âûáåðèòå ïîäõîäÿùèé òèï ëèíèè òðåíäà.
4. Ùåëêíèòå íà êíîïêå ОК.
Ïðèìåð êâàäðàòè÷íîé ëèíèè òðåíäà ïîêàçàí íà ðèñ. 6.14. Îáðàùàåì âíèìàíèå, ÷òî äîïîëíèòåëüíî ìîæíî âûâåñòè óðàâíåíèå ðåãðåññèè è êîýôôèöèåíò äåòåðìèíàöèè R2.
Ðèñ. 6.13. Äèàëîãîâîå îêíî Линия тренда
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 207
Ðèñ. 6.14. Ïðèìåð ëèíèè òðåíäà
Íà âêëàäêå Тип äèàëîãîâîãî îêíà Линия тренда ìîæíî âûáðàòü ñëåäóþùèå
òèïû ëèíèé òðåíäà (áîëåå ïîäðîáíàÿ èíôîðìàöèÿ îá ýòèõ òèïàõ ðåãðåññèè ïðèâåäåíà â ðàçäåëàõ 3.4 è 15.1).
•
Ëèíåéíàÿ. Ñòðîèò ïðÿìóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ
ëèíåéíîé ðåãðåññèè.
•
Ëîãàðèôìè÷åñêàÿ. Ñòðîèò ëîãàðèôìè÷åñêóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ëîãàðèôìè÷åñêèé òèï çàâèñèìîñòè.
•
Ïîëèíîìèàëüíàÿ. Ñòðîèò ïîëèíîìèàëüíóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ïîëèíîìèàëüíûé
òèï çàâèñèìîñòè. Â ïîëå Степень çàäàåòñÿ ñòåïåíü àïïðîêñèìèðóþùåãî
ïîëèíîìà (çíà÷åíèå ìîæåò ëåæàòü â èíòåðâàëå îò 2 äî 6).
•
Ñòåïåííàÿ. Ñòðîèò ñòåïåííóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ñòåïåííîé òèï çàâèñèìîñòè.
•
Ýêñïîíåíöèàëüíàÿ. Ñòðîèò ýêñïîíåíöèàëüíóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ýêñïîíåíöèàëüíûé òèï çàâèñèìîñòè.
•
Ëèíåéíàÿ ôèëüòðàöèÿ. Ñòðîèò êðèâóþ ìåòîäîì ñêîëüçÿùåãî ñðåäíåãî.
Êîëè÷åñòâî òî÷åê íà ýòîé êðèâîé ðàâíî ÷èñëó òî÷åê ðÿäà äàííûõ ìèíóñ
÷èñëî, óêàçàííîå â ïîëå Точки.  ýòîì ïîëå çàäàåòñÿ êîëè÷åñòâî òî÷åê, èñïîëüçóåìûõ äëÿ âû÷èñëåíèÿ ñêîëüçÿùåãî ñðåäíåãî. (Î ìåòîäå ñêîëüçÿùåãî
ñðåäíåãî ðå÷ü èäåò â ðàçäåëå 5.17.)
Íà ýòîé æå âêëàäêå èìååòñÿ ñïèñîê Построен на ряде, â êîòîðîì óêàçûâàåòñÿ,
íà îñíîâå êàêîãî ðÿäà äàííûõ ñòðîèòñÿ ëèíèÿ òðåíäà.
208 Часть II. Средства Excel для статистического анализа
Параметры линии тренда
Îïöèè, ïðèâåäåííûå íà âêëàäêå Параметры äèàëîãîâîãî îêíà Линия тренда
(ðèñ. 6.15), ïðåäëàãàþò ñëåäóþùèå âîçìîæíîñòè.
•
Название аппроксимирующей (сглаженной) кривой. Îïöèè ýòîé ãðóïïû ïîçâîëÿþò çàäàòü íàçâàíèå ëèíèè òðåíäà, ëèáî âûáðàâ ïðåäëàãàåìîå ïî óìîë÷àíèþ
(ïåðåêëþ÷àòåëü автоматическое), ëèáî ââåäÿ ñâîé âàðèàíò èìåíè
(ïåðåêëþ÷àòåëü другое).
•
Прогноз. Îïöèè ýòîé ãðóïïû çàäàþò ÷èñëî ïåðèîäîâ (êàê íàçàä, òàê è âïåðåä), íà êîòîðûå áóäåò âûïîëíåíà ýêñòðàïîëÿöèÿ ëèíèè òðåíäà.
•
Îïöèÿ пересечение кривой с осью Y в точке îïðåäåëÿåò òî÷êó ïåðåñå÷åíèÿ
ëèíèè òðåíäà ñ îñüþ Y.
•
Îïöèè показывать уравнение на диаграмме è поместить на диаграмму
величину достоверности аппроксимации (R^2) èñïîëüçóþòñÿ äëÿ îòîáðàæåíèÿ íà äèàãðàììå óðàâíåíèÿ ðåãðåññèè è çíà÷åíèÿ êîýôôèöèåíòà äåòåðìèíàöèè, êàê ïîêàçàíî íà ðèñ. 6.14.
Ðèñ. 6.15. Âêëàäêà Параметры äèàëîãîâîãî îêíà
Линия тренда
Форматирование линии тренда
Êàê è â ñëó÷àå èñïîëüçîâàíèÿ äðóãèõ ýëåìåíòîâ äèàãðàììû, ìîæåò âîçíèêíóòü íåîáõîäèìîñòü èçìåíèòü êàêèå-ëèáî ïàðàìåòðû îòîáðàæåíèÿ ëèíèè òðåíäà.
Âûäåëèâ ëèíèþ òðåíäà, ìîæíî ôîðìàòèðîâàòü åå òî÷íî òàê æå, êàê è ëþáîé
äðóãîé ýëåìåíò äèàãðàììû.
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 209
Äëÿ ôîðìàòèðîâàíèÿ ëèíèè òðåíäà âûïîëíèòå ñëåäóþùåå.
1. Âûäåëèòå ëèíèþ òðåíäà.
2. Èç ìåíþ Формат âûáåðèòå êîìàíäó Выделенная линия тренда, è îòêðîåòñÿ
äèàëîãîâîå îêíî Формат линии тренда.
3. Íà âêëàäêå Вид äèàëîãîâîãî îêíà Формат линии тренда âûáåðèòå íåîáõîäèìûå ïàðàìåòðû ôîðìàòèðîâàíèÿ (ðèñ. 6.16).
Ðèñ. 6.16. Âêëàäêà Вид äèàëîãîâîãî îêíà Формат
линии тренда
Äâå äðóãèå âêëàäêè äèàëîãîâîãî îêíà Формат линии тренда ïîâòîðÿþò âêëàäêè Тип è Параметры äèàëîãîâîãî îêíà Линия тренда. Ïîýòîìó â îêíå Формат
линии тренда ìîæíî òàêæå èçìåíèòü òèï ëèíèè òðåíäà è åå ïàðàìåòðû.
6.2.2. Планки погрешностей
Äëÿ îïðåäåëåííûõ òèïîâ äèàãðàìì ìîæíî äîáàâèòü ê òî÷êàì äàííûõ ïëàíêè
ïîãðåøíîñòåé. Îíè îáû÷íî èñïîëüçóþòñÿ äëÿ òîãî, ÷òîáû ïîêàçàòü ñòåïåíü èçìåí÷èâîñòè çíà÷åíèÿ äàííûõ â êîíêðåòíîé òî÷êå. Ïëàíêè ïîãðåøíîñòåé äëÿ
çíà÷åíèé îñè Y ïðèìåíÿþòñÿ òîëüêî äëÿ äèàãðàìì ñ îáëàñòÿìè, ãèñòîãðàìì,
ãðàôèêîâ, ëèíåé÷àòûõ è òî÷å÷íûõ äèàãðàìì. Íàáîð äàííûõ òî÷å÷íîé äèàãðàììû ìîæåò èìåòü ïëàíêè ïîãðåøíîñòåé è äëÿ çíà÷åíèé îñè Õ, è äëÿ çíà÷åíèé
îñè Y îäíîâðåìåííî. Ùåëêíèòå â äèàëîãîâîì îêíå Формат ряда данных íà
âêëàäêå Y-погрешности, ÷òîáû âûâåñòè íà ýêðàí îïöèè, ïîêàçàííûå íà ðèñ. 6.17.
210 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.17. Âêëàäêà Y-погрешности äèàëîãîâîãî îêíà
Формат ряда данных
 Excel ìîæíî óñòàíîâèòü ñëåäóþùèå òèïû ïëàíîê ïîãðåøíîñòåé.
•
Ïåðåêëþ÷àòåëü фиксированное значение. Ïëàíêè ïîãðåøíîñòåé èìåþò çàäàííûé ôèêñèðîâàííûé ðàçìåð.
•
Ïåðåêëþ÷àòåëü относительное значение. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â ïðîöåíòàõ îò êàæäîãî çíà÷åíèÿ.
•
Ïåðåêëþ÷àòåëü стандартное отклонение. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â åäèíèöàõ ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ îò ñðåäíåãî çíà÷åíèÿ, êîòîðûå Excel âû÷èñëÿåò äëÿ ðÿäà äàííûõ.
•
Ïåðåêëþ÷àòåëü стандартная погрешность. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â åäèíèöàõ ñðåäíåêâàäðàòè÷åñêîé îøèáêè, êîòîðóþ âû÷èñëÿåò Excel
äëÿ ðÿäà äàííûõ.
•
Ïåðåêëþ÷àòåëü пользовательская. Çäåñü ìîæíî óêàçàòü ðàçìåð âåðõíåé
è íèæíåé ïëàíîê ïîãðåøíîñòåé.  ïîëÿ ââîäà ýòîé îïöèè ìîæíî ââåñòè çíà÷åíèÿ èëè ññûëêó íà äèàïàçîí, â êîòîðîì ñîäåðæàòñÿ çíà÷åíèÿ
ïîãðåøíîñòåé.
Íà ðèñ. 6.18 ïîêàçàíà äèàãðàììà, ê êîòîðîé áûëè äîáàâëåíû ïëàíêè ïîãðåøíîñòåé. Ìîæíî îòêðûòü äèàëîãîâîå îêíî Формат планок погрешностей
è ñ åãî ïîìîùüþ èçìåíèòü âíåøíèé âèä ïëàíîê ïîãðåøíîñòåé, íàïðèìåð
ñòèëü ëèíèé è öâåò.
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 211
Ðèñ. 6.18. Íà äèàãðàììå ê ðÿäó äàííûõ äîáàâëåíû ïëàíêè ïîãðåøíîñòåé
6.2.3. Построение гистограмм и функций распределения
дискретных случайных величин
Îáû÷íî äëÿ ïîñòðîåíèÿ ãèñòîãðàìì äèñêðåòíûõ ðàñïðåäåëåíèé â Excel èñïîëüçóåòñÿ òèï äèàãðàììû Гистограмма. Îäíàêî ýòîò òèï äèàãðàììû ìîæíî èñïîëüçîâàòü òîëüêî òîãäà, êîãäà çíà÷åíèÿ, ïðèíèìàåìûå äèñêðåòíîé ñëó÷àéíîé
âåëè÷èíîé, ðàñïîëàãàþòñÿ íà îñè ÎÕ ðàâíîìåðíî (ò.å. ÷åðåç ðàâíûå ïðîìåæóòêè). Åñëè æå îíè ðàñïîëàãàþòñÿ íåðàâíîìåðíî, òî ïîäõîäèò òîëüêî òèï äèàãðàììû Точечная. Íî ýòîò òèï äèàãðàììû íå ïîçâîëÿåò ñòðîèòü ñòîëáöîâûå äèàãðàììû.
Îòìåòèì, ÷òî ñðåäñòâî Гистограмма èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.2) òàêæå íå ìîæåò ñòðîèòü ãèñòîãðàììû äëÿ íåðàâíîìåðíî ðàñïðåäåëåííûõ çíà÷åíèé.
Èç ýòîé ñèòóàöèè ïðåäëàãàåì ñëåäóþùèé âûõîä. Ïóñòü èìååòñÿ âåðîÿòíîñòíàÿ òàáëèöà, â ñòîëáöå À ñîäåðæàùàÿ çíà÷åíèÿ, êîòîðûå ìîæåò ïðèíèìàòü ñëó÷àéíàÿ âåëè÷èíà, à â ñòîëáöå  — âåðîÿòíîñòè ïðèíÿòèÿ ýòèõ çíà÷åíèé, êàê ïîêàçàíî íà ðèñ. 6.19. Ñòðîèòñÿ äèàãðàììà òèïà Точечная áåç ëèíèé, ñîåäèíÿþùèõ
òî÷êè äàííûõ. Çàòåì âûäåëÿåòñÿ ðÿä äàííûõ è âûáèðàåòñÿ êîìàíäà
ФорматÖВыделенный ряд. Â îòêðûâøåìñÿ äèàëîãîâîì îêíå Формат ряда данных
ïåðåõîäèì íà âêëàäêó Y-погрешности è çàäàåì
ïëàíêó ïîãðåøíîñòè òèïà Минус.  êà÷åñòâå
âåëè÷èíû ïîãðåøíîñòè çàäàåì Относительное
значение 100% (ðèñ. 6.20). Íà ãðàôèêå ïîÿâëÿþòñÿ âåðòèêàëüíûå ñòîëáöû îò çíà÷åíèé äàííûõ äî îñè Õ. Òåïåðü îñòàåòñÿ îòôîðìàòèðîâàòü
ïëàíêè ïîãðåøíîñòåé è çíà÷åíèÿ äàííûõ.
Ó çíà÷åíèé äàííûõ óáèðàåì ìàðêåðû (îïöèÿ
Отсутствует â îáëàñòè Маркер âêëàäêè Вид äèàëîãîâîãî îêíà Формат ряда данных), äëÿ ïëàíîê
ïîãðåøíîñòåé â äèàëîãîâîì îêíå Формат планок
погрешностей íà âêëàäêå Вид âûáèðàåì âèä
Ðèñ. 6.19. ×àñòîòíàÿ òàáëèöà
212 Часть II. Средства Excel для статистического анализа
ïëàíêè áåç ãîðèçîíòàëüíîé ëèíèè è äåëàåì åå ìàêñèìàëüíî “òîëñòîé” (ýòè îïöèè ïîêàçàíû íà ðèñ. 6.21).  ðåçóëüòàòå ïîëó÷àåì ãèñòîãðàììó âûáîðêè, ïîêàçàííóþ íà ðèñ. 6.22.
Ðèñ. 6.20. Äèàëîãîâîå îêíî Формат ряда данных
Ðèñ. 6.21. Äèàëîãîâîå îêíî Формат планок погрешностей
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 213
Ðèñ. 6.22. Ãèñòîãðàììà äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ
Òàêóþ äèàãðàììó ìîæíî ñîõðàíèòü êàê íåñòàíäàðòíóþ â ñðåäñòâå ïîñòðîåíèÿ äèàãðàìì Excel äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ. Äëÿ ýòîãî âûäåëèòå äèàãðàììó, âûïîëíèòå êîìàíäó ДиаграммаÖТип диаграммы, â îòêðûâøåìñÿ äèàëîãîâîì îêíå Тип диаграммы ïåðåéäèòå íà âêëàäêó Нестандартные, óñòàíîâèòå
ïåðåêëþ÷àòåëü Дополнительные è ùåëêíèòå íà êíîïêå Добавить.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Добавление нового типа диаграммы ïðèñâîéòå èìÿ ýòîìó òèïó äèàãðàììû è äàéòå åå îïèñàíèå.
Ïîñòðîåíèå ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí òàêæå èìååò íåêîòîðûå ñëîæíîñòè, ïîñêîëüêó òàêàÿ ôóíêöèÿ èìååò ñòóïåí÷àòûé âèä, íî íè ñðåäñòâî ïîñòðîåíèÿ äèàãðàìì Excel, íè ñðåäñòâî
Гистограмма èç ïàêåòà àíàëèçà òàêèå ãðàôèêè ñòðîèòü íå ìîæåò. Ïîêàæåì, êàê
âñå-òàêè â Excel ïîñòðîèòü òàêîé ãðàôèê.
Ïóñòü çàäàíû çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, êàê ïîêàçàíî íà ðèñ. 6.23.
×òîáû ïîäñ÷èòàòü ýòè çíà÷åíèÿ íà îñíîâå èçâåñòíûõ âåðîÿòíîñòåé îòäåëüíûõ
çíà÷åíèé, â ÿ÷åéêó Ñ2 (åñëè äàííûå ðàñïîëàãàþòñÿ òàê æå, êàê íà ðèñ. 6.23) çàïèñûâàåòñÿ ôîðìóëà =В2, â ÿ÷åéêó Ñ3 — =С2+В3. Çàòåì ýòà ôîðìóëà ðàñïðîñòðàíÿåòñÿ âíèç äî ÿ÷åéêè Ñ8.
×òîáû ïîñòðîèòü ñòóïåí÷àòûé ãðàôèê ôóíêöèè ðàñïðåäåëåíèÿ, íåêîòîðûå îïåðàöèè ïðèäåòñÿ âûïîëíèòü âðó÷íóþ. Ñíà÷àëà âñòàâèì ïóñòîé ñòîëáåö ïåðåä ñòîëáöîì, ñîäåðæàùèì çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, è ñêîïèðóåì â íåãî âûáîðî÷íûå çíà÷åíèÿ èç ñòîëáöà À. Çàòåì ïåðåä êàæäîé ñòðîêîé â ñòîëáöàõ Ñ è D (òåïåðü
â ñòîëáöå D íàõîäÿòñÿ çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ) âñòàâèì ïî ïóñòîé ñòðîêå, ñäâèãàÿ ÿ÷åéêè âíèç. Äîëæíî ïîëó÷èòüñÿ òàê, êàê ïîêàçàíî íà ðèñ. 6.24.
Äàëåå â ÿ÷åéêó Ñ2 ââåäåì ôîðìóëó =С3-0,0000001, à â ÿ÷åéêó D2 — ÷èñëî 0.
Ôîðìóëó èç ÿ÷åéêè Ñ2 ñêîïèðóåì â ÿ÷åéêó Ñ4, à â ÿ÷åéêó D4 ââåäåì ôîðìóëó
=D3. Âûäåëèì ÿ÷åéêè Ñ4:D4 è ñêîïèðóåì èõ âî âñå ñâîáîäíûå ÿ÷åéêè âíèç äî
ñòðîêè 14.  ÿ÷åéêó Ñ16 ìîæíî ââåñòè ÷èñëî 5, à â ÿ÷åéêó D16 — ÷èñëî 1
(íî ýòî íå îáÿçàòåëüíî). Ðàáî÷èé ëèñò íà ýòîì ýòàïå ïîêàçàí íà ðèñ. 6.25.
214 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.23. Âû÷èñëåíèå çíà÷åíèé ôóíêöèè
ðàñïðåäåëåíèÿ
Ðèñ. 6.24. Âñòàâêà ïóñòûõ ÿ÷ååê
Òåïåðü äëÿ ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äîñòàòî÷íî ïîñòðîèòü ñðåäñòâàìè Excel äèàãðàììó òèïà Точечная ñ ñîåäèíèòåëüíûìè
ëèíèÿìè áåç ìàðêåðîâ íà îñíîâå äàííûõ äèàïàçîíà Ñ2:D16. Ãîòîâàÿ îòôîðìàòèðîâàííàÿ äèàãðàììà ïîêàçàíà íà ðèñ. 6.26. ×òîáû ïðîâåñòè ïóíêòèðíûå ëèíèè
â óçëîâûõ òî÷êàõ ãðàôèêà, èñïîëüçóþòñÿ ïëàíêè ïîãðåøíîñòåé, êàê îïèñàíî
âûøå, ïðè ïîñòðîåíèè ãèñòîãðàììû. Òàêóþ äèàãðàììó ìîæíî ñîõðàíèòü êàê íåñòàíäàðòíóþ äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ.
6.2.4. Гистограммы с перекрытием
Òî, ÷òî áóäåò ïîêàçàíî â ýòîì ðàçäåëå, îòíîñèòñÿ ê “ìàëåíüêèì ñåêðåòàì”
ôîðìàòèðîâàíèÿ äèàãðàìì è íå èãðàåò ïðèíöèïèàëüíîé ðîëè, îäíàêî ïîçâîëÿåò
ñäåëàòü, íàïðèìåð, ãèñòîãðàììû ÷àñòîò áîëåå íàãëÿäíûìè äëÿ ñðàâíåíèÿ. Îáû÷íî íà ãèñòîãðàììàõ, ïîñòðîåííûõ ïî íåñêîëüêèì ðÿäàì äàííûõ, ñòîëáöû, ñîîòâåòñòâóþùèå ðàçíûì ðÿäàì äàííûõ, èìåþò îäíó è òó æå øèðèíó, îïðåäåëÿåìóþ
ïàðàìåòðîì Ширина зазора íà âêëàäêå Параметры äèàëîãîâîãî îêíà Формат ряда
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 215
данных. Åñëè ñîâìåñòèòü ñòîëáöû ðàçíûõ ðÿäîâ äàííûõ, òî îíè ïåðåêðûâàþò
äðóã äðóãà è äèàãðàììà ñòàíîâèòñÿ íå÷èòàåìîé. ×òîáû ñäåëàòü ñòîëáöû ðàçíîé
øèðèíû, êàê ïîêàçàíî íà ðèñ. 6.27, çíà÷åíèÿ îäíîãî èëè íåñêîëüêèõ ðÿäîâ äàííûõ ñëåäóåò îòëîæèòü íà äîïîëíèòåëüíîé îñè, à çàòåì ñäåëàòü ýòó îñü íåâèäèìîé è îòìåíèòü çàëèâêó äëÿ îäíîãî èç ðÿäîâ äàííûõ.
Ðèñ. 6.25. Âñå ãîòîâî äëÿ ïîñòðîåíèÿ ãðàôèêà
Ðèñ. 6.26. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
216 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.27. Ãèñòîãðàììà ñ ïåðåêðûòèåì
Äëÿ ñîçäàíèÿ ïîäîáíîãî ýôôåêòà âûïîëíèòå ñëåäóþùåå.
1. Íà÷íèòå ñ ïîñòðîåíèÿ ãèñòîãðàììû.
2. Âûäåëèòå îäèí èç ðÿäîâ äàííûõ.
3. Èç ìåíþ Формат âûáåðèòå êîìàíäó Выделенный ряд, è îòêðîåòñÿ äèàëîãîâîå îêíî Формат ряда данных.
4. Ïåðåéäèòå íà âêëàäêó Вид è â ãðóïïå Заливка óñòàíîâèòå ïåðåêëþ÷àòåëü
прозрачная.
5. Ïåðåéäèòå íà âêëàäêó
вспомогательной оси.
Ось
è
óñòàíîâèòå
ïåðåêëþ÷àòåëü
по
6. Ïåðåéäèòå íà âêëàäêó Параметры (ðèñ. 6.28).
7. Ïðèñâîéòå ïàðàìåòðó Перекрытие çíà÷åíèå 0, à ïàðàìåòðó Ширина зазора —
çíà÷åíèå 50.
8. Ùåëêíèòå íà êíîïêå ОК.
6.3. Надстройка Поиск решения
Поиск решения — ýòî íàäñòðîéêà, âõîäÿùàÿ â ïîñòàâêó Excel è ïðåäíàçíà÷åííàÿ äëÿ ðåøåíèÿ çàäà÷ ëèíåéíîé è íåëèíåéíîé îïòèìèçàöèè1. Äëÿ ýòîãî â íåé
èñïîëüçóþòñÿ ìåòîäû è àëãîðèòìû ìàòåìàòè÷åñêîãî ïðîãðàììèðîâàíèÿ, êîòîðûå
ïîçâîëÿþò íàõîäèòü îïòèìàëüíûå ðåøåíèÿ çàäà÷ îïòèìèçàöèè, ïðåäñòàâëåííûõ
â Excel â âèäå òàáëè÷íûõ ìîäåëåé. Äëÿ ëèíåéíûõ çàäà÷ íàäñòðîéêà Поиск
решения èñïîëüçóåò ñèìïëåêñ-ìåòîä, äëÿ çàäà÷ öåëî÷èñëåííîãî ïðîãðàììèðîâàíèÿ —
1
Íàäñòðîéêà Поиск решения (â îðèãèíàëüíîé àíãëîÿçû÷íîé âåðñèè Excel îíà íàçûâàåòñÿ
Solver) ðàçðàáîòàíà êîìïàíèåé Frontline Systems (http://www.frontsys.com). Ýòîé æå êîìïàíèåé ðàçðàáîòàíî íåñêîëüêî ðàñøèðåííûõ êîììåð÷åñêèõ ïðîãðàìì-îïòèìèçàòîðîâ, â òîì
÷èñëå íàäñòðîéêà Premium Edition Solver, êîòîðàÿ íå òîëüêî ðàñøèðÿåò âîçìîæíîñòè ñòàíäàðòíîé íàäñòðîéêè Поиск решения (íàïðèìåð, ñîäåðæèò íåñêîëüêî ñïîñîáîâ êîððåêöèè îøèáîê è ãåíåðèðóåò äîïîëíèòåëüíûå îò÷åòû), íî è èìååò íåñêîëüêî íîâûõ âñòðîåííûõ àëãîðèòìîâ ðåøåíèÿ ñóùåñòâåííî íåëèíåéíûõ çàäà÷, â òîì ÷èñëå ãåíåòè÷åñêèé àëãîðèòì.
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 217
ìåòîä âåòâåé è ãðàíèö è äëÿ íåëèíåéíûõ çàäà÷ — ìåòîä ïðèâåäåííîãî ãðàäèåíòà. Ïîäðîáíûå ñâåäåíèÿ î íàäñòðîéêå Поиск решения è åå èñïîëüçîâàíèè äëÿ ðåøåíèÿ îïòèìèçàöèîííûõ çàäà÷, ìîæíî íàéòè â êíèãå [12].
Ðèñ. 6.28. Óñòàíîâêà çíà÷åíèÿ ïåðåêðûòèÿ è øèðèíû çàçîðà
Ñðåäñòâî Поиск решения ìîæíî ýôôåêòèâíî èñïîëüçîâàòü íå òîëüêî ïðè ðåøåíèè çàäà÷ îïòèìèçàöèè, íî è ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà. Íèæå
áóäóò ïîêàçàíû ïðèìåðû ïðèìåíåíèÿ ñðåäñòâà Поиск решения äëÿ ðåøåíèÿ ñèñòåì ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé (ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ
êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè) è äëÿ ïîäáîðà ïàðàìåòðîâ ðàñïðåäåëåíèé.
Äðóãèå ïðèìåíåíèÿ ñðåäñòâà Поиск решения äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí ïîêàçàíû â ãëàâå 7.
6.3.1. Задачи оптимизации и средство Поиск решения
Ïîñêîëüêó ðàññìàòðèâàåìîå çäåñü ñðåäñòâî ïðåäíàçíà÷åíî, â ïåðâóþ î÷åðåäü,
äëÿ ðåøåíèÿ çàäà÷ îïòèìèçàöèè, íåîáõîäèìî èìåòü õîòÿ áû îáùåå ïðåäñòàâëåíèå îá ýòèõ çàäà÷àõ è çíàòü ñîîòâåòñòâóþùóþ òåðìèíîëîãèþ, òàê êàê îíà èñïîëüçóåòñÿ ïðè çàäàíèè ïàðàìåòðîâ äàííîãî ñðåäñòâà. Ïîýòîìó ïðèâåäåì îáùóþ
ôîðìóëèðîâêó çàäà÷ îïòèìèçàöèè è ïîêàæåì, êàê ïðåäñòàâèòü åå â âèäå òàáëè÷íîé ìîäåëè íà ðàáî÷åì ëèñòå Excel.
Îáùóþ çàäà÷ó îïòèìèçàöèè ìîæíî ñôîðìóëèðîâàòü ñëåäóþùèì îáðàçîì.
Ïóñòü X = (x1, x2, ..., xn) — âåêòîð äåéñòâèòåëüíûõ ïåðåìåííûõ. Íåîáõîäèìî
ìèíèìèçèðîâàòü (èëè ìàêñèìèçèðîâàòü) öåëåâóþ ôóíêöèþ z = f(X)
ïðè âûïîëíåíèè îãðàíè÷åíèé
g1(X) ≤ b1,
218 Часть II. Средства Excel для статистического анализа
g2(X) ≤ b2,
...
gm(X) ≤ bm.
Îáû÷íî ïðåäïîëàãàåòñÿ, ÷òî ôóíêöèè f(X) è gi(X) (i = 1, 2, ..., m) äâàæäû íåïðåðûâíî äèôôåðåíöèðóåìû. ×àñòî äîáàâëÿþòñÿ óñëîâèÿ íåîòðèöàòåëüíîñòè ïåðåìåííûõ X ≥ 0, êîòîðûå ìîãóò êàê âêëþ÷àòüñÿ â óêàçàííûå m îãðàíè÷åíèé,
òàê è íå âêëþ÷àòüñÿ. Ñðåäè îãðàíè÷åíèé ìîãóò áûòü îãðàíè÷åíèÿ â âèäå íåðàâåíñòâ è â âèäå ðàâåíñòâ. Âåêòîð (b1, b2, ..., bm) íàçûâàåòñÿ âåêòîðîì ïðàâûõ ÷àñòåé îãðàíè÷åíèé.
Åñëè âñå ôóíêöèè f(X) è gi(X) ëèíåéíû îòíîñèòåëüíî ïåðåìåííûõ x1, x2, ...,
xn, èìååì çàäà÷ó ëèíåéíîé îïòèìèçàöèè; åñëè õîòÿ áû îäíà èç ýòèõ ôóíêöèé
íåëèíåéíàÿ, ïîëó÷àåì çàäà÷ó íåëèíåéíîé îïòèìèçàöèè.
Èòàê, çàäà÷à îïòèìèçàöèè âêëþ÷àåò òðè “îáúåêòà”: ïåðåìåííûå x1, x2, ..., xn
(â ñðåäñòâå Поиск решения ÿ÷åéêè, ñîäåðæàùåé çíà÷åíèÿ ýòèõ ïåðåìåííûõ, îíè
íàçûâàþòñÿ èçìåíÿåìûìè ÿ÷åéêàìè), öåëåâàÿ ôóíêöèÿ (ÿ÷åéêà, ñîäåðæàùàÿ
çíà÷åíèå ýòîé ôóíêöèè â ñðåäñòâå Поиск решения, íàçûâàåòñÿ öåëåâîé ÿ÷åéêîé)
è îãðàíè÷åíèÿ (äëÿ ïðèìåíåíèÿ ñðåäñòâà Поиск решения îãðàíè÷åíèÿ ìîãóò áûòü
çàïèñàíû íà ðàáî÷åì ëèñòå è çàòåì óêàçàíû â äèàëîãîâîì îêíå ýòîãî ñðåäñòâà
ëèáî çàäàíû íåïîñðåäñòâåííî â ýòîì îêíå áåç çàïèñè íà ðàáî÷åì ëèñòå). Ïðè çàäàíèè îãðàíè÷åíèé îòäåëüíî óêàçûâàþòñÿ ôóíêöèè îãðàíè÷åíèé gi(X) (i = 1, 2,
..., m) è âåêòîð ïðàâûõ ÷àñòåé îãðàíè÷åíèé (b1, b2, ..., bm).
Ïðè ñîçäàíèè òàáëè÷íîé ìîäåëè îïòèìèçàöèè â Excel ïðåäëàãàåì ó÷èòûâàòü
ñëåäóþùèå ðåêîìåíäàöèè, êîòîðûå îáëåã÷àò äàëüíåéøåå ïðèìåíåíèå ñðåäñòâà
Поиск решения.
•
Çíà÷åíèÿ ïåðåìåííûõ ðàñïîëàãàþòñÿ â îòäåëüíûõ ÿ÷åéêàõ è ãðóïïèðóþòñÿ â îòäåëüíûé áëîê ÿ÷ååê.
•
Êàæäîìó îãðàíè÷åíèþ îòâîäèòñÿ îòäåëüíàÿ ñòðîêà èëè ñòîëáåö òàáëèöû.
Îãðàíè÷åíèÿ ãðóïïèðóþòñÿ â îòäåëüíûé áëîê ÿ÷ååê.
•
Æåëàòåëüíî, ÷òîáû ÿ÷åéêè, ñîäåðæàùèå ïåðåìåííûå è çíà÷åíèå öåëåâîé
ôóíêöèè, à òàêæå âñå îãðàíè÷åíèÿ, èìåëè çàãîëîâêè.
•
Êîýôôèöèåíòû öåëåâîé ôóíêöèè äîëæíû õðàíèòüñÿ â îòäåëüíîé ñòðîêå,
ðàñïîëàãàÿñü íåïîñðåäñòâåííî ïîä èëè íàä ñîîòâåòñòâóþùèìè ïåðåìåííûìè; ôîðìóëà äëÿ âû÷èñëåíèÿ öåëåâîé ôóíêöèè äîëæíà íàõîäèòüñÿ â ñîñåäíåé ÿ÷åéêå.
•
 êàæäîé ñòðîêå îãðàíè÷åíèé çà ÿ÷åéêàìè, ñîäåðæàùèìè êîýôôèöèåíòû
äàííîãî îãðàíè÷åíèÿ, ñëåäóåò ÿ÷åéêà, â êîòîðóþ çàïèñûâàåòñÿ âû÷èñëåííîå
çíà÷åíèå ôóíêöèè îãðàíè÷åíèÿ (çíà÷åíèå ëåâîé ÷àñòè îãðàíè÷åíèÿ). Çà íåé
ìîæåò ñëåäîâàòü ÿ÷åéêà, â êîòîðîé ñòîèò ñîîòâåòñòâóþùèé çíàê íåðàâåíñòâà
èëè ðàâåíñòâà îãðàíè÷åíèÿ, à çàòåì ÿ÷åéêà, ñîäåðæàùàÿ çíà÷åíèå ïðàâîé
÷àñòè îãðàíè÷åíèÿ. Äîïîëíèòåëüíî ìîæíî èìåòü ÿ÷åéêó, â êîòîðîé âû÷èñëåíà ðàçíîñòü ìåæäó çíà÷åíèÿìè ëåâîé è ïðàâîé ÷àñòåé íåðàâåíñòâà.
•
Óñëîâèÿ íåîòðèöàòåëüíîñòè ïåðåìåííûõ ðåøåíèÿ íå îáÿçàòåëüíî âêëþ÷àòü
â òàáëè÷íóþ ìîäåëü. Êàê ïðàâèëî, îíè îïóñêàþòñÿ è óêàçûâàþòñÿ íåïîñðåäñòâåííî â äèàëîãîâîì îêíå ñðåäñòâà Поиск решения.
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 219
 ðåçóëüòàòå âûïîëíåíèÿ ýòèõ ðåêîìåíäàöèé âñå îñíîâíûå êîýôôèöèåíòû ìîäåëè
ñîäåðæàòñÿ â îòäåëüíûõ ÿ÷åéêàõ, ïîýòîìó èõ ëåãêî èçìåíÿòü, íå ìåíÿÿ ôîðìóë ìîäåëè. Áëàãîäàðÿ ãðóïïèðîâàíèþ óïðîùàåòñÿ ðàáîòà ñî ñðåäñòâîì Поиск решения, ïîñêîëüêó äëÿ óêàçàíèÿ ïåðåìåííûõ èëè îãðàíè÷åíèé ìîæíî èñïîëüçîâàòü äèàïàçîíû
ÿ÷ååê, ò.å. çàäàâàòü ïåðåìåííûå è îãðàíè÷åíèÿ ãðóïïîé, à íå ïî îòäåëüíîñòè.
Íà ðèñ. 6.29 ïîêàçàíà òàáëè÷íàÿ ìîäåëü äëÿ ñëåäóþùåé ïðîñòîé çàäà÷è:
ìèíèìèçèðîâàòü z = 2õ1 + 3õ2 + 5õ3
ïðè îãðàíè÷åíèÿõ
õ1 + õ2 – õ3 ≥ –5,
–6õ1 + 7õ2 – 9õ3 ≤ 4,
õ1 + õ2 + 4õ3 = 10.
Íà ïåðåìåííûå õ1 è õ2 òàêæå íàêëàäûâàþòñÿ óñëîâèÿ íåîòðèöàòåëüíîñòè2.
Ðèñ. 6.29. Òàáëè÷íàÿ ìîäåëü çàäà÷è îïòèìèçàöèè
Íà ýòîì æå ïðèìåðå íàíåñåì ïåðâûé “âèçèò” ê ñðåäñòâó Поиск решения. Íî ñíà÷àëà ñäåëàåì ñëåäóþùåå çàìå÷àíèå. Íàäñòðîéêà Поиск решения, õîòÿ è âõîäèò â ïîñòàâêó Excel, íå ïîäêëþ÷àåòñÿ àâòîìàòè÷åñêè ê ýòîé ïðîãðàììå. Ïîýòîìó, åñëè
â ìåíþ Сервис íåò êîìàíäû Поиск решения, çíà÷èò, íàäñòðîéêà íå ïîäêëþ÷åíà. Äëÿ
åå ïîäêëþ÷åíèÿ íàäî âûïîëíèòü êîìàíäó СервисÖНадстройки è â îòêðûâøåìñÿ
äèàëîãîâîì îêíå Надстройки óñòàíîâèòü ôëàæîê ïåðåä îïöèåé Поиск решения.
Íàäñòðîéêà Поиск решения èñïîëüçóåòñÿ ñëåäóþùèì îáðàçîì.
1. Îòêðîéòå Excel è ñîçäàéòå òàáëè÷íóþ ìîäåëü.
2. Ïîñëå îòëàäêè ìîäåëè ïåðåéäèòå ê ýòàïó îïòèìèçàöèè, âûáðàâ êîìàíäó
Поиск решения â ìåíþ Сервис.
3. Â îòêðûâøåìñÿ äèàëîãîâîì îêíå Поиск решения óêàæèòå äàííûå, íåîáõîäèìûå äëÿ ïðîöåññà îïòèìèçàöèè (ðèñ. 6.30).
a)  ïîëå Установить целевую ячейку ââîäèòñÿ àäðåñ ÿ÷åéêè, ñîäåðæàùåé
çíà÷åíèå öåëåâîé ôóíêöèè. Äëÿ íàøåé ìîäåëè â ýòî ïîëå ñëåäóåò ââå2
Çäåñü ôîðìóëèðîâêà çàäà÷è ïðåäíàìåðåííî íå ïðèâåäåíà ê “ïðàâèëüíîìó” âèäó (êîãäà îãðàíè÷åíèÿ èìåþò îäèí òèï è ò.ï.), ÷òîáû ñäåëàòü ýòîò ìàëåíüêèé ïðèìåð ìàêñèìàëüíî
îáîáùåííûì.
220 Часть II. Средства Excel для статистического анализа
ñòè Е4, íî ëó÷øå ùåëêíóòü óêàçàòåëåì ìûøè íà ýòîé ÿ÷åéêå, ÷òîáû
ââåñòè åå àäðåñ àâòîìàòè÷åñêè.
á) Îïöèè îáëàñòè Равной äèàëîãîâîãî îêíà Поиск решения ïîçâîëÿþò çàäàòü òèï îïòèìèçàöèè.  äàííîì ñëó÷àå íåîáõîäèìî ìèíèìèçèðîâàòü
çíà÷åíèå öåëåâîé ôóíêöèè. Äëÿ ýòîãî íóæíî ùåëêíóòü íà ïåðåêëþ÷àòåëå минимальному значению. Ùåë÷îê íà ïåðåêëþ÷àòåëå максимальному значению óêàæåò, ÷òî ñëåäóåò ìàêñèìèçèðîâàòü öåëåâóþ ôóíêöèþ. Ìîæíî òàêæå ñäåëàòü çíà÷åíèå öåëåâîé ôóíêöèè ðàâíûì çàäàííîìó ÷èñëó, óñòàíîâèâ ïåðåêëþ÷àòåëü значению è ââåäÿ ýòî ÷èñëî.
â) Ïîëå Изменяя ячейки ïîçâîëÿåò óêàçàòü ÿ÷åéêè, â êîòîðûõ ñîäåðæàòñÿ
ïåðåìåííûå ìîäåëè; â äàííîì ñëó÷àå ýòî äèàïàçîí B3:D3. (Ìîæíî ïîïðîáîâàòü âîñïîëüçîâàòüñÿ êíîïêîé Предположить, íî ïðè ýòîì îáû÷íî
ïðåäëàãàþòñÿ íåâåðíûå àäðåñà ÿ÷ååê ïåðåìåííûõ.)
ã) Äàëåå íåîáõîäèìî çàäàòü îãðàíè÷åíèÿ. Ùåë÷îê íà êíîïêå Добавить
îòêðûâàåò äèàëîãîâîå îêíî Добавление ограничения, ïîêàçàííîå íà
ðèñ. 6.31. Ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî îãðàíè÷åíèå èìååò âèä
íåðàâåíñòâà ñî çíàêîì ≤. Åñëè òàáëè÷íàÿ ìîäåëü îðãàíèçîâàíà òàê, ÷òî
íåðàâåíñòâà îäíîãî çíàêà ðàñïîëîæåíû ðÿäîì, òî èõ ìîæíî ââåñòè âñå
âìåñòå, èñïîëüçóÿ äèàïàçîíû ÿ÷ååê.  ïðîòèâíîì ñëó÷àå ïðèäåòñÿ ââîäèòü îãðàíè÷åíèÿ ïî îòäåëüíîñòè, ùåëêàÿ íà êíîïêå Добавить äèàëîãîâîãî îêíà Добавление ограничения. Çàìåòèì, ÷òî â ïîëå Ссылка на
ячейку íåëüçÿ ââîäèòü ôîðìóëû — ýòî äîëæíû áûòü ññûëêè íà ÿ÷åéêè,
êîòîðûå, â ñâîþ î÷åðåäü, ìîãóò ñîäåðæàòü ôîðìóëû.
ä) Ñëåäóåò ïîìíèòü îá óñëîâèÿõ íåîòðèöàòåëüíîñòè äëÿ ñîäåðæèìîãî
ÿ÷ååê B3 è C3. ×òîáû ââåñòè ýòè îãðàíè÷åíèÿ, â äèàëîãîâîì îêíå
Добавление ограничения óêàæèòå äèàïàçîí B3:C3, âûáåðèòå çíàê íåðàâåíñòâà >= è â ïîëå Ограничение ââåäèòå 0. Åñëè óñëîâèå íåîòðèöàòåëüíîñòè íàêëàäûâàåòñÿ íà âñå ïåðåìåííûå, òî ýòî óñëîâèå ìîæíî
çàäàòü â äèàëîãîâîì îêíå Параметры поиска решения (îïöèÿ
Неотрицательные значения), êîòîðîå îòêðûâàåòñÿ ïîñëå ùåë÷êà íà
êíîïêå Параметры äèàëîãîâîãî îêíà Поиск решения.
4. Ïîñêîëüêó ìû ðàáîòàåì ñ ëèíåéíîé ìîäåëüþ, â äèàëîãîâîì îêíå
Параметры поиска решения óñòàíîâèòå ôëàæîê îïöèè Линейная модель,
à òàêæå
Автоматическое
масштабирование
(ðèñ. 6.32).
Ðåæèì
Автоматическое масштабирование ïðåäíàçíà÷åí äëÿ ìàñøòàáèðîâàíèÿ ÷èñëîâûõ çíà÷åíèé â ìîäåëè òàêèì îáðàçîì, ÷òîáû ðàçíîñòü ìåæäó íàèáîëüøèì è íàèìåíüøèì ÷èñëàìè â ìîäåëè áûëà êàê ìîæíî ìåíüøåé,
èíà÷å â ïðîöåññå âû÷èñëåíèé ìîãóò âîçíèêíóòü áîëüøèå îøèáêè îêðóãëåíèÿ è ðåçóëüòàò ìîæåò áûòü äàëåêèì îò èñòèííîãî ðåøåíèÿ. Îñòàëüíûå
îïöèè ýòîãî îêíà ìîæíî îñòàâèòü áåç èçìåíåíèÿ — îíè, â îñíîâíîì, îòíîñÿòñÿ ê îïòèìèçàöèè öåëî÷èñëåííûõ è íåëèíåéíûõ ìîäåëåé. Ùåëêíèòå íà
êíîïêå OK, ÷òîáû âåðíóòüñÿ â äèàëîãîâîå îêíî Поиск решения.
5. Ïîñëå çàäàíèÿ íåîáõîäèìûõ äàííûõ (óêàçàíèÿ ÿ÷åéêè, ñîäåðæàùåé ôîðìóëó äëÿ âû÷èñëåíèÿ öåëåâîé ôóíêöèè, óêàçàíèÿ ÿ÷ååê, â êîòîðûõ íàõîäÿòñÿ
ïåðåìåííûå, è çàäàíèÿ îãðàíè÷åíèé) ùåëêíèòå íà êíîïêå Выполнить.
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 221
6. Ñðåäñòâî Поиск решения âûïîëíÿåò îïòèìèçàöèþ.  ïðîöåññå âû÷èñëåíèé
â ñòðîêå ñîñòîÿíèÿ îòîáðàæàþòñÿ ÷èñëî èòåðàöèé è çíà÷åíèÿ öåëåâîé
ôóíêöèè ïðè ïåðåáîðå ìíîæåñòâà äîïóñòèìûõ ðåøåíèé çàäà÷è. Ýòà èíôîðìàöèÿ ïîçâîëÿåò ñëåäèòü, êàê ïðîäâèãàåòñÿ ïðîöåññ îïòèìèçàöèè
áîëüøèõ ìîäåëåé, ãäå îí ìîæåò äëèòüñÿ äîñòàòî÷íî äîëãî.
7. Åñëè â òàáëè÷íîé ìîäåëè íåò îøèáîê, Поиск решения âûâåäåò íà ýêðàí
äèàëîãîâîå îêíî Результаты поиска решения (ðèñ. 6.33), â êîòîðîì ìîæíî
óêàçàòü, îáíîâèòü ëè èñõîäíóþ ìîäåëü (ò.å. çàíåñòè ëè â ÿ÷åéêè çíà÷åíèÿ
îïòèìàëüíîãî ðåøåíèÿ) è ñîçäàâàòü ëè îò÷åò.
.
Ðèñ. 6.30. Çàäàíèå ïàðàìåòðîâ äëÿ ïîèñêà ðåøåíèÿ
Ðèñ. 6.31. Çàäàíèå îãðàíè÷åíèé
222 Часть II. Средства Excel для статистического анализа
Ðèñ. 6.32. Äèàëîãîâîå îêíî Параметры поиска решения
Ðèñ. 6.33. Óñïåøíîå çàâåðøåíèå ðåøåíèÿ çàäà÷è îïòèìèçàöèè
Äèàëîãîâîå îêíî Результаты поиска решения ñîîáùàåò î çàâåðøåíèè ïîèñêà
(ñì. ðèñ. 6.33). Òî, ÷òî ïðîãðàììà Поиск решения çàâåðøèëà ðàáîòó, íå îçíà÷àåò,
÷òî îíà íàøëà îïòèìàëüíîå ðåøåíèå. Åñëè îïòèìàëüíîå ðåøåíèå íàéäåíî,
â äèàëîãîâîì îêíå Результаты поиска решения äîëæíû ïðèñóòñòâîâàòü äâà êëþ÷åâûõ ïðåäëîæåíèÿ: Решение найдено è Все ограничения и условия оптимальности
выполнены. Åñëè õîòÿ áû îäíîãî èç ýòèõ ïðåäëîæåíèé íåò, ïðîãðàììå íå óäàëîñü îïòèìèçèðîâàòü ìîäåëü.  òàêîì ñëó÷àå ñëåäóåò ñíà÷àëà ïðîâåðèòü ïðàâèëüíîñòü âíåñåíèÿ äàííûõ â äèàëîãîâîå îêíî Поиск решения, çàòåì ïðîâåðèòü
òàáëè÷íóþ ìîäåëü è íàêîíåö ïåðåñìîòðåòü èñõîäíóþ ôîðìóëèðîâêó çàäà÷è.
Åñëè ïîëó÷åíî ñîîáùåíèå îá óñïåøíîì çàâåðøåíèè ïîèñêà, ìîæíî èëè ñîõðàíèòü íàéäåííîå ðåøåíèå, âûáðàâ ñîîòâåòñòâóþùóþ îïöèþ, èëè îòáðîñèòü
åãî, âûáðàâ îïöèþ Восстановить исходные значения.  ðåçóëüòàòå ÿ÷åéêàì ïåðåГлава 6. Дополнительные возможности Excel для проведения статистического анализа 223
ìåííûõ áóäóò âîçâðàùåíû çíà÷åíèÿ, êîòîðûå â íèõ íàõîäèëèñü äî çàïóñêà ïðîãðàììû Поиск решения. Ñóùåñòâóåò âîçìîæíîñòü òàêæå ïîëó÷èòü òðè òèïà îò÷åòîâ î ðåøåíèè. Êàæäûé îò÷åò âûâîäèòñÿ íà íîâûé ëèñò ðàáî÷åé êíèãè.
6.3.2. Задачи, решаемые средством Поиск решения
Îïèøåì ÷åòûðå îñíîâíûõ òèïà çàäà÷, êîòîðûå ìîæíî ðåøèòü ñ ïîìîùüþ
ñðåäñòâà Поиск решения. Îïòèìèçàöèÿ ïðè íàëè÷èè îãðàíè÷åíèé — ñàìûé îáùèé òèï çàäà÷è îïòèìèçàöèè; äðóãèå òèïû çàäà÷ ïîÿâëÿþòñÿ ïðè îãðàíè÷åíèÿõ
ñïåöèàëüíîãî âèäà èëè èõ îòñóòñòâèè. Ýòè çàäà÷è ìîãóò ðåøàòüñÿ è êàê çàäà÷è
ëèíåéíîé îïòèìèçàöèè, è êàê çàäà÷è íåëèíåéíîé îïòèìèçàöèè.
1. Ïîèñê äîïóñòèìîãî ðåøåíèÿ. Åñëè íå çàäàâàòü öåëåâóþ ÿ÷åéêó (â ïîëå
ââîäà Установить целевую ячейку â äèàëîãîâîì îêíå Поиск решения), òî
ñðåäñòâî Поиск решения îñòàíîâèò ðàáîòó, íàéäÿ äîïóñòèìîå ðåøåíèå çàäà÷è, ò.å. íàáîð çíà÷åíèé äëÿ èçìåíÿåìûõ ÿ÷ååê, êîòîðûå óäîâëåòâîðÿþò
âñåì îãðàíè÷åíèÿì. Åñëè âñå ôóíêöèè îãðàíè÷åíèé ëèíåéíûå, òî, óñòàíîâèâ ôëàæîê Линейная модель â äèàëîãîâîì îêíå Параметры поиска
решения, ìîæíî óñêîðèòü ïîèñê äîïóñòèìîãî ðåøåíèÿ.
2. Ïîäáîð ïàðàìåòðîâ. Öåëåâàÿ ÿ÷åéêà íå çàäàåòñÿ, óêàçûâàþòñÿ îãðàíè÷åíèÿ òîëüêî â âèäå ðàâåíñòâ èëè çàäàåòñÿ êîíêðåòíîå çíà÷åíèå äëÿ öåëåâîé ÿ÷åéêè áåç îïðåäåëåíèÿ êàêèõ-ëèáî îãðàíè÷åíèé.  ïåðâîì ñëó÷àå
âûïîëíÿåòñÿ ïîèñê òåõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê, êîòîðûå óäîâëåòâîðÿþò çàäàííîé ñèñòåìå îãðàíè÷åíèé, ò.å., ïî ñóòè, ðåøàåòñÿ ñèñòåìà óðàâíåíèé, â êîòîðîé íåèçâåñòíûìè ÿâëÿþòñÿ çíà÷åíèÿ èçìåíÿåìûõ ÿ÷ååê.
(Åñëè íåêîòîðûå îãðàíè÷åíèÿ çàäàíû â âèäå íåðàâåíñòâ, Поиск решения
íàõîäèò äîïóñòèìîå ðåøåíèå, îïðåäåëÿåìîå çàäàííîé ñèñòåìîé îãðàíè÷åíèé (ñì. çàäà÷ó 1).) Âî âòîðîì ñëó÷àå (êîãäà çàäàíî êîíêðåòíîå çíà÷åíèå
öåëåâîé ôóíêöèè áåç óêàçàíèÿ îãðàíè÷åíèé) Поиск решения ðàáîòàåò ïîäîáíî ñðåäñòâó Excel Подбор параметра, ïðè ýòîì èñïîëüçóÿ äðóãîé àëãîðèòì ïîèñêà. Êðîìå òîãî, â îòëè÷èå îò ñðåäñòâà Подбор параметра, Поиск
решения ìîæåò ïðîâîäèòü ïîäáîð íåñêîëüêèõ ïàðàìåòðîâ, äîñòàâëÿþùèõ
çàäàííîå çíà÷åíèå öåëåâîé ôóíêöèè.
3. Ïîèñê áåçóñëîâíîãî îïòèìóìà — çàäà÷à íàõîæäåíèÿ ìàêñèìóìà èëè ìèíèìóìà öåëåâîé ôóíêöèè ïðè îòñóòñòâèè îãðàíè÷åíèé. Ýòà çàäà÷à èìååò
ñìûñë òîëüêî â òîì ñëó÷àå, åñëè öåëåâàÿ ôóíêöèÿ ÿâëÿåòñÿ íåëèíåéíîé
(ïî îòíîøåíèþ ê çíà÷åíèÿì èçìåíÿåìûõ ÿ÷ååê).  ñëó÷àå ïîïûòêè ïîèñêà
îïòèìóìà ëèíåéíîé öåëåâîé ôóíêöèè (áåç çàäàíèÿ îãðàíè÷åíèé) áóäåò âûâîäèòüñÿ ñîîáùåíèå î íåîãðàíè÷åííîì ðåøåíèè. Åñëè öåëåâàÿ ôóíêöèÿ
èìååò íåñêîëüêî ìàêñèìóìîâ èëè ìèíèìóìîâ, òî Поиск решения íàõîäèò
îäèí èç íèõ (ëîêàëüíûé îïòèìóì), êîòîðûé ìîæåò íå ñîâïàäàòü ñ ãëîáàëüíûì îïòèìóìîì. Êàêîé êîíêðåòíî áóäåò íàéäåí ëîêàëüíûé îïòèìóì,
çàâèñèò îò íà÷àëüíûõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê.
4. Ïîèñê îïòèìóìà ïðè íàëè÷èè îãðàíè÷åíèé. Íàèáîëåå îáùåé çàäà÷åé ÿâëÿåòñÿ çàäà÷à óñëîâíîé îïòèìèçàöèè, êîãäà çàäàíû îãðàíè÷åíèÿ è àäðåñ
ÿ÷åéêè öåëåâîé ôóíêöèè, êîòîðóþ íåîáõîäèìî ìàêñèìèçèðîâàòü èëè ìèíèìèçèðîâàòü. Åñëè öåëåâàÿ ôóíêöèÿ è âñå îãðàíè÷åíèÿ ëèíåéíû, òî ýòî çàäà÷à ëèíåéíîé îïòèìèçàöèè. Ðåøåíèå ýòîé çàäà÷è áóäåò íàéäåíî áûñòðåå, íà-
224 Часть II. Средства Excel для статистического анализа
äåæíåå è ñ áîëåå ïîäðîáíîé äîïîëíèòåëüíîé èíôîðìàöèåé, åñëè â äèàëîãîâîì îêíå Параметры поиска решения óñòàíîâëåí ôëàæîê Линейная модель.
 ïðîòèâíîì ñëó÷àå Поиск решения èñïîëüçóåò ìåòîä ïðèâåäåííîãî ãðàäèåíòà.
Åñëè öåëåâàÿ ôóíêöèÿ èìååò íåñêîëüêî îïòèìóìîâ, êîòîðûå óäîâëåòâîðÿþò
îãðàíè÷åíèÿì, òî Поиск решения íàéäåò îäèí èç íèõ (ò.å. ëîêàëüíûé îïòèìóì), êîòîðûé ìîæåò íå áûòü ãëîáàëüíûì. Êàêîé êîíêðåòíî áóäåò íàéäåí
ëîêàëüíûé îïòèìóì, çàâèñèò îò íà÷àëüíûõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê.
6.3.3. Примеры применения средства Поиск решения
Ðàññìîòðèì äâà ïðèìåðà ïðèìåíåíèÿ ñðåäñòâà Поиск решения. Ïåðâûé ïðèìåð ïîêàçûâàåò ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé íà îñíîâå
äàííûõ ïðèìåðà èç ðàçäåëà 6.1.5, â êîòîðîì ïîêàçàí äðóãîé ñïîñîá ðåøåíèÿ òàêèõ ñèñòåì. Âî âòîðîì ïðèìåðå ïîêàçàíî, êàê íà îñíîâàíèè êðèòåðèÿ χ2 ïîäîáðàòü ïàðàìåòðû âåðîÿòíîñòíîãî ðàñïðåäåëåíèÿ.
Решение системы линейных алгебраических уравнений
Èñõîäíàÿ òàáëè÷íàÿ ìîäåëü äëÿ ýòîé çàäà÷è ïîêàçàíà íà ðèñ. 6.34.  äàííîé
ìîäåëè âû÷èñëåíèÿ ïðîèçâîäÿòñÿ òîëüêî â ñòîëáöå Å, ãäå âû÷èñëÿþòñÿ çíà÷åíèÿ
ëåâûõ ÷àñòåé óðàâíåíèé (ôîðìóëû ïîêàçàíû íà ðèñ. 6.34). Çàïîëíåííîå äèàëîãîâîå îêíî Поиск решения äëÿ äàííîé çàäà÷è ïðåäñòàâëåíî íà ðèñ. 6.35, à íàéäåííîå ðåøåíèå — íà ðèñ. 6.36. Êàê âèäíî íà ïîñëåäíåì ðèñóíêå, ñðåäñòâîì
Поиск решения íàéäåíî òî÷íîå ðåøåíèå ñèñòåìû.
Ðèñ. 6.34. Èñõîäíàÿ òàáëè÷íàÿ ìîäåëü äëÿ ðåøåíèÿ ñèñòåìû ëèíåéíûõ
àëãåáðàè÷åñêèõ óðàâíåíèé
Подбор параметров вероятностного распределения
Íà ðèñ. 6.37 ïîêàçàíû èñõîäíûå äàííûå: âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè,
èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 1 è ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèåì 2 (âûáîðêà ñîçäàíà ñ ïîìîùüþ ñðåäñòâà Генерация
случайных чисел èç ïàêåòà àíàëèçà). Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка (ýòî èìÿ èñïîëüçóåòñÿ â ôîðìóëàõ). Âûáîðî÷íûå ñðåäíåå
è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèÿ ðàâíû ñîîòâåòñòâåííî 0,91903 è 2,171256
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 225
(çíà÷åíèÿ â ÿ÷åéêàõ Í1 è Í2). Ãðàíèöû èíòåðâàëîâ êàðìàíîâ çàïèñàíû â äèàïàçîíå
Ñ5:Ñ14, à ÷àñòîòû (äèàïàçîí D5:D15) ïîäñ÷èòàíû ñ ïîìîùüþ ñðåäñòâà Гистограмма
èç ïàêåòà àíàëèçà. Îæèäàåìûå ÷àñòîòû âû÷èñëÿþòñÿ ïî ôîðìóëàì, êîòîðûå ïîêàçàíû íà ðèñ. 6.38. Ôîðìóëà âû÷èñëåíèÿ çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè äëÿ êðèòåðèÿ χ2 (ñì. ðàçäåë 2.4.3) çàïèñàíà â ÿ÷åéêå G7. Îòìåòèì, ÷òî ýòî ôîðìóëà ìàññèâà,
êîòîðàÿ ïîçâîëÿåò èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé. Çíà÷åíèå êðèòåðèàëüíîé
ñòàòèñòèêè äëÿ ñëó÷àÿ, êîãäà â êà÷åñòâå ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èñïîëüçîâàíû ñîîòâåòñòâóþùèå âûáîðî÷íûå çíà÷åíèÿ, ïîêàçàíî íà ðèñ. 6.37.
Ðèñ. 6.35. Äèàëîãîâîå îêíî Поиск решения äëÿ äàííîé çàäà÷è
Ðèñ. 6.36. Íàéäåííîå ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé
226 Часть II. Средства Excel для статистического анализа
Èçìåíÿÿ çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ, çàïèñàííûå â ÿ÷åéêàõ D1 è D2, ñ ïîìîùüþ ñðåäñòâà Поиск решения
ïîïðîáóåì óìåíüøèòü çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, òåì ñàìûì ïîäîáðàâ
çíà÷åíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðîå ëó÷øå ñîîòâåòñòâóåò âûáîðêå. Äèàëîãîâîå îêíî Поиск решения äëÿ ýòîé çàäà÷è ïîêàçàíî íà ðèñ. 6.39.  äàííîì
ñëó÷àå ïðèñóòñòâóåò òîëüêî îäíî îãðàíè÷åíèå — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äîëæíî áûòü ïîëîæèòåëüíûì. Íî ìîæíî çàäàòü è äðóãèå îãðàíè÷åíèÿ, íàïðèìåð, ÷òîáû îæèäàåìàÿ ÷àñòîòà â êðàéíèõ êàðìàíàõ èìåëà çíà÷åíèÿ íå ìåíåå 1, êàê ñîâåòóþò íåêîòîðûå ñòàòèñòè÷åñêèå ðóêîâîäñòâà.
Ðåøåíèå, ïîëó÷åííîå ñ ïîìîùüþ Поиск решения, ïîêàçàíî íà ðèñ. 6.40. Ïîëó÷åííûå çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ íåìíîãî äàëüøå îò èñòèííûõ, ÷åì âûáîðî÷íûå îöåíêè, íî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè ñòàëî ìåíüøå, ò.å. ðàñïðåäåëåíèå ñ ýòèìè çíà÷åíèÿìè
ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ëó÷øå ïîäõîäèò äëÿ àïïðîêñèìàöèè ðàñïðåäåëåíèÿ âûáîðêè.
Ðèñ. 6.37. Èñõîäíûå äàííûå
Ðèñ. 6.38. Ôîðìóëû äëÿ âû÷èñëåíèé
Глава 6. Дополнительные возможности Excel для проведения статистического анализа 227
Ðèñ. 6.39. Äèàëîãîâîå îêíî Поиск решения
Ðèñ. 6.40. Ðåøåíèå
228 Часть II. Средства Excel для статистического анализа
Глава
7
Моделирование случайных
величин
Ì
îäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí ÷àñòî èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå, õîòÿ áû äëÿ ïîñòðîåíèÿ òåñòîâûõ âûáîðîê ñ çàäàííûìè ñòàòèñòè÷åñêèìè õàðàêòåðèñòèêàìè, íà îñíîâå êîòîðûõ ìîæíî ïðîâåðèòü âû÷èñëèòåëüíûå àëãîðèòìû ìåòîäîâ ìàòåìàòè÷åñêîé ñòàòèñòèêè.  äàííîé êíèãå âñå ïðèìåðû ïðàêòè÷åñêîé ðåàëèçàöèè îïèñûâàåìûõ ìåòîäîâ èëëþñòðèðóþòñÿ ñ èñïîëüçîâàíèåì âûáîðîê, ïîñòðîåííûõ â Excel. Íî îñíîâíîå ïðèìåíåíèå “èñêóññòâåííûå” ñëó÷àéíûå
âåëè÷èíû íàõîäÿò â ìåòîäàõ Ìîíòå-Êàðëî è èìèòàöèîííîì ìîäåëèðîâàíèè, ãäå
áåç òàêèõ ñëó÷àéíûõ âåëè÷èí ïðîñòî íåâîçìîæíî ãîâîðèòü îá ýòèõ ïðåäìåòàõ.
Îáû÷íî ðàññìîòðåíèå òåìû ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí íà÷èíàåòñÿ
ñ ìåòîäîâ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàâíîìåðíîå ðàñïðåäåëåíèå
íà èíòåðâàëå [0, 1], òàê êàê ýòè âåëè÷èíû ÿâëÿþòñÿ îñíîâîé äëÿ ìîäåëèðîâàíèÿ
ñëó÷àéíûõ âåëè÷èí, èìåþùèõ äðóãèå ðàñïðåäåëåíèÿ. Ìû íå áóäåì ïîäíèìàòü
ýòó èíòåðåñíóþ òåìó, ïîñêîëüêó â Excel èìåþòñÿ ãîòîâûå ñðåäñòâà (ôóíêöèÿ
СЛЧИС è ñðåäñòâî Генерация случайных чисел) äëÿ ñîçäàíèÿ ïîñëåäîâàòåëüíîñòè
ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë. Ðàññìîòðèì ñïîñîáû ìîäåëèðîâàíèÿ ïðîèçâîëüíûõ ñëó÷àéíûõ âåëè÷èí.
 Excel åñòü äîâîëüíî ìíîãî ñðåäñòâ äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ âåëè÷èí, èìåþùèõ ðàçëè÷íûå ðàñïðåäåëåíèÿ. Ýòè ñðåäñòâà ïåðå÷èñëåíû íèæå. Íî,
êîíå÷íî, âñòðîåííûå ñðåäñòâà Excel íå îáåñïå÷èâàþò ìîäåëèðîâàíèå âåðîÿòíîñòíûõ
ðàñïðåäåëåíèé “íà âñå ñëó÷àè æèçíè”. Ïîýòîìó ïðè íåîáõîäèìîñòè ãåíåðèðîâàíèÿ
ñëó÷àéíûõ ÷èñåë, ðàñïðåäåëåíèÿ êîòîðûõ íåò â íèæåïðèâåäåííîì ñïèñêå, ïðèõîäèòñÿ âñïîìèíàòü ìåòîäû ïîëó÷åíèÿ ñëó÷àéíûõ çíà÷åíèé, èìåþùèåñÿ â àðñåíàëå òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Íå âäàâàÿñü â “ãëóáîêóþ” òåîðèþ,
ïîêàæåì ïðèìåíåíèå ìåòîäà îáðàòíûõ ôóíêöèé, ìåòîäà ñóïåðïîçèöèé è ìåòîäà
îòáîðà äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë â Excel.  êîíöå ãëàâû ðàññìîòðèì
âîïðîñ î ìîäåëèðîâàíèè çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí.
7.1. Средства Excel для генерирования
случайных чисел
Ïåðå÷èñëèì èìåþùèåñÿ â Excel ñðåäñòâà äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë.
•
Ôóíêöèÿ СЛЧИС, âû÷èñëÿþùàÿ ñëó÷àéíûå ÷èñëà, êîòîðûå ðàâíîìåðíî
ðàñïðåäåëåíû íà èíòåðâàëå [0, 1] (ñì. ðàçäåë 4.13.1).
•
Ôóíêöèÿ СЛУЧМЕЖДУ, ãåíåðèðóþùàÿ öåëî÷èñëåííûå çíà÷åíèÿ, êîòîðûå
ïîä÷èíÿþòñÿ äèñêðåòíîìó ðàâíîìåðíîìó ðàñïðåäåëåíèþ (ñì. ðàçäåë 4.13.2). (Ôóíêöèÿ äîñòóïíà òîëüêî òîãäà, êîãäà ïîäêëþ÷åíà íàäñòðîéêà Пакет анализа.)
•
Ñðåäñòâî Генерация случайных чисел èç íàäñòðîéêè Пакет анализа (ñì. ðàçäåë 5.3), ïðåäîñòàâëÿþùåå âîçìîæíîñòü ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà,
êîòîðûå èìåþò ñëåäóþùèå ðàñïðåäåëåíèÿ.
•
Ðàâíîìåðíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë â çàäàííîì èíòåðâàëå.
•
Íîðìàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ íîðìàëüíîìó ðàñïðåäåëåíèþ. Çàäàåòñÿ ìàòåìàòè÷åñêîå
îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå.
•
Áåðíóëëè. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïðèíèìàþùèõ òîëüêî çíà÷åíèå 0 èëè 1, â çàâèñèìîñòè îò çàäàííîé âåðîÿòíîñòè óñïåõà (èñõîäà “1”). (Î ðàñïðåäåëåíèè Áåðíóëëè ðå÷ü èäåò â ðàçäåëå 1.4.2.)
•
Áèíîìèàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë,
ðàâíîå êîëè÷åñòâó èñõîäîâ “1” â n íåçàâèñèìûõ èñïûòàíèÿõ.  ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1”
è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.3). Çäåñü íåîáõîäèìî çàäàòü ÷èñëî èñïûòàíèé n è âåðîÿòíîñòü p.
•
Ïóàññîíà. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà ñ çàäàííûì ïàðàìåòðîì λ. (Î ðàñïðåäåëåíèè Ïóàññîíà ðå÷ü èäåò â ðàçäåëå 1.4.4.)
•
Äèñêðåòíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ çàäàííîìó äèñêðåòíîìó ðàñïðåäåëåíèþ. Äëÿ çàäàíèÿ ýòîãî
ðàñïðåäåëåíèÿ íåîáõîäèìî óêàçàòü äèàïàçîí ÿ÷ååê, ñîñòîÿùèé èç äâóõ
ñòîëáöîâ: â ïåðâîì ñòîëáöå ñîäåðæàòñÿ çíà÷åíèÿ, à âî âòîðîì — âåðîÿòíîñòè êàæäîãî çíà÷åíèÿ.
Ìåæäó ñïîñîáàìè âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë, ïîëó÷åííûõ ñ ïîìîùüþ
ôóíêöèè СЛЧИС (ñîîòâåòñòâóþùèå ôîðìóëû ïðèâåäåíû â ñëåäóþùèõ ðàçäåëàõ)
è ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, â ÷àñòíîñòè ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1], èìåþòñÿ ñóùåñòâåííûå ðàçëè÷èÿ. Ïåðâîå ðàçëè÷èå çàêëþ÷àåòñÿ â òîì, ÷òî ôóíêöèþ СЛЧИС ìîæíî íåïîñðåäñòâåííî èñïîëüçîâàòü â ôîðìóëàõ (â òîì ÷èñëå â ôîðìóëàõ ìàññèâîâ) êàê àðãóìåíò ôîðìóëû
èëè äðóãîé ôóíêöèè, òîãäà êàê äëÿ òîãî, ÷òîáû èñïîëüçîâàòü â ôîðìóëàõ ñëó÷àéíûå ÷èñëà, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, ñíà÷àëà íåîáõîäèìî èõ ïîëó÷èòü, ò.å. çàïèñàòü â îòäåëüíîì äèàïàçîíå ÿ÷ååê,
è òîëüêî çàòåì èñïîëüçîâàòü â ôîðìóëàõ.
Âòîðîå îòëè÷èå ñîñòîèò â òîì, ÷òî ôîðìóëû, ñîäåðæàùèå ôóíêöèþ СЛЧИС,
ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà (íàïðèìåð, ïðè ëþáîì
ââîäå çíà÷åíèÿ â ÿ÷åéêó èëè ïðè óäàëåíèè ÷åãî-ëèáî, èëè ïðè íàæàòèè êëàâèøè <F9>), à çíà÷åíèÿ, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Генерация случайных
чисел, ôèêñèðîâàíû — ïðè íåîáõîäèìîñòè ïîëó÷åíèÿ íîâîé âûáîðêè íà ìåñòå
ñòàðîé, ñëåäóåò åùå ðàç âûçâàòü è ïðèìåíèòü ýòî ñðåäñòâî. Ñâîéñòâî
230 Часть II. Средства Excel для статистического анализа
“èçìåí÷èâîñòè” ôóíêöèè СЛЧИС ïîëåçíî, íàïðèìåð, â èìèòàöèîííîì ìîäåëèðîâàíèè. Îäíàêî â äðóãèõ ñëó÷àÿõ îíî ìîæåò ñèëüíî çàìåäëÿòü ðàáîòó â Excel èëè
áûòü ïðîñòî èçëèøíèì. ×òîáû çàôèêñèðîâàòü çíà÷åíèÿ, âû÷èñëÿåìûå ñ ïîìîùüþ ôóíêöèè СЛЧИС, íàäî âûäåëèòü äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, è ñêîïèðîâàòü åãî (êîìàíäà ПравкаÖКопировать). Çàòåì, íå îòìåíÿÿ âûäåëåíèÿ äèàïàçîíà, ñëåäóåò âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка,
â îòêðûâøåìñÿ äèàëîãîâîì îêíå Специальная вставка óñòàíîâèòü ïåðåêëþ÷àòåëü
Значения è ùåëêíóòü íà êíîïêå ОК.  ÿ÷åéêè âûäåëåííîãî äèàïàçîíà âìåñòî
ôîðìóë áóäóò çàïèñàíû ÷èñëîâûå çíà÷åíèÿ.
Ïîêàæåì, êàê ìîæíî èñïîëüçîâàòü ïåðåñ÷åò ôóíêöèè СЛЧИС äëÿ ïîëó÷åíèÿ
íà îñíîâå îäíîé âûáîðêè ðåçóëüòàòîâ íåñêîëüêèõ ýêñïåðèìåíòîâ, êîãäà
“âûõîäîì” ýêñïåðèìåíòà ÿâëÿåòñÿ ñàìà âûáîðêà. Íà ðèñ. 7.1 â ñòîëáöå À ïîêàçàíà âûáîðêà îáúåìîì 15 çíà÷åíèé, ïîëó÷åííàÿ ïî ôîðìóëå ìàññèâà {=СЛЧИС()}.
Ïóñòü ïî âûáîðî÷íûì çíà÷åíèÿì â ñòîëáöå  âû÷èñëÿþòñÿ ñðåäíåå, âûáîðî÷íàÿ
äèñïåðñèÿ, ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ ïî ñòàíäàðòíûì ôîðìóëàì.
(Ýòè ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè â äàííîì ñëó÷àå âûáðàíû ïðîèçâîëüíî; â çàâèñèìîñòè îò êîíêðåòíûõ öåëåé ìîãóò âû÷èñëÿòüñÿ äðóãèå âåëè÷èíû, íàïðèìåð
êðèòåðèàëüíûå ñòàòèñòèêè èëè èíòåðâàëüíûå îöåíêè êàêèõ-ëèáî ïàðàìåòðîâ.)
Ðèñ. 7.1. Âûáîðêà è åå õàðàêòåðèñòèêè
Åñëè â äàííîé ñèòóàöèè íàæàòü êëàâèøó <F9>, âûáîðî÷íûå çíà÷åíèÿ èçìåíÿòñÿ è ñîîòâåòñòâåííî èçìåíÿòñÿ çíà÷åíèÿ â ñòîëáöå Â. Òàêèì îáðàçîì, ïîëó÷àåòñÿ íîâàÿ âûáîðêà ñ òåì æå ðàñïðåäåëåíèåì. Îñòàëîñü çàôèêñèðîâàòü íîâûå
çíà÷åíèÿ õàðàêòåðèñòèê. Äëÿ ýòîãî èõ ìîæíî ñêîïèðîâàòü (êàê çíà÷åíèÿ, à íå
ôîðìóëû!) â îòäåëüíûé äèàïàçîí ÿ÷ååê. Íî ýòî íåóäîáíûé ïðèåì, åñëè íàäî ïðîâåñòè íåñêîëüêî ýêñïåðèìåíòîâ ñ îäíîé è òîé æå âûáîðêîé.
Ïîêàæåì, êàê ìîæíî âûïîëíèòü ñðàçó ñòîëüêî ýêñïåðèìåíòîâ, ñêîëüêî íåîáõîäèìî, è çàîäíî ñðàçó ïîëó÷èòü âñå çíà÷åíèÿ õàðàêòåðèñòèê äëÿ êàæäîãî ýêñïåðèìåíòà. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü òàáëèöû ïîäñòàíîâêè Excel.  äàííîì
ñëó÷àå öåëåñîîáðàçíî èñïîëüçîâàòü òàáëèöó ïîäñòàíîâêè ñ îäíèì âõîäîì. Äëÿ
Глава 7. Моделирование случайных величин
231
ñîçäàíèÿ òàêîé òàáëèöû ââåäåì ñíà÷àëà ïîñëåäîâàòåëüíîñòü öåëûõ ÷èñåë îò 1 äî
÷èñëà, çàäàþùåãî êîëè÷åñòâî ýêñïåðèìåíòîâ.  íàøåì ïðèìåðå ââåäåì ÷èñëà îò
1 äî 12 â ñòîëáöå D, êàê ïîêàçàíî íà ðèñ. 7.21.  ÿ÷åéêó Å3 ââåäåì ôîðìóëó
=В2, â ÿ÷åéêó F3 — ôîðìóëó =В4, â ÿ÷åéêó G3 — =В6 è â ÿ÷åéêó H3 — =В8. Ýòè
ôîðìóëû óêàçûâàþò, êàêèå õàðàêòåðèñòèêè áóäóò âû÷èñëÿòüñÿ â òàáëèöå ïîäñòàíîâêè. Äëÿ ïîÿñíåíèÿ ìîæíî äîáàâèòü çàãîëîâêè ñòîëáöîâ Среднее,
Дисперсия è ò.ä., êàê ïîêàçàíî íà ðèñ. 7.2.
Ðèñ. 7.2. Ïîäãîòîâêà òàáëèöû ïîäñòàíîâêè
Äàëåå ñëåäóåò âûäåëèòü äèàïàçîí ÿ÷ååê D3:Í15 è âûïîëíèòü êîìàíäó ДанныеÖ
Таблица подстановки, â ðåçóëüòàòå ÷åãî îòêðîåòñÿ äèàëîãîâîå îêíî Таблица
подстановки (ðèñ. 7.3). Â ýòîì äèàëîãîâîì îêíå ïîëå Подставлять значения по
столбцам в îñòàâèì ïóñòûì (îíî çàïîëíÿåòñÿ, åñëè äëÿ òàáëèöû ïîäñòàíîâêè ÷èñëîâûå çíà÷åíèÿ çàïèñàíû â ñòðîêó, à ôîðìóëû — â ñòîëáåö).  ïîëå Подставлять
значения по строкам в ââåäåì àäðåñ ëþáîé ïóñòîé ÿ÷åéêè (íà ðèñ. 7.3 ïîêàçàí àäðåñ
ÿ÷åéêè I1).  äàííîì ñëó÷àå, â îòëè÷èå îò “íàñòîÿùèõ” òàáëèö ïîñòàíîâêè, ÷èñëà
â ñòîëáöå D íå ó÷àñòâóþò â âû÷èñëåíèÿõ; çäåñü àêò èõ ïîäñòàíîâêè â óêàçàííóþ ÿ÷åéêó ÿâëÿåòñÿ “ñïóñêîâûì ìåõàíèçìîì” äëÿ íîâîãî ïåðåñ÷åòà ôîðìóë, ñîäåðæàùèõ
ôóíêöèþ СЛЧИС. Ïîñëå ùåë÷êà íà êíîïêå ОК â îêíå Таблица подстановки âûäåëåííàÿ îáëàñòü áóäåò çàïîëíåíà ðåçóëüòàòàìè ðàñ÷åòîâ, êàê ïîêàçàíî íà ðèñ. 7.4.
Ðåçóëüòàòû ðàñ÷åòîâ â òàáëèöå ïîäñòàíîâêè ïîäâåðæåíû èçìåíåíèÿì (ò.å. àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ), íàïðèìåð, ïðè íàæàòèè êëàâèøè <F9>. ×òîáû
çàôèêñèðîâàòü ýòè çíà÷åíèÿ, ñëåäóåò èëè ïðåîáðàçîâàòü èõ â çíà÷åíèÿ ñ ïîìîùüþ äèàëîãîâîãî îêíà Специальная вставка, êàê ðàññêàçàíî âûøå, ëèáî ñêîïèðîâàòü è âñòàâèòü èõ êàê çíà÷åíèÿ â íîâûé äèàïàçîí ÿ÷ååê (à â òàáëèöå ïîäñòàíîâêè ìîæíî ïðîäîëæàòü ýêñïåðèìåíòû).
1
 ïðèíöèïå, ýòè ÷èñëà ìîãóò áûòü ëþáûìè, â òîì ÷èñëå ðàâíûìè, äðîáíûìè èëè îòðèöàòåëüíûìè, ÷òî íå âëèÿåò íà äàëüíåéøèå âû÷èñëåíèÿ. Íî â âèäå íàòóðàëüíûõ ÷èñåë îíè ìîãóò íåñòè ñìûñëîâóþ íàãðóçêó êàê ïîðÿäêîâûå íîìåðà ýêñïåðèìåíòîâ.
232 Часть II. Средства Excel для статистического анализа
Ðèñ. 7.3. Äèàëîãîâîå îêíî Таблица подстановки
Ðèñ. 7.4. Ðåçóëüòàòû ðàñ÷åòîâ
Ôóíêöèþ СЛЧИС ëåãêî ïðèìåíèòü äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí,
ðàâíîìåðíî ðàñïðåäåëåííûõ íà ïðîèçâîëüíîì èíòåðâàëå [a, b]. Äëÿ ýòîãî íåîáõîäèìî èñïîëüçîâàòü ôîðìóëó
=(b–a)*СЛЧИС()+а,
ãäå âìåñòî a è b ïîäñòàâëÿþòñÿ êîíêðåòíûå ÷èñëà èëè ññûëêè íà ÿ÷åéêè, ñîäåðæàùèå ýòè ÷èñëà.
Òàêæå îòìåòèì, ÷òî ôîðìóëà =ЦЕЛОЕ((b–a)*СЛЧИС()+а) ãåíåðèðóåò öåëî÷èñëåííûå çíà÷åíèÿ, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [a, b – 1], ò.å. ÿâëÿåòñÿ àíàëîãîì ôóíêöèè СЛУЧМЕЖДУ.
Глава 7. Моделирование случайных величин
233
7.2. Метод обратных функций моделирования
случайных величин
 îñíîâå ýòîãî ìåòîäà ëåæèò èçâåñòíûé ìàòåìàòè÷åñêèé ôàêò, ÷òî åñëè
G(x) — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ F(x), òî ñëó÷àéíàÿ âåëè÷èíà Y = G(X), ãäå ñëó÷àéíàÿ âåëè÷èíà X ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå
[0, 1], èìååò ôóíêöèþ ðàñïðåäåëåíèÿ F(x) (ñì. ðàçäåë 1.3).  Excel åñòü íåñêîëüêî ôóíêöèé, âîçâðàùàþùèõ çíà÷åíèÿ îáðàòíûõ ôóíêöèé äëÿ ðàçëè÷íûõ ðàñïðåäåëåíèé. Ýòî ñëåäóþùèå ôóíêöèè (ñì. ðàçäåë 4.7).
•
FРАСПОБР. Âîçâðàùàåò îáðàòíîå çíà÷åíèå äëÿ F-ðàñïðåäåëåíèÿ.
•
БЕТАОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áåòàðàñïðåäåëåíèÿ.
•
ГАММАОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ãàììàðàñïðåäåëåíèÿ.
•
ЛОГНОРМОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ.
•
НОРМОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ.
•
НОРМСТОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ.
•
СТЬЮДРАСПОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà.
•
ХИ2ОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ χ2.
Òàêèì îáðàçîì, ôîðìóëà =ФУНКЦИЯ(СЛЧИС();...), ãäå ФУНКЦИЯ îáîçíà÷àåò
îäíó èç âûøåïåðå÷èñëåííûõ ôóíêöèé ñ ñîîòâåòñòâóþùèìè àðãóìåíòàìè, áóäåò
ãåíåðèðîâàòü ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, êîòîðûå èìåþò ðàñïðåäåëåíèå, îïðåäåëÿåìîå äàííîé ôóíêöèåé2. Ýòèì ñïîñîáîì ìîæíî ãåíåðèðîâàòü ñëó÷àéíûå âåëè÷èíû, èìåþùèå
•
F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà);
•
áåòà-ðàñïðåäåëåíèå;
•
ãàììà-ðàñïðåäåëåíèå;
•
ëîãàðèôìè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå;
•
íîðìàëüíîå ðàñïðåäåëåíèå;
•
ðàñïðåäåëåíèå Ñòüþäåíòà;
•
ðàñïðåäåëåíèå χ2.
2
Íåêîòîðûå èç ïåðå÷èñëåííûõ ôóíêöèé ÿâëÿþòñÿ îáðàòíûìè íå ê ôóíêöèè ðàñïðåäåëåíèÿ
F(x), à ê ôóíêöèè 1 – F(x), ïîýòîìó, ñòðîãî ãîâîðÿ, â òàêèõ ôóíêöèÿõ âìåñòî àðãóìåíòà
СЛЧИС() äîëæåí ñòîÿòü àðãóìåíò 1 – СЛЧИС(). Но ïîñêîëüêó ñëó÷àéíûå âåëè÷èíû Õ è 1 – Õ
èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, åñëè Õ ðàâíîìåðíî ðàñïðåäåëåíà íà èíòåðâàëå [0, 1], òî
ïðèâåäåííàÿ ôîðìóëà ñïðàâåäëèâà äëÿ ëþáûõ îáðàòíûõ ôóíêöèé.
234 Часть II. Средства Excel для статистического анализа
Ìîäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí, èìåþùèõ ðàñïðåäåëåíèå Ñòüþäåíòà, òðåáóåò ïîÿñíåíèÿ, ïîñêîëüêó ôóíêöèÿ Excel СТЬЮДРАСПОБР íå âîçâðàùàåò îòðèöàòåëüíûõ çíà÷åíèé, — îíà ïðåäíàçíà÷åíà äëÿ èñïîëüçîâàíèÿ â ñòàòèñòè÷åñêèõ êðèòåðèÿõ äëÿ âû÷èñëåíèÿ êðèòè÷åñêèõ çíà÷åíèé, íî íå äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë. Îäíàêî, ïîñêîëüêó ýòî ðàñïðåäåëåíèå ñèììåòðè÷íî
îòíîñèòåëüíî íóëÿ, ñëó÷àéíàÿ âåëè÷èíà Õ, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà,
ñ âåðîÿòíîñòüþ 0,5 ìîæåò ïðèíèìàòü îòðèöàòåëüíûå çíà÷åíèÿ è ñ òàêîé æå âåðîÿòíîñòüþ — ïîëîæèòåëüíûå. Èñõîäÿ èç ýòîãî çàìå÷àíèÿ äëÿ ãåíåðèðîâàíèÿ
ñëó÷àéíûõ ÷èñåë ñ äàííûì ðàñïðåäåëåíèåì ìîæíî ïðèìåíèòü ôîðìóëó
=ЕСЛИ(СЛЧИС()<0,5;–СТЬЮДРАСПОБР(СЛЧИС();К); СТЬЮДРАСПОБР(СЛЧИС();К)).
Çäåñü àðãóìåíò К çàäàåò ÷èñëî ñòåïåíåé ñâîáîäû ðàñïðåäåëåíèÿ Ñòüþäåíòà. Ôîðìóëó ìîæíî ïðèìåíÿòü êàê ôîðìóëó ìàññèâà äëÿ ãåíåðèðîâàíèÿ âûáîðêè íóæíîãî ðàçìåðà. Ýòà ôîðìóëà èñïîëüçîâàíà â ïðèìåðå èç ðàçäåëà 9.2.1.
Èç âûøåïðèâåäåííîãî ñïèñêà òîëüêî íîðìàëüíî ðàñïðåäåëåííûå ñëó÷àéíûå
÷èñëà ìîæíî ïîëó÷èòü ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Òàêèì îáðàçîì, ìåòîä îáðàòíûõ ôóíêöèé ñ èñïîëüçîâàíèåì âñòðîåííûõ ôóíêöèé Excel ïîçâîëÿåò ìîäåëèðîâàòü øèðîêèé ñïåêòð âåðîÿòíîñòíûõ ðàñïðåäåëåíèé, îñîáåííî
ñ ó÷åòîì òîãî, ÷òî ìíîãèå äðóãèå ðàñïðåäåëåíèÿ, íå âîøåäøèå â âûøåïðèâåäåííûé
ñïèñîê, ÿâëÿþòñÿ ÷àñòíûìè ñëó÷àÿìè ëèáî áåòà-ðàñïðåäåëåíèÿ (íàïðèìåð, ðàñïðåäåëåíèå àðêñèíóñà, òðåóãîëüíîå è äàæå ðàâíîìåðíîå), ëèáî ãàììà-ðàñïðåäåëåíèÿ
(íàïðèìåð, ðàñïðåäåëåíèå Ýðëàíãà è ïîêàçàòåëüíîå ðàñïðåäåëåíèå).
Åñëè íåîáõîäèìî ìîäåëèðîâàòü ñëó÷àéíóþ âåëè÷èíó, ðàñïðåäåëåíèÿ êîòîðîé íåò
â ïðèâåäåííîì âûøå ñïèñêå, íî èçâåñòíà ôóíêöèÿ, îáðàòíàÿ ê åå ôóíêöèè ðàñïðåäåëåíèÿ, òî èñïîëüçóþò ôîðìóëó, âû÷èñëÿþùóþ ýòó îáðàòíóþ ôóíêöèþ ñ àðãóìåíòîì
СЛЧИС. Íàïðèìåð, èçâåñòíî, ÷òî ôóíêöèÿ ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ èìååò âèä
F(õ) = 1 – e–λõ (õ ≥ 0), ãäå λ — ïàðàìåòð ðàñïðåäåëåíèÿ, λ > 0. Îáðàòíàÿ ôóíêöèÿ,
1
λ
êàê íåòðóäíî ïîêàçàòü, îïðåäåëÿåòñÿ ôîðìóëîé G ( x ) = − ln(1 − x) . Ïîýòîìó äëÿ
ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ïîêàçàòåëüíîå ðàñïðåäåëåíèå, ìîæíî
èñïîëüçîâàòü ôîðìóëó =–LN(СЛЧИС())/А1, åñëè çíà÷åíèå λ çàïèñàíî â ÿ÷åéêå À1.
Òàêèì îáðàçîì, åñëè èçâåñòíà ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ, òî
ìîäåëèðîâàíèå íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí íå âûçûâàåò îñîáûõ çàòðóäíåíèé.
Ìîäåëèðîâàíèå äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí ìåòîäîì îáðàòíûõ ôóíêöèé âûçûâàåò îïðåäåëåííûå ñëîæíîñòè, ñâÿçàííûå ñ òåì, ÷òî äëÿ äèñêðåòíûõ ñëó÷àéíûõ
âåëè÷èí ôóíêöèÿ ðàñïðåäåëåíèÿ èìååò ñòóïåí÷àòûé âèä è ïîýòîìó îáðàòíàÿ ôóíêöèÿ îïðåäåëÿåòñÿ íåîäíîçíà÷íî. Ñóùåñòâóåò íåñêîëüêî ïîäõîäîâ ê ïîñòðîåíèþ îáðàòíûõ ôóíêöèé äèñêðåòíûõ ðàñïðåäåëåíèé, è õîòÿ ïî ñóòè îíè äîñòàòî÷íî ïðîñòû,
íà ïðàêòèêå èñïîëüçîâàòü èõ íåóäîáíî. Excel ïîçâîëÿåò ìîäåëèðîâàòü äèñêðåòíûå
ñëó÷àéíûå âåëè÷èíû áåç íåïîñðåäñòâåííîãî ïîñòðîåíèÿ îáðàòíîé ôóíêöèè. (Íå çàáûâàåì, ÷òî ñðåäñòâî Генерация случайных чисел òàêæå ïîçâîëÿåò ìîäåëèðîâàòü
ëþáûå äèñêðåòíûå âåëè÷èíû, íî çäåñü ìû îáîéäåìñÿ áåç ýòîãî ñðåäñòâà.)
Íà ðèñ. 7.5 ïîêàçàíà òàáëèöà, ñîäåðæàùàÿ çíà÷åíèÿ, âåðîÿòíîñòè ýòèõ çíà÷åíèé è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ. ×òîáû ìîäåëèðîâàòü ñëó÷àéíóþ âåëè÷èíó ñ òàêèì ðàñïðåäåëåíèåì, íàäî âûïîëíèòü òàêèå äåéñòâèÿ. Ïåðåä ñòîëáöîì, ñîäåðæàùèì çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû, âñòàâèòü åùå îäèí ñòîëáåö,
ñîäåðæàùèé çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, êàê ïîêàçàíî íà ðèñ. 7.6. Îáðàùàåì âíèìàíèå, ÷òî ïåðâîå çíà÷åíèå â ýòîì ñòîëáöå ðàâíî 0. Äàííûå â ñòîëáöàõ
C è D â äàëüíåéøåì íå èñïîëüçóþòñÿ.
Глава 7. Моделирование случайных величин
235
Ðèñ. 7.5. Ðàñïðåäåëåíèå äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû
Ðèñ. 7.6. Ïîäãîòîâêà ê ìîäåëèðîâàíèþ
Äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë â äàííîì ñëó÷àå èñïîëüçóåòñÿ ôîðìóëà
=ВПР(СЛЧИС();A2:B8;2).
Ôóíêöèÿ ВПР â ïåðâîì ñòîëáöå òàáëèöû, çàäàâàåìîé âòîðûì àðãóìåíòîì A2:B8,
èùåò ñîâïàäåíèÿ ñî çíà÷åíèåì ïåðâîãî àðãóìåíòà СЛЧИС(). Ïðè íàëè÷èè òàêîãî
ñîâïàäåíèÿ ôóíêöèÿ âîçâðàùàåò çíà÷åíèå èç âòîðîãî ñòîëáöà (íîìåð ñòîëáöà çàäàåò òðåòèé àðãóìåíò 2) è ñòðîêè, â êîòîðîé áûëî îáíàðóæåíî ñîâïàäåíèå çíà÷åíèé.
Åñëè òî÷íîãî ñîâïàäåíèÿ íåò, òî â êà÷åñòâå èñêîìîãî áåðåòñÿ áëèæàéøåå çíà÷åíèå,
íå ïðåâîñõîäÿùåå çíà÷åíèå ïåðâîãî àðãóìåíòà. Òàê ðàáîòàåò ýòà ôóíêöèÿ, åñëè íå
çàäàí åå ÷åòâåðòûé (íåîáÿçàòåëüíûé) àðãóìåíò. Ïðèâåäåííóþ ôîðìóëó ìîæíî ïðèìåíÿòü êàê ôîðìóëó ìàññèâà äëÿ ãåíåðèðîâàíèÿ íå îäíîãî, à íåñêîëüêèõ ñëó÷àéíûõ
÷èñåë. Íà ðèñ. 7.7 â ñòîëáöå F ïîêàçàí ìàññèâ ñãåíåðèðîâàííûõ çíà÷åíèé. Ýòè çíà÷åíèÿ ïåðåñ÷èòûâàþòñÿ ïðè íàæàòèè êëàâèøè <F9>, ïîýòîìó èõ ìîæíî èñïîëüçîâàòü äëÿ ïîëó÷åíèÿ íåñêîëüêèõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ.
Íà ïðàêòèêå ìåòîä îáðàòíûõ ôóíêöèé èñïîëüçóåòñÿ â îñíîâíîì òîãäà, êîãäà
èçâåñòíî àíàëèòè÷åñêîå âûðàæåíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ.
Íî â Excel åñòü ñðåäñòâà, êîòîðûå ïîçâîëÿþò ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà áåç
èñïîëüçîâàíèÿ ÿâíîãî âèäà îáðàòíîé ôóíêöèè, ÷òî ïîêàçûâàåò ïðèâåäåííûé ïðèìåð ìîäåëèðîâàíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû. Äëÿ ìîäåëèðîâàíèÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí ìîæíî èñïîëüçîâàòü ñðåäñòâà Подбор параметра
è Поиск решения äëÿ ïîëó÷åíèÿ çíà÷åíèé îáðàòíîé ôóíêöèè ïóòåì ðåøåíèÿ óðàâíåíèÿ F(õ) = ξ, ãäå ξ — çàäàííîå çíà÷åíèå ñëó÷àéíîé âåëè÷èíû, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1]. Ïîêàæåì, êàê ýòî äåëàåòñÿ, íà ïðèìåðå
236 Часть II. Средства Excel для статистического анализа
ãåíåðèðîâàíèÿ íîðìàëüíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë, ïîñêîëüêó ñ÷èòàåòñÿ,
÷òî íîðìàëüíî ðàñïðåäåëåííûå ñëó÷àéíûå ÷èñëà ìåòîäîì îáðàòíûõ ôóíêöèé ãåíåðèðîâàòü âåñüìà ñëîæíî è òàêèå ÷èñëà îáû÷íî ãåíåðèðóþò ñ ïîìîùüþ äðóãèõ ìåòîäîâ.
Ðèñ. 7.7. Ãåíåðèðîâàíèå ñëó÷àéíûõ ÷èñåë
Ñîçäàäèì òàáëèöó, ïîêàçàííóþ íà ðèñ. 7.8.  ñòîëáöå À ââåäåì ñòîëüêî ÷èñåë, ñêîëüêî èõ äîëæíî áûòü â áóäóùåé âûáîðêå. Ýòè ÷èñëà ìîãóò áûòü ïðîèçâîëüíûìè. Åäèíñòâåííîå îãðàíè÷åíèå, êîòîðîå íà íèõ íàêëàäûâàåòñÿ, çàêëþ÷àåòñÿ â òîì, ÷òîáû ôóíêöèÿ ðàñïðåäåëåíèÿ, âû÷èñëÿåìàÿ íà èõ îñíîâå, íå ïðèíèìàëà êðàéíèõ çíà÷åíèé 0 è 1, ïîñêîëüêó ýòî çàòðóäíèò ðàáîòó ñðåäñòâà Поиск
решения.  ñòîëáöå  âû÷èñëÿþòñÿ çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, â äàííîì
ñëó÷àå ïî ôîðìóëå =НОРМСТРАСП(A2), êîòîðàÿ çàïèñàíà â ÿ÷åéêå Â2 è çàòåì
ñêîïèðîâàíà âíèç äî êîíöà èíòåðâàëà. Â ñòîëáöå Ñ ñ ïîìîùüþ ôîðìóëû ìàññèâà
{=СЛЧИС()} ñãåíåðèðîâàíû ñëó÷àéíûå ÷èñëà, èìåþùèå ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1]. Çàòåì ôîðìóëà ïðåîáðàçóåòñÿ â çíà÷åíèÿ ñ ïîìîùüþ
äèàëîãîâîãî îêíà Специальная вставка.
Äàëåå ïðèìåíÿåòñÿ ñðåäñòâî Поиск решения, äèàëîãîâîå îêíî êîòîðîãî ïîêàçàíî
íà ðèñ. 7.9.  äàííîì ñëó÷àå ñ ïîìîùüþ ýòîãî ñðåäñòâà âû÷èñëÿþòñÿ êîðíè óðàâíåíèé F(õ) = ξ, çíà÷åíèÿ ξ êîòîðûõ çàïèñàíû â ñòîëáöå Ñ, à çíà÷åíèÿ êîðíåé õ áóäóò çàïèñàíû â ñòîëáöå À (îá èñïîëüçîâàíèè ñðåäñòâà Поиск решения äëÿ ðåøåíèÿ
óðàâíåíèé ðå÷ü èäåò â ðàçäåëå 6.3). Îäíîâðåìåííî ðåøàåòñÿ ñòîëüêî óðàâíåíèé,
ñêîëüêî íåîáõîäèìî ñãåíåðèðîâàòü âûáîðî÷íûõ çíà÷åíèé.  äèàëîãîâîì îêíå
Поиск решения öåëåâàÿ ÿ÷åéêà íå çàäàåòñÿ, â êà÷åñòâå èçìåíÿåìûõ ÿ÷ååê óêàçûâàþòñÿ âñå ÿ÷åéêè ñòîëáöà À, â êîòîðûå ââåäåíû ÷èñëà. Îãðàíè÷åíèÿ â äàííîì
ñëó÷àå çàäàþòñÿ â âèäå îäíîãî ðàâåíñòâà В2:В16 = С2:С16. Ïîñëå ùåë÷êà íà êíîïêå
Выполнить Excel ïîñëå íåêîòîðîãî âðåìåíè “ðàçäóìèé”, äëèòåëüíîñòü êîòîðîãî çàâèñèò îò êîëè÷åñòâà ðåøàåìûõ óðàâíåíèé, íàéäåò êîðíè âñåõ óðàâíåíèé è òåì ñàìûì ñãåíåðèðóåò ñëó÷àéíûå ÷èñëà. Ðåçóëüòàò âû÷èñëåíèé ïîêàçàí íà ðèñ. 7.10.
Ïîäîáíûì îáðàçîì ìîæíî ñãåíåðèðîâàòü çíà÷åíèÿ ëþáîé ñëó÷àéíîé âåëè÷èíû ñ èçâåñòíîé ôóíêöèåé ðàñïðåäåëåíèÿ, åñëè ñàìà ôóíêöèÿ ðàñïðåäåëåíèÿ äîñòàòî÷íî ãëàäêàÿ, ïîñêîëüêó Поиск решения äëÿ ðåøåíèÿ óðàâíåíèé èñïîëüçóåò
ãðàäèåíòíûé ìåòîä.
Глава 7. Моделирование случайных величин
237
Ðèñ. 7.8. Ïîäãîòîâêà ê ìîäåëèðîâàíèþ
Ðèñ. 7.9. Äèàëîãîâîå îêíî Поиск решения
7.3. Метод суперпозиций
Äàííûé ìåòîä ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ ïðèìåíÿåòñÿ
òîãäà, êîãäà åå ôóíêöèþ ðàñïðåäåëåíèÿ F(x) ìîæíî ïðåäñòàâèòü â âèäå ñóììû
m
F ( x) = ∑ ck Fk ( x) , ãäå âñå Fk(x) — òàêæå ôóíêöèè ðàñïðåäåëåíèÿ, à âñå êîýôôèöèk =1
238 Часть II. Средства Excel для статистического анализа
åíòû ñk > 0, ïðè ýòîì ñ1 + ñ2 + ... + cm = 1. (Òàêàÿ ñëó÷àéíàÿ âåëè÷èíà Õ íàçûâàåòñÿ ñìåñüþ ñëó÷àéíûõ âåëè÷èí.) Êîýôôèöèåíòû ñk ìîæíî ðàññìàòðèâàòü êàê âåðîÿòíîñòè, çàäàþùèå ðàñïðåäåëåíèå äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Y, êîòîðàÿ
ïðèíèìàåò öåëî÷èñëåííûå çíà÷åíèÿ k ñ âåðîÿòíîñòüþ ñk. Äîêàçàíî [16, ñ. 64], ÷òî
åñëè â ñîîòâåòñòâèè ñ ðàñïðåäåëåíèåì âåëè÷èíû Y âûáèðàòü íîìåð k, à çàòåì èç
óðàâíåíèÿ Fk(X) = ξ, ãäå ξ — çíà÷åíèå ñëó÷àéíîé âåëè÷èíû, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1], îïðåäåëèòü Õ, òî ñëó÷àéíàÿ âåëè÷èíà Õ
m
ïîä÷èíÿåòñÿ âåðîÿòíîñòíîìó çàêîíó ñ ôóíêöèåé ðàñïðåäåëåíèÿ F ( x) = ∑ ck Fk ( x) .
k =1
Ðèñ. 7.10. Ñãåíåðèðîâàííûå ñëó÷àéíûå ÷èñëà
Íà îñíîâå ýòîãî óòâåðæäåíèÿ ìîæíî ïîñòðîèòü ñëåäóþùóþ ñõåìó âû÷èñëåíèÿ
çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ. Ïóñòü èìåþòñÿ äâà ñãåíåðèðîâàííûõ íåçàâèñèìûõ ñëó÷àéíûõ ÷èñëà ξ1 è ξ2, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1].
Çíà÷åíèå õ ñëó÷àéíîé âåëè÷èíû Õ âû÷èñëÿåòñÿ ïî ôîðìóëå
 G1 (ξ 2 ),
 G (ξ ),
 2 2



x = Gk (ξ 2 ),



 G (ξ ),
 m 2

если ξ1 < c1 ,
если c1 < ξ1 < c1 + c2 ,
#
если
k −1
k
∑c
< ξ1 < ∑ ci ,
i
i =1
i =1
#
если
m −1
∑c
i
< ξ1 < 1,
i =1
ãäå Gk — ôóíêöèè, îáðàòíûå ê ôóíêöèÿì ðàñïðåäåëåíèÿ Fk (ò.å. çäåñü èñïîëüçóåòñÿ ìåòîä îáðàòíûõ ôóíêöèé).
Глава 7. Моделирование случайных величин
239
Ïîêàæåì, êàê ýòó ôîðìóëó ìîæíî ðåàëèçîâàòü â Excel. Ñíà÷àëà ðàññìîòðèì
ïðîñòîé ñëó÷àé, êîãäà m = 2. Ïóñòü F ( x) =
2
3
F1 ( x) + F2 ( x) , F1(x) — ôóíêöèÿ
5
5
ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà ñ ïàðàìåòðîì λ = 2 (äëÿ ýòîãî ðàñïðåäåëå-
1
λ
íèÿ îáðàòíàÿ ôóíêöèÿ èìååò âèä G ( x ) = − ln(1 − x) ), F2(x) — ôóíêöèÿ ðàñïðåäåëåíèÿ íîðìàëüíîãî çàêîíà ñ ïàðàìåòðàìè m = 1 è σ = 2 (çäåñü äëÿ âû÷èñëåíèÿ
îáðàòíîé ôóíêöèè áóäåì èñïîëüçîâàòü ôóíêöèþ Excel НОРМОБР). Äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ
F ( x) =
2
3
F1 ( x) + F2 ( x) , íàäî ïðèìåíèòü ôîðìóëó
5
5
=ЕСЛИ(СЛЧИС()<2/5;–LN(СЛЧИС())/2;НОРМОБР(СЛЧИС();1;2).
Åå ìîæíî èñïîëüçîâàòü êàê ôîðìóëó ìàññèâà, ñãåíåðèðîâàâ ïðè ýòîì ñòîëüêî
çíà÷åíèé, ñêîëüêî íåîáõîäèìî. Òàêæå îòìåòèì, ÷òî ýòè çíà÷åíèÿ áóäóò ïåðåñ÷èòûâàòüñÿ ïðè íàæàòèè êëàâèøè <F9>. Òàêèì îáðàçîì êàæäûé ðàç ìîæíî ïîëó÷àòü íîâóþ âûáîðêó.
Åñëè m ≥ 3, ïðîñòîé ôîðìóëû äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë íå ñóùåñòâóåò3. Äëÿ ñëó÷àéíîãî âûáîðà îáðàòíîé ôóíêöèè Gk, êîòîðàÿ äàñò î÷åðåäíîå
çíà÷åíèå ñëó÷àéíîé âåëè÷èíû â ñîîòâåòñòâèè ñ ïðèâåäåííîé âûøå ôîðìóëîé,
â Excel ìîæíî èñïîëüçîâàòü ôóíêöèþ ВПР òàê, êàê ïðè ìîäåëèðîâàíèè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí (ñì. ïðåäûäóùèé ðàçäåë). Ïóñòü, íàïðèìåð,
F(x) = 0,1F1(x) + 0,3F2(x) + 0,2F3(x) + 0,1F4(x) + 0,3F5(x),
ãäå F1 — ôóíêöèÿ áåòà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 1 è 2, F2 — ôóíêöèÿ ãàììàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 2 è 3, F3 — ôóíêöèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî
ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 1 è 1, F4 — ôóíêöèÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ è F5 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ 10-þ ñòåïåíÿìè ñâîáîäû.
Íà ðèñ. 7.11 ïîêàçàíà ïîäãîòîâèòåëüíàÿ òàáëèöà, ñîäåðæàùàÿ êîýôôèöèåíòû, èõ ÷àñòè÷íûå ñóììû, à òàêæå ôîðìóëû ñ èñïîëüçîâàíèåì îáðàòíûõ ôóíêöèé äëÿ âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë.  ÿ÷åéêó D2 ââåäåì ôîðìóëó
=ВПР(СЛЧИС();$A$8:$B$12;2) è ñêîïèðóåì åå âíèç ñòîëüêî ðàç, ñêîëüêî íåîáõîäèìî. (Ââîäèòü ýòó ôîðìóëó êàê ôîðìóëó ìàññèâà â äàííîì ñëó÷àå íåöåëåñîîáðàçíî ïî ïðè÷èíàì, êîòîðûå áóäóò ïîíÿòíû ïîçæå.)  ðåçóëüòàòå ïîëó÷èì ñëó÷àéíûå ÷èñëà, ïîêàçàííûå íà ðèñ. 7.12 â ñòîëáöå Случайные числа.
Íåòðóäíî çàìåòèòü îäèíàêîâûå çíà÷åíèÿ ñðåäè ñãåíåðèðîâàííûõ ÷èñåë. Ýòî
ñëåäñòâèå òîãî, ÷òî ñëó÷àéíûå ÷èñëà áåðóòñÿ èç òàáëèöû Обратные функции, êîòîðàÿ, õîòÿ è ïåðåñ÷èòûâàåòñÿ ïðè êàæäîì âû÷èñëåíèè, èìååò êîíå÷íûé íàáîð
çíà÷åíèé. ×òîáû îáîéòè ýòî ïðåïÿòñòâèå è ïîëó÷èòü ïîëíîöåííóþ âûáîðêó, íåêîòîðûå äåéñòâèÿ íåîáõîäèìî âûïîëíèòü âðó÷íóþ. Ïîñëå êàæäîãî ïåðåñ÷åòà òàáëèö
Обратные функции è Случайные числа, âûïîëíÿåìîãî ñ ïîìîùüþ êëàâèøè <F9>,
3
Íåëüçÿ èñïîëüçîâàòü âëîæåííûå ôóíêöèè ЕСЛИ äëÿ ïðîâåðêè çíà÷åíèÿ, âîçâðàùàåìîãî
ôóíêöèåé СЛЧИС, ïîñêîëüêó äëÿ ïðîâåðêè áîëåå äâóõ óñëîâèé íåîáõîäèìî íåñêîëüêî
“ýêçåìïëÿðîâ” ýòîãî çíà÷åíèÿ. Íî åñëè äëÿ ïîëó÷åíèÿ ýòèõ “ýêçåìïëÿðîâ” îïÿòü èñïîëüçîâàòü ôóíêöèþ СЛЧИС, îíà äàñò äðóãîå çíà÷åíèå. Åñëè â ôîðìóëå íåñêîëüêî ðàç âñòðå÷àåòñÿ
ôóíêöèÿ СЛЧИС, òî îíà êàæäûé ðàç ãåíåðèðóåò íîâîå çíà÷åíèå. Íàïðèìåð, ôîðìóëà
=СЛЧИС()–СЛЧИС() íèêîãäà íå âîçâðàòèò íóëåâîãî çíà÷åíèÿ.
240 Часть II. Средства Excel для статистического анализа
Ðèñ. 7.11. Ïîäãîòîâèòåëüíàÿ òàáëèöà
Ðèñ. 7.12. Ñãåíåðèðîâàííûå ñëó÷àéíûå ÷èñëà
íåîáõîäèìî ïîî÷åðåäíî çàôèêñèðîâàòü ÷èñëà (ïðåîáðàçîâàòü ôîðìóëó â çíà÷åíèå)
â ñòîëáöå Случайные числа. (Èç-çà ýòîãî äåéñòâèÿ ôîðìóëó â ñòîëáöå Случайные
числа íå ñëåäóåò ââîäèòü êàê ôîðìóëó ìàññèâà, òàê êàê ôîðìóëà ìàññèâà íå ïîçâîëÿåò ìàíèïóëèðîâàòü îòäåëüíûìè çíà÷åíèÿìè.) ×òîáû óïðîñòèòü ýòî äåéñòâèå, ìîæíî íàïèñàòü ïðîñòîé ìàêðîñ, êîòîðûé áóäåò âûïîëíÿòü ñëåäóþùèå äåéñòâèÿ. Ïóñòü âûäåëåíà îòäåëüíàÿ ÿ÷åéêà. Ñíà÷àëà âûïîëíÿåòñÿ êîïèðîâàíèå ñîäåðæèìîãî ÿ÷åéêè ëþáûì ñïîñîáîì (ñ ïîìîùüþ ùåë÷êà íà êíîïêå Копировать
ñòàíäàðòíîé ïàíåëè èíñòðóìåíòîâ èëè êîìàíäû ПравкаÖКопировать). Çàòåì ïî
êîìàíäå ПравкаÖСпециальная вставка îòêðûâàåòñÿ îäíîèìåííîå äèàëîãîâîå îêíî, â êîòîðîì óñòàíàâëèâàåòñÿ ïåðåêëþ÷àòåëü Значения. Ùåë÷îê íà êíîïêå ОК
ýòîãî îêíà — ïîñëåäíåå äåéñòâèå, êîòîðîå íàäî çàïèñàòü â ìàêðîñ. Ïåðåä íà÷àëîì çàïèñè ìàêðîñà (êîìàíäà СервисÖМакросÖНачать запись) â îêíå Запись
Глава 7. Моделирование случайных величин
241
макроса ðåêîìåíäóåì çàäàòü êîìáèíàöèþ êëàâèø, ñ ïîìîùüþ êîòîðîé áóäåò âûïîëíÿòüñÿ ìàêðîñ. Ïîñëå ùåë÷êà íà êíîïêå ОК â îêíå Запись макроса îòêðûâàåòñÿ ïàíåëü Остановить запись, ãäå ïåðåä çàïèñüþ äåéñòâèé îáÿçàòåëüíî íàäî
ùåëêíóòü íà êíîïêå Относительные ссылки. Åñëè èñïîëüçîâàòü îïèñàííûé ìàêðîñ, òî ïîî÷åðåäíîå ôèêñèðîâàíèå çíà÷åíèé âûáîðêè ñðåäíèõ ðàçìåðîâ (ïîðÿäêà
100 ÷èñåë) çàéìåò âñåãî ïàðó ìèíóò èëè ÷óòü áîëüøå (â çàâèñèìîñòè îò ñêîðîñòè
íàæàòèÿ êëàâèø). Íà ðèñ. 7.13 ïîêàçàíà îêîí÷àòåëüíàÿ âûáîðêà.
Ðèñ. 7.13. Îêîí÷àòåëüíî ñôîðìèðîâàííàÿ âûáîðêà
7.4. Метод отбора
Ýòîò ìåòîä ïðèìåíÿåòñÿ äëÿ ìîäåëèðîâàíèÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí, êîòîðûå èìåþò ñëîæíîå ðàñïðåäåëåíèå íà êîíå÷íîì èíòåðâàëå è äëÿ êîòîðûõ èçâåñòíî àíàëèòè÷åñêîå âûðàæåíèå ïëîòíîñòè âåðîÿòíîñòåé ð(õ). Ìåòîä èñïîëüçóåòñÿ â îñíîâíîì òîãäà, êîãäà äðóãèå ìåòîäû ìîäåëèðîâàíèÿ íåïðèåìëåìû.
Ðàññìîòðèì ïðîñòåéøèé âàðèàíò ìåòîäà îòáîðà, êîòîðûé òàêæå íàçûâàþò ìåòîäîì Íåéìàíà (ïî èìåíè åãî ðàçðàáîò÷èêà)4.
Íà ðèñ. 7.14 ïîêàçàí ãðàôèê ïëîòíîñòè âåðîÿòíîñòè ó = ð(õ) íåêîòîðîé ñëó÷àéíîé âåëè÷èíû Õ, ðàñïðåäåëåííîé íà èíòåðâàëå [a, b], è ãðàôèê ôóíêöèè
ó = ñ, êîòîðàÿ ìàæîðèðóåò ïëîòíîñòü ð(õ). Ïóñòü ξ è η — ñëó÷àéíûå âåëè÷èíû, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëàõ [a, b] è [0, ñ] ñîîòâåòñòâåííî.
Äîêàçàíî [16, ñ. 76], ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ, îïðåäåëÿåìàÿ óñëîâèåì Õ = ξ,
åñëè η < ð(ξ), èìååò ðàñïðåäåëåíèå ñ ïëîòíîñòüþ âåðîÿòíîñòåé ð(õ). Äðóãèìè
ñëîâàìè, åñëè äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà (ξ, η), ðàâíîìåðíî ðàñïðåäåëåííàÿ â ïðÿìîóãîëüíèêå a ≤ õ ≤ b, 0 ≤ ó ≤ ñ, ïîïàäàåò â îáëàñòü, ëåæàùóþ íèæå
ãðàôèêà ó = ð(õ), òî ïðèíèìàåòñÿ, ÷òî Õ = ξ (ðèñ. 7.14). Âåëè÷èíà ñ îáû÷íî
4
Èíîãäà âñå ìåòîäû îòáîðà íàçûâàþò ìåòîäàìè Íåéìàíà.
242 Часть II. Средства Excel для статистического анализа
áåðåòñÿ ðàâíîé ìàêñèìóìó ôóíêöèè ð(õ), íî, åñëè ìàêñèìóì íåèçâåñòåí èëè
ñëîæíî íàéòè åãî òî÷íîå çíà÷åíèå, âåëè÷èíà ñ áåðåòñÿ çàâåäîìî áîëüøåé, ÷åì
ìàêñèìàëüíîå çíà÷åíèå ð(õ).
Ðèñ. 7.14. Ïîÿñíÿþùèé ðèñóíîê ê îïèñàíèþ
ìåòîäà îòáîðà
Íà ýòîì îñíîâàíèè ïîñòðîåí ìåòîä îòáîðà: ãåíåðèðóþòñÿ äâà íåçàâèñèìûõ
ñëó÷àéíûõ ÷èñëà ξ1 è ξ2, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1], è âû÷èñëÿþòñÿ çíà÷åíèÿ õ = a + (b – a)ξ1 è y = cξ2. Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
y < ð(õ), òî çà çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Õ ïðèíèìàåòñÿ çíà÷åíèå õ.  ïðîòèâíîì ñëó÷àå ïàðà ÷èñåë ξ1 è ξ2 îòáðàñûâàåòñÿ è ãåíåðèðóåòñÿ íîâàÿ, äëÿ êîòîðîé âûïîëíÿåòñÿ àíàëîãè÷íàÿ ïðîâåðêà.
Ïîêàæåì ðåàëèçàöèþ ýòîãî àëãîðèòìà íà ïðèìåðå ìîäåëèðîâàíèÿ ñëó÷àéíîé
âåëè÷èíû Õ, èìåþùåé ðàñïðåäåëåíèå íà èíòåðâàëå [–1, 1] ñ ïëîòíîñòüþ âåðîÿòíîñòè p ( x) =
2
1 − x 2 . Çäåñü ïî ñãåíåðèðîâàííûì ñëó÷àéíûì ÷èñëàì ξ1 è ξ2, ðàâπ
íîìåðíî ðàñïðåäåëåííûì íà èíòåðâàëå [0, 1], ïðîâåðÿåòñÿ íåðàâåíñòâî
2ξ2/π < ð(2ξ1 – 1), êîòîðîå ìîæíî ïðåîáðàçîâàòü â ýêâèâàëåíòíîå íåðàâåíñòâî
ξ22 < 1 – (2ξ1 – 1)2. Åñëè ýòî íåðàâåíñòâî âûïîëíÿåòñÿ, òî çà çíà÷åíèå ñëó÷àéíîé
âåëè÷èíû Õ ïðèíèìàåòñÿ ÷èñëî 2ξ1 – 1. Íà ðèñ. 7.15 ïîêàçàí ðàáî÷èé ëèñò,
â ñòîëáöàõ À è Â êîòîðîãî ñ ïîìîùüþ ôîðìóë =СЛЧИС() ñãåíåðèðîâàíû
ðàâíîìåðíî ðàñïðåäåëåííûå ÷èñëà ξ1 è ξ2.  ñòîëáöå Ñ ïî ôîðìóëå
=ЕСЛИ(B2^2<1-(2*A2-1)^2;2*A2-1;"M"),
çàïèñàííîé â ÿ÷åéêå Ñ2 è ñêîïèðîâàííîé âíèç, âû÷èñëÿþòñÿ çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ. Åñëè îïðåäåëÿþùåå íåðàâåíñòâî íå âûïîëíÿåòñÿ, â ÿ÷åéêó
ñòîëáöà Ñ çàïèñûâàåòñÿ áóêâà М (ìîæíî çàïèñàòü ëþáîå çíà÷åíèå, ïîêàçûâàþùåå,
÷òî â äàííîé ÿ÷åéêå íåò âûáîðî÷íîãî çíà÷åíèÿ). Äàëåå îñòàåòñÿ óäàëèòü èç âûáîðêè ÿ÷åéêè ñ áóêâîé М, ò.å. òå ÿ÷åéêè, â êîòîðûõ íåò âûáîðî÷íûõ çíà÷åíèé.
Íåäîñòàòêîì äàííîãî ìåòîäà ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë ÿâëÿåòñÿ òî, ÷òî
íåâîçìîæíî çàðàíåå ïðåäñêàçàòü, ñêîëüêî çíà÷åíèé áóäåò â êîíå÷íîé âûáîðêå.
Ñóùåñòâóþò ðàçëè÷íûå ìîäèôèêàöèè ýòîãî ìåòîäà, óìåíüøàþùèå êîëè÷åñòâî
ïðîáíûõ ïàð ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë.
Глава 7. Моделирование случайных величин
243
Ðèñ. 7.15. Ãåíåðèðîâàíèå ñëó÷àéíûõ ÷èñåë ïî ìåòîäó îòáîðà
7.5. Моделирование многомерных случайных
величин
Åñëè êîìïîíåíòû Õ1, Õ2, ..., Xn ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû
Õ = (Õ1, Õ2, ..., Xn) íåçàâèñèìû, òî ìîæíî ìîäåëèðîâàòü êàæäóþ ñëó÷àéíóþ âåëè÷èíó Xk (k = 1, 2, ..., n) íåçàâèñèìî è èç ðåàëèçàöèé ýòèõ âåëè÷èí
(ñãåíåðèðîâàííûõ ñëó÷àéíûõ ÷èñåë) ñîñòàâèòü ðÿä n-ìåðíûõ âåêòîðîâ, êîòîðûå
îáðàçóþò âûáîðêó èç ãåíåðàëüíîé ñîâîêóïíîñòè ñëó÷àéíîé âåëè÷èíû Õ.
 ñëó÷àå çàâèñèìîñòè êîìïîíåíòîâ Õ1, Õ2, ..., Xn äëÿ ìîäåëèðîâàíèÿ ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2, ..., Xn) íåîáõîäèìî èñïîëüçîâàòü ñîâìåñòíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x1, x2, ..., xn) êîìïîíåíòîâ Õ1, Õ2, ..., Xn. Äëÿ
óïðîùåíèÿ âûêëàäîê äàëåå ðàññìîòðèì ñëó÷àé äâóìåðíîé íåïðåðûâíîé ñëó÷àéíîé
âåëè÷èíû Õ = (Õ1, Õ2); ìîäåëèðîâàíèå â îáùåì ñëó÷àå ïîêàçàíî â [16, ãëàâà 2].
Ïóñòü ñîâìåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ F(x1, x2) äâàæäû äèôôåðåíöèðîâàíà è ñóùåñòâóåò ñîâìåñòíàÿ ïëîòíîñòü âåðîÿòíîñòè f ( x1 , x2 ) =
∂F ( x1 , x2 )
. Ýòó
∂x1∂x2
ïëîòíîñòü ìîæíî ïðåäñòàâèòü â âèäå ïðîèçâåäåíèÿ ÷àñòíîé è óñëîâíîé ïëîòíîñòåé âåðîÿòíîñòåé ñëó÷àéíûõ âåëè÷èí Õ1 è Õ2:
f(x1, x2) = f1(x1) f2(x2 | x1) = f2(x2) f1(x1 | x2),
ãäå f1 ( x1 ) =
+∞
∫
f ( x1 , x2 )dx2 , f 2 ( x2 | x1 ) =
−∞
f ( x1 , x2 )
(ôóíêöèè f2(x2) è f1(x1 | x2) âû÷èñf1 ( x1 )
ëÿþòñÿ ïî àíàëîãè÷íûì ôîðìóëàì ñ çàìåíîé èíäåêñîâ 1 íà 2 è 2 íà 1). Äàëåå
íåîáõîäèìî âû÷èñëèòü óñëîâíûå ôóíêöèè ðàñïðåäåëåíèÿ:
x
F1 ( x) =
∫
−∞
x
f1 ( x1 )dx1 , F2 ( x | x1 ) =
∫
f ( x2 | x1 )dx2 .
−∞
244 Часть II. Средства Excel для статистического анализа
Ìîäåëèðîâàíèå ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2) îñíîâàíî íà òîì ôàêòå, ÷òî
ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2, ïîëó÷åííûå ïðè ïîñëåäîâàòåëüíîì ðåøåíèè óðàâíåíèé F1(X1) = Y1, F2(Õ2 | X1) = Y2, ãäå Y1 è Y2 — íåçàâèñèìûå ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] ñëó÷àéíûå âåëè÷èíû, èìåþò ñîâìåñòíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x1, x2).
Ðàññìîòðèì ïðèìåð ìîäåëèðîâàíèÿ ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2), êîòîðàÿ ìîæåò ïðèíèìàòü çíà÷åíèÿ â òðåóãîëüíèêå x + y = 1, x > 0, y > 0 ñ ïëîòíîñòüþ âåðîÿòíîñòè f(x, ó) = 6ó. Ñíà÷àëà âû÷èñëèì óñëîâíûå ïëîòíîñòè âåðîÿòíîñòåé:
f1 ( x) =
+∞
∫
f ( x, y )dy =
1− x
∫ 6 ydy = 3(1 − x)
−∞
2
, f 2 ( y | x) =
0
f ( x, y )
2y
=
.
f1 ( x)
(1 − x)2
Äàëåå âû÷èñëèì óñëîâíûå ôóíêöèè ðàñïðåäåëåíèÿ:
x
F1 ( x) =
x
∫
−∞
f1 (u )du = ∫ 3(1 − u ) 2 du = 1 − (1 − x)3 ,
0
y
F2 ( y | x) =
∫
y
f 2 (u | x)du =
−∞
2
y2
=
.
udu
(1 − x) 2 ∫0
(1 − x) 2
 äàííîì ñëó÷àå ðåøåíèå óðàâíåíèé F1(x) = ξ1, F2(ó | x) = ξ2 ìîæíî íàéòè
â ÿâíîì âèäå: x = 1 − 3 1 − ξ1 , y = 3 1 − ξ1 ξ 2 . Ïîñêîëüêó ñëó÷àéíûå âåëè÷èíû ξ1
è 1 – ξ1 èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, åñëè âåëè÷èíà ξ1 ðàâíîìåðíî ðàñïðåäåëåíà íà èíòåðâàëå [0, 1], ôîðìóëû äëÿ âû÷èñëåíèÿ õ è ó ìîæíî çàïèñàòü ñëåäóþùèì îáðàçîì: x = 1 − 3 ξ1 , y = 3 ξ1 ξ 2 .
Íà ðèñ. 7.16 ïîêàçàí ðàáî÷èé ëèñò, â êîòîðîì ñãåíåðèðîâàíû 15 çíà÷åíèé
ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2). Çíà÷åíèÿ ñëó÷àéíûõ âåëè÷èí Õ1 è Õ2 ïîëó÷åíû ñ ïîìîùüþ ôîðìóë ìàññèâà
{=1-СТЕПЕНЬ(СЛЧИС();1/3)} è {=(1-A2:A16)*ÊÎÐÅÍÜ(ÑË×ÈÑ())}
ñîîòâåòñòâåííî.
Îòìåòèì, ÷òî äëÿ ðåøåíèÿ óðàâíåíèé F1(X1) = Y1 è F2(Õ2 | X1) = Y2 â îáùåì
ñëó÷àå â Excel ìîæíî èñïîëüçîâàòü ñðåäñòâî Поиск решения.
7.5.1. Моделирование зависимых случайных величин с
известным коэффициентом корреляции
Îïèñàííûé íèæå ìåòîä îáû÷íî ïðèìåíÿåòñÿ äëÿ ìîäåëèðîâàíèÿ çàâèñèìûõ
ñëó÷àéíûõ âåëè÷èí, ðàñïðåäåëåíèå êîòîðûõ ïðèíàäëåæèò êëàññó áåçãðàíè÷íî
äåëèìûõ ðàñïðåäåëåíèé, è ðåæå — äëÿ ñëó÷àéíûõ âåëè÷èí ñ äðóãèìè ðàñïðåäåëåíèÿìè, ïîñêîëüêó â ïîñëåäíåì ñëó÷àå, êàê ïðàâèëî, íåîáõîäèìû ïðåäâàðèòåëüíûå äîñòàòî÷íî ñëîæíûå àíàëèòè÷åñêèå âûêëàäêè. Åñëè ðàñïðåäåëåíèå F
ñëó÷àéíîé âåëè÷èíû Õ ïðèíàäëåæèò êëàññó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé, òî ñëó÷àéíóþ âåëè÷èíó Õ ìîæíî ïðåäñòàâèòü êàê ñóììó íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí Õ = Õ1 + Õ2, èìåþùèõ òîò æå òèï
ðàñïðåäåëåíèÿ F (âîçìîæíî, ñ äðóãèìè ïàðàìåòðàìè). Ñïðàâåäëèâî è îáðàòíîå
óòâåðæäåíèå: åñëè ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2 èìåþò îäèí è òîò æå òèï ðàñïðåäåëåíèÿ F, ïðèíàäëåæàùèé êëàññó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé, òî
ñëó÷àéíàÿ âåëè÷èíà Õ = Õ1 + Õ2 èìååò òîò æå òèï ðàñïðåäåëåíèÿ F. Êëàññó
Глава 7. Моделирование случайных величин
245
áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé ïðèíàäëåæàò ìíîãèå ðàñïðåäåëåíèÿ, âñòðå÷àþùèåñÿ íà ïðàêòèêå, â ÷àñòíîñòè, íîðìàëüíîå ðàñïðåäåëåíèå, ðàñïðåäåëåíèå Ïóàññîíà, áèíîìèàëüíîå ðàñïðåäåëåíèå, ãàììà-ðàñïðåäåëåíèå, ðàñïðåäåëåíèå χ2 è äð.
Ðèñ. 7.16.
Ìîäåëèðîâàíèå
Õ = (Õ1, Õ2)
ñëó÷àéíîé
âåëè÷èíû
Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ1, Õ2, ..., Xn, ÿâëÿþùèåñÿ êîìïîíåíòàìè ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2, ..., Xn), èìåþò ìàòåìàòè÷åñêèå îæèäàíèÿ m = (m1, m2, ..., mn) è ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ σ = (σ1, σ2,
..., σn). Èõ ñîâìåñòíîå ðàñïðåäåëåíèå õàðàêòåðèçóåòñÿ êîððåëÿöèîííîé ìàòðèöåé
R = {rij} (i, j = 1, 2, ..., n), ãäå rij = 1, åñëè i = j, à ïðè i ≠ j rij îíè ÿâëÿþòñÿ êîýôôèöèåíòàìè êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Xi è Xj. Èçâåñòíî,
÷òî ìàòðèöó R ìîæíî ïðåäñòàâèòü â âèäå ïðîèçâåäåíèÿ äâóõ òðåóãîëüíûõ ìàòðèö: R = SST5. Îáîçíà÷èì êàê Y = (Y1, Y2, ..., Yn) âåêòîð íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ íóëåâûå ìàòåìàòè÷åñêèå îæèäàíèÿ è åäèíè÷íûå äèñïåðñèè. Òîãäà ñëó÷àéíàÿ âåëè÷èíà Z = σSY + m áóäåò èìåòü âåêòîðû ìàòåìàòè÷åñêèõ îæèäàíèé m = (m1, m2, ..., mn) è ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé
σ = (σ1, σ2, ..., σn), à çàâèñèìîñòü ìåæäó êîìïîíåíòàìè ýòîãî âåêòîðà áóäåò õàðàêòåðèçîâàòüñÿ êîððåëÿöèîííîé ìàòðèöåé R.
×òîáû íà îñíîâå ïðåîáðàçîâàíèÿ Z = σSY + m ïîëíîñòüþ ñìîäåëèðîâàòü ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Õ, íåîáõîäèìî òàê ïîäîáðàòü ðàñïðåäåëåíèÿ
ñëó÷àéíûõ âåëè÷èí Y = (Y1, Y2, ..., Yn), ÷òîáû ÷àñòíûå ðàñïðåäåëåíèÿ êîìïîíåíòîâ Z1, Z2, ..., Zn, ñîñòàâëÿþùèõ âåêòîð Z, ñîâïàäàëè ñ ÷àñòíûìè ðàñïðåäåëåíèÿìè âåëè÷èí Õ1, Õ2, ..., Xn. Óñëîâèå ïðèíàäëåæíîñòè ýòèõ ðàñïðåäåëåíèé îäíîìó òèïó ðàñïðåäåëåíèé èç êëàññà áåçãðàíè÷íî äåëèìûõ çàêîíîâ çíà÷èòåëüíî
îáëåã÷àåò ðåøåíèå òàêîé çàäà÷è. Îáîçíà÷èì êàê X1 , X 2 ,..., X n ñòàíäàðòèçîâàííûå
5
Ìàòðèöà R ÿâëÿåòñÿ ïîëîæèòåëüíî îïðåäåëåííîé ìàòðèöåé, ïîýòîìó åå ìîæíî ïðåäñòàâèòü â âèäå òàêîãî ïðîèçâåäåíèÿ.
246 Часть II. Средства Excel для статистического анализа
ñëó÷àéíûå âåëè÷èíû, èìåþùèå íóëåâûå ìàòåìàòè÷åñêèå îæèäàíèÿ, åäèíè÷íûå
äèñïåðñèè è òàêèå æå ðàñïðåäåëåíèÿ, êàê è âåëè÷èíû Õ1, Õ2, ..., Xn.
Ïóñòü ìàòðèöà S — íèæíÿÿ òðåóãîëüíàÿ; òîãäà âñå åå ýëåìåíòû, ñòîÿùèå
âûøå ãëàâíîé äèàãîíàëè, ðàâíû íóëþ, è, ïîñêîëüêó ýòà ìàòðèöà ÿâëÿåòñÿ ðàçëîæåíèåì êîððåëÿöèîííîé ìàòðèöû, ñóììà êâàäðàòîâ ýëåìåíòîâ ëþáîé ñòðîêè
ìàòðèöû ðàâíà 1. Òîãäà
SY = (Y1, s21Y1 + s22Y2, s31Y1 + s32Y2 + s33Y3, ..., sn1Y1 + sn2Y2 + ... + snnYn).
Ïîëó÷àåì, ÷òî
Y1 = X1 , Y2 = ( X 2 – s21Y1)/s22, Y3 = ( X 3 – s31Y1 – s32Y2)/s33, ...,
Yn = ( X n – sn1Y1 – sn2Y2 – ... – sn(n–1)Yn–1.
Îòñþäà âèäíî, ÷òî ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Y1 ñîâïàäàåò ñ ðàñïðåäåëåíèåì ñëó÷àéíîé âåëè÷èíû X1 . Çíàÿ ðàñïðåäåëåíèå ñëó÷àéíûõ âåëè÷èí Y1
è X 2 , ìîæíî íàéòè ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Y2 è ò.ä. Òàêèì îáðàçîì
ìîæíî ïîñëåäîâàòåëüíî íàéòè ðàñïðåäåëåíèÿ âñåõ âåëè÷èí Y1, Y2, ..., Yn. Ýòè
ðàñïðåäåëåíèÿ ìîæíî íàéòè äëÿ ëþáûõ ðàñïðåäåëåíèé âåëè÷èí Õ1, Õ2, ..., Xn,
õîòÿ, ìîæåò áûòü, ñ íåêîòîðûìè ñëîæíîñòÿìè. Íî åùå ðàç ïîä÷åðêíåì, ÷òî íàèáîëåå ïðîñòî ýòè ðàñïðåäåëåíèÿ îïðåäåëÿþòñÿ â ñëó÷àå, êîãäà ðàñïðåäåëåíèÿ âåëè÷èí Õ1, Õ2, ..., Xn ïðèíàäëåæàò îäíîìó òèïó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé.  ýòîì ñëó÷àå äîñòàòî÷íî âû÷èñëèòü òîëüêî ïàðàìåòðû ðàñïðåäåëåíèé,
à íå îïðåäåëÿòü òèï ðàñïðåäåëåíèé.
Ïîêàæåì ðåàëèçàöèþ îïèñàííîãî ìåòîäà â óïðîùåííîì (íî íàèáîëåå ÷àñòî
èñïîëüçóåìîì íà ïðàêòèêå) âàðèàíòå, êîãäà n = 2, à ñëó÷àéíàÿ âåëè÷èíà
Õ = (Õ1, Õ2) èìååò äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2 èìåþò ìàòåìàòè÷åñêèå îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ñîîòâåòñòâåííî m1, m2 è σ1, σ2. Êîýôôèöèåíò êîððåëÿöèè ìåæäó íèìè
1
r

ïóñòü ðàâåí r. Òîãäà ìàòðèöà S èìååò âèä S = 

.
1 − r 2 
0
Ñëó÷àéíûå âåëè÷èíû Y1 è Y2 â äàííîì ñëó÷àå áóäóò èìåòü ñòàíäàðòíûå íîðìàëüíûå ðàñïðåäåëåíèÿ. Çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ1 áóäóò âû÷èñëÿòüñÿ ïî
ôîðìóëå õ1 = σ1ó1 + m1, à âåëè÷èíû Õ2 — ïî ôîðìóëå x2 = σ 2 (ry1 + 1 − r 2 y2 ) + m2 ,
ãäå ó1 è ó2 — çíà÷åíèÿ ñëó÷àéíûõ âåëè÷èí Y1 è Y2. Íà ðèñ. 7.17 ïîñëåäîâàòåëüíî ïîêàçàíû âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë õ1 è õ2.  ñòîëáöå sY1 ïî ôîðìóëå
ìàññèâà {=НОРМСТОБР(СЛЧИС())} âû÷èñëÿþòñÿ çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû
Y1 (äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, íàçâàí sY1).  ñòîëáöå sY2 ñ èñïîëüçîâàíèåì ôîðìóëû ìàññèâà
{=F1*sY1+КОРЕНЬ(1-F1*F1)*НОРМСТОБР(СЛЧИС())}
âû÷èñëÿþòñÿ çíà÷åíèÿ ry1 + 1 − r 2 y2 (çíà÷åíèå êîýôôèöèåíòà êîððåëÿöèè çàïèñàíî â ÿ÷åéêå F1). Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, íàçâàí sY2.
 ñòîëáöàõ Х1 è Х2 âû÷èñëÿþòñÿ çíà÷åíèÿ âåëè÷èí Õ1 è Õ2 ïî ôîðìóëàì ìàññèâîâ {=F4*sY1+F2} è {=F5*sY2+F3} ñîîòâåòñòâåííî. Êîíå÷íî, ìîæíî îáîéòèñü áåç
ïðîìåæóòî÷íûõ âû÷èñëåíèé â ñòîëáöàõ À è Â, îäíàêî òàêèå âû÷èñëåíèÿ áîëåå
Глава 7. Моделирование случайных величин
247
íàãëÿäíû è ïðîñòû. Êðîìå òîãî, îíè ïîçâîëÿþò ëåãêî ãåíåðèðîâàòü âûáîðêè
ñ ðàçëè÷íûìè ïàðàìåòðàìè ðàñïðåäåëåíèÿ, äëÿ ÷åãî äîñòàòî÷íî èçìåíèòü çíà÷åíèÿ â ÿ÷åéêàõ F1:F5.  ÿ÷åéêå F8 âû÷èñëÿåòñÿ âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè. Êàê âèäíî íà ðèñ. 7.17, ïîäñ÷èòàííîå çíà÷åíèå âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè áëèçêî ê èñòèííîìó çíà÷åíèþ êîýôôèöèåíòà êîððåëÿöèè.
Ðèñ. 7.17. Ìîäåëèðîâàíèå äâóìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ
248 Часть II. Средства Excel для статистического анализа
Часть
III
Анализ одномерных
выборок
В этой части...
Ãëàâà 8. Ïðåäâàðèòåëüíûé àíàëèç
Ãëàâà 9. Ïîäáîð ðàñïðåäåëåíèÿ
Ãëàâà 10. Èíòåðâàëüíîå îöåíèâàíèå ïàðàìåòðîâ ðàñïðåäåëåíèÿ
Ãëàâà 11. Ïðîâåðêà ãèïîòåç î ïàðàìåòðàõ ðàñïðåäåëåíèé
Ãëàâà 12. Ñðàâíåíèå îäíîìåðíûõ âûáîðîê
Â
ýòîé ÷àñòè ðå÷ü èäåò î ïðàêòè÷åñêîé ðåàëèçàöèè ìåòîäîâ ñòàòèñòè÷åñêîãî
àíàëèçà îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê. Ãëàâà 8 ïîñâÿùåíà ïðåäâàðèòåëüíîé îáðàáîòêå äàííûõ, â ãëàâå 9 ðàññìîòðåíû âàæíûå äëÿ ïîñëåäóþùåãî
àíàëèçà âîïðîñû ïîäáîðà ðàñïðåäåëåíèé ïî èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì.
 ãëàâàõ 10 è 11 ïîêàçàíû ìåòîäû èíòåðâàëüíîãî îöåíèâàíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ ïàðàìåòðîâ. Ãëàâà 12
ïîñâÿùåíà ñðàâíåíèþ ðàñïðåäåëåíèé íåñêîëüêèõ îäíîìåðíûõ âûáîðîê.
Глава
8
Предварительный анализ
Ï
ðåäâàðèòåëüíûé ýòàï íà ïðàêòèêå ïðèñóòñòâóåò â ëþáîì ñòàòèñòè÷åñêîì
àíàëèçå è çàêëþ÷àåòñÿ, ïî êðàéíåé ìåðå, â ïîäãîòîâêå äàííûõ äëÿ ïðîâåäåíèÿ àíàëèçà. Íî, êîíå÷íî, äåéñòâèÿ, âûïîëíÿåìûå íà ýòîì ýòàïå, çàâèñÿò îò
êîíêðåòíûõ çàäà÷, ðåøàåìûõ ñ ïîìîùüþ ñòàòèñòè÷åñêîãî àíàëèçà, è èñõîäíûõ
äàííûõ. Òàê, åñëè âîçíèêëè ïîäîçðåíèÿ, ÷òî âûáîðêà èìååò çíà÷åíèÿ, êîòîðûå
íå ÿâëÿþòñÿ ñëó÷àéíûìè èëè ðåçêî âûäåëÿþòñÿ íà ôîíå îñòàëüíûõ âûáîðî÷íûõ
çíà÷åíèé, òî ñëåäóåò ïðîâåñòè öåíçóðèðîâàíèå âûáîðêè. Åñëè íåîáõîäèìà èíòåðâàëüíàÿ îöåíêà íåèçâåñòíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, òî ïðåäâàðèòåëüíûì
ýòàïîì ìîæíî ñ÷èòàòü ïðîâåðêó ãèïîòåçû î íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ, ÷òîáû âïîñëåäñòâèè èñïîëüçîâàòü èíòåðâàëüíûå îöåíêè, ïîñòðîåííûå
íà îñíîâå íîðìàëüíîãî ðàñïðåäåëåíèÿ.  äðóãèõ ñëó÷àÿõ öåëüþ ñòàòèñòè÷åñêîãî
àíàëèçà ìîæåò áûòü óñòàíîâêà òèïà âûáîðî÷íîãî ðàñïðåäåëåíèÿ, à íà ïðåäâàðèòåëüíîì ýòàïå ñòðîÿòñÿ ãèñòîãðàììû âûáîðî÷íîãî ðàñïðåäåëåíèÿ è ïîäñ÷èòûâàþòñÿ ðàçëè÷íûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè, ÷òîáû ïîäîáðàòü òèï
ðàñïðåäåëåíèÿ, íàèáîëåå ñîîòâåòñòâóþùèé èñõîäíûì äàííûì.
Òàêèì îáðàçîì, ñ îäíîé ñòîðîíû, òðóäíî î÷åðòèòü êðóã òåõ äåéñòâèé, êîòîðûå
ñëåäóåò âñåãäà âûïîëíÿòü â êà÷åñòâå ïðåäâàðèòåëüíîãî àíàëèçà; ñ äðóãîé ñòîðîíû, íåâîçìîæíî ÷åòêî îòäåëèòü ïðåäâàðèòåëüíûé ýòàï ñòàòèñòè÷åñêîãî àíàëèçà
îò ñàìîãî àíàëèçà. Ïîýòîìó çäåñü ìû îñòàíîâèìñÿ ëèøü íà íåêîòîðûõ äåéñòâèÿõ,
êîòîðûå îáû÷íî îòíîñÿò ê ïðåäâàðèòåëüíîìó ýòàïó ñòàòèñòè÷åñêîãî àíàëèçà. Ðàññìîòðèì öåíçóðèðîâàíèå è ïðåîáðàçîâàíèå âûáîðîê, ïîñòðîåíèå ãèñòîãðàìì, ïîëèãîíîâ è ýìïèðè÷åñêèõ ôóíêöèé ðàñïðåäåëåíèÿ, à òàêæå âû÷èñëåíèå òî÷å÷íûõ
îöåíîê ïàðàìåòðîâ âûáîðî÷íûõ ðàñïðåäåëåíèé. Äðóãèìè ñëîâàìè, ðàññìîòðèì
“òåõíè÷åñêóþ” ðàáîòó, ïðîâîäèìóþ ïåðåä ïðèìåíåíèåì ñòàòèñòè÷åñêèõ ìåòîäîâ.
8.1. Цензурирование
Èíîãäà â äàííûõ ìîæíî íàáëþäàòü âûáðîñû — ñèëüíî îòêëîíÿþùèåñÿ çíà÷åíèÿ,
ò.å. çíà÷åíèÿ, êîòîðûå, ïî-âèäèìîìó, íå ïðèíàäëåæàò äàííîìó ðàñïðåäåëåíèþ, ïîñêîëüêó îíè ëèáî ñëèøêîì âåëèêè, ëèáî ñëèøêîì ìàëû. Âûáðîñû çàòðóäíÿþò
ïðîâîäèìûé ñòàòèñòè÷åñêèé àíàëèç è ìîãóò ïðèâåñòè ê íåâåðíî èíòåðïðåòèðóåìûì ðåçóëüòàòàì. Ïîýòîìó âûáðîñû ñëåäóåò âûÿâèòü è îáðàáîòàòü îòäåëüíî.
Ïðîöåññ óäàëåíèÿ èç âûáîðêè âûáðîñîâ íàçûâàåòñÿ öåíçóðèðîâàíèåì âûáîðêè.
 çàâèñèìîñòè îò ïðåäïîëîæåíèé î ïðèðîäå âûáðîñîâ (ýòî îøèáêè íàáëþäåíèé èëè àðòåôàêòû, ïðèâíåñåííûå ÷åëîâåêîì, ëèáî êîððåêòíûå, íî
“îòëè÷àþùèåñÿ îò îñòàëüíûõ” çíà÷åíèÿ äàííûõ) ïðîáëåìó âûáðîñîâ ðåøàþò
ïî-ðàçíîìó. Íî â ëþáîì ñëó÷àå ïðåäïðèíèìàåìûå äåéñòâèÿ ïî ðåøåíèþ ýòîé
250 Часть III. Анализ одномерных выборок
ïðîáëåìû íåîáõîäèìî îáîñíîâûâàòü èñõîäÿ ëèáî èç ïðèðîäû âûáðîñîâ, ëèáî èç
öåëåé êîíêðåòíîãî ñòàòèñòè÷åñêîãî àíàëèçà.
Åñëè ýòî ýëåìåíòàðíàÿ îøèáêà íàáëþäåíèé, òî çíà÷åíèå ïî âîçìîæíîñòè
íóæíî ïðîñòî îòêîððåêòèðîâàòü. Åñëè ýòî àðòåôàêò, íå ïîäëåæàùèé êîððåêòèðîâêå, òî åãî óäàëÿþò. Åñëè åñòü óáåäèòåëüíûå ïîäòâåðæäåíèÿ òîìó, ÷òî çíà÷åíèÿ-âûáðîñû íå ïðèíàäëåæàò ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé ïîëó÷åíà èññëåäóåìàÿ âûáîðêà, òî èõ òàêæå óäàëÿþò. Åñëè ïîñëåäíåå óòâåðæäåíèå îáîñíîâàòü
òðóäíî, íî âñå-òàêè åñòü “ïîäîçðèòåëüíûå” âûáîðî÷íûå çíà÷åíèÿ, òî ìîæíî âûïîëíèòü äâà àíàëèçà — áåç óäàëåíèÿ âûáðîñîâ è ñ óäàëåíèåì âûáðîñîâ.
Ñëåäóåò îòìåòèòü, ÷òî äëÿ öåíçóðèðîâàííûõ âûáîðîê èíîãäà ïðèìåíÿþò ñïåöèàëüíûå ôîðìóëû äëÿ âû÷èñëåíèÿ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèÿ [14]. ×àñòî ýòè âû÷èñëåíèÿ âûïîëíÿþòñÿ èòåðàöèîííî, ïîêà íå ñîéäóòñÿ ê îïðåäåëåííûì
çíà÷åíèÿì. Ïðèìåíåíèå òàêèõ ôîðìóë îáû÷íî òðåáóåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ; “óíèâåðñàëüíûå” ôîðìóëû âåñüìà ñëîæíû [23] è íà
ïðàêòèêå èñïîëüçóþòñÿ ðåäêî. Òàêèå ôîðìóëû ìû ðàññìàòðèâàòü íå áóäåì.
8.1.1. Цензурирования на основе построения доверительных
интервалов
Ñóùåñòâóåò íåñêîëüêî îñíîâíûõ ïîäõîäîâ ê èäåíòèôèêàöèè âûáðîñîâ, ñðåäè
êîòîðûõ âûäåëèì ïîäõîä, îñíîâàííûé íà àïðèîðíîé èíôîðìàöèè î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, è íåïàðàìåòðè÷åñêèå ìåòîäû, íå èñïîëüçóþùèå
èíôîðìàöèè î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ðàññìîòðèì ñíà÷àëà
ïåðâûé ïîäõîä ïðè ñàìûõ îáùèõ ïðåäïîëîæåíèÿõ.
Èäåÿ âûäåëåíèÿ âûáðîñîâ ñðåäè âûáîðî÷íûõ çíà÷åíèé äîñòàòî÷íî ïðîñòà. Íà
îñíîâå âûáîðêè êàêèì-ëèáî îáðàçîì ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë, ñîäåðæàùèé îñíîâíóþ ìàññó çíà÷åíèé ñ çàäàííîé âåðîÿòíîñòüþ. Çíà÷åíèÿ, âûõîäÿùèå çà
ýòîò èíòåðâàë, ñ÷èòàþòñÿ âûáðîñàìè. Çàòåì íà îñíîâàíèè óæå öåíçóðèðîâàííîé
âûáîðêè ñòðîèòñÿ íîâûé äîâåðèòåëüíûé èíòåðâàë è âûáîðêà ñíîâà ïðîâåðÿåòñÿ íà
íàëè÷èå âûáðîñîâ. Åñëè òàêîâûå èìåþòñÿ, òî ïðîöåññ ïîâòîðÿåòñÿ äî òåõ ïîð, ïîêà
îáúåì öåíçóðèðîâàííîé âûáîðêè íå ñòàáèëèçèðóåòñÿ, ò.å. äî òåõ ïîð, ïîêà áóäóò
èäåíòèôèöèðîâàòüñÿ íîâûå âûáðîñû.  ýòîì ìåòîäå î÷åâèäíà ðîëü àïðèîðíûõ
ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ïîñêîëüêó íà îñíîâå ýòèõ ïðåäïîëîæåíèé ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë. Åùå îäíîé ïðîáëåìîé ÿâëÿåòñÿ íåèçâåñòíîñòü çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèÿ, âìåñòî êîòîðûõ
ïðèõîäèòñÿ áðàòü èõ âûáîðî÷íûå îöåíêè. Ýòî, â ñâîþ î÷åðåäü, ïðèâîäèò ê òðåáîâàíèþ äîñòàòî÷íî áîëüøîãî îáúåìà âûáîðêè. Îòìåòèì òàêæå, ÷òî âìåñòî ñòàíäàðòíîé îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ êàê êîðíÿ èç âûáîðî÷íîé äèñïåðñèè
ðåêîìåíäóåòñÿ
èñïîëüçîâàòü
ñðåäíåå
àáñîëþòíîå
îòêëîíåíèå
dn =
1 n
∑ | xi − x | , ãäå x — âûáîðî÷íîå ñðåäíåå [1, 23], îñîáåííî äëÿ ìàëûõ âûáîn i =1
ðîê è âûáîðîê, ðàñïðåäåëåíèå êîòîðûõ çíà÷èòåëüíî îòëè÷àåòñÿ îò íîðìàëüíîãî.
Åñëè íå äåëàòü îãðàíè÷èòåëüíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ, òî
åäèíñòâåííûì ñïîñîáîì ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ èñïîëüçîâàíèå íåðàâåíñòâà ×åáûøåâà èëè íåðàâåíñòâà Ãàóññà â ïðåäïîëîæåíèè, ÷òî
ðàñïðåäåëåíèå îäíîìîäàëüíî (ýòè íåðàâåíñòâà ïðèâåäåíû â ðàçäåëå 1.2.4). ×òîáû
ñîñòàâèòü ïðåäñòàâëåíèå î âèäå ðàñïðåäåëåíèÿ, ïåðåä íà÷àëîì öåíçóðèðîâàíèÿ
ñëåäóåò ïîñòðîèòü ãèñòîãðàììó, êîòîðàÿ ïî êðàéíåé ìåðå ïîêàæåò, ìîæíî ëè
Глава 8. Предварительный анализ
251
ñ÷èòàòü ðàñïðåäåëåíèå îäíîìîäàëüíûì. Îòìåòèì, ÷òî èñïîëüçîâàíèå íåðàâåíñòâà
×åáûøåâà — íàèáîëåå íàäåæíûé è áåçîïàñíûé ñïîñîá öåíçóðèðîâàíèÿ, ïîñêîëüêó â ýòîì ñëó÷àå âåðîÿòíîñòü îòáðîñèòü òå çíà÷åíèÿ, êîòîðûå äåéñòâèòåëüíî ïðèíàäëåæàò âûáîðêå, ìèíèìàëüíà (íî, ñ äðóãîé ñòîðîíû, ìàêñèìàëüíà âåðîÿòíîñòü îñòàâèòü âûáðîñû â âûáîðêå).
Íà ðèñ. 8.1 â ñòîëáöå À ïîêàçàíà âûáîðêà îáúåìîì 50 çíà÷åíèé, èìåþùàÿ ëîãíîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = 0 è σ = 1, ê êîòîðîé äîáàâëåíû çíà÷åíèÿ –0,5, –1,2, 8, 9 è 10. (Âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû â ðåçóëüòàòå ïðèìåíåíèÿ ôîðìóëû ìàññèâà {=ЛОГНОРОБР(СЛЧИС();0;)} ê äèàïàçîíó À2:À51. Çàòåì
ôîðìóëû áûëè çàìåíåíû çíà÷åíèÿìè, êàê îïèñàíî â ðàçäåëå 7.1.) Îòìåòèì, ÷òî
çäåñü îòðèöàòåëüíûå çíà÷åíèÿ ÿâëÿþòñÿ î÷åâèäíûì àðòåôàêòîì, îäíàêî òîëüêî
åñëè àïðèîðè èçâåñòíî, ÷òî âûáîðêà ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû,
ïðèíèìàþùåé ïîëîæèòåëüíûå çíà÷åíèÿ ñ âåðîÿòíîñòüþ 1.  ïðîòèâíîì ñëó÷àå èñêëþ÷èòü îòðèöàòåëüíûå çíà÷åíèÿ èç âûáîðêè “çàêîííûì” ñïîñîáîì ïðàêòè÷åñêè
íåâîçìîæíî. Â ñòîëáöå Â íà ðèñ. 8.1 ïðèâåäåíà òà æå âûáîðêà, îòñîðòèðîâàííàÿ
â ïîðÿäêå âîçðàñòàíèÿ; ðåçóëüòàòû öåíçóðèðîâàíèÿ íå çàâèñÿò îò ïîðÿäêà âûáîðî÷íûõ çíà÷åíèé, íî äëÿ íàãëÿäíîñòè óäîáíåå èñïîëüçîâàòü îòñîðòèðîâàííóþ âûáîðêó.
Ðèñ. 8.1. Èñõîäíûå äàííûå äëÿ öåíçóðèðîâàíèÿ
Íà ýòîì æå ðèñóíêå ïîêàçàíà ãèñòîãðàììà ÷àñòîò. (Äëÿ ïîäñ÷åòà ÷àñòîò
â äèàïàçîíå
Å2:Å9
èñïîëüçîâàíà
ôîðìóëà
ìàññèâà
{=ЧАСТОТА(Исходная_выборка;D2:D8)}; äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí
Исходная_выборка.) Çíà÷åíèÿ, ïðåâûøàþùèå 6, ñãðóïïèðîâàíû â èíòåðâàëå, ïîìå÷åííîì ÷èñëîì 7. Íà ãèñòîãðàììå âèäíî, ÷òî ðàñïðåäåëåíèå äàëåêî îò îäíîìîäàëüíîãî, ïîýòîìó èñïîëüçóåì íåðàâåíñòâî ×åáûøåâà.
Íàïîìíèì, ÷òî íåðàâåíñòâî ×åáûøåâà (ñì. ðàçäåë 1.2.4) èìååò âèä
P{|X – m| ≥ λσ} ≤ 1/λ2,
252 Часть III. Анализ одномерных выборок
ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, m — åå ìàòåìàòè÷åñêîå îæèäàíèå, σ — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå, λ îïðåäåëÿåò ðàçìåð äîâåðèòåëüíîãî èíòåðâàëà
è âû÷èñëÿåòñÿ íà îñíîâàíèè çàäàííîãî äîâåðèòåëüíîãî óðîâíÿ (âåðîÿòíîñòè) ð.
 êà÷åñòâå îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ èñïîëüçóåì âûáîðî÷íîå ñðåäíåå,
à âìåñòî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ — ñðåäíåå àáñîëþòíîå îòêëîíåíèå
dn. Åñëè çàäàíà âåðîÿòíîñòü ð, ñ êîòîðîé äîâåðèòåëüíûé èíòåðâàë äîëæåí ñîäåðæàòü îñíîâíóþ ìàññó âûáîðî÷íûõ çíà÷åíèé, òî äàëåå çíà÷åíèå 1 – ð ïðèðàâíèâàåòñÿ ê 1/λ2 è èç ýòîãî ðàâåíñòâà îïðåäåëÿåòñÿ çíà÷åíèå λ. Òàêèì îáðàçîì, λ
âû÷èñëÿåòñÿ ïî ôîðìóëå λ = 1/ 1 − p , íèæíÿÿ tí è âåðõíÿÿ tâ ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà âû÷èñëÿþòñÿ ïî ôîðìóëàì
tí = x – λdn è tâ = x + λdn.
Ðàáî÷èé ëèñò ñ ðåçóëüòàòàìè âû÷èñëåíèé ïî ýòèì ôîðìóëàì äëÿ ð = 0,9 ïîêàçàí íà ðèñ. 8.2. Òåïåðü îñòàëîñü îïðåäåëèòü, êàêèå âûáîðî÷íûå çíà÷åíèÿ âûõîäÿò çà ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë. Êîíå÷íî, äëÿ äàííîé îòíîñèòåëüíî ìàëîé âûáîðêè ýòî ñäåëàòü íåñëîæíî, òåì áîëåå ÷òî îíà îòñîðòèðîâàíà.
È âñå-òàêè ïîêàæåì äâà ñïîñîáà àâòîìàòèçàöèè ïðîöåññà ïîèñêà âûáðîñîâ.
Ðèñ. 8.2. Ðåçóëüòàòû âû÷èñëåíèé
Ïåðâûé ñïîñîá ïðîñòî âûäåëÿåò íà îñíîâå çàðàíåå çàäàííîãî ôîðìàòà çíà÷åíèÿ, âûõîäÿùèå çà ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà. Äëÿ ýòîãî èñïîëüçóåòñÿ
óñëîâíîå ôîðìàòèðîâàíèå.
1. Ñíà÷àëà íåîáõîäèìî âûäåëèòü äèàïàçîíû ÿ÷ååê, ê êîòîðûì áóäåò ïðèìåíåíî óñëîâíîå ôîðìàòèðîâàíèå; â äàííîì ïðèìåðå ýòî äèàïàçîí À1:Â56,
ñîäåðæàùèé êàê èñõîäíóþ, òàê è îòñîðòèðîâàííóþ âûáîðêè.
2. Ïî êîìàíäå ФорматÖУсловное форматирование îòêðûâàåòñÿ îäíîèìåííîå äèàëîãîâîå îêíî (ðèñ. 8.3). Â íåì íåîáõîäèìî çàäàòü óñëîâèå, êîòîðîìó äîëæíû
Глава 8. Предварительный анализ
253
óäîâëåòâîðÿòü çíà÷åíèÿ, ÷òîáû ê ýòèì çíà÷åíèÿì áûë ïðèìåíåí îïðåäåëåííûé ôîðìàò, è ñàì ôîðìàò. Äëÿ çàäàíèÿ óñëîâèÿ â ïåðâîì ïîëå ñëåäóåò óêàçàòü, ÷òî óñëîâèå çàäàåòñÿ îòíîñèòåëüíî çíà÷åíèÿ (ìîæíî òàêæå çàäàòü óñëîâèå â âèäå ôîðìóëû), âî âòîðîì ïîëå èç ðàñêðûâàþùåãîñÿ ñïèñêà íåîáõîäèìî
âûáðàòü çíàê ðàâåíñòâà èëè íåðàâåíñòâà.  òðåòüåì ïîëå íóæíî óêàçàòü çíà÷åíèå, ñ êîòîðûì ñðàâíèâàåòñÿ çíà÷åíèå â ÿ÷åéêå. Çäåñü ìîæíî ââåñòè íå
òîëüêî êîíêðåòíîå ÷èñëî, íî è ññûëêó íà ÿ÷åéêó, ñîäåðæàùóþ ýòî ÷èñëî.
 äàííîì ïðèìåðå ïåðâîå óñëîâèå çàäàåòñÿ äëÿ çíà÷åíèé, êîòîðûå ìåíüøå
íèæíåé ãðàíèöû; ñàìî çíà÷åíèå íèæíåé ãðàíèöû âû÷èñëåíî â ÿ÷åéêå F15.
3. ×òîáû çàäàòü ôîðìàò, íàäî ùåëêíóòü íà êíîïêå Формат, ïîñëå ÷åãî îòêðîåòñÿ äèàëîãîâîå îêíî Формат ячеек.  íåì ìîæíî çàäàòü ëþáîé ôîðìàò êàê
äëÿ çíà÷åíèé, òàê è äëÿ ÿ÷ååê, èõ ñîäåðæàùèõ.
4. Äëÿ çàäàíèÿ åùå îäíîãî óñëîâèÿ è ñîîòâåòñòâóþùåãî ôîðìàòà (íàïðèìåð,
÷òîáû ïî-ðàçíîìó ôîðìàòèðîâàòü íàèáîëüøèå è íàèìåíüøèå çíà÷åíèÿ)
ñëåäóåò ùåëêíóòü íà êíîïêå А также. Îêíî ðàñøèðèòñÿ, è ìîæíî áóäåò çàäàòü íîâûå óñëîâèå è ôîðìàò. Â äàííîì ïðèìåðå âòîðîå óñëîâèå çàäàåòñÿ
äëÿ çíà÷åíèé, êîòîðûå áîëüøå âåðõíåé ãðàíèöû (ÿ÷åéêà F16).
5. Ïîñëå çàäàíèÿ âñåõ óñëîâèé è ôîðìàòîâ ñëåäóåò ùåëêíóòü íà êíîïêå ОК.
Ôîðìàòû áóäóò íåìåäëåííî ïðèìåíåíû ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê.
Ðåçóëüòàò ïðèìåíåíèÿ óñëîâíîãî ôîðìàòà äëÿ îïèñûâàåìîãî ïðèìåðà ïîêàçàí íà ðèñ. 8.4.
Âñåãî ìîæíî çàäàòü äî òðåõ óñëîâèé. ß÷åéêè, ñîäåðæèìîå êîòîðûõ íå óäîâëåòâîðÿåò íè îäíîìó óñëîâèþ, ñîõðàíÿþò ôîðìàò, êîòîðûé îíè èìåëè äî çàäàíèÿ óñëîâíîãî ôîðìàòà. Äîñòîèíñòâîì óñëîâíîãî ôîðìàòèðîâàíèÿ ÿâëÿåòñÿ òî,
÷òî ïðè èçìåíåíèè çíà÷åíèé â ÿ÷åéêàõ, ñîäåðæàùèõ êàê âûáîðî÷íûå, òàê è âû÷èñëÿåìûå çíà÷åíèÿ (íàïðèìåð, çíà÷åíèÿ íèæíåé è âåðõíåé ãðàíèö), óñëîâíîå
ôîðìàòèðîâàíèå ñîõðàíÿåòñÿ è ïðèìåíÿåòñÿ ê íîâûì çíà÷åíèÿì.
Ðèñ. 8.3. Çàäàíèå óñëîâíûõ ôîðìàòîâ
254 Часть III. Анализ одномерных выборок
Ðèñ. 8.4. Ïðèìåíåíèå óñëîâíîãî ôîðìàòèðîâàíèÿ
Âòîðîé ñïîñîá èñêëþ÷åíèÿ âûáðîñîâ áîëåå ðàäèêàëåí, ïîñêîëüêó îí ôîðìèðóåò íîâóþ âûáîðêó, íî óæå áåç ýòèõ âûáðîñîâ. ×òîáû ñîçäàòü òàêóþ âûáîðêó, âûïîëíèòå ñëåäóþùèå äåéñòâèÿ.
1. Âûäåëèòå äèàïàçîí ÿ÷ååê, ñîâïàäàþùèé ïî ðàçìåðó ñ äèàïàçîíîì, ñîäåðæàùèì èñõîäíóþ âûáîðêó.
2. Ââåäèòå
ïðèâåäåííóþ
íèæå
ôîðìóëó
è
íàæìèòå
êëàâèøè
<Ctrl+Shift+Enter>. Òåì ñàìûì áóäåò ñîçäàíà ôîðìóëà ìàññèâà, ðàñïðîñòðàíÿþùàÿ ñâîå äåéñòâèå íà âåñü âûäåëåííûé äèàïàçîí. (Çäåñü äèàïàçîí
ÿ÷ååê, ñîäåðæàùèé âûáîðêó, íàçâàí Выборка.)
=ЕСЛИ(Выборка<F15;"";ЕСЛИ(Выборка>F16;"";Выборка))
Êàê ïîêàçàíî íà ðèñ. 8.5, ýòà ôîðìóëà îñòàâëÿåò ÿ÷åéêè, êîòîðûå ñîîòâåòñòâóþò çíà÷åíèÿì, âûõîäÿùèì çà äîâåðèòåëüíûé èíòåðâàë, ïóñòûìè. (Íà ðèñ. 8.5
òàêæå ïîêàçàíà ãèñòîãðàììà äëÿ íîâîé âûáîðêè.) Ïîñëå ïðèíÿòèÿ îêîí÷àòåëüíîãî ðåøåíèÿ î òîì, ÷òîáû îñòàâèòü öåíçóðèðîâàííóþ âûáîðêó (ïðèíÿòîå, êîíå÷íî, ïîñëå äîïîëíèòåëüíûõ ýêñïåðèìåíòîâ ñî çíà÷åíèåì âåðîÿòíîñòè ð), ìîæíî óäàëèòü èç ýòîãî äèàïàçîíà ôîðìóëû è îñòàâèòü òîëüêî çíà÷åíèÿ.
Åñëè çàäàòü çíà÷åíèå âåðîÿòíîñòè ð ðàâíûì 0,95 (÷òî áîëåå åñòåñòâåííî, ÷åì
çíà÷åíèå 0,9), òî â ýòîì ñëó÷àå áóäåò èñêëþ÷åíî òîëüêî çíà÷åíèå 10, êàê ïîêàçàíî íà ðèñ. 8.6. Òàêèì îáðàçîì, íåðàâåíñòâî ×åáûøåâà ñëèøêîì “îñòîðîæíî”
â îïðåäåëåíèè âûáðîñîâ.
Äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ñîäåðæàùåãî îñíîâíóþ ìàññó âûáîðî÷íûõ çíà÷åíèé, ìîæíî òàêæå ïðèìåíèòü ýìïèðè÷åñêîå ïðàâèëî 3S, êîòîðîå
óòâåðæäàåò, ÷òî âåðîÿòíîñòü P{|X – x | ≤ 3Sn} ñîñòàâëÿåò íå ìåíåå 0,95. Çäåñü
x — âûáîðî÷íîå ñðåäíåå, à Sn — âûáîðî÷íàÿ îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ. Ðåçóëüòàòû öåíçóðèðîâàíèÿ íà îñíîâå ýòîãî íåðàâåíñòâà ïîêàçàíû íà
ðèñ. 8.7.  äàííîì ñëó÷àå öåíçóðèðîâàííàÿ âûáîðêà ñîâïàäàåò ñ âûáîðêîé,
Глава 8. Предварительный анализ
255
ïîëó÷åííîé ïðè èñïîëüçîâàíèè íåðàâåíñòâà ×åáûøåâà ñ âåðîÿòíîñòüþ ð = 0,9.
Íî ñëåäóåò îòìåòèòü, ÷òî âìåñòî âûáîðî÷íîé îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ çäåñü ïî-ïðåæíåìó èñïîëüçîâàëîñü ñðåäíåå àáñîëþòíîå îòêëîíåíèå dn.
Ðèñ. 8.5. Íîâàÿ öåíçóðèðîâàííàÿ âûáîðêà
Ðèñ. 8.6. Öåíçóðèðîâàííàÿ âûáîðêà ïðè âåðîÿòíîñòè 0,95
 çàêëþ÷åíèå îòìåòèì, ÷òî ïðè ïðîâåäåíèè öåíçóðèðîâàíèÿ íà îñíîâå íåðàâåíñòâ ×åáûøåâà, Ãàóññà èëè íà îñíîâå ïðàâèëà 3S èòåðàöèîííàÿ ïðîöåäóðà
öåíçóðèðîâàíèÿ (ïîñëåäîâàòåëüíîãî ïðîâåäåíèÿ öåíçóðèðîâàíèÿ äî òåõ ïîð, ïîêà
áóäóò îïðåäåëÿòüñÿ íîâûå âûáðîñû), êàê ïðàâèëî, íå ïðîâîäèòñÿ, ïîñêîëüêó
256 Часть III. Анализ одномерных выборок
çäåñü íå ïðåäóñìîòðåíû “ñòàáèëèçèðóþùèå” ïîïðàâêè äëÿ âû÷èñëåíèÿ ñðåäíåãî
è îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ, àíàëîãè÷íûå ïðèìåíÿåìûì ïðè
öåíçóðèðîâàíèè âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ñîâîêóïíîñòåé [23].
Ðèñ. 8.7. Öåíçóðèðîâàíèå íà îñíîâå ïðàâèëà 3S
8.1.2. Непараметрическое цензурирование
 îïèñàííîì íèæå ìåòîäå öåíçóðèðîâàíèÿ íå òðåáóåòñÿ àïðèîðíûõ ïðåäïîëîæåíèé î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, ïîñêîëüêó îí ïîñòðîåí íà îñíîâå
ïîðÿäêîâûõ ñòàòèñòèê (î ïîðÿäêîâûõ ñòàòèñòèêàõ ðå÷ü èäåò â ðàçäåëå 2.3.9). Ñóùåñòâóåò íåñêîëüêî ïîäõîäîâ ê öåíçóðèðîâàíèþ âûáîðîê íà îñíîâå ïîðÿäêîâûõ ñòàòèñòèê. Ïîêàæåì ìåòîä öåíçóðèðîâàíèÿ, ïðåäëîæåííûé Äæ. Òüþêè (J.W. Tukey) [15].
Äëÿ èëëþñòðàöèè ìåòîäà èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì ðàçäåëå.
1. Âû÷èñëÿåòñÿ ðàíã r0,25 íèæíåãî êâàðòèëÿ ξ0,25 (î êâàðòèëÿõ ðå÷ü èäåò
â ðàçäåëå 1.2.3) ïî ôîðìóëå r0,25 = (1 + [(1 + n)/2])/2, ãäå n — îáúåì âûáîðêè, [õ] îáîçíà÷àåò öåëóþ ÷àñòü ÷èñëà õ. Íà ðèñ. 8.8 ýòîò ðàíã âû÷èñëÿåòñÿ â ÿ÷åéêå Å2 ïî ôîðìóëå =(1+ЦЕЛОЕ((1+$D$2)/2))/2 (â ÿ÷åéêå D2 ïîäñ÷èòûâàåòñÿ îáúåì âûáîðêè ïî ôîðìóëå =СЧЁТ(Исходная_выборка)).
2. Âû÷èñëÿåòñÿ ðàíã r0,75 âåðõíåãî êâàðòèëÿ ξ0,75 ïî ôîðìóëå r0,75 = n + 1 –
r0,25. Íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.8, äàííûé ðàíã âû÷èñëÿåòñÿ
â ÿ÷åéêå F2 ïî ôîðìóëå =$D$2+1–E2.
3. Îïðåäåëÿþòñÿ çíà÷åíèÿ íèæíåãî êâàðòèëÿ ξ0,25 è âåðõíåãî êâàðòèëÿ ξ0,75:
åñëè âû÷èñëåííûå ðàíãè ýòèõ êâàðòèëåé — öåëûå ÷èñëà, òî â êà÷åñòâå
çíà÷åíèé ýòèõ êâàðòèëåé áåðóòñÿ âûáîðî÷íûå çíà÷åíèÿ ðàíãîâ, ñîâïàäàþùèõ ñ âû÷èñëåííûìè ðàíãàìè êâàðòèëåé. Åñëè æå âû÷èñëåííûå ðàíãè
êâàðòèëåé äðîáíûå, òî â êà÷åñòâå çíà÷åíèé êâàðòèëåé áåðåòñÿ ñðåäíåå âûáîðî÷íûõ çíà÷åíèé ñ ðàíãàìè, áëèæàéøèõ ê âû÷èñëåííûì ðàíãàì êâàðòèëåé. Íàïðèìåð, åñëè ðàíã íèæíåãî êâàðòèëÿ ðàâåí 14,5 (êàê â íàøåì
Глава 8. Предварительный анализ
257
ïðèìåðå), çà çíà÷åíèå ýòîãî êâàðòèëÿ ïðèíèìàåòñÿ ñðåäíåå âûáîðî÷íûõ
çíà÷åíèé ñ ðàíãàìè 14 è 15. ×òîáû àâòîìàòèçèðîâàòü îïðåäåëåíèå çíà÷åíèé êâàðòèëåé è ðåàëèçîâàòü ýòè ïðîñòûå âû÷èñëåíèÿ, â ýëåêòðîííîé òàáëèöå ïðèõîäèòñÿ ïðèìåíÿòü äîñòàòî÷íî ñëîæíûå ôîðìóëû. Íà ðèñ. 8.8
â ÿ÷åéêå Å4 äëÿ âû÷èñëåíèÿ íèæíåãî êâàðòèëÿ èñïîëüçóåòñÿ ôîðìóëà
=ЕСЛИ(E2–ЦЕЛОЕ(E2)=0;ИНДЕКС(B2:B56;E2;1);
(ИНДЕКС(B2:B56;ЦЕЛОЕ(E2);1)+ИНДЕКС(B2:B56;ЦЕЛОЕ(E2)+1;1))/2).
Àíàëîãè÷íàÿ ôîðìóëà èñïîëüçóåòñÿ â ÿ÷åéêå F4 äëÿ âû÷èñëåíèÿ âåðõíåãî
êâàðòèëÿ:
=ЕСЛИ(F2–ЦЕЛОЕ(F2)=0;ИНДЕКС(B2:B56;F2;1);
(ИНДЕКС(B2:B56;ЦЕЛОЕ(F2);1)+ИНДЕКС(B2:B56;ЦЕЛОЕ(F2)+1;1))/2).
(Â ôîðìóëàõ ïðèìåíåíà ôóíêöèÿ ИНДЕКС â ôîðìå ìàññèâà. Ýòà ôóíêöèÿ
â äàííîé ôîðìå âîçâðàùàåò ñîäåðæèìîå ÿ÷åéêè, ðàñïîëîæåííîé íà ïåðåñå÷åíèè óêàçàííîé ñòðîêè è óêàçàííîãî ñòîëáöà (âòîðîé è òðåòèé àðãóìåíòû ôóíêöèè) äèàïàçîíà ÿ÷ååê, çàäàâàåìîãî â ïåðâîì àðãóìåíòå ôóíêöèè.)
4. Âû÷èñëÿþòñÿ íèæíÿÿ tí è âåðõíÿÿ tâ ãðàíèöû, îòíîñèòåëüíî êîòîðûõ îïðåäåëÿþòñÿ âûáîðî÷íûå çíà÷åíèÿ, ïðèíèìàåìûå çà âûáðîñû; âûáðîñàìè
ñ÷èòàþòñÿ çíà÷åíèÿ, êîòîðûå ìåíüøå tí è êîòîðûå áîëüøå tâ. Ýòè ãðàíèöû
âû÷èñëÿþòñÿ ïî ôîðìóëàì1
tí = ξ0,25 – 1,5(ξ0,25 – ξ0,75) è tâ = ξ0,75 + 1,5(ξ0,25 – ξ0,75).
 íàøåì ïðèìåðå äàííûå çíà÷åíèÿ âû÷èñëÿþòñÿ ñîîòâåòñòâåííî â ÿ÷åéêàõ
Å6 è F6 ïî ôîðìóëàì =E4–1,5*($F$4–$E$4) è =F4+1,5*($F$4–$E$4).
5.  èñõîäíîé âûáîðêå âû÷èñëÿþòñÿ çíà÷åíèÿ, êîòîðûå âûõîäÿò çà íèæíþþ
è âåðõíþþ ãðàíèöû. Ýòî ìîæíî ñäåëàòü ñïîñîáàìè, îïèñàííûìè â ïðåäûäóùåì ðàçäåëå. Íà ðèñ. 8.9 ïîêàçàíû âûáðîñû, âûäåëåííûå ñ ïîìîùüþ
óñëîâíîãî ôîðìàòèðîâàíèÿ.
Êàê âèäíî íà ðèñ. 8.9, â ðåçóëüòàòå öåíçóðèðîâàíèÿ â êà÷åñòâå âûáðîñîâ îïðåäåëåíû è äâà “ïðàâèëüíûõ” âûáîðî÷íûõ çíà÷åíèÿ. Ýòî åùå ðàç äîêàçûâàåò,
÷òî ê öåíçóðèðîâàíèþ íàäî îòíîñèòüñÿ îñòîðîæíî è ïðèìåíÿòü åãî ñëåäóåò òîëüêî òîãäà, êîãäà äëÿ ýòîãî åñòü âåñêèå îñíîâàíèÿ.
8.1.3. Винзоризация выборки
Âèíçîðèçàöèÿ âûáîðêè, ÿâëÿÿñü ñâîåîáðàçíîé ðàçíîâèäíîñòüþ öåíçóðèðîâàíèÿ, îòëè÷àåòñÿ îò ïîñëåäíåé òåì, ÷òî èäåíòèôèöèðîâàííûå âûáðîñû íå óäàëÿþòñÿ èç âûáîðêè; èì ïðèñâàèâàþòñÿ çíà÷åíèÿ, ðàâíûå ñîîòâåòñòâåííî íèæíåé tí
èëè âåðõíåé tâ ãðàíèöàì, îòíîñèòåëüíî êîòîðûõ èäåíòèôèöèðóþòñÿ âûáðîñû.
×àñòî âèíçîðèçàöèþ âûïîëíÿþò ïðè çàäàíèè òîëüêî îäíîé ãðàíèöû — âåðõíåé
èëè íèæíåé. Ýòî íàçûâàåòñÿ îäíîñòîðîííåé âèíçîðèçàöèåé, â îòëè÷èå îò äâóõñòîðîííåé, êîãäà èñïîëüçóþòñÿ îáå ãðàíèöû.
Ïðè çàäàíèè ãðàíèö ïðèìåíÿþòñÿ äâà ïîäõîäà. Ïðè ïåðâîì ïîäõîäå èñõîäÿ
èç êàêèõ-ëèáî àïðèîðíûõ ïðåäïîëîæåíèé çàäàåòñÿ êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áóäóò âèíçîðèçèðóåìû (ò.å. ïðèðàâíåíû ê çíà÷åíèÿì ãðàíèö).
Íàïðèìåð, ìîæíî çàäàòü, ÷òî âèíçîðèçèðóåòñÿ íå áîëåå 5% èëè 10% âûáîðî÷íûõ
1
Ðàçíîñòü ìåæäó êâàðòèëÿìè ξ0,75 – ξ0,25 íàçûâàåòñÿ èíòåðêâàðòèëüíûé ðàçìàõ è èíîãäà èñïîëüçóåòñÿ â êà÷åñòâå ìåðû ðàçáðîñà âûáîðî÷íûõ çíà÷åíèé.
258 Часть III. Анализ одномерных выборок
çíà÷åíèé2. Òàêîé ñïîñîá çàäàíèÿ ãðàíèö ðåàëèçîâàí íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.10 è 8.11. (Íà ýòèõ ðèñóíêàõ ïîêàçàíû è ðàñ÷åòíûå ôîðìóëû.)
Îòìåòèì, ÷òî çäåñü âû÷èñëÿþòñÿ íå ñàìè çíà÷åíèÿ ãðàíèö, à íèæíèé è âåðõíèé
ðàíãè âûáîðî÷íûõ çíà÷åíèé, êîòîðûå îïðåäåëÿþò ãðàíèöû. Òàêîé ïîäõîä íåìíîãî óïðîùàåò âû÷èñëåíèÿ.
Ðèñ. 8.8. Ïîäãîòîâêà ê öåíçóðèðîâàíèþ
Äðóãîé ïîäõîä ê îïðåäåëåíèþ íèæíåé tí è âåðõíåé tâ ãðàíèö àíàëîãè÷åí ïîñòðîåíèþ äîâåðèòåëüíîãî èíòåðâàëà íà îñíîâå âûáîðî÷íûõ îöåíîê ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè (òîãäà tí è tâ áóäóò ãðàíèöàìè äàííîãî èíòåðâàëà).
Íà ýòîé îñíîâå îðãàíèçîâàíà ñëåäóþùàÿ èòåðàöèîííàÿ ïðîöåäóðà âèíçîðèçàöèè
âûáîðî÷íûõ çíà÷åíèé [23].
1. Ïî âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íîå ñðåäíåå x =
1 n
∑ xi
n i =1
è âûáîðî÷íîå
ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå sn êàê êîðåíü èç âûáîðî÷íîé äèñïåðñèè
sn2 =
1 n
∑ ( xi − x )2
n − 1 i =1
(xi — âûáîðî÷íûå çíà÷åíèÿ, n — îáúåì âûáîðêè).
Òàêæå âû÷èñëÿþòñÿ ãðàíèöû tí = x – csn è tâ = x + csn, ãäå êîíñòàíòà ñ
îïðåäåëÿåò ñõîäèìîñòü ïðîöåäóðû (ïîñêîëüêó ýòî èòåðàöèîííàÿ ïðîöåäóðà) è îáû÷íî âûáèðàåòñÿ èç èíòåðâàëà îò 1 äî 2, íàïðèìåð 1,5.
2
Î÷åâèäíî, ÷òî òàêîé ïîäõîä (êîãäà çàäàåòñÿ ïðîöåíò âûáðîñîâ) ìîæíî ïðèìåíèòü è äëÿ
îáû÷íîãî öåíçóðèðîâàíèÿ âûáîðêè. Èñõîäÿ èç òîãî ôàêòà, ÷òî âåðîÿòíîñòü, ñ êîòîðîé ñëó÷àéíàÿ âåëè÷èíà Õ (âûáîðêà ÿâëÿåòñÿ ðåàëèçàöèåé ýòîé ñëó÷àéíîé âåëè÷èíû) ïðèíèìàåò
çíà÷åíèÿ èç èíòåðâàëà (õ(i–1), õ(i)) (õ(i–1) è õ(i) — ïîðÿäêîâûå ñòàòèñòèêè), íå çàâèñèò îò
ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1) (n — îáúåì âûáîðêè), çàäàíèÿ ïðîöåíòà âûáðîñîâ, íàïðèìåð 5%, ìîæíî èíòåðïðåòèðîâàòü êàê ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà, ñîäåðæàùåãî ïðèìåðíî 95% îñíîâíîé ìàññû çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ. Îäíàêî íà ïðàêòèêå òàêîé
ïîäõîä èñïîëüçóåòñÿ îòíîñèòåëüíî ðåäêî.
Глава 8. Предварительный анализ
259
Ðèñ. 8.9. Ðåçóëüòàòû öåíçóðèðîâàíèÿ
Ðèñ. 8.10. 5% âèíçîðèçàöèè
2. Ñòðîèòñÿ âèíçîðèçèðîâàííàÿ âûáîðêà {xi*} ïî ñëåäóþùåé ñõåìå: xi* = xi,
åñëè tí ≤ xi ≤ tâ; xi* = tí, åñëè xi ≤ tí; xi* = tâ, åñëè xi ≥ tâ.
3. Ïî âèíçîðèçèðîâàííîé âûáîðêå {xi*} âû÷èñëÿþòñÿ íîâûå çíà÷åíèÿ ñðåäíåãî
x * (ïî îáû÷íîé ôîðìóëå) è âûáîðî÷íàÿ äèñïåðñèÿ sn2* ïî ôîðìóëå
2
n 1 n
sn2* =  
∑ ( xi − x )2 , ãäå m — êîëè÷åñòâî íåèçìåíåííûõ âûáîðî÷íûõ
 m  n − 1 i =1
çíà÷åíèé.
4. Ïîâòîðÿåòñÿ ïðîöåññ âèíçîðèçàöèè äëÿ âûáîðêè {xi*}, îïèñàííûé â ï. 2.
Åñëè íîâûõ âèíçîðèçèðîâàííûõ âûáîðî÷íûõ çíà÷åíèé íå ïîÿâèëîñü, òî íà
ýòîì ïðîöåññ çàâåðøàåòñÿ.  ïðîòèâíîì ñëó÷àå ïîâòîðÿåòñÿ ï. 3 è ò.ä.
260 Часть III. Анализ одномерных выборок
Ðèñ. 8.11. 10% âèíçîðèçàöèè
Íà ïðàêòèêå, åñëè ïðîöåññ íå çàâåðøèëñÿ ïîñëå äâóõ-òðåõ èòåðàöèé, åãî îñòàíàâëèâàþò è óâåëè÷èâàþò çíà÷åíèå ñ, ïîñëå ÷åãî âèíçîðèçàöèÿ âûïîëíÿåòñÿ
ñíà÷àëà. Ñóùåñòâóþò áîëåå ñëîæíûå ìîäèôèêàöèè îïèñàííîé ïðîöåäóðû, äëÿ
êîòîðûõ äîêàçàíà ñõîäèìîñòü çà êîíå÷íîå ÷èñëî øàãîâ.
Íà ðèñ. 8.12 ïîêàçàíà ðåàëèçàöèÿ ïåðâûõ äâóõ ýòàïîâ îïèñàííîé ïðîöåäóðû.
Îáðàòèòå âíèìàíèå, ÷òî êîëè÷åñòâî íåèçìåíåííûõ çíà÷åíèé (ÿ÷åéêà F8) âû÷èñëÿåòñÿ êàê ôîðìóëà ìàññèâà. Âèíçîðèçèðîâàíî ïÿòü íàèáîëüøèõ çíà÷åíèé âûáîðêè.
Ðèñ. 8.12. Ðåàëèçàöèÿ ïåðâûõ äâóõ ýòàïîâ âèíçîðèçàöèè âûáîðêè
Глава 8. Предварительный анализ
261
Ïîñêîëüêó ïðåäïîëàãàåòñÿ, ÷òî ïðîöåäóðà âèíçîðèçàöèè áóäåò èìåòü íå áîëåå
òðåõ èòåðàöèé, äëÿ åå ðåàëèçàöèè ìîæíî îáîéòèñü áåç öèêëè÷åñêèõ âû÷èñëåíèé,
ñîçäàâ âû÷èñëåíèÿ äëÿ òðåõ èòåðàöèé ïóòåì ïðîñòîãî êîïèðîâàíèÿ ôîðìóë è èõ
íåáîëüøîé ïîäãîíêè ïîä íîâûå äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ ïîñëåäîâàòåëüíûå
âèíçîðèçèðîâàííûå âûáîðêè. Ðàáî÷èé ëèñò, ðàññ÷èòàííûé íà âûïîëíåíèå òðåõ
èòåðàöèé, ïîêàçàí íà ðèñ. 8.13. Ôîðìóëû, ïî êîòîðûì ïðîâîäÿòñÿ âû÷èñëåíèÿ,
àíàëîãè÷íû ïîêàçàííûì íà ðèñ. 8.12, çà èñêëþ÷åíèåì ñòàíäàðòíîãî îòêëîíåíèÿ,
êîòîðîå ðàññ÷èòûâàåòñÿ ïî ôîðìóëå, ïðèâåäåííîé â ï. 3 îïèñàíèÿ ïðîöåäóðû.
Êàê âèäíî íà ðèñ. 8.13, ïî ÷èñëó âèíçîðèçèðîâàííûõ çíà÷åíèé ïðîöåññ ñîøåëñÿ
ïîñëå âòîðîé èòåðàöèè. Åñëè áû ýòîãî íå ïðîèçîøëî, ìîæíî áûëî áû èçìåíèòü
çíà÷åíèå êîíñòàíòû ñ â ÿ÷åéêå G3. Ïîñëå ýòîãî òðè èòåðàöèè ïðîöåññà âèíçîðèçàöèè ïîâòîðèëèñü áû àâòîìàòè÷åñêè. Âèíçîðèçèðîâàííûå çíà÷åíèÿ âèçóàëüíî
âûäåëÿþòñÿ ñ ïîìîùüþ óñëîâíîãî ôîðìàòèðîâàíèÿ.
Ðèñ. 8.13. Òðè èòåðàöèè âèíçîðèçàöèè
Îòìåòèì, ÷òî ïðîöåññ âèíçîðèçàöèè ñîøåëñÿ ïî ÷èñëó âèíçîðèçèðîâàííûõ
çíà÷åíèé, íî íå ïî çíà÷åíèÿì ñðåäíåãî è âûáîðî÷íîé äèñïåðñèè (èëè, ÷òî òî æå
ñàìîå, ïî çíà÷åíèÿì ãðàíèö tí è tâ). ×òîáû äîñòèãíóòü òàêîé ñõîäèìîñòè, ñëåäîâàëî áû ïðîäîëæèòü ïðîöåññ âèíçîðèçàöèè. Îäíàêî äëÿ îïèñàííîé ïðîöåäóðû
òàêàÿ ñõîäèìîñòü íå ãàðàíòèðîâàíà. Ïîýòîìó íà ïðàêòèêå îãðàíè÷èâàþòñÿ ñõîäèìîñòüþ ïî ÷èñëó âèíçîðèçèðîâàííûõ çíà÷åíèé.
Îòìåòèì, ÷òî âûáîðêè ñ “îáðåçàííûìè” ýêñòðåìàëüíûìè çíà÷åíèÿìè ìîãóò
ïîÿâèòüñÿ íå òîëüêî â ðåçóëüòàòå âèíçîðèçèðîâàíèÿ, íî è “åñòåñòâåííûì” ïóòåì.
Íàïðèìåð, åñëè âûáîðêó ñîñòàâëÿþò íàáëþäåíèÿ çà íåêîòîðîé ôèçè÷åñêîé ïåðåìåííîé, çíà÷åíèÿ êîòîðîé ôèêñèðóþòñÿ ñ ïîìîùüþ ïðèáîðà è ýòîò ïðèáîð
èìååò îïðåäåëåííûå ïðåäåëû èçìåðåíèé, òî çíà÷åíèÿ ôèçè÷åñêîé ïåðåìåííîé,
262 Часть III. Анализ одномерных выборок
âûõîäÿùèå çà ýòè ïðåäåëû, áóäóò çàôèêñèðîâàíû íà óðîâíå ïðåäåëà èçìåðåíèÿ
ïðèáîðà. Äðóãîé ïðèìåð èç ýêîíîìåòðèêè: îáû÷íî ïðè èññëåäîâàíèè äîõîäîâ íàñåëåíèÿ ôèêñèðóþòñÿ òî÷íî òîëüêî äîõîäû, êîòîðûå ëåæàò â îïðåäåëåííûõ ãðàíèöàõ. Äëÿ äîõîäîâ, êîòîðûå ìåíüøå îïðåäåëåííîãî óðîâíÿ (íàïðèìåð, íèæå
óðîâíÿ áåäíîñòè) ëèáî áîëüøå íåêîòîðîãî äðóãîãî ôèêñèðîâàííîãî óðîâíÿ, ïîäñ÷èòûâàåòñÿ òîëüêî èõ êîëè÷åñòâî, áåç çàïèñè êîíêðåòíîãî çíà÷åíèÿ. Òàêèå âûáîðêè ìîæíî ðàññìàòðèâàòü êàê âèíçîðèçèðîâàííûå.
8.2. Преобразование данных
Ïåðåä âûïîëíåíèåì ñòàòèñòè÷åñêîãî àíàëèçà ÷àñòî ïðîâîäèòñÿ ïðåîáðàçîâàíèå
äàííûõ. Äåëàåòñÿ ýòî ïî íåñêîëüêèì ïðè÷èíàì. Âî-ïåðâûõ, äëÿ òîãî, ÷òîáû ðàñïðåäåëåíèå ïðåîáðàçîâàííûõ âûáîðî÷íûõ çíà÷åíèé áûëî ñâîáîäíî îò ïàðàìåòðîâ
ëèáî áûëî áëèçêî ê èçâåñòíîìó ðàñïðåäåëåíèþ (÷àùå âñåãî — ê íîðìàëüíîìó), ëèáî èìåëî ëåãêî ïðîâåðÿåìûå ñâîéñòâà. Íàïðèìåð, åñëè âûáîðî÷íîå ðàñïðåäåëåíèå
ÿâíî àñèììåòðè÷íî, èìååò áîëüøîé “õâîñò” âïðàâî è âñå âûáîðî÷íûå çíà÷åíèÿ ïîëîæèòåëüíû, òî ïðèìåíåíèå ëîãàðèôìè÷åñêîãî ïðåîáðàçîâàíèÿ ïðèâåäåò ê áîëåå
ñèììåòðè÷íîìó ðàñïðåäåëåíèþ, ïîñêîëüêó îíî ðàñòÿíåò øêàëó â îêðåñòíîñòè íóëÿ. Âî-âòîðûõ, íåîáõîäèìîñòü ïðåîáðàçîâàíèÿ âîçíèêàåò òîãäà, êîãäà ïàðàìåòðû
ðàñïðåäåëåíèÿ çàâèñÿò îäèí îò äðóãîãî (îáû÷íî ïðåäïîëàãàåòñÿ, ÷òî ïî êðàéíåé
ìåðå ïåðâûå ìîìåíòû — ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ — íå ñâÿçàíû
ìåæäó ñîáîé). Íàïðèìåð, ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ïóàññîíîâñêîãî
ðàñïðåäåëåíèÿ ñîâïàäàþò.  ïîäîáíîì ñëó÷àå íóæíî ïîäîáðàòü òàêîå ïðåîáðàçîâàíèå, ÷òîáû ïàðàìåòðû ðàñïðåäåëåíèÿ ïðåîáðàçîâàííûõ äàííûõ áûëè íåçàâèñèìû. Îòìåòèì, ÷òî ïðè òàêîì ïðåîáðàçîâàíèè ÷àñòî óëó÷øàþòñÿ ñâîéñòâà ðàñïðåäåëåíèÿ ïðåîáðàçîâàííûõ äàííûõ, íàïðèìåð îíî ïðèâîäèò ê ðàñïðåäåëåíèþ,
áëèçêîìó ê íîðìàëüíîìó, èëè ñòàáèëèçèðóåò äèñïåðñèþ âûáîðêè (äåëàåò åå ìåíåå ÷óâñòâèòåëüíîé ê îáúåìó âûáîðêè è äðóãèì ïàðàìåòðàì âûáîðêè).
Ðàññìîòðèì ÷àñòî èñïîëüçóåìûå ïðåîáðàçîâàíèÿ äàííûõ.
8.2.1. Преобразование квадратного корня
Ýòî ïðåîáðàçîâàíèå ïðèìåíÿþò ê ðàñïðåäåëåíèÿì, äèñïåðñèÿ êîòîðûõ ñîâïàäàåò ñ ìàòåìàòè÷åñêèì îæèäàíèåì èëè ïðîïîðöèîíàëüíà åìó. Ó ïðåîáðàçîâàííîé ñëó÷àéíîé âåëè÷èíû ýòè ïàðàìåòðû ìîæíî ñ÷èòàòü íåçàâèñèìûìè, ïðè ýòîì
åå äèñïåðñèÿ ïðèáëèçèòåëüíî ðàâíà 1/4 (èëè k/4, åñëè äèñïåðñèÿ ïðîïîðöèîíàëüíà ìàòåìàòè÷åñêîìó îæèäàíèþ ñ êîýôôèöèåíòîì ïðîïîðöèîíàëüíîñòè k).
Êðîìå òîãî, äàííîå ïðåîáðàçîâàíèå ÷àñòî ïðèâîäèò ê ðàñïðåäåëåíèþ, êîòîðîå
áëèæå ê íîðìàëüíîìó, ÷åì èñõîäíîå. Ïîêàæåì èñïîëüçîâàíèå ýòîãî ïðåîáðàçîâàíèÿ äëÿ ïóàññîíîâñêîãî è χ2 ðàñïðåäåëåíèé.
Пуассоновское распределение
Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Õ, ðàñïðåäåëåííîé ïî çàêîíó Ïóàññîíà, ðàâíà åå
ìàòåìàòè÷åñêîìó îæèäàíèþ θ (ñì. ðàçäåë 1.4.4). Ïðîñòåéøèì ïðåîáðàçîâàíèåì ýòîé
âåëè÷èíû áóäåò
X+
X . Ïðè θ < 4 áîëåå ýôôåêòèâíûì ñ÷èòàåòñÿ ïðåîáðàçîâàíèå âèäà
3
. Ïðè ìàëûõ θ èíîãäà ðåêîìåíäóþò èñïîëüçîâàòü ïðåîáðàçîâàíèå
8
X + X +1 .
Глава 8. Предварительный анализ
263
Íà ðèñ. 8.14 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà, èìåþùàÿ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì θ = 2 (100 âûáîðî÷íûõ çíà÷åíèé ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, äèàïàçîí âûáîðî÷íûõ çíà÷åíèé íàçâàí Выборка).  ñòîëáöàõ Â, Ñ è D çàïèñàíû âûáîðî÷íûå
çíà÷åíèÿ, ïðåîáðàçîâàííûå ïî ôîðìóëàì X , X + 3 / 8 è X + X + 1 ñîîòâåòñòâåííî.  ñòîëáöå F âû÷èñëåíû ñðåäíèå è äèñïåðñèè (ïî ñòàíäàðòíûì ôîðìóëàì
ñ èñïîëüçîâàíèåì ôóíêöèé СРЗНАЧ è ДИСП), â ñòîëáöå G — îöåíêè ïàðàìåòðà θ
(ôîðìóëû äëÿ âû÷èñëåíèé ïîêàçàíû íà ðèñ. 8.14). Êàê âèäíî, íàèëó÷øèé ðåçóëüòàò ïî çíà÷åíèþ äèñïåðñèè (ïî áëèçîñòè ê çíà÷åíèþ 0,25) äàåò ïðåîáðàçîâàíèå
X + 3 / 8 , ïî áëèçîñòè îöåíêè θ ê èñòèííîìó çíà÷åíèþ — ïðåîáðàçîâàíèå
X + X + 1 . Íà ðèñ. 8.15 ïîêàçàíû ãèñòîãðàììû äëÿ ïåðâîíà÷àëüíîé âûáîðêè
è äëÿ çíà÷åíèé, ïðåîáðàçîâàííûõ ïî ôîðìóëàì
X è
X + 3 / 8 (ïîñëåäíÿÿ ôîð-
ìóëà ïðèâîäèò ê áîëåå ñèììåòðè÷íîìó ðàñïðåäåëåíèþ, ÷åì ôîðìóëà
X ).
Ðèñ. 8.14. Ïðåîáðàçîâàíèå êâàäðàòíîãî êîðíÿ
Распределение χ2
Ïðåîáðàçîâàíèå êâàäðàòíîãî êîðíÿ äëÿ âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå χ2, íà ïðàêòèêå ïðèìåíÿåòñÿ îòíîñèòåëüíî ðåäêî. Ýòî ïðåîáðàçîâàíèå
èìååò ñêîðåå òåîðåòè÷åñêîå çíà÷åíèå è èñïîëüçóåòñÿ äëÿ àïïðîêñèìàöèè ýòîãî
ðàñïðåäåëåíèÿ íîðìàëüíûì, íàïðèìåð, ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ. Êðîìå òîãî, ýòî ïðåîáðàçîâàíèå äàåò óäîâëåòâîðèòåëüíóþ àïïðîêñèìàöèþ
òîëüêî ïðè äîñòàòî÷íî áîëüøîì çíà÷åíèè n ñòåïåíè ñâîáîäû ðàñïðåäåëåíèÿ χ2.
264 Часть III. Анализ одномерных выборок
Ðèñ. 8.15. Ãèñòîãðàììû ïåðâîíà÷àëüíîé è ïðåîáðàçîâàííûõ âûáîðîê
Åñëè n ≥ 30, òî ñëó÷àéíàÿ âåëè÷èíà Y =
3
X / n + 2 / 9n − 1
2 / 9n
èìååò ïðèáëèæåííî
íîðìàëüíîå ñòàíäàðòíîå ðàñïðåäåëåíèå, çäåñü Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî çàêîíó χ2 ñ n ñòåïåíÿìè ñâîáîäû. Åñëè n ≥ 100, òî èñïîëüçóåòñÿ áîëåå ïðîñòîå ïðåîáðàçîâàíèå, êîòîðîå òàêæå ïðèâîäèò ê ïðèáëèæåííî íîðìàëüíîìó ñòàíäàðòíîìó ðàñïðåäåëåíèþ: Y = 2X − 2n − 1 .
Íà ðèñ. 8.16 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà,
èìåþùàÿ ðàñïðåäåëåíèå χ2 ñî çíà÷åíèåì ñòåïåíè ñâîáîäû n = 50 (200 âûáîðî÷íûõ
çíà÷åíèé ïîëó÷åíû ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ХИ2ОБР(СЛЧИС();50)}).
 ñòîëáöàõ  è Ñ çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, ïðåîáðàçîâàííûå ïî ôîðìóëàì
Y = 2X − 2n − 1 è Y =
3
X / n + 2 / 9n − 1
2 / 9n
ñîîòâåòñòâåííî (îáîçíà÷åíû êàê Формула 1
è Формула 2; äèàïàçîíàì ÿ÷ååê, ñîäåðæàùèì ýòè çíà÷åíèÿ, ïðèñâîåíû òàêèå æå
èìåíà). Ôîðìóëû ïðåîáðàçîâàíèÿ ïîêàçàíû íà ðèñ. 8.16.  ñòîëáöå Å âû÷èñëåíû
ñðåäíèå è äèñïåðñèè (ïî ñòàíäàðòíûì ôîðìóëàì ñ èñïîëüçîâàíèåì ôóíêöèé
СРЗНАЧ è ДИСП). Íà ðèñ. 8.17 ïîêàçàíû ãèñòîãðàììû äëÿ ïåðâîíà÷àëüíîé âûáîðêè è ïðåîáðàçîâàííûõ âûáîðîê. Êàê âèäíî, îáå ôîðìóëû â äàííîì ñëó÷àå äàþò
ïðèìåðíî îäèíàêîâûå ðåçóëüòàòû: ôîðìóëà 1 äàåò ÷óòü ëó÷øèå çíà÷åíèÿ ñðåäíåãî
è âûáîðî÷íîé äèñïåðñèè, ôîðìóëà 2 — áîëåå ñèììåòðè÷íóþ ãèñòîãðàììó.
8.2.2. Логарифмическое преобразование
Ýòî ïðåîáðàçîâàíèå, ïî-âèäèìîìó, ÷àùå âñåãî èñïîëüçóåòñÿ íà ïðàêòèêå, îñîáåííî ïðè àíàëèçå ýêîíîìè÷åñêèõ äàííûõ, êîòîðûå ÷àñòî èìåþò ëîãàðèôìè÷åñêè íîðìàëüíîå èëè ïðèáëèæåííî ëîãíîðìàëüíîå ðàñïðåäåëåíèå. Ëîãàðèôìè÷åñêîå
Глава 8. Предварительный анализ
265
ïðåîáðàçîâàíèå òàêæå ïðèìåíÿþò, êîãäà â ðàñïðåäåëåíèè ñëó÷àéíîé âåëè÷èíû Õ
ìàòåìàòè÷åñêîå îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå ïðîïîðöèîíàëüíû
(íàïðèìåð, ñ êîýôôèöèåíòîì ïðîïîðöèîíàëüíîñòè k). Òîãäà ñëó÷àéíàÿ âåëè÷èíà
Y = ln(X) áóäåò èìåòü äèñïåðñèþ, ïðèáëèæåííî ðàâíóþ k2, ò.å. ïðèõîäèì ê ðàñïðåäåëåíèþ ñ ïî÷òè íåçàâèñèìûìè ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé.
Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü íóëåâûå çíà÷åíèÿ, òî èñïîëüçóåòñÿ ôîðìóëà Y = ln(X + 1).
Ðèñ. 8.16. Ïðåîáðàçîâàíèå èñõîäíîé âûáîðêè
Ðèñ. 8.17. Ãèñòîãðàììû ïåðâîíà÷àëüíîé è ïðåîáðàçîâàííûõ âûáîðîê
266 Часть III. Анализ одномерных выборок
Íà ðèñ. 8.18 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà, èìåþùàÿ ëîãíîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = 1 è σ2 = 4 (1200
âûáîðî÷íûõ
çíà÷åíèé
ïîëó÷åíû
ñ
ïîìîùüþ
ôîðìóëû
ìàññèâà
{=ЛОГНОРМОБР(СЛЧИС();1;2)}).  ñòîëáöå  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ,
ïðåîáðàçîâàííûå ïî ôîðìóëå Y = ln(X).  ñòîëáöå Ñ âû÷èñëåíû ñðåäíèå è ñòàíäàðòíîå îòêëîíåíèå ïðåîáðàçîâàííîé âûáîðêè. Íà ýòîì æå ðèñóíêå ïîêàçàíà
ãèñòîãðàììà äëÿ ïðåîáðàçîâàííîé âûáîðêè.
Ðèñ. 8.18. Ïðåîáðàçîâàíèå èñõîäíîé âûáîðêè
8.2.3. Стандартизирующее преобразование
Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò èçâåñòíîå ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèþ σ2, òî ñëó÷àéíàÿ âåëè÷èíà Y = X – m íàçûâàåòñÿ öåíòðèðîâàííîé, âåëè÷èíà
Y = X/σ — íîðìèðîâàííîé, à Y = (X – m)/σ — ñòàíäàðòèçèðîâàííîé. Ïîñëåäíåå
ïðåîáðàçîâàíèå íàçûâàåòñÿ ñòàíäàðòèçèðóþùèì è èñïîëüçóåòñÿ íà ïðàêòèêå äëÿ ïîëó÷åíèÿ ñòàíäàðòèçèðîâàííûõ âûáîðîê (â êà÷åñòâå çíà÷åíèé m è σ îáû÷íî áåðóòñÿ
âûáîðî÷íûå ñðåäíåå è ñòàíäàðòíîå îòêëîíåíèå). Äëÿ âûïîëíåíèÿ ýòîãî ïðåîáðàçîâàíèÿ â Excel åñòü ñïåöèàëüíàÿ ôóíêöèÿ НОРМАЛИЗАЦИЯ (ñì. ðàçäåë 4.12.2). Îòìåòèì, ÷òî ñòàíäàðòèçèðóþùåå ïðåîáðàçîâàíèå íå èçìåíÿåò òèï ðàñïðåäåëåíèÿ,
à èçìåíÿåò òîëüêî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè.
8.3. Построение гистограмм, полигонов
и эмпирических функций распределения
Íà ïðåäâàðèòåëüíîì ýòàïå ñòàòèñòè÷åñêîãî àíàëèçà, êàê ïðàâèëî, ñòðîÿòñÿ
ãèñòîãðàììû, ïîëèãîíû è ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ. Ýòî óäîáíûé
Глава 8. Предварительный анализ
267
ñïîñîá âèçóàëüíîãî ïðåäñòàâëåíèÿ ñòàòèñòè÷åñêèõ äàííûõ, êîòîðûé ïîçâîëÿåò
äåëàòü âûâîäû î ðàñïðåäåëåíèè íàáëþäàåìîé ñëó÷àéíîé âåëè÷èíû, ðåàëèçàöèåé
êîòîðîé ÿâëÿåòñÿ èìåþùàÿñÿ âûáîðêà.
8.3.1. Построение гистограммы и эмпирической функции
распределения для дискретных случайных величин
Ñëó÷àéíàÿ âåëè÷èíà, ïîä÷èíÿþùàÿñÿ äèñêðåòíîìó ðàñïðåäåëåíèþ, ìîæåò
ïðèíèìàòü êîíå÷íîå èëè ñ÷åòíîå ìíîæåñòâî çíà÷åíèé. Åñòåñòâåííî, â êîíå÷íîé
âûáîðêå âñåãäà åñòü òîëüêî êîíå÷íîå êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé. Îáû÷íî
ïîäîáíàÿ âûáîðêà èìååò âèä òàáëèöû, â êîòîðîé óêàçûâàåòñÿ, ñêîëüêî ðàç êàæäîå çíà÷åíèå âñòðå÷àåòñÿ â âûáîðêå. Òàêàÿ òàáëèöà íàçûâàåòñÿ ÷àñòîòíîé.
Çäåñü íåîáõîäèìî ñäåëàòü íåáîëüøîå îòñòóïëåíèå îá èñïîëüçóåìûõ òåðìèíàõ.
Åñëè äèñêðåòíàÿ ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò çíà÷åíèÿ õ1, õ2, ..., õm
è äàííûå çíà÷åíèÿ âñòðå÷àþòñÿ â âûáîðêå ñîîòâåòñòâåííî f1, f2, ..., fm ðàç, òî ýòè
÷èñëà íàçûâàþòñÿ ÷àñòîòàìè çíà÷åíèé õi. Çíà÷åíèÿ ÷àñòîò, äåëåííûå íà îáúåì
âûáîðêè è âûðàæåííûå â äîëÿõ åäèíèöû èëè â ïðîöåíòàõ, íàçûâàþòñÿ ÷àñòîñòÿìè, îòíîñèòåëüíûìè ÷àñòîòàìè èëè ñòàòèñòè÷åñêèìè âåðîÿòíîñòÿìè.
Íàêîïëåííûìè ÷àñòîòàìè ñi íàçûâàþòñÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, íå
ïðåâûøàþùèõ õi. Ýòè æå âåëè÷èíû, äåëåííûå íà îáúåì âûáîðêè, íàçûâàþòñÿ
îòíîñèòåëüíûìè íàêîïëåííûìè ÷àñòîòàìè èëè íàêîïëåííûìè ÷àñòîñòÿìè.
Âîçâðàùàåìñÿ ê âûáîðî÷íûì çíà÷åíèÿì äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû. Ïî
÷àñòîòíîé òàáëèöå ïîñòðîèòü ãèñòîãðàììó íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé (çà èñêëþ÷åíèåì òåõ ñëó÷àåâ, êîãäà çíà÷åíèÿ ðàñïðåäåëåíû íåðàâíîìåðíî íà îñè Õ; ñì.
íèæå). Íî èíîãäà, åñëè âûáîðêà ñîñòîèò èç ïîñëåäîâàòåëüíûõ íàáëþäåíèé, äàííûå
íå ñãðóïïèðîâàíû è íåîáõîäèìî ïîäñ÷èòàòü ÷àñòîòû ðàçíûõ çíà÷åíèé. Åñëè âûáîðêà
íåáîëüøîãî îáúåìà è èçâåñòíû çíà÷åíèÿ, êîòîðûå ïðèíèìàåò ñëó÷àéíàÿ âåëè÷èíà,
òî ñäåëàòü ýòî îòíîñèòåëüíî íåñëîæíî. Îäíàêî äëÿ áîëüøèõ âûáîðîê è îñîáåííî
â ñëó÷àå, êîãäà íåèçâåñòíû âñå çíà÷åíèÿ, ïðèíèìàåìûå ñëó÷àéíîé âåëè÷èíîé, çàäà÷à
óñëîæíÿåòñÿ. Ïîêàæåì, êàê åå ìîæíî âûïîëíèòü â Excel â ñàìîì îáùåì ñëó÷àå.
Íà ðèñ. 8.19 ïîêàçàíà âûáîðêà èç 100 çíà÷åíèé, ñãåíåðèðîâàííàÿ ñ ïîìîùüþ
ñðåäñòâà Генерация случайных чисел èç ïàêåòà àíàëèçà ñ òèïîì ðàñïðåäåëåíèÿ
Дискретное. Ðàñïðåäåëåíèå çàäàíî â èíòåðâàëå I2:J8 (çíà÷åíèÿ ýòîãî ðàñïðåäåëåíèÿ ïîëó÷åíû ñ ïîìîùüþ ôóíêöèè СЛЧИС).
Àíàëèç âûáîðêè ñëåäóåò íà÷àòü ñ ïîäñ÷åòà êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé,
äëÿ ÷åãî ïðèìåíèòü ïðîñòóþ ôîðìóëó =СЧЁТ(Выборка) (çäåñü äèàïàçîíó ÿ÷ååê,
ñîäåðæàùåìó âûáîðêó, ïðèñâîåíî èìÿ Выборка). Äàëåå íàäî ïîäñ÷èòàòü êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé â âûáîðêå.  îáùåì ñëó÷àå ýòî íåòðèâèàëüíàÿ çàäà÷à.
Äëÿ åå âûïîëíåíèÿ ìîæíî èñïîëüçîâàòü ôîðìóëó ìàññèâà
{=СУММ(1/СЧЁТЕСЛИ(Выборка;Выборка))}.
Äàííàÿ ôîðìóëà ñíà÷àëà ñîçäàåò âèðòóàëüíûé ìàññèâ, ñîäåðæàùèé äëÿ êàæäîãî
âûáîðî÷íîãî çíà÷åíèÿ êîëè÷åñòâî òàêèõ çíà÷åíèé (ýòî äåëàåò ÷àñòü ôîðìóëû
СЧЁТЕСЛИ(Выборка;Выборка)). Íàïðèìåð, ÷èñëî 4,56 âñòðå÷àåòñÿ â âûáîðêå 24
ðàçà. Òîãäà êàæäûé ýëåìåíò âèðòóàëüíîãî ìàññèâà, ñîîòâåòñòâóþùèé âûáîðî÷íîìó
çíà÷åíèþ 4,56, áóäåò ðàâåí 24. ×àñòü ôîðìóëû 1/СЧЁТЕСЛИ(Выборка;Выборка))
ñîçäàåò íîâûé âèðòóàëüíûé ìàññèâ, ñîäåðæàùèé âåëè÷èíû, îáðàòíûå çíà÷åíèÿì
ïåðâîãî âèðòóàëüíîãî ìàññèâà. Íàïðèìåð, 24 ýëåìåíòà ýòîãî ìàññèâà, ñîîòâåòñòâóþùèå âûáîðî÷íîìó çíà÷åíèþ 4,56, áóäóò ñîäåðæàòü ÷èñëî 0,041667 (=1/24).
Ôóíêöèÿ СУММ ñóììèðóåò çíà÷åíèÿ âòîðîãî âèðòóàëüíîãî ìàññèâà (ñóììà çíà÷åíèé,
268 Часть III. Анализ одномерных выборок
ñîîòâåòñòâóþùèõ âûáîðî÷íîìó çíà÷åíèþ 4,56, äàñò 1), è â ðåçóëüòàòå ïîëó÷àåòñÿ
èñêîìîå êîëè÷åñòâî ðàçëè÷íûõ âûáîðî÷íûõ çíà÷åíèé.  ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.20, ýòà ôîðìóëà çàïèñàíà â ÿ÷åéêå Ñ2.
Ðèñ. 8.19. Âûáîðêà è åå ðàñïðåäåëåíèå
Ðèñ. 8.20. Ïîñòðîåíèå ãèñòîãðàììû äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ
Глава 8. Предварительный анализ
269
Òåïåðü íåîáõîäèìî ñîçäàòü ìàññèâ, ñîäåðæàùèé âñå ðàçëè÷íûå âûáîðî÷íûå
çíà÷åíèÿ. Ðàçìåð òàêîãî ìàññèâà ðàâåí ÷èñëó, ïîäñ÷èòàííîìó ïðåäûäóùåé ôîðìóëîé. Íà ðèñ. 8.20 ýòîò ìàññèâ ñîäåðæèòñÿ â äèàïàçîíå Å2:Å8 â ñòîëáöå Значения.
Çíà÷åíèÿ ýòîãî äèàïàçîíà âû÷èñëåíû ñ ïîìîùüþ ñëåäóþùåé ôîðìóëû ìàññèâà:
{=ИНДЕКС(Выборка;НАИМЕНЬШИЙ(ЕСЛИ(ПОИСКПОЗ(Выборка;Выборка;0)=СТРОК
А(ДВССЫЛ("1:"&ЧСТРОК(Выборка)));ПОИСКПОЗ(Выборка;Выборка;0);"");СТРОКА(Д
ВССЫЛ("1:"&ЧСТРОК(Выборка)))))}.
Ýòà ôîðìóëà, êàê è ïðåäûäóùàÿ, âçÿòà èç êíèãè [20]. Ìû íå áóäåì îïèñûâàòü,
êàê îíà ðàáîòàåò (ýòî çíà÷èòåëüíî óâåëî áû â ñòîðîíó îò íàøåé òåìû); îòìåòèì
òîëüêî, ÷òî ðàáîòàåò îíà áåçóêîðèçíåííî íà ëþáûõ âûáîðêàõ.
Åäèíñòâåííûé íåäîñòàòîê äàííîé ôîðìóëû ñîñòîèò â òîì, ÷òî ïîëó÷åííûé
ìàññèâ íå óïîðÿäî÷åí. Îäíàêî îòìåòèì, ÷òî åñëè èñõîäíàÿ âûáîðêà îòñîðòèðîâàíà â ïîðÿäêå óáûâàíèÿ èëè âîçðàñòàíèÿ, òî äàííûé ìàññèâ òàêæå áóäåò óïîðÿäî÷åí. Îòñîðòèðîâàòü ýòîò ìàññèâ íà ìåñòå íå óäàñòñÿ, ïîñêîëüêó îí ïîëó÷åí
ñ ïîìîùüþ ôîðìóëû ìàññèâà. Ïðîñòîé âûõîä èç òàêîé ñèòóàöèè çàêëþ÷àåòñÿ
â òîì, ÷òîáû ñêîïèðîâàòü åãî â ñîñåäíèé äèàïàçîí ÿ÷ååê è çàìåíèòü ôîðìóëû
çíà÷åíèÿìè (êîìàíäà ПравкаÖСпециальная вставка, îïöèÿ Значения). Òåïåðü
ìîæíî ïðèìåíèòü ñòàíäàðòíóþ ñîðòèðîâêó, äëÿ ÷åãî ñëåäóåò âûäåëèòü äèàïàçîí
è âûáðàòü êîìàíäó ДанныеÖСортировка. Åñëè ïîñëå ýòîãî ïîÿâëÿåòñÿ äèàëîãîâîå
îêíî Обнаружены данные вне указанного диапазона, òî â ýòîì îêíå íåîáõîäèìî
óñòàíîâèòü ïåðåêëþ÷àòåëü Сортировать в пределах указанного выделения è çàòåì
ùåëêíóòü íà êíîïêå Сортировка. Óïîðÿäî÷åííûé ïî âîçðàñòàíèþ ìàññèâ óíèêàëüíûõ âûáîðî÷íûõ çíà÷åíèé íà ðèñ. 8.20 ïîêàçàí â ñòîëáöå F, îçàãëàâëåííîì
Сортировка.  ñòîëáöå G âû÷èñëåíû ÷àñòîñòè âûáîðî÷íûõ çíà÷åíèé ñ ïðèìåíåíèåì ôîðìóëû ìàññèâà {=ЧАСТОТА(Выборка;F2:F8)/C4}. Íà îñíîâàíèè ýòèõ
äàííûõ äàëåå ñòðîèòñÿ ãèñòîãðàììà.
Îáû÷íî äëÿ ïîñòðîåíèÿ ãèñòîãðàìì â Excel èñïîëüçóåòñÿ òèï äèàãðàììû
Гистограмма. Îäíàêî ýòîò òèï äèàãðàììû ðàñïîëàãàåò äàííûå ïî îñè Õ ðàâíîìåðíî, ÷òî âïîëíå ïîäõîäèò, åñëè ñëó÷àéíàÿ âåëè÷èíà ïðèíèìàåò ðàâíîîòñòîÿùèå çíà÷åíèÿ íà êàêîì-ëèáî èíòåðâàëå.  íàøåì ñëó÷àå çíà÷åíèÿ, ïðèíèìàåìûå
ñëó÷àéíîé âåëè÷èíîé, ðàñïðåäåëåíû íå ðàâíîìåðíî.  òàêîé ñèòóàöèè ìîæíî
ïðèìåíèòü òèï äèàãðàììû Точечная è â êà÷åñòâå ñòîëáöîâ ãèñòîãðàììû èñïîëüçîâàòü ïëàíêè ïîãðåøíîñòåé, êàê îïèñàíî â ðàçäåëå 6.2.3. Íàïîìíèì êðàòêî,
êàê ïîñòðîèòü ãèñòîãðàììó â äàííîì ñëó÷àå.
Ñíà÷àëà ñòðîèì äèàãðàììó òèïà Точечная áåç ëèíèé, ñîåäèíÿþùèõ òî÷êè
äàííûõ. Çàòåì âûäåëÿåì ðÿä äàííûõ è âûáèðàåì êîìàíäó ФорматÖВыделенный
ряд.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Формат ряда данных íà âêëàäêå Y-погрешности çàäàåì ïëàíêó ïîãðåøíîñòè òèïà Минус.  êà÷åñòâå âåëè÷èíû ïîãðåøíîñòè çàäàåì Относительное значение 100% (ðèñ. 8.21). Íà ãðàôèêå ïîÿâëÿþòñÿ
âåðòèêàëüíûå ñòîëáöû îò çíà÷åíèé äàííûõ äî îñè Õ. Òåïåðü îñòàåòñÿ îòôîðìàòèðîâàòü ïëàíêè ïîãðåøíîñòåé è çíà÷åíèÿ äàííûõ.  ðåçóëüòàòå ïîëó÷àåì ãèñòîãðàììó âûáîðêè, ïîêàçàííóþ íà ðèñ. 8.20.
Ïðè ïîñòðîåíèè ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí òàêæå âîçíèêàþò íåêîòîðûå ñëîæíîñòè, ïîñêîëüêó òàêàÿ ôóíêöèÿ èìååò ñòóïåí÷àòûé âèä, íî íè ñðåäñòâî ïîñòðîåíèÿ äèàãðàìì Excel, íè ñðåäñòâî Гистограмма èç ïàêåòà àíàëèçà ïîäîáíûå ãðàôèêè ñòðîèòü íå ìîãóò.
 ðàçäåëå 6.2.3 ïîêàçàíî, êàê âñå-òàêè â Excel ïîñòðîèòü òàêîé ãðàôèê.
270 Часть III. Анализ одномерных выборок
Ðèñ. 8.21. Äèàëîãîâîå îêíî Формат ряда данных
Ñíà÷àëà íàäî ïîäñ÷èòàòü íàêîïëåííûå ÷àñòîòû èëè îòíîñèòåëüíûå íàêîïëåííûå ÷àñòîòû (íàêîïëåííûå ÷àñòîñòè). Ýòî âûïîëíÿåòñÿ ïðîñòî, åñëè óæå ïîäñ÷èòàíû ÷àñòîòû èëè ÷àñòîñòè. Ïóñòü âû÷èñëåííûå ÷àñòîñòè ñîäåðæàòñÿ â ñòîëáöå
G, à íàêîïëåííûå ÷àñòîñòè — â ñòîëáöå H, êàê íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà
ðèñ. 8.22.  ÿ÷åéêó Í2 çàïèñûâàåòñÿ ôîðìóëà =G2, â ÿ÷åéêó Í3 — =H2+G3. Çàòåì ýòà ôîðìóëà ðàñïðîñòðàíÿåòñÿ âíèç äî ÿ÷åéêè Í8. Òàêèì îáðàçîì áóäóò ïîäñ÷èòàíû íàêîïëåííûå ÷àñòîñòè.
Ðèñ. 8.22. Âû÷èñëåíèå íàêîïëåííûõ ÷àñòîñòåé
Îïèñàíèå ïðîöåññà ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ ïðèâåäåíî â ðàçäåëå 6.2.3. Êðàòêî íàïîìíèì åãî.
Ñíà÷àëà íåîáõîäèìî âñòàâèòü ïóñòîé ñòîëáåö ïåðåä ñòîëáöîì, ñîäåðæàùèì
íàêîïëåííûå ÷àñòîñòè, à çàòåì ñêîïèðîâàòü â íåãî îòñîðòèðîâàííûå óíèêàëüíûå
âûáîðî÷íûå çíà÷åíèÿ èç ñòîëáöà F. Ïîñëå ýòîãî ïåðåä êàæäîé ñòðîêîé â ñòîëáöàõ Í è I (òåïåðü â ñòîëáöå I íàõîäÿòñÿ íàêîïëåííûå ÷àñòîñòè) ñëåäóåò âñòàâèòü
ïî ïóñòîé ñòðîêå, ñäâèãàÿ ÿ÷åéêè âíèç.
Глава 8. Предварительный анализ
271
Äàëåå â ïóñòóþ ÿ÷åéêó Í2 ââåäåì ôîðìóëó =H3-0,000009, à â ÿ÷åéêó I2 ÷èñëî 0. Ôîðìóëó èç ÿ÷åéêè Í2 ñêîïèðóåì â ÿ÷åéêó Í4, à â ÿ÷åéêó I2 ââåäåì ôîðìóëó =I3. Âûäåëèì ÿ÷åéêè Í4:I4 è ñêîïèðóåì èõ âî âñå ñâîáîäíûå ÿ÷åéêè âíèç
äî ñòðîêè 14.  ÿ÷åéêó Í16 ìîæíî ââåñòè ÷èñëî 5, à â ÿ÷åéêó I5 — ÷èñëî 1 (íî
ýòî íå îáÿçàòåëüíî). Ðàáî÷èé ëèñò íà äàííîì ýòàïå ïîêàçàí íà ðèñ. 8.23.
Ðèñ. 8.23. Âñå ãîòîâî äëÿ ïîñòðîåíèÿ ãðàôèêà
Òåïåðü äëÿ ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äîñòàòî÷íî ïîñòðîèòü ñðåäñòâàìè Excel äèàãðàììó òèïà Точечная ñ ñîåäèíèòåëüíûìè
ëèíèÿìè áåç ìàðêåðîâ íà îñíîâå äàííûõ äèàïàçîíà Í2:I16. Ãîòîâàÿ îòôîðìàòèðîâàííàÿ äèàãðàììà ïîêàçàíà íà ðèñ. 8.24.
Ðèñ. 8.24. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
272 Часть III. Анализ одномерных выборок
8.3.2. Построение гистограммы и полигона для непрерывных
распределений
×òîáû ïîñòðîèòü ãèñòîãðàììó äëÿ âûáîðêè, èìåþùåé íåïðåðûâíîå ðàñïðåäåëåíèå, íåîáõîäèìî ñîçäàòü äëÿ íåå ÷àñòîòíóþ òàáëèöó. Äëÿ ýòîãî ñíà÷àëà âñÿ îáëàñòü èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé ðàçáèâàåòñÿ íà ðÿä íåïåðåñåêàþùèõñÿ èíòåðâàëîâ è çàòåì ïîäñ÷èòûâàþòñÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ
â êàæäûé èíòåðâàë. Òàêèå èíòåðâàëû ÷àñòî íàçûâàþò êàðìàíàìè, ýòî æå íàçâàíèå èñïîëüçóþò ôóíêöèÿ Excel ЧАСТОТА è ñðåäñòâî Гистограмма. Ïåðâàÿ ïðîáëåìà âîçíèêàåò ïðè îïðåäåëåíèè êîëè÷åñòâà òàêèõ èíòåðâàëîâ, êîòîðîå, êîíå÷íî æå,
äîëæíî âûáèðàòüñÿ â çàâèñèìîñòè îò îáúåìà âûáîðêè.  íàñòîÿùåå âðåìÿ íàèáîëåå “ïîïóëÿðíîé” ôîðìóëîé, ïî êîòîðîé îïðåäåëÿåòñÿ êîëè÷åñòâî k èíòåðâàëîâ
â çàâèñèìîñòè îò ÷èñëà n âûáîðî÷íûõ çíà÷åíèé, ÿâëÿåòñÿ ôîðìóëà Ñòåðäæåññà:
k = [1 + 3,22 ln(n)] ([õ] — öåëàÿ ÷àñòü ÷èñëà õ). Äëÿ ïîëíîòû êàðòèíû ïðèâåäåì
äðóãèå ôîðìóëû, ðåêîìåíäóåìûå äëÿ âû÷èñëåíèÿ k (ñì., íàïðèìåð, [13]).
k = 10 lg(n), ïðè ýòîì k íå äîëæíî âûõîäèòü çà èíòåðâàë [5, 30].
k = 5 lg(n) è k ∈ [6, 20].
k = [3,26 lg(n) + 0,5] + 1, åñëè n ≤ 100; è k = min([0,1n], 25) + 1, åñëè n > 100.
k = [4(0,75(n – 1)2)1/5], åñëè n > 200; è k = [0,2n], åñëè n ≤ 200.
(
)
k = min  n  , 30 . ( ýòèõ ôîðìóëàõ [õ] — öåëàÿ ÷àñòü ÷èñëà õ.)
Êàêèå áû ôîðìóëû íå èñïîëüçîâàëèñü äëÿ âû÷èñëåíèÿ k, ñëåäóåò ïîìíèòü,
÷òî ïðè ñëèøêîì áîëüøîì çíà÷åíèè k âèä ðàñïðåäåëåíèÿ èñêàæàåòñÿ ñëó÷àéíûìè çíà÷åíèÿìè ÷àñòîò (ïîñêîëüêó èíòåðâàëû î÷åíü êîðîòêèå). À ïðè ìàëîì ÷èñëå èíòåðâàëîâ ñãëàæèâàþòñÿ è íèâåëèðóþòñÿ õàðàêòåðíûå îñîáåííîñòè ðàñïðåäåëåíèÿ (íàïðèìåð, íàëè÷èå äâóõ áëèçêîðàñïîëîæåííûõ ìîä). Ïîýòîìó äëÿ
êà÷åñòâåííîãî àíàëèçà ñòðîÿò ãèñòîãðàììû ïðè íåñêîëüêèõ çíà÷åíèÿõ k.
Ïîñëå âûáîðà êîëè÷åñòâà èíòåðâàëîâ îïðåäåëÿåòñÿ äëèíà èíòåðâàëîâ è èõ
ãðàíèöû. Åñëè âñå èíòåðâàëû îäèíàêîâîé äëèíû, òî èõ äëèíà îïðåäåëÿåòñÿ
ôîðìóëîé d = R/k, ãäå R = xmax – xmin — ðàçìàõ âûáîðêè, xmax è xmin — ìàêñèìàëüíîå è ìèíèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ. ×àñòî äëÿ òîãî, ÷òîáû ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ ëåæàëè âíóòðè èíòåðâàëîâ, à íå íà ãðàíèöå, d
âû÷èñëÿþò ïî ôîðìóëå d = 1,02R/k. Åñëè d — äðîáíîå ÷èñëî, òî çà äëèíó èíòåðâàëà ïðèíèìàåòñÿ èëè áëèæàéøåå öåëîå ÷èñëî, ïðåâîñõîäÿùåå d, èëè áëèæàéøàÿ ïðîñòàÿ äðîáü, òàêæå íå ìåíüøàÿ d. Ãðàíèöû i-ãî èíòåðâàëà
∆i = [ai1, ai2) âû÷èñëÿþòñÿ ïî ôîðìóëàì ai1 = à11 + (i – 1)d è ai1 = à11 + id
( i = 1, k ), ãäå à11 — íèæíÿÿ ãðàíèöà èíòåðâàëà ∆1. Ãðàíèöà à11 ðàâíà xmin, åñëè d
òî÷íî ðàâíî R/k ëèáî íåìíîãî ìåíüøå ìèíèìàëüíîãî âûáîðî÷íîãî çíà÷åíèÿ.
×àñòîòû fi âû÷èñëÿþòñÿ êàê êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ
â èíòåðâàë ∆i. Îáû÷íî â ýòî êîëè÷åñòâî çàñ÷èòûâàþòñÿ çíà÷åíèÿ, êîòîðûå áîëüøå íèæíåé ãðàíèöû èíòåðâàëà èëè ðàâíû åé è ìåíüøèå âåðõíåé ãðàíèöû.
Ðàññìîòðèì, êàê îïèñàííûå âû÷èñëåíèÿ ðåàëèçóþòñÿ â Excel: ñíà÷àëà ñ ïîìîùüþ ôîðìóë ìàññèâîâ, à çàòåì ñ ïîìîùüþ ôóíêöèè ЧАСТОТА è ñðåäñòâà
Гистограмма.
Глава 8. Предварительный анализ
273
Использование формул массивов
Íà ðèñ. 8.25 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæàòñÿ âûáîðî÷íûå çíà÷åíèÿ (ýòîò äèàïàçîí ÿ÷ååê íàçâàí Выборка) è âû÷èñëåíû ãðàíèöû èíòåðâàëîâ (ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, òàêæå ïîêàçàíû íà
ðèñ. 8.25).  äàííîì ñëó÷àå âûáîðêà èìååò ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [–1, 1]. Êîëè÷åñòâî èíòåðâàëîâ âû÷èñëÿåòñÿ â ÿ÷åéêå Ñ8 ïî ôîðìóëå Ñòåðäæåññà. Íîìåðà èíòåðâàëîâ â ñòîëáöå D ââåäåíû êàê çíà÷åíèÿ àðèôìåòè÷åñêîé ïðîãðåññèè ñ øàãîì 1 (êîìàíäà ПравкаÖЗаполнитьÖПрогрессия). Ýòî ïðîñòåéøèé
ñïîñîá ñîçäàíèÿ èíòåðâàëîâ, è îí òðåáóåò âûïîëíåíèÿ íåêîòîðûõ îïåðàöèé âðó÷íóþ, íàïðèìåð, êîïèðîâàíèÿ ôîðìóëû èç ÿ÷åéêè Å3 â äèàïàçîí Å4:Å9.
Ðèñ. 8.25. Âû÷èñëåíèå ãðàíèö èíòåðâàëîâ
Ïðèâåäåì ôîðìóëó ìàññèâà, êîòîðàÿ âû÷èñëÿåò ãðàíèöû èíòåðâàëîâ, ïðè÷åì
íèæíÿÿ ãðàíèöà ïåðâîãî èíòåðâàëà ñîâïàäàåò ñ xmin, à âåðõíÿÿ ãðàíèöà ïîñëåäíåãî — ñ xmax:
{=МИН(Выборка)+((СТРОКА(ДВССЫЛ("1:"&(C8+1)))-1)* (МАКС(Выборка)МИН(Выборка))/C8)}
Çäåñü ÷àñòü ôîðìóëû СТРОКА(ДВССЫЛ("1:"&(C8+1)))-1 ôîðìèðóåò âèðòóàëüíûé
ìàññèâ èç öåëûõ ÷èñåë îò 0 äî 7. Ýòè ÷èñëà çàòåì óìíîæàþòñÿ íà äëèíó èíòåðâàëà, êîòîðàÿ âû÷èñëÿåòñÿ ÷àñòüþ ôîðìóëû МАКС(Выборка)-МИН(Выборка))/C8.
Êàê âèäíî, äëÿ ðàáîòû äàííîé ôîðìóëû íàäî ïðåäâàðèòåëüíî âû÷èñëèòü òîëüêî
êîëè÷åñòâî èíòåðâàëîâ (ÿ÷åéêà Ñ8). Ðåçóëüòàò èñïîëüçîâàíèÿ ýòîé ôîðìóëû ïîêàçàí íà ðèñ. 8.26 â ñòîëáöå Карманы2.
Íåáîëüøîå î÷åâèäíîå èçìåíåíèå ïîñëåäíåé ôîðìóëû
{=ОКРУГЛ(МИН(Выборка)-0,02*Длина;2)+ (СТРОКА(ДВССЫЛ("1:"&(C8+1)))1)*ОКРУГЛ(1,04*Длина;2)}
ïîçâîëÿåò ñîçäàâàòü èíòåðâàëû, â êîòîðûõ çíà÷åíèÿ xmax è xmin ëåæàò âíóòðè
èíòåðâàëîâ, à òàêæå îêðóãëÿåò äðîáíûå çíà÷åíèÿ ãðàíèö èíòåðâàëîâ äî äâóõ äåñÿòè÷íûõ çíàêîâ. Çäåñü, äëÿ òîãî ÷òîáû óïðîñòèòü ôîðìóëó, äëèíà èíòåðâàëà ïî
ôîðìóëå =МАКС(Выборка)-МИН(Выборка))/C8 âû÷èñëÿåòñÿ â ÿ÷åéêå, êîòîðîé ïðèñâîåíî èìÿ Длина (ÿ÷åéêà Ñ12 íà ðèñ. 8.26). Ìíîæèòåëè 0,02 è 1,04 ïåðåä çíà÷åíèåì Длина íàäî ïîäáèðàòü òàêèì îáðàçîì, ÷òîáû âû÷èñëåííîå çíà÷åíèå
274 Часть III. Анализ одномерных выборок
ОКРУГЛ(МИН(Выборка)-0,02*Длина;2) áûëî ìåíüøå xmin. Íàïðèìåð, â äàííîì
ïðèìåðå ïðè ìíîæèòåëå 0,01 çíà÷åíèå íèæíåé ãðàíèöû ïåðâîãî èíòåðâàëà áûëî
áîëüøå xmin. Ýòî ðåçóëüòàò îêðóãëåíèÿ — åñëè íå èñïîëüçîâàòü ôóíêöèþ
ОКРУГЛ, òî ëþáîé ïîëîæèòåëüíûé ìíîæèòåëü áóäåò äàâàòü çíà÷åíèå íèæíåé
ãðàíèöû ïåðâîãî èíòåðâàëà, ìåíüøåå xmin. Ðåçóëüòàòû âû÷èñëåíèé ïî ïîñëåäíåé
ôîðìóëå ïîêàçàíû íà ðèñ. 8.26 â ñòîëáöå Карманы3.
Ðèñ. 8.26. Ôîðìóëû ìàññèâîâ äëÿ âû÷èñëåíèÿ ãðàíèö èíòåðâàëîâ
Òåïåðü ïîäñ÷èòàåì êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàäàþùèõ â ñîîòâåòñòâóþùèå èíòåðâàëû, ò.å. ñîçäàäèì ÷àñòîòíóþ òàáëèöó. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôîðìóëó ìàññèâà (ãðàíèöû èíòåðâàëîâ çàïèñàíû â ñòîëáöå G íà÷èíàÿ
ñî âòîðîé ñòðîêè)
{=СУММ((Выборка>=G2)*(Выборка<G3))},
êîòîðàÿ çàïèñûâàåòñÿ â ïåðâóþ ÿ÷åéêó ÷àñòîòíîé òàáëèöû, à çàòåì êîïèðóåòñÿ
âíèç. Çäåñü â çíà÷åíèÿ ÷àñòîò çàñ÷èòûâàþòñÿ âûáîðî÷íûå çíà÷åíèÿ, êîòîðûå
áîëüøå íèæíåé ãðàíèöû èíòåðâàëà èëè ðàâíû åé è ìåíüøèå âåðõíåé ãðàíèöû.
Íà ðèñ. 8.27 ïî ýòèì ôîðìóëàì â ñòîëáöå Í (îçàãëàâëåííîì Частота) ïîäñ÷èòàíû
÷àñòîòû äëÿ èíòåðâàëîâ Карманы3.  ñòîëáöå I (îçàãëàâëåííîì Частота2) ïî àíàëîãè÷íûì ôîðìóëàì ïîäñ÷èòàíû ÷àñòîòû äëÿ èíòåðâàëîâ Карманы2, ãäå â êà÷åñòâå íèæíåé ãðàíèöû ïåðâîãî èíòåðâàëà âçÿòî xmin, à âåðõíåé ãðàíèöåé ïîñëåäíåãî — xmax. Êàê âèäíî íà ðèñ. 8.27 â ñòðîêå ñîñòîÿíèÿ, â ýòîì ñëó÷àå ñóììà
÷àñòîò íå ðàâíà 100 (ò.å. îáúåìó âûáîðêè), ïîñêîëüêó â ïîñëåäíåì èíòåðâàëå íå
çàñ÷èòàíî çíà÷åíèå xmax. Òàêèì îáðàçîì, ñëåäóåò ñîçäàâàòü òàêèå èíòåðâàëû,
÷òîáû çíà÷åíèÿ xmin è xmax íàõîäèëèñü âíóòðè èíòåðâàëîâ.
Äëÿ âû÷èñëåíèÿ ÷àñòîñòåé çíà÷åíèÿ ÷àñòîò íåîáõîäèìî ðàçäåëèòü íà êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé. Åñëè âû÷èñëÿòü ÷àñòîñòè áåç ïðåäâàðèòåëüíîãî âû÷èñëåíèÿ ÷àñòîò, òî äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôîðìóëó
{=СУММ((Выборка>=G2)*(Выборка<G3))/СЧЁТ(Выборка)},
êîòîðàÿ çàïèñûâàåòñÿ â ïåðâóþ ÿ÷åéêó òàáëèöû ÷àñòîñòåé, à çàòåì êîïèðóåòñÿ
âíèç (çäåñü ïðåäïîëàãàåòñÿ, ÷òî ãðàíèöû èíòåðâàëîâ çàïèñàíû â ñòîëáöå G íà÷èíàÿ ñî âòîðîé ñòðîêè). Íà ðèñ. 8.28 çíà÷åíèÿ ÷àñòîñòåé âû÷èñëåíû ïî ïðèâåäåííûì âûøå ôîðìóëàì è çàïèñàíû â ñòîëáöå I, îçàãëàâëåííîì Частости.
Глава 8. Предварительный анализ
275
Ðèñ. 8.27. Âû÷èñëåíèå ÷àñòîòíîé òàáëèöû
Äëÿ âû÷èñëåíèÿ íàêîïëåííûõ ÷àñòîò èëè íàêîïëåííûõ ÷àñòîñòåé ìîæíî èñïîëüçîâàòü ðàíåå âû÷èñëåííûå çíà÷åíèÿ ÷àñòîò èëè ÷àñòîñòåé ëèáî íàéòè èõ
“íàïðÿìóþ” áåç ïðîìåæóòî÷íîãî âû÷èñëåíèÿ ÷àñòîò (÷àñòîñòåé). Äëÿ âûïîëíåíèÿ ïåðâîãî âàðèàíòà âû÷èñëåíèé â ÿ÷åéêó J2 (ñì. ðèñ. 8.28) çàïèñûâàåòñÿ ôîðìóëà =I2, â ÿ÷åéêó J3 — ôîðìóëà =J2+I3. Ïîñëåäíÿÿ ôîðìóëà êîïèðóåòñÿ âíèç.
Äëÿ âûïîëíåíèÿ âòîðîãî âàðèàíòà âû÷èñëåíèé â ïåðâóþ ÿ÷åéêó äèàïàçîíà ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ íàêîïëåííûõ ÷àñòîñòåé (ÿ÷åéêà Ê2 íà ðèñ. 8.28), çàïèñûâàåòñÿ ôîðìóëà ìàññèâà
{=СУММ(1*(Выборка<G3))/СЧЁТ(Выборка)},
êîòîðàÿ çàòåì êîïèðóåòñÿ âíèç. Ðåçóëüòàò âû÷èñëåíèÿ íàêîïëåííûõ ÷àñòîñòåé
îïèñàííûìè ñïîñîáàìè ïîêàçàí íà ðèñ. 8.28 â ñòîëáöàõ J è Ê.
Ðèñ. 8.28. Âû÷èñëåíèå íàêîïëåííûõ ÷àñòîñòåé
276 Часть III. Анализ одномерных выборок
Íà îñíîâå òàáëèö ÷àñòîò (èëè ÷àñòîñòåé) è íàêîïëåííûõ ÷àñòîò (íàêîïëåííûõ
÷àñòîñòåé) âèçóàëüíî ïðåäñòàâëÿþò ðàñïðåäåëåíèå âûáîðêè â âèäå ãèñòîãðàììû,
ïîëèãîíà è ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ. Ïîëèãîí — ýòî ãðàôèê, ïîñòðîåííûé ïî çíà÷åíèÿì ÷àñòîò (÷àñòîñòåé), ïðè ýòîì çíà÷åíèÿ ñîåäèíÿþòñÿ îòðåçêàìè ïðÿìûõ. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé òàêæå ñòðîèòñÿ â âèäå êóñî÷íî-ëèíåéíîãî ãðàôèêà, à íå â âèäå
ñòóïåí÷àòîé ôóíêöèè, êàê ýòî äåëàåòñÿ äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  Excel
äëÿ ïîñòðîåíèÿ ãèñòîãðàììû èñïîëüçóåòñÿ òèï äèàãðàììû Гистограмма, äëÿ ïîëèãîíà — òèï График, à äëÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ — òèï
Точечная. Ýòè òèïû ãðàôèêîâ ïîêàçàíû íà ðèñ. 8.29.
Ðèñ. 8.29. Ãèñòîãðàììà, ïîëèãîí è ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
Использование функции ЧАСТОТА и средства Гистограмма
Ôóíêöèÿ ЧАСТОТА îïèñàíà â ðàçäåëå 4.11.4. Íàïîìíèì åå ñèíòàêñèñ:
ЧАСТОТА(Ìàññèâ_äàííûõ;Ìàññèâ_èíòåðâàëîâ)
Àðãóìåíò Массив_данных — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé
âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò Массив_интервалов — ìàññèâ èëè ññûëêà íà
äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ãðàíèö èíòåðâàëîâ {a0, a1, ..., ak–1, ak}.
Ôóíêöèÿ ââîäèòñÿ êàê ôîðìóëà ìàññèâà è âîçâðàùàåò ìàññèâ çíà÷åíèé
(ðèñ. 8.30). Ðàçìåðíîñòü ýòîãî ìàññèâà íà åäèíèöó áîëüøå ðàçìåðíîñòè ìàññèâà
ãðàíèö èíòåðâàëîâ. ×àñòîòû ïîäñ÷èòûâàåòñÿ ñëåäóþùèì îáðàçîì. Ïåðâîå çíà÷åíèå ìàññèâà ÷àñòîò — ýòî êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ìåíüøèõ èëè ðàâíûõ a0, âòîðîå — ÷èñëî âûáîðî÷íûõ çíà÷åíèé, áîëüøèõ a0 è ìåíüøèõ èëè ðàâíûõ a1, è ò.ä. Ïîñëåäíåå çíà÷åíèå ìàññèâà ÷àñòîò ðàâíî êîëè÷åñòâó âûáîðî÷íûõ
çíà÷åíèé, áîëüøèõ ak. Òàêèì îáðàçîì, â îòëè÷èå îò ôîðìóë ïðåäûäóùåãî ðàçäåëà, çäåñü â êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â òîò èëè èíîé èíòåðâàë, çàñ÷èòûâàþòñÿ çíà÷åíèÿ, êîòîðûå áîëüøå íèæíåé ãðàíèöû èíòåðâàëà
è ìåíüøå âåðõíåé ãðàíèöû èëè ðàâíû åé. Êîíå÷íî, òàêîå ðàçëè÷èå íåñóùåñòâåííî
Глава 8. Предварительный анализ
277
è èãðàåò ñâîþ ðîëü òîëüêî â òåõ ñëó÷àÿõ, êîãäà ãðàíèöû íåêîòîðûõ èíòåðâàëîâ ñîâïàäàþò ñ âûáîðî÷íûìè çíà÷åíèÿìè (íàïðèìåð, åñëè íèæíÿÿ ãðàíèöà ïåðâîãî èíòåðâàëà è âåðõíÿÿ ãðàíèöà ïîñëåäíåãî èíòåðâàëà ðàâíû ñîîòâåòñòâåííî xmin è xmax).
Ðèñ. 8.30. Ïðèìåíåíèå ôóíêöèè ЧАСТОТА
Ñðåäñòâî ïàêåòà àíàëèçà Гистограмма îïèñàíî â ðàçäåëå 5.2. Îòìåòèì, ÷òî åñëè íå çàäàíû èíòåðâàëû êàðìàíîâ, òî îíè âû÷èñëÿþòñÿ àâòîìàòè÷åñêè ñëåäóþùèì ñïîñîáîì. Âû÷èñëÿþòñÿ êîëè÷åñòâî èíòåðâàëîâ ïî ôîðìóëå Ñòåðäæåññà
k = [1 + 3,22 ln(n)] (n — îáúåì âûáîðêè) è äëèíà èíòåðâàëîâ êàê d = R/(k – 1)
(R — ðàçìàõ âûáîðêè). Çàòåì ïîñëåäîâàòåëüíî âû÷èñëÿþòñÿ ãðàíèöû èíòåðâàëîâ, ïðè÷åì çà íèæíþþ ãðàíèöó ïåðâîãî èíòåðâàëà áåðåòñÿ xmin. Îáðàùàåì âíèìàíèå, ÷òî ñðåäñòâî Гистограмма ñòðîèò íà îäèí èíòåðâàë áîëüøå, ÷åì âû÷èñëÿåò ôîðìóëà Ñòåðäæåññà. Ïîñëåäíèé èíòåðâàë Гистограмма îáîçíà÷àåò êàê Еще.
Çíà÷åíèÿ ÷àñòîò ñðåäñòâî Гистограмма âû÷èñëÿåò òàê æå, êàê è ôóíêöèÿ
ЧАСТОТА. Íà ðèñ. 8.31 ïîêàçàíû èíòåðâàëû êàðìàíîâ, âû÷èñëåííûå ñðåäñòâîì
Гистограмма, è ïîñòðîåííàÿ èì ãèñòîãðàììà ÷àñòîò. Îòìåòèì, ÷òî â êà÷åñòâå
ïîäïèñåé ê îñè Õ Гистограмма áåðåò çíà÷åíèÿ èç ìàññèâà Карман. Ïîýòîìó äëÿ
òîãî, ÷òîáû èçìåíèòü ôîðìàò ïîäïèñåé íà äèàãðàììå, ñëåäóåò èçìåíèòü ôîðìàò
÷èñëîâûõ çíà÷åíèé â ìàññèâå Карман.  îñòàëüíîì ýòó äèàãðàììó ìîæíî ôîðìàòèðîâàòü òàê æå, êàê ëþáóþ äðóãóþ äèàãðàììó Excel.
8.4. Вычисление точечных оценок параметров
распределения
Âû÷èñëåíèå ðàçëè÷íûõ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèÿ ïðåäøåñòâóåò ëþáîìó áîëåå-ìåíåå ãëóáîêîìó ñòàòèñòè÷åñêîìó àíàëèçó èìåþùèõñÿ âûáîðî÷íûõ
äàííûõ. Óæå íà ýòàïå ïðåäâàðèòåëüíîãî àíàëèçà èñïîëüçóþòñÿ ýòè îöåíêè, îñîáåííî ïåðâûõ ìîìåíòîâ, íàïðèìåð ïðè öåíçóðèðîâàíèè è ïðåîáðàçîâàíèè
(íîðìàëèçàöèè) èñõîäíûõ äàííûõ (ñì. ðàçäåëû 8.1 è 8.2). Íî, ïðåæäå âñåãî,
îöåíêè ïàðàìåòðîâ äàþò ïåðâîíà÷àëüíîå ïðåäñòàâëåíèå î òèïå è õàðàêòåðå ðàñïðåäåëåíèÿ âûáîðêè (êîíå÷íî, íàðÿäó ñ äðóãèìè ñðåäñòâàìè ïðåäâàðèòåëüíîãî
àíàëèçà, íàïðèìåð ñ ãèñòîãðàììàìè è ýìïèðè÷åñêîé ôóíêöèåé ðàñïðåäåëåíèÿ).
Ïàðàìåòðû ðàñïðåäåëåíèÿ ìîæíî ðàçáèòü íà íåñêîëüêî ãðóïï.
278 Часть III. Анализ одномерных выборок
Ðèñ. 8.31. Ïðèìåíåíèå ñðåäñòâà Гистограмма
1. Ïàðàìåòðû ïîëîæåíèÿ. Õàðàêòåðèçóþò ïîëîæåíèå âûáîðî÷íûõ äàííûõ
(òî÷íåå, ãåíåðàëüíîé ñîâîêóïíîñòè) íà ÷èñëîâîé îñè. Ê òàêèì ïàðàìåòðàì
ìîæíî îòíåñòè ìèíèìàëüíîå è ìàêñèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ è âûáîðî÷íûå êâàíòèëè. “Ñðåäíèå çíà÷åíèÿ” ìåñòîïîëîæåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè õàðàêòåðèçóþò âûáîðî÷íûå ñðåäíèå (àðèôìåòè÷åñêîå, ãåîìåòðè÷åñêîå èëè ãàðìîíè÷åñêîå), ìåäèàíà è ìîäà.
2. Ïàðàìåòðû ðàçáðîñà. Õàðàêòåðèçóþò ñòåïåíü ðàçáðîñà âûáîðî÷íûõ äàííûõ îòíîñèòåëüíî íåêîòîðîãî “ñðåäíåãî çíà÷åíèÿ”. Ê íèì, â ïåðâóþ î÷åðåäü, îòíîñÿòñÿ âûáîðî÷íûå äèñïåðñèÿ è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå, ðàçìàõ âûáîðêè è èíòåðêâàðòèëüíûé ðàçìàõ (ðàçíîñòü ìåæäó
âûáîðî÷íûìè âåðõíèì è íèæíèì êâàðòèëÿìè), êîýôôèöèåíò âàðèàöèè
(îòíîøåíèå âûáîðî÷íîãî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ê ñðåäíåìó) è äð.
3. Ïàðàìåòðû ôîðìû ðàñïðåäåëåíèÿ. Îïðåäåëÿþò “ãåîìåòðè÷åñêèå” õàðàêòåðèñòèêè ðàñïðåäåëåíèÿ, íàïðèìåð ñèììåòðè÷íîñòü è “îñòðîòà” ôîðìû
ïëîòíîñòè âåðîÿòíîñòè. Ê òàêèì ïàðàìåòðàì, ïðåæäå âñåãî, îòíîñÿòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà, à òàêæå êîëè÷åñòâî ìîä
(åñëè ïî ãèñòîãðàììå ìîæíî ÷åòêî îïðåäåëèòü íàëè÷èå íåñêîëüêèõ ìîä),
îòíîñèòåëüíîå ðàññòîÿíèå ìåæäó ìåäèàíîé è ñðåäíèì è ò.ï.
Äëÿ âû÷èñëåíèÿ áîëüøèíñòâà ïåðå÷èñëåííûõ ïàðàìåòðîâ â Excel ïðåäóñìîòðåíû ñîîòâåòñòâóþùèå ôóíêöèè (ñì. ãëàâó 4), à òàêæå ñðåäñòâî Описательная
статистика èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.1). Íàïðèìåð, äëÿ âûáîðêè, êîòîðàÿ
èñïîëüçîâàëàñü â ïðèìåðàõ ïðåäûäóùåãî ðàçäåëà, ñðåäñòâî Описательная
статистика ðàññ÷èòàëî ñòàòèñòè÷åñêèå ïîêàçàòåëè, ïîêàçàííûå íà ðèñ. 8.32.
Ïðèâåäåì ñïèñîê îñíîâíûõ òî÷å÷íûõ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèé ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè è íàçâàíèÿìè ôóíêöèé Excel, êîòîðûå âû÷èñëÿþò
ýòè îöåíêè. ( ôîðìóëàõ xi — âûáîðî÷íûå çíà÷åíèÿ, n — îáúåì âûáîðêè, x(i) —
÷ëåíû âàðèàöèîííîãî ðÿäà, ïîñòðîåííîãî ïî èñõîäíîé âûáîðêå.) Òàêæå óêàæåì,
âûïîëíÿþòñÿ ëè ýòè âû÷èñëåíèÿ ñðåäñòâîì Описательная статистика.
Глава 8. Предварительный анализ
279
2
1
n −[αn ] / 2
1
∑ xi
n − [αn] i =1+[αn ] / 2
1
∑ xi
n i =1
хгарм = n
Ôóíêöèÿ Excel
i =1
n
i
1
∑x
(Ñì. ðàçäåëû 1.2.3 è 4.2.1)
(Ñì. ðàçäåë 8.4.2)
m = õ(k+1), åñëè n = 2k + 1;
m = (õ(k) + õ(k+1))/2, åñëè n = 2k
xmax = max(õ1, õ2, ..., õn)
Íåò
Íåò
СРГЕОМ
СРГАМ
Äà
Íåò
МОДА
КВАРТИЛЬ
Äà
Äà
1
Äà
Äà
МЕДИАНА, КВАРТИЛЬ ,
ПЕРСЕНТИЛЬ2
НАИБОЛЬШИЙ
МАКС, МАКСА, НАИБОЛЬШИЙ
НАИМЕНЬШИЙ
Äà
Íåò
УРЕЗСРЕДНЕЕ
МИН, МИНА, НАИМЕНЬШИЙ
Äà
Îïèñàòåëüíàÿ
ñòàòèñòèêà
СРЗНАЧ, СРЗНАЧА
Ïàðàìåòðû ïîëîæåíèÿ
xгеом = n x1 x2 ⋅ ... ⋅ xn
xα =
x=
n
xmin = min(õ1, õ2, ..., õn)
Ôîðìóëà
Ýòà ôóíêöèÿ âû÷èñëÿåò ìåäèàíó ïðè çíà÷åíèè àðãóìåíòà Часть, ðàâíîì 2.
Ýòà ôóíêöèÿ âû÷èñëÿåò ìåäèàíó ïðè çíà÷åíèè àðãóìåíòà k = 0,5.
Êâàíòèëè
Ìîäà
Ìåäèàíà
k-å íàèáîëüøåå çíà÷åíèå
Ìàêñèìàëüíîå âûáîðî÷íîå
çíà÷åíèå
k-å íàèìåíüøåå çíà÷åíèå
Ìèíèìàëüíîå âûáîðî÷íîå
çíà÷åíèå
Ñðåäíåå ãàðìîíè÷åñêîå
Ñðåäíåå ãåîìåòðè÷åñêîå
Óñå÷åííîå ñðåäíåå
Ñðåäíåå
Îöåíêà
Ñðåäíåå àáñîëþòíîå îòêëîíåíèå
Ñòàíäàðòíîå îòêëîíåíèå
Ñðåäíåêâàäðàòè÷åñêîå
îòêëîíåíèå
Óñå÷åííàÿ âûáîðî÷íàÿ
äèñïåðñèÿ
Íåñìåùåííàÿ âûáîðî÷íàÿ äèñïåðñèÿ
Âûáîðî÷íàÿ äèñïåðñèÿ
k-é íà÷àëüíûé ìîìåíò
Ïðîöåíòèëè
Îöåíêà
sα2 =
Ôîðìóëà
1 n
∑ ( xi − x )2
n i =1
1 n
∑ ( xi − x )2
n − 1 i =1
1 n
∑ ( xi − x )2
n i =1
Íåò
Äà
Íåò
СТАНДОТКЛОНП,
СТАНДОТКЛОНПА
СТАНДОТКЛОН, СТАНДОТКЛОНА
СРОТКЛ
281
Íåò
Äà
ДИСП, ДИСПА
Ïîñëå ïðåäâàðèòåëüíîãî öåíçóðèðîâàíèÿ âûáîðêè ìîæíî ïðèìåíèòü ôóíêöèè ДИСП è ДИСПА
Íåò
Íåò
Íåò
Îïèñàòåëüíàÿ
ñòàòèñòèêà
ДИСПР, ДИСПРА
Глава 8. Предварительный анализ
1 n
∑ | xi − x |
n i =1
1 n
∑ ( xi − x )2
n − 1 i =1
dn =
sn =
Sn =
Ñïåöèàëüíîé ôóíêöèè íåò, íî ëåãêî âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèè СУММ èëè СРЗНАЧ
ПЕРСЕНТИЛЬ
Ïàðàìåòðû ðàçáðîñà
1 n k
∑ xi
n i =1
n −[αn ] / 2
1
∑ ( xi − xα )2
n − [αn] − 1 i =1+[αn ] / 2
sn2 =
Sn2 =
mk =
(Ñì. ðàçäåë 1.2.3)
Ïàðàìåòðû ïîëîæåíèÿ
Ôóíêöèÿ Excel
Ïðîäîëæåíèå òàáë.
β̂ 2 =
Âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèé
СУММ è СРЗНАЧ
4
n
 xi − x 
n( n + 1)
3(n − 1) 2

 −
∑
( n − 1)( n − 2)(n − 3) i =1  sn  ( n − 3)(n − 3)
2
ЭКСЦЕСС
СКОС
Ïàðàìåòðû ôîðìû ðàñïðåäåëåíèÿ
1 n
∑ ( xi − x )k
n i =1
n
 xi − x 
n


∑
(n − 1)(n − 2) i =1  sn 
µk =
282 Часть III. Анализ одномерных выборок
Êîýôôèöèåíò ýêñöåññà
Êîýôôèöèåíò àñèììåòðèè
k-é öåíòðàëüíûé ìîìåíò
Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèè КВАРТИЛЬ
R0,5 = ξ0,75 – ξ0,25
Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèé СТАНДОТКЛОН è
СРЗНАЧ
Èíòåðêâàðòèëüíûé ðàçìàõ
s
⋅100%
x
Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèé МАКС è МИН
v=
Ïàðàìåòðû ðàçáðîñà
Ôóíêöèÿ Excel
R = xmax – xmin
β̂1 =
Ôîðìóëà
Ðàçìàõ
Êîýôôèöèåíò âàðèàöèè
Îöåíêà
Äà
Äà
Íåò
Íåò
Äà
(íàçûâàåòñÿ
Интервал)
Íåò
Îïèñàòåëüíàÿ
ñòàòèñòèêà
Îêîí÷àíèå òàáë.
Ðèñ. 8.32. Ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Описательная статистика
Ïðèâåäåííûå ôîðìóëû ïðèìåíèìû äëÿ ëþáûõ ðàñïðåäåëåíèé. Äëÿ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé ñóùåñòâóþò ñïåöèàëüíûå òî÷å÷íûå îöåíêè ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðûå áóäóò ïîêàçàíû â ãëàâå 10. Îòäåëüíîãî ðàññìîòðåíèÿ òðåáóþò ôîðìóëû äëÿ âûáîðêè èç äèñêðåòíîé ãåíåðàëüíîé
ñîâîêóïíîñòè, ïðåäñòàâëåííîé â âèäå ÷àñòîòíîé òàáëèöû, à òàêæå íåêîòîðûå ïîÿñíåíèÿ íåîáõîäèìû äëÿ îöåíêè ìîäû.
8.4.1. Точечные оценки дискретного распределения
Ïóñòü âûáîðêà èç äèñêðåòíîé ãåíåðàëüíîé ñîâîêóïíîñòè ïðåäñòàâëåíà â âèäå
÷àñòîòíîé òàáëèöû, ãäå äëÿ êàæäîãî çíà÷åíèÿ õ1, õ2, ..., õm óêàçûâàþòñÿ ñîîòâåòñòâóþùèå ÷àñòîòû f1, f2, ..., fm. Îáîçíà÷èì êàê n ñóììó âñåõ ÷àñòîò, ò.å.
m
n = ∑ f i . Ïðèâåäåì ìàòåìàòè÷åñêèå ôîðìóëû è ôîðìóëû Excel äëÿ âû÷èñëåíèÿ
i =1
îöåíîê ìîìåíòîâ ðàñïðåäåëåíèÿ.  ôîðìóëàõ Excel áóäåì ïðåäïîëàãàòü, ÷òî çíà÷åíèÿ õ1, õ2, ..., õm ðàñïîëàãàþòñÿ â äèàïàçîíå ÿ÷ååê ñ èìåíåì Значения, çíà÷åíèÿ ÷àñòîò f1, f2, ..., fm — â äèàïàçîíå ñ èìåíåì Частота, à çíà÷åíèå n — â ÿ÷åéêå ñ èìåíåì N (äëÿ íàõîæäåíèÿ n ìîæíî ïðèìåíèòü ôîðìóëó =СУММ(Частота)).
Îöåíêà
Âûáîðî÷íîå
ñðåäíåå
k-é íà÷àëüíûé
ìîìåíò
Ôîðìóëà
x=
mk =
Ôîðìóëà Excel
1 n
∑ xi fi
n i =1
=СУММПРОИЗВ(Значения;Частота)/N
1 n k
∑ xi fi
n i =1
=СУММПРОИЗВ(Значения^К;Частота)/N
(çíà÷åíèå k çàïèñàíî â ÿ÷åéêå ñ èìåíåì К)
Глава 8. Предварительный анализ
283
Îêîí÷àíèå òàáë.
Îöåíêà
Âûáîðî÷íàÿ
äèñïåðñèÿ
Ôîðìóëà
Sn2 =
Ôîðìóëà Excel
1
∑ ( xi − x )2 fi
n i =1
=СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/N (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)1
=СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/(N-1) (çíà÷åíèå x
çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)
n
Íåñìåùåííàÿ
âûáîðî÷íàÿ
äèñïåðñèÿ
sn2 =
1 n
( xi − x )2 f i
∑
n − 1 i =1
Ñðåäíåêâàäðàò
è÷åñêîå îòêëîíåíèå
Sn =
1 n
∑ ( xi − x )2 fi
n i =1
=КОРЕНЬ(СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/N) (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)
1 n
∑ ( xi − x )2 fi
n − 1 i =1
=КОРЕНЬ(СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/(N-1)) (çíà÷åíèå x
çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)
Ñòàíäàðòíîå
îòêëîíåíèå
sn =
Ñðåäíåå àáñîëþòíîå îòêëîíåíèå
dn =
1 n
∑ | xi − x | fi
n i =1
=СУММПРОИЗВ(ABS(ЗначенияСреднее);Частота)/N (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)
k-é öåíòðàëüíûé ìîìåíò
µk =
1 n
∑ ( xi − x )k fi
n i =1
=СУММПРОИЗВ((ЗначенияСреднее)^К;Частота)/N (çíà÷åíèå k çàïèñàíî â ÿ÷åéêå ñ èìåíåì К)
Ìîäà
Çíà÷åíèå, êîòîðîìó
ñîîòâåòñòâóåò íàèáîëüøåå çíà÷åíèå ÷àñòîòû
=ИНДЕКС(Значения;ПОИСКПОЗ(МАКС(Ча
стота);Частота))2
Äëÿ âû÷èñëåíèÿ ìåäèàíû òàêæå ìîæíî ñîçäàòü ôîðìóëó Excel, îäíàêî îíà
áóäåò î÷åíü ãðîìîçäêîé è íåóäîáíîé â èñïîëüçîâàíèè. Âû÷èñëåíèÿ çíà÷èòåëüíî
ñîêðàòÿòñÿ è óïðîñòÿòñÿ, åñëè ïðåäâàðèòåëüíî îòñîðòèðîâàòü ÷àñòîòíóþ òàáëèöó
ïî âîçðàñòàíèþ çíà÷åíèé è ïîäñ÷èòàòü íàêîïëåííûå ÷àñòîòû, à òàêæå íàéòè
çíà÷åíèå õm, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm, ìåíüøàÿ n/2,
è ñëåäóþùåå ïî âåëè÷èíå çíà÷åíèå õm+1, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm+1, áîëüøàÿ èëè ðàâíàÿ n/2. Òîãäà ìåäèàíà Ì âû÷èñëÿåòñÿ ïî ôîðìóëå
M = xm + ( xm +1 − xm )
n / 2 − Fm
.
Fm +1
Íà ðèñ. 8.33 ïîêàçàíî âû÷èñëåíèå ìåäèàíû ïî ýòîé ôîðìóëå. Çíà÷åíèÿ õm
è õm+1 è ñîîòâåòñòâóþùèå èì çíà÷åíèÿ ÷àñòîò è íàêîïëåííûõ ÷àñòîò âûäåëåíû ñåðûì öâåòîì.
1
Äëÿ ýòîé ôîðìóëû ñíà÷àëà íåîáõîäèìî âû÷èñëèòü ñðåäíåå. ×òîáû íàéòè òîëüêî îöåíêó
äèñïåðñèè, áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé, â ïîñëåäíþþ ôîðìóëó âìåñòî Среднее ñëåäóåò
âñòàâèòü âûøåïðèâåäåííóþ ôîðìóëó âû÷èñëåíèÿ ñðåäíåãî. Ýòî æå çàìå÷àíèå îòíîñèòñÿ
è ê ïðèâåäåííûì íèæå ôîðìóëàì.
2
Åñëè åñòü ãðóïïà èç íåñêîëüêèõ çíà÷åíèé, êîòîðûì ñîîòâåòñòâóþò îäèíàêîâûå íàèáîëüøèå çíà÷åíèÿ ÷àñòîò, òî ýòà ôîðìóëà âîçâðàùàåò ïåðâîå âñòðå÷åííîå çíà÷åíèå èç
äàííîé ãðóïïû.
284 Часть III. Анализ одномерных выборок
Ðèñ. 8.33. Âû÷èñëåíèå ìåäèàíû
8.4.2. Вычисление моды для непрерывных распределений
Êàê óêàçûâàëîñü ïðè îïèñàíèè ôóíêöèè МОДА (ñì. ðàçäåë 4.11.3), ýòà ôóíêöèÿ íà ñàìîì äåëå íå âû÷èñëÿåò ìîäó ðàñïðåäåëåíèÿ (âïðî÷åì, êàê è ñðåäñòâî
Описательная статистика). Îíà ïðîñòî îïðåäåëÿåò âûáîðî÷íîå çíà÷åíèå, êîòîðîå
âñòðå÷àåòñÿ â âûáîðêå íàèáîëåå ÷àñòî. Íî ïîñêîëüêó äëÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí âåðîÿòíîñòü ïðèíÿòèÿ îäèíàêîâûõ çíà÷åíèé ðàâíà íóëþ, òî â âûáîðêàõ, èìåþùèõ íåïðåðûâíîå ðàñïðåäåëåíèå, îäèíàêîâûå çíà÷åíèÿ ïðàêòè÷åñêè íå âñòðå÷àþòñÿ (à åñëè è âñòðå÷àþòñÿ, òî ýòî, ñêîðåå âñåãî, àðòåôàêò). Íà
ïðàêòèêå ìîäà íåïðåðûâíûõ ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ñëåäóþùèì îáðàçîì.
1. Ïî âûáîðî÷íûì çíà÷åíèÿì ñòðîèòñÿ ãèñòîãðàììà (èëè ïîëèãîí) (ñì. ðàçäåë 8.3.2), ïî âèäó êîòîðîé îïðåäåëÿåòñÿ èíòåðâàë, â êîòîðîì ìîæåò íàõîäèòüñÿ ìîäà (òàêîé èíòåðâàë íàçûâàåòñÿ ìîäàëüíûì). Ïóñòü ãðàíèöàìè
ýòîãî èíòåðâàëà ñëóæàò ÷èñëà õm è õm+1.
2. Çíà÷åíèå ìîäû m âû÷èñëÿåòñÿ ïî ñëåäóþùåé ôîðìóëå:
m = xm + ( xm +1 − xm )
f m − f m −1
,
2 f m − f m −1 − f m +1
ãäå fm, fm-1 è fm+1 — ÷àñòîòû ñîîòâåòñòâåííî ìîäàëüíîãî, ïðåäøåñòâóþùåãî
ìîäàëüíîìó è ñëåäóþùåãî çà ìîäàëüíûì èíòåðâàëîâ.  ýòîé ôîðìóëå âìåñòî ÷àñòîò ìîæíî èñïîëüçîâàòü ÷àñòîñòè.
Åñëè îïðåäåëåí ìîäàëüíûé èíòåðâàë, òî ðåàëèçàöèÿ òàêîé ôîðìóëû â Excel
íå âûçûâàåò çàòðóäíåíèé.
Глава 8. Предварительный анализ
285
Глава
9
Подбор распределения
Î
ïðåäåëåíèå âèäà ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ, ðåàëèçàöèåé êîòîðîé ÿâëÿþòñÿ èìåþùèåñÿ âûáîðî÷íûå çíà÷åíèÿ, — îäíà èç îñíîâíûõ öåëåé
ëþáîãî ñòàòèñòè÷åñêîãî àíàëèçà. Ïî áîëüøîìó ñ÷åòó, åñëè èçâåñòíî ðàñïðåäåëåíèå âûáîðêè, íà ýòîì ìîæíî çàêàí÷èâàòü ñòàòèñòè÷åñêèé àíàëèç îäíîìåðíîé
âûáîðêè, ïîñêîëüêó èçâåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ìîæåò äàòü èñ÷åðïûâàþùóþ èíôîðìàöèþ î ñëó÷àéíîé âåëè÷èíå Õ. Íà ïðàêòèêå, êîíå÷íî, ðàñïðåäåëåíèå âûáîðêè íåèçâåñòíî, — â ëó÷øåì ñëó÷àå èñõîäÿ èç êàêèõ-ëèáî àïðèîðíûõ
ñîîáðàæåíèé ìîæíî ïðåäïîëîæèòü, ÷òî ýòî ðàñïðåäåëåíèå ïðèíàäëåæèò êàêîìóíèáóäü èçâåñòíîìó êëàññó ðàñïðåäåëåíèé. Íî, ïîñêîëüêó ëþáîå êîíêðåòíîå ðàñïðåäåëåíèå îïðåäåëÿåòñÿ íåêîòîðûì íàáîðîì ïàðàìåòðîâ, âîçíèêàåò çàäà÷à, âîïåðâûõ, ïðîâåðèòü ãèïîòåçó î òîì, ÷òî ðàñïðåäåëåíèå äàííîé âûáîðêè äåéñòâèòåëüíî ïðèíàäëåæèò äàííîìó êëàññó ðàñïðåäåëåíèé, à âî-âòîðûõ, íàéòè ÷èñëîâûå çíà÷åíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèÿ.
Âòîðàÿ çàäà÷à, íàõîæäåíèå ÷èñëîâûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, ðàçðåøèìà, åñëè â êà÷åñòâå ÷èñëîâûõ çíà÷åíèé ýòèõ ïàðàìåòðîâ ïðèíÿòü èõ ñòàòèñòè÷åñêèå îöåíêè, ðàññ÷èòàííûå ïî âûáîðî÷íûì çíà÷åíèÿì. Êàê ïðàâèëî, äàííûå ïàðàìåòðû ìîæíî âûðàçèòü ÷åðåç ïåðâûå ìîìåíòû ðàñïðåäåëåíèÿ (åñëè ïàðàìåòðû, îïðåäåëÿþùèå
ðàñïðåäåëåíèå, ñàìè íå ÿâëÿþòñÿ ýòèìè ìîìåíòàìè), ïîýòîìó è ñ âû÷èñëèòåëüíîé
òî÷êè çðåíèÿ îöåíèâàíèå òàêèõ ïàðàìåòðîâ ÿâëÿåòñÿ îòíîñèòåëüíî ïðîñòîé çàäà÷åé.
(Êîíå÷íî, ýòî óòâåðæäåíèå ñïðàâåäëèâî òîëüêî â òîì ñëó÷àå, åñëè íå âêëþ÷àòü â çàäà÷ó îöåíêè ïàðàìåòðîâ ïðîáëåìó íàäåæíîñòè è òî÷íîñòè ïîëó÷åííûõ îöåíîê.)
 ëþáîì ñëó÷àå ñíà÷àëà íàäî îïðåäåëèòü êëàññ ðàñïðåäåëåíèé, ê êîòîðîìó ìîæåò îòíîñèòüñÿ ðàñïðåäåëåíèå èìåþùåéñÿ âûáîðêè. Åñëè íå ïðèâëåêàòü êàêèõëèáî àïðèîðíûõ ïðåäïîëîæåíèé î êëàññå ðàñïðåäåëåíèé, òî îñòàåòñÿ îïðåäåëèòü
ýòîò êëàññ òîëüêî íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé, íàïðèìåð ïî âèäó ãèñòîãðàììû èëè ïîëèãîíà, ëèáî íà îñíîâàíèè íåêîòîðûõ âûáîðî÷íûõ ñòàòèñòèê (÷àùå
âñåãî äëÿ ýòîãî èñïîëüçóþòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà).
Ïðåäâàðèòåëüíîìó îïðåäåëåíèþ êëàññà ðàñïðåäåëåíèé ïîñâÿùåí ñëåäóþùèé ðàçäåë ýòîé ãëàâû. Íî äàëåå íåîáõîäèìî ïðîâåðèòü âûäâèíóòóþ ãèïîòåçó î òîì, ÷òî
âûáîðêà äåéñòâèòåëüíî èìååò ðàñïðåäåëåíèå èç äàííîãî êëàññà ðàñïðåäåëåíèé.
Ïðîâåðêà òàêîé ãèïîòåçû ðàññìîòðåíà â ïîñëåäóþùèõ äâóõ ðàçäåëàõ ãëàâû.
9.1. Предварительное определение класса
распределения
Îñíîâíûì “îðóäèåì” äëÿ ïðåäâàðèòåëüíîãî îïðåäåëåíèÿ êëàññà ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè ñëóæèò ãèñòîãðàììà èëè ïîëèãîí ÷àñòîò. Îäíàêî
äëÿ ýòîãî íåîáõîäèì “âîñïðèèì÷èâûé ãëàç” îïûòíîãî ñòàòèñòèêà, ïîñêîëüêó
ãèñòîãðàììû î÷åíü ÷óâñòâèòåëüíû ê ñòàòèñòè÷åñêîé ïðèðîäå âûáîðîê, ÷òî õîðîøî âèäíî íà ïðèìåðàõ ãèñòîãðàìì, ïîñòðîåííûõ íà îñíîâå îäíîé è òîé æå
âûáîðêè, íî ñ ðàçíûìè êîëè÷åñòâàìè êàðìàíîâ. Íà ðèñ. 9.1 è 9.2 ïîêàçàíû ãèñòîãðàììû òðåõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ (ñòàíäàðòíîå íîðìàëüíîå), îäèíàêîâûå îáúåìû (ïî 100 çíà÷åíèé), íî ïîñòðîåííûõ äëÿ ðàçíûõ
êîëè÷åñòâ ðàçáèåíèÿ èíòåðâàëà èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé (íà ðèñ. 9.1
èñïîëüçîâàíî 8 êàðìàíîâ, à íà ðèñ. 9.2 — 12 êàðìàíîâ).
Ðèñ. 9.1. Ãèñòîãðàììû òðåõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ
Ðèñ. 9.2. Ãèñòîãðàììû òåõ æå âûáîðîê ïðè äðóãîì êîëè÷åñòâå êàðìàíîâ
Глава 9. Подбор распределения
287
Îáðàùàåì âíèìàíèå íà íåñèììåòðè÷íîñòü ãèñòîãðàìì — äëÿ ëþáîé âûáîðêè,
èìåþùåé ñèììåòðè÷íîå ðàñïðåäåëåíèå, ãèñòîãðàììà áóäåò èìåòü îïðåäåëåííûé
ñêîñ â òó èëè èíóþ ñòîðîíó. Ýòîò ôàêò òåîðåòè÷åñêè îáîñíîâàí, íî äëÿ ïðàêòè÷åñêîãî àíàëèçà îò ýòîãî íå ëåã÷å. Åñëè âûáîðêà äîñòàòî÷íî áîëüøîãî ðàçìåðà,
ìîæíî ïîïðîáîâàòü ðàçáèòü åå íà äâå è äëÿ êàæäîé ïîëîâèíû ïîñòðîèòü ñâîþ
ãèñòîãðàììó. Åñëè ãèñòîãðàììû áóäóò èìåòü ñêîñ â ðàçíûå ñòîðîíû, òî ýòî ìîæåò ñëóæèòü “íàìåêîì” íà ñèììåòðè÷íîñòü ðàñïðåäåëåíèÿ. Íà îñíîâå ãèñòîãðàìì, ïîêàçàííûõ íà ðèñ. 9.1, åäèíñòâåííîå, ÷òî ìîæíî óòâåðæäàòü ñ áîëüøîé
äîëåé óâåðåííîñòè, — ÷òî ðàñïðåäåëåíèå âûáîðêè îäíîìîäàëüíî.
Èòàê, íóæåí “îïûòíûé ãëàç”, ÷òîáû íà îñíîâàíèè ãèñòîãðàìì (èëè ïîëèãîíîâ) ñäåëàòü âûâîäû î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè òîìó èëè èíîìó
êëàññó ðàñïðåäåëåíèé. ×òîáû ñäåëàòü àíàëîãè÷íûå âûâîäû íà îñíîâå ïðîáèòãðàôèêîâ, êîòîðûå ìû ñåé÷àñ ðàññìîòðèì, òàêæå íåîáõîäèì îïûò ñòàòèñòè÷åñêèõ èññëåäîâàíèé, íî çäåñü óæå âîçìîæíû è íåêîòîðûå ÷èñëîâûå îöåíêè áëèçîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ ê íåêîòîðîìó êëàññó ðàñïðåäåëåíèé.
9.1.1. Построение пробитграфиков
Ïðîáèò-ãðàôèê — ýòî ãðàôèê çàâèñèìîñòè y = Ô–1(Fn(x)), ãäå Fn — ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ, Ô–1 — ôóíêöèÿ, îáðàòíàÿ ê íåêîé ôóíêöèè
ðàñïðåäåëåíèÿ. Åñëè ðàñïðåäåëåíèå âûáîðêè ñîâïàäàåò ñ ðàñïðåäåëåíèåì Ô, òî
ïðîáèò-ãðàôèêîì äëÿ òàêîé âûáîðêè áóäåò ïðÿìàÿ ëèíèÿ. Ïî ñòåïåíè îòêëîíåíèÿ ïðîáèò-ãðàôèêà îò ïðÿìîé ëèíèè ñóäÿò î áëèçîñòè ðàñïðåäåëåíèÿ âûáîðêè
ê ðàñïðåäåëåíèþ Ô. Òàêèì îáðàçîì, äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêà íåîáõîäèìî
èìåòü ïðåäïîëîæåíèå î òîì, êàêîìó êëàññó ðàñïðåäåëåíèé ìîæåò ïðèíàäëåæàòü
ðàñïðåäåëåíèå âûáîðêè. Ïðîñòîòà ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ, à òàêæå ÷èñëîâûå ïîêàçàòåëè îòêëîíåíèÿ ïðîáèò-ãðàôèêà îò ïðÿìîé ëèíèè, ïîçâîëÿþò ïðîñìîòðåòü íåñêîëüêî âàðèàíòîâ ïðåäïîëàãàåìûõ ôóíêöèé ðàñïðåäåëåíèé è âûáðàòü èç íèõ íàèáîëåå ïîäõîäÿùèé.
Ñóùåñòâóåò íåñêîëüêî ñïîñîáîâ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ1. Ïåðâûé ñïîñîá
ïðåäïîëàãàåò âûáîðêó áîëüøîãî îáúåìà è ïðåäíàçíà÷åí èìåííî äëÿ ïîäáîðà òèïà
ðàñïðåäåëåíèÿ. Âòîðîé ñïîñîá ïðèìåíÿåòñÿ ê ìàëûì âûáîðêàì è ÷àñòî èñïîëüçóåòñÿ äëÿ îïðåäåëåíèÿ âûáðîñîâ (ñì. ðàçäåë 8.1). Ðàññìîòðèì ïåðâûé ñïîñîá.
Íà ðèñ. 9.3 ïîêàçàíû âûáîðêà (èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå è ïîñòðîåííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел), à òàêæå òàáëèöà ÷àñòîñòåé è íàêîïëåííûõ ÷àñòîñòåé, ðàññ÷èòàííàÿ ïî ýòîé âûáîðêå. (Î ñîçäàíèè òàêîé òàáëèöû ðå÷ü èäåò â ðàçäåëå 8.3.2.) Íàêîïëåííûå ÷àñòîñòè — ýòî
ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ, ãðàôèê êîòîðîé òàêæå ïîêàçàí íà ðèñ. 9.3.
 êà÷åñòâå àðãóìåíòîâ õ äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêà âîçüìåì ñåðåäèíû
èíòåðâàëîâ-êàðìàíîâ. Íà ðèñ. 9.4 ýòè çíà÷åíèÿ çàïèñàíû â ñòîëáöå Значения х.
Òåïåðü îñòàëîñü ïîäñ÷èòàòü çíà÷åíèÿ y, âû÷èñëÿåìûå ïî ôîðìóëå y = Ô–1(Fn(x)).
Çíà÷åíèÿ Fn(x) — ýòî çíà÷åíèÿ íàêîïëåííûõ ÷àñòîñòåé, çàïèñàííûå â ñòîëáöå
Накопленные частости. Ïîñòðîèì ïðîáèò-ãðàôèêè äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ è ðàâíîìåðíîãî, ñîñðåäîòî÷åííîãî íà èíòåðâàëå [–3, 3].  ïåðâîì ñëó÷àå èñïîëüçóåì ôóíêöèþ НОРМСТОБР (ñì. ðàçäåë 4.7.6). Âî âòîðîì ñëó÷àå, êàê íå1
Ðàíåå, â äîêîìïüþòåðíóþ ýïîõó, äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ ñóùåñòâîâàëà îñîáàÿ âåðîÿòíîñòíàÿ áóìàãà ñî ñïåöèàëüíîé øêàëîé, ðàññ÷èòàííîé äëÿ ðàçíûõ ðàñïðåäåëåíèé, â ÷àñòíîñòè äëÿ íîðìàëüíîãî è ëîãíîðìàëüíîãî.
288 Часть III. Анализ одномерных выборок
òðóäíî ïðîâåðèòü, ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ, èìååò âèä
Ô–1(õ) = 6(ó – 0,5). Ïîäñ÷èòàííûå çíà÷åíèÿ y äëÿ ïåðâîãî è âòîðîãî ñëó÷àåâ ïîêàçàíû íà ðèñ. 9.4 â ñòîëáöàõ Нормальное у è Равномерное у. Îòìåòèì, ÷òî
êðàéíèå çíà÷åíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ (ò.å. çíà÷åíèÿ 0 è 1)
äëÿ âû÷èñëåíèé íå èñïîëüçóþòñÿ. Ïðè÷èíû ýòîãî î÷åâèäíû — åñëè ðàñïðåäåëåíèå Ô îïðåäåëåíî íà áåñêîíå÷íîì èíòåðâàëå, òî ôóíêöèÿ Ô–1(õ) òàêæå äîëæíà
ïðèíèìàòü áåñêîíå÷íûå çíà÷åíèÿ ïðè õ = 0 è õ = 1.
Ðèñ. 9.3. Âûáîðêà è åå ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
Ðèñ. 9.4. Ïîñòðîåíèå ïðîáèò-ãðàôèêîâ
Глава 9. Подбор распределения
289
Äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ ñíà÷àëà ïðèìåíÿåòñÿ òèï äèàãðàììû
Точечная, à çàòåì ïðîâîäèòñÿ ïðÿìàÿ ëèíåéíîãî òðåíäà (ñì. ðàçäåë 6.2.1). Ïðîáèò-ãðàôèêè äëÿ íàøåãî ïðèìåðà ïîêàçàíû íà ðèñ. 9.4. Äàæå “íà ãëàç” âèäíî,
÷òî â äàííîì ñëó÷àå ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ áëèæå ê íîðìàëüíîìó
ðàñïðåäåëåíèþ, ÷åì ê ðàâíîìåðíîìó. Íî ÷òîáû ïîäòâåðäèòü ýòî, ìîæíî ïîäñ÷èòàòü ñòàíäàðòíóþ îøèáêó ïðèáëèæåíèÿ, ò.å. êâàäðàòíûé êîðåíü èç ñðåäíåé ñóììû
îñòàòêîâ (ñì. ðàçäåë 3.4.3). Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôóíêöèþ Excel
СТОШYX (ñì. ðàçäåë 4.9.3). Çíà÷åíèÿ ñòàíäàðòíîé îøèáêè ïðèáëèæåíèÿ ê íîðìàëüíîìó è ðàâíîìåðíîìó ðàñïðåäåëåíèÿì íà
ðèñ. 9.4 ïîêàçàíû â ÿ÷åéêàõ F10 è G10 ñîîòâåòñòâåííî. Ýòè çíà÷åíèÿ òàêæå ïîêàçûâàþò,
÷òî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ
áëèæå ê íîðìàëüíîìó ðàñïðåäåëåíèþ, ÷åì ê
ðàâíîìåðíîìó.
Âòîðîé ñïîñîá ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ
îòëè÷àåòñÿ îò îïèñàííîãî âûøå òîëüêî ñïîñîáîì ïîñòðîåíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ. Íà ðèñ. 9.5 ïîêàçàíû âûáîðêà
îáúåìîì 19 çíà÷åíèé, èìåþùàÿ ñòàíäàðòíîå
íîðìàëüíîå ðàñïðåäåëåíèå, è âàðèàöèîííûé
ðÿä,
ïîñòðîåííûé
ïî
ýòîé
âûáîðêå.
(Âàðèàöèîííûé ðÿä ïîñòðîåí ñ ïîìîùüþ ñîðòèðîâêè âûáîðî÷íûõ çíà÷åíèé; êîìàíäà
ДанныеÖСортировка.) Ïîñêîëüêó âåðîÿòíîñòü
òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå èç èíòåðâàëà (õ(i–1), õ(i)), îáðàçîâàííîãî
ïîñëåäîâàòåëüíûìè ïîðÿäêîâûìè ñòàòèñòèêàÐèñ. 9.5. Âû÷èñëåíèå çíà÷åíèé ýì- ìè õ(i–1) è õ(i), íå çàâèñèò îò ðàñïðåäåëåíèÿ
ïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ
è âñåãäà ðàâíà 1/(n + 1) (ñì. ðàçäåë 2.3.9),
çíà÷åíèå ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ Fn(x) ïðè õ = x(i) ðàâíî i/(n + 1). Ïî ýòîé ôîðìóëå ïîäñ÷èòàíû çíà÷åíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ íà ðèñ. 9.5 â ñòîëáöå Функция распределения.
Çíà÷åíèÿ y âû÷èñëÿþòñÿ òàêèì æå îáðàçîì, êàê ïðè ïåðâîì ñïîñîáå ïîñòðîåíèÿ
ïðîáèò-ãðàôèêà äëÿ ïðîâåðÿåìûõ ðàñïðåäåëåíèé. Çàòåì ñòðîÿòñÿ ïðîáèò-ãðàôèêè,
ïðÿìûå ëèíåéíîãî òðåíäà, à òàêæå ðàññ÷èòûâàþòñÿ ñòàíäàðòíûå îøèáêè ïðèáëèæåíèÿ. Ïðîáèò-ãðàôèêè äëÿ äàííîãî ïðèìåðà ïîêàçàíû íà ðèñ. 9.6. Çäåñü âèçóàëüíî ñëîæíî îïðåäåëèòü, ê êàêîìó ðàñïðåäåëåíèþ áëèæå ýìïèðè÷åñêîå ðàñïðåäåëåíèå. Îäíàêî çíà÷åíèÿ ñòàíäàðòíûõ îøèáîê ïðèáëèæåíèÿ ïî-ïðåæíåìó
ïîêàçûâàþò, ÷òî ýìïèðè÷åñêóþ ôóíêöèþ ðàñïðåäåëåíèÿ ëó÷øå ïðèáëèæàåò íîðìàëüíîå ðàñïðåäåëåíèå.
Ïîñòðîåííûå òàêèì ñïîñîáîì ïðîáèò-ãðàôèêè ÷àñòî èñïîëüçóþòñÿ äëÿ îïðåäåëåíèÿ âûáðîñîâ, — âûáîðî÷íûå çíà÷åíèÿ, êîòîðûå ïîðîæäàþò òî÷êè, äàëåêî
îòñòîÿùèå îò ëèíèè òðåíäà, ïîäîçðèòåëüíû êàê àðòåôàêòû. Ñóùåñòâåííî, ÷òî
çäåñü ìîæíî îïðåäåëèòü íå òîëüêî ýêñòðåìàëüíûå âûáðîñû, íî è âûáðîñû, êîòîðûå ëåæàò âíóòðè èíòåðâàëà èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé.
290 Часть III. Анализ одномерных выборок
9.2. Подбор функции распределения на основе
числовых характеристик выборки
Âèçóàëüíûå ìåòîäû ïîäáîðà ôóíêöèè ðàñïðåäåëåíèÿ íà îñíîâå ãèñòîãðàìì
è ïðîáèò-ãðàôèêîâ íå ñëèøêîì íàäåæíû è ìîãóò äàòü òîëüêî ïåðâîíà÷àëüíûå
ïðåäïîëîæåíèÿ î êëàññå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Áîëåå íàäåæíû âûâîäû íà îñíîâå ÷èñëîâûõ õàðàêòåðèñòèê âûáîðêè.
Ðèñ. 9.6. Ïîñòðîåííûå ïðîáèò-ãðàôèêè
Åñëè âû÷èñëåíû ïåðâûå ÷åòûðå âûáîðî÷íûõ ìîìåíòà, òî ìîæíî ïîäîáðàòü
ðàñïðåäåëåíèå èç ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà (ñì. ðàçäåë 1.5.12). Â Excel
äîñòàòî÷íî ñëîæíî ïîëíîñòüþ àâòîìàòèçèðîâàòü ïîäáîð ðàñïðåäåëåíèÿ èç ýòîé
ñèñòåìû áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé âðó÷íóþ, êîòîðûå â çíà÷èòåëüíîé ñòåïåíè çàâèñÿò îò òèïà ðàñïðåäåëåíèÿ. Îãðàíè÷åííûé îáúåì êíèãè, ê ñîæàëåíèþ,
íå ïîçâîëÿåò ïîäðîáíî ïîêàçàòü ýòîò ïðîöåññ. Îãðàíè÷èìñÿ îáùèì çàìå÷àíèåì:
ëþáîå ïðåäïîëîæåíèå î òîì, ÷òî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ïðèíàäëåæèò êàêîìó-ëèáî êëàññó ðàñïðåäåëåíèé, òðåáóåò ïîäòâåðæäåíèÿ íà îñíîâå
êðèòåðèåâ ïðîâåðêè ãèïîòåç, îïèñàííûõ â ïîñëåäóþùèõ ðàçäåëàõ ãëàâû.
Ê äðóãèì ÷èñëîâûì õàðàêòåðèñòèêàì ðàñïðåäåëåíèÿ, íà îñíîâå êîòîðûõ
ìîæíî äåëàòü íåêîòîðûå ïðåäïîëîæåíèÿ î òèïå ðàñïðåäåëåíèÿ, îòíîñÿòñÿ êîýôôèöèåíò àñèììåòðèè è êîýôôèöèåíò ýêñöåññà (ñì. ðàçäåëû 1.2.3 è 2.3.4). Íàïîìíèì, ÷òî ýòè êîýôôèöèåíòû ðàññ÷èòûâàþòñÿ ïî ôîðìóëàì
β1 =
µ3
µ
3
2
,
β2 =
µ4
−3,
µ 22
Глава 9. Подбор распределения
291
ãäå µ k =
1 n
∑ ( xi − x )k (k = 2, 3, 4) — âûáîðî÷íûå öåíòðàëüíûå ìîìåíòû (î âûn i =1
÷èñëåíèè òàêèõ ìîìåíòîâ ðå÷ü èäåò â ðàçäåëå 8.4). Åñëè ðàñïðåäåëåíèå âûáîðêè
áëèçêî ê íîðìàëüíîìó, òî âûáîðî÷íûå ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ýòèõ
êîýôôèöèåíòîâ âû÷èñëÿþòñÿ ñîîòâåòñòâåííî ïî ôîðìóëàì
s1 =
6(n − 2)
24n(n − 2)(n − 3)
è s2 =
.
(n + 1)(n + 3)
(n + 1)2 (n + 3)(n + 5)
Èíîãäà ðåêîìåíäóåòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà âû÷èñëÿòü ïî ôîðìóëàì
β1 =
k3
k
3
2
,
k3 =
β2 =
k4
µ
µ3
− 3 , ãäå k2 = 2 , k3 =
,
1
1  2 
k22

1−
1 −  1 − 
n
 n  n 
µ4
3µ 22
.
−
2  2  3   2  3 

1
−
1
−
1
−
1
−
1
−



 


 n + 1  n  n   n  n 
Åñëè âûáîðî÷íîå ðàñïðåäåëåíèå íîðìàëüíî èëè áëèçêî ê íîðìàëüíîìó, òî âû÷èñëåííûå ïî ïîñëåäíèì ôîðìóëàì β1 è β2 èìåþò àñèìïòîòè÷åñêè íîðìàëüíûå
ðàñïðåäåëåíèÿ ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è ñðåäíåêâàäðàòè÷åñêèìè îòêëîíåíèÿìè ñîîòâåòñòâåííî
s1 =
6n(n − 1)
24n(n − 1) 2
è s2 =
.
(n − 2)(n + 1)(n + 3)
(n − 3)(n − 2)(n + 3)(n + 5)
Ñ÷èòàåòñÿ, ÷òî åñëè âûïîëíÿåòñÿ íåðàâåíñòâî | β1 | ≤ 3s1, òî ðàñïðåäåëåíèå ñèììåòðè÷íî. Åñëè, êðîìå òîãî, äëÿ êîýôôèöèåíòà ýêñöåññà âûïîëíÿåòñÿ íåðàâåíñòâî | β2 | ≤ 5s2, ðàñïðåäåëåíèå ìîæíî ñ÷èòàòü íîðìàëüíûì. Ðåàëèçîâàòü ïðèâåäåííûå ôîðìóëû â Excel íå ïðåäñòàâëÿåò òðóäà.
Åñëè ãîâîðèòü î íîðìàëüíîì ðàñïðåäåëåíèè, òî äëÿ îïðåäåëåíèÿ ïðèíàäëåæíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ êëàññó íîðìàëüíûõ çàêîíîâ èñïîëüçóåòñÿ åùå
îäíà ÷èñëîâàÿ õàðàêòåðèñòèêà — òàê íàçûâàåìîå íîðìèðîâàííîå ñðåäíåå àáñîëþòíîå îòêëîíåíèå, îïðåäåëÿåìîå ôîðìóëîé δ =
M | X − MX |
. Ýòà âåëè÷èíà äëÿ
σ
2 / π = 0,79788. Âûáîðî÷íîå çíà÷åíèå
1 n
äàííîãî ïîêàçàòåëÿ âû÷èñëÿåòñÿ ïî ôîðìóëå δ =
∑ | xi − x | , ãäå s — âûáîðî÷ns i =1
íîðìàëüíîãî ðàñïðåäåëåíèÿ ðàâíà
íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå. Åñëè âûáîðî÷íîå ðàñïðåäåëåíèå íîðìàëüíî èëè áëèçêî ê íîðìàëüíîìó, òî ðàñïðåäåëåíèå δ àñèìïòîòè÷åñêè íîðìàëüíî
ñ ïàðàìåòðàìè
292 Часть III. Анализ одномерных выборок
Mδ =
 n +1 
Γ

2
 2 =
π(n − 1) Γ  n 
 
2
2
2
 1 
+ O 2  ,
1 +
π  8n − 9
 n 
2
  n +1 
Γ
1 2
1   n − 1   2  
1
1
1 

 =  0, 04507 − 0,0796 + O  2   ,
−
Dδ = 1 +  n(n − 1) + arcsin


n π
n − 1 
n
n
π  n 
 n 
 Γ  2  


ãäå
Ã(õ) —
ãàììà-ôóíêöèÿ
Ýéëåðà.
Åñëè
âûïîëíÿåòñÿ
íåðàâåíñòâî
|δ –
2 / π | ≤ 0,7/ n , òî âûáîðî÷íîå ðàñïðåäåëåíèå ìîæíî ñ÷èòàòü íîðìàëüíûì èëè
áëèçêèì ê íîðìàëüíîìó.
Î÷åâèäíî, ÷òî çíà÷åíèÿ β1 = 0, β2 = 0 è δ = 2 / π ìîãóò èìåòü ðàñïðåäåëåíèÿ, îòëè÷íûå îò íîðìàëüíîãî, è áëèçîñòü ê ýòèì çíà÷åíèÿì âûáîðî÷íûõ êîýôôèöèåíòîâ àñèììåòðèè, ýêñöåññà è íîðìèðîâàííîãî ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ íå ãàðàíòèðóåò íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Îïèñûâàåìûé
íèæå êðèòåðèé, îñíîâàííûé íà âûáîðî÷íûõ çíà÷åíèÿõ ýòèõ ïîêàçàòåëåé, ñëóæèò, ãëàâíûì îáðàçîì, íå äëÿ ïðîâåðêè íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ, à äëÿ âûÿâëåíèÿ îòêëîíåíèé âûáîðî÷íîãî ðàñïðåäåëåíèÿ îò íîðìàëüíîãî,
òî÷íåå — äëÿ ïðîâåðêè ãèïîòåç β1 ≠ 0, β2 ≠ 0 è δ ≠
2/ π .
9.2.1. Критерии отклонения распределения от нормального
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûìè ïàðàìåòðàìè m è σ.
Äëÿ ïðîâåðêè çíà÷åíèé êîýôôèöèåíòîâ β1, β2 è δ ìîæíî ñôîðìóëèðîâàòü íåñêîëüêî ãèïîòåç, ïðîâåðÿÿ èõ çíà÷åíèÿ ïîîäèíî÷êå, ïîïàðíî èëè ñîâìåñòíî äëÿ âñåõ
òðåõ êîýôôèöèåíòîâ. Ïîêàæåì òðè êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ
êîýôôèöèåíòîâ ïî îòäåëüíîñòè. Íî, ïîñêîëüêó âû÷èñëåíèÿ äëÿ âñåõ òðåõ êðèòåðèåâ
îäíîòèïíû, îïèñàíèå èõ ïðîâåäåì ïàðàëëåëüíî, îáîçíà÷àÿ êðèòåðèè êàê à, á è â.
Ãèïîòåçû
Í0: à) β1 = 0; á) β2 = 0; â) δ =
Í1: à) β1 ≠ 0; á) β2 ≠ 0; â) δ ≠
2/ π
2/ π
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ ïåðâûå ÷åòûðå âûáîðî÷íûõ ìîìåíòà è âûáîðî÷íîå ñðåäíåå àáñîëþòíîãî îòêëîíåíèÿ ïî ôîðìóëàì
Глава 9. Подбор распределения
293
x=
1 n
∑ xi ,
n i =1
dn =
sn2 =
1 n
∑ ( xi − x )2 ,
n − 1 i =1
µ3 =
1 n
∑ ( xi − x )3 ,
n i =1
µ4 =
1 n
∑ ( xi − x )4 ,
n i =1
1 n
∑ | xi − x | .
n i =1
2. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè:
à) âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè β1 =
á) âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà β2 =
â)
âûáîðî÷íîå
δ=
íîðìèðîâàííîå
µ3
sn3
;
µ4
−3;
sn2
ñðåäíåå
àáñîëþòíîãî
îòêëîíåíèÿ
dn
2
−
.
sn
π
3. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ïîäñ÷èòàííûõ â ïðåäûäóùåì ïóíêòå âåëè÷èí
à) âûáîðî÷íîãî êîýôôèöèåíòà àñèììåòðèè s1 =
á) âûáîðî÷íîãî êîýôôèöèåíòà ýêñöåññà s2 =
â)
âûáîðî÷íîãî
s3 =
íîðìèðîâàííîãî
6(n − 2)
;
(n + 1)(n + 3)
24n(n − 1) 2
;
(n − 3)(n − 2)(n + 3)(n + 5)
ñðåäíåãî
àáñîëþòíîãî
îòêëîíåíèÿ
1
1
 0, 04507 − 0, 0796  .
n
n
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 âñå
âûáîðî÷íûå êîýôôèöèåíòû èìåþò àñèìïòîòè÷åñêè íîðìàëüíûå ðàñïðåäåëåíèÿ
ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è ñîîòâåòñòâóþùèìè äèñïåðñèÿìè.
Íàõîäèòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ.
Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ:
äëÿ ãèïîòåçû à) — têð = ts1;
äëÿ ãèïîòåçû á) — têð = ts2;
äëÿ ãèïîòåçû â) — têð = ts3.
Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè |T| ≤ têð (Ò — îäíà èç ïîäñ÷èòàííûõ
â ï. 2 êðèòåðèàëüíûõ ñòàòèñòèê).  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ.
Êîììåíòàðèè
1. Âñå òðè êðèòåðèÿ ÿâëÿþòñÿ ïðèáëèæåííûìè. Èõ òî÷íîñòü çàâèñèò îò áëèçîñòè ðàñïðåäåëåíèÿ êðèòåðèàëüíûõ ñòàòèñòèê ê íîðìàëüíîìó äëÿ äàííîãî
îáúåìà âûáîðêè n. Ðàñïðåäåëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà àñèììåòðèè
è âûáîðî÷íîãî ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ ñõîäÿòñÿ ê íîðìàëüíîìó
äîñòàòî÷íî áûñòðî. Ñ÷èòàåòñÿ, ÷òî äëÿ ýòèõ âåëè÷èí äîñòàòî÷íàÿ òî÷íîñòü
äîñòèãàåòñÿ ïðè n > 50. Ðàñïðåäåëåíèå âûáîðî÷íîãî êîýôôèöèåíòà ýêñöåñ-
294 Часть III. Анализ одномерных выборок
ñà ñõîäèòñÿ ê íîðìàëüíîìó î÷åíü ìåäëåííî — ïðèåìëåìàÿ òî÷íîñòü äîñòèãàåòñÿ òîëüêî äëÿ âûáîðîê, èìåþùèõ íåñêîëüêî òûñÿ÷ çíà÷åíèé. Äëÿ ìàëûõ âûáîðîê ñóùåñòâóþò òàáëèöû îïðåäåëåíèÿ êðèòè÷åñêèõ çíà÷åíèé [4].
2. Åñëè âû÷èñëÿþòñÿ âñå òðè êðèòåðèÿ, ãèïîòåçó î íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëåäóåò îòâåðãíóòü, êîãäà õîòÿ áû ïî îäíîìó êðèòåðèþ îòâåðãàåòñÿ
íóëåâàÿ ãèïîòåçà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 9.7 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàíû âñå òðè îïèñàííûõ êðèòåðèÿ. Íà ýòîì æå ëèñòå ïðåäñòàâëåíû ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ. (Íå ïîêàçàíû ôîðìóëû äëÿ âû÷èñëåíèÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, ñðåäíåãî, äèñïåðñèè è ñòàíäàðòíîãî îòêëîíåíèÿ — îíè
âû÷èñëÿþòñÿ ïî ñòàíäàðòíûì ôîðìóëàì.)  êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà
âûáîðêà èç 100 çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû 2; çíà÷åíèå ñòåïåíè ñâîáîäû çàäàåòñÿ â ÿ÷åéêå G1 (î òîì, êàê ìîäåëèðîâàòü ðàñïðåäåëåíèå Ñòüþäåíòà, ðå÷ü èäåò â ðàçäåëå 7.2). Âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè íàçâàí Бета 1, âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà — Бета 2,
âûáîðî÷íîå ñðåäíåå àáñîëþòíîãî îòêëîíåíèÿ — Дельта.
Ðèñ. 9.7. Ôîðìóëû äëÿ êðèòåðèåâ
Êàê âèäíî íà ðèñ. 9.7, êðèòåðèè ïî êîýôôèöèåíòó ýêñöåññà è âûáîðî÷íîìó
ñðåäíåìó àáñîëþòíîãî îòêëîíåíèÿ îòêëîíÿþò ãèïîòåçó î íîðìàëüíîñòè ðàñïðåäåëåíèÿ âûáîðêè. Åñëè âûáîðêà áóäåò èìåòü ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû 6 (÷òîáû èçìåíèòü âûáîðêó, äîñòàòî÷íî èçìåíèòü çíà÷åíèå â ÿ÷åéêå
G1), òî, êàê ïîêàçàíî íà ðèñ. 9.8, ãèïîòåçó î íîðìàëüíîñòè ñëåäóåò îòâåðãíóòü
òîëüêî ïî êðèòåðèþ ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ. Òàêèì îáðàçîì, êðèòåðèé
ïî êîýôôèöèåíòó àñèììåòðèè â äàííîì ñëó÷àå ïðàêòè÷åñêè íå ðàáîòàåò, ïîñêîëüêó ðàñïðåäåëåíèå Ñòüþäåíòà ñèììåòðè÷íî, íî äðóãèå êðèòåðèè ìîãóò âûÿâèòü îòêëîíåíèå îò íîðìàëüíîñòè.
Глава 9. Подбор распределения
295
9.2.2. Критерий отклонения от распределения Пуассона
Åñëè ïàðàìåòðû ãèïîòåòè÷åñêîãî ðàñïðåäåëåíèÿ ñâÿçàíû êàêèì-ëèáî ñîîòíîøåíèåì (íàïðèìåð, äèñïåðñèÿ ðàñïðåäåëåíèÿ χ2 ïðè ëþáîì ÷èñëå ñòåïåíåé ñâîáîäû ðîâíî â äâà ðàçà áîëüøå ìàòåìàòè÷åñêîãî îæèäàíèÿ; ñì. ðàçäåë 1.5.5), òî
âûïîëíåíèå ýòîãî ñîîòíîøåíèÿ äëÿ ÷èñëîâûõ õàðàêòåðèñòèê äàííîé âûáîðêè
ìîæíî èñïîëüçîâàòü êàê ïîêàçàòåëü òîãî, ÷òî âûáîðî÷íîå ðàñïðåäåëåíèå ñîâïàäàåò ñ ãèïîòåòè÷åñêèì ðàñïðåäåëåíèåì. Íî ïîñêîëüêó òàêîå ñîîòíîøåíèå ìîæåò
èìåòü è ðàñïðåäåëåíèå äðóãîãî òèïà (êàê íóëåâûå çíà÷åíèÿ êîýôôèöèåíòîâ
àñèììåòðèè è ýêñöåññà â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ èç ïðåäûäóùåãî
ðàçäåëà), òî ÷àùå íåâûïîëíåíèå ýòîãî ñîîòíîøåíèÿ èñïîëüçóþò êàê êðèòåðèé
îòêëîíåíèÿ îò äàííîãî ãèïîòåòè÷åñêîãî ðàñïðåäåëåíèÿ. Íà òàêîé îñíîâå ïîñòðîåí êðèòåðèé îòêëîíåíèÿ îò ðàñïðåäåëåíèÿ Ïóàññîíà, ìàòåìàòè÷åñêîå îæèäàíèå
è äèñïåðñèè êîòîðîãî, êàê èçâåñòíî, ñîâïàäàþò (ñì. ðàçäåë 1.4.4).
Ðèñ. 9.8. Êðèòåðèè äëÿ íîâîé âûáîðêè
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé
ðàñïðåäåëåíèå Ïóàññîíà ñ íåèçâåñòíûì ïàðàìåòðîì λ.
Ãèïîòåçû
Í0: DX = MX
Í1: DX ≠ MX
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíåå è äèñïåðñèÿ
x=
1 n
1 n
xi , sn2 =
∑
∑ ( xi − x )2 .
n i =1
n − 1 i =1
296 Часть III. Анализ одномерных выборок
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
(n − 1) sn2
.
x
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 êðèòåðèàëüíàÿ ñòàòèñòèêà àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (n – 2) ñòåïåíüþ ñâîáîäû. Íàõîäÿòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 2)
ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Îí ïðèìåíÿåòñÿ, åñëè nx ≥ 10 .
2. Ïî ñóòè, ýòî êðèòåðèé ïðîâåðêè ãèïîòåçû î çíà÷åíèè äèñïåðñèè íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 2.4.1), ãäå òî÷íîå çíà÷åíèå äèñïåðñèè çàìåíåíî âûáîðî÷íûì ñðåäíèì. Îòñþäà òðåáîâàíèå, ÷òîáû nx áûëî äîñòàòî÷íî
áîëüøèì, —
òîãäà
ðàñïðåäåëåíèå
Ïóàññîíà
ìîæíî
àïïðîêñèìèðîâàòü íîðìàëüíûì ðàñïðåäåëåíèåì.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ î÷åâèäíà è íå âûçûâàåò çàòðóäíåíèé.
Äàëåå ðàññìîòðèì êðèòåðèé ñîãëàñèÿ χ2 (êðèòåðèé Ïèðñîíà) è êðèòåðèé Êîëìîãîðîâà.
9.3. Критерий χ
2
Òåîðåòè÷åñêîå îïèñàíèå ýòîãî êðèòåðèÿ äàíî â ðàçäåëå 2.4.3. Çäåñü ïðèâåäåì
åãî ïðàêòè÷åñêóþ ðåàëèçàöèþ äëÿ äâóõ ñëó÷àåâ: äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé è äëÿ äèñêðåòíûõ. Ñíà÷àëà ðàññìîòðèì ñëó÷àé äèñêðåòíûõ ðàñïðåäåëåíèé.
9.3.1. Критерий χ2 для дискретных распределений
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà èç äèñêðåòíîé ãåíåðàëüíîé ñîâîêóïíîñòè
ïðåäñòàâëåíà â âèäå ÷àñòîòíîé òàáëèöû, â êîòîðîé äëÿ êàæäîãî çíà÷åíèÿ õ1, õ2,
k
..., õk óêàçûâàþòñÿ ñîîòâåòñòâóþùèå ÷àñòîòû f1, f2, ..., fk, ïðè ýòîì
∑f
i
= n.
i =1
Ôóíêöèÿ ðàñïðåäåëåíèÿ F(u) ãåíåðàëüíîé ñîâîêóïíîñòè çàâèñèò îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ íåèçâåñòíû. (Íàïðèìåð, F(u) — ôóíêöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p, ïðè ýòîì n èçâåñòíî, à çíà÷åíèå
p íåèçâåñòíî. Òîãäà m = 2, à m1 = 1.)
Ãèïîòåçû
Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé
ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì2.
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
2
Çäåñü íå óêàçûâàåòñÿ, êàê çàäàåòñÿ ðàñïðåäåëåíèå: ñ ïîìîùüþ ôóíêöèè ðàñïðåäåëåíèÿ èëè
ôóíêöèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.2.1). Çäåñü ãîâîðèòñÿ ëèøü î òîì, ÷òî ðàñïðåäåëåíèå èçâåñòíî, ñïîñîá åãî çàäàíèÿ âëèÿåò òîëüêî íà äàëüíåéøèå âû÷èñëåíèÿ.
Глава 9. Подбор распределения
297
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1.  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò νi äëÿ âñåõ çíà÷åíèé õi. Åñëè ðàñïðåäåëåíèå çàäàåòñÿ ñ ïîìîùüþ
ôóíêöèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.2.1), òî νi = nði = nÐ(Õ = õi). Åñëè èçâåñòíà ôóíêöèÿ ðàñïðåäåëåíèÿ F(u) = Ð(Õ < u), òî νi = n[F(xi) – F(xi–1)].
 ïîñëåäíåì ñëó÷àå äëÿ i = 1 ν1 = nF(x1).
k
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑
i =1
( fi − ν i ) 2
.
νi
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû.
Íàõîäèòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.
 ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
 ñòàòèñòè÷åñêîé ëèòåðàòóðå ïðèâîäÿòñÿ ñïåöèàëüíûå òàáëèöû, ïî êîòîðûì
íà îñíîâå çíà÷åíèé Ò è èçâåñòíîãî ÷èñëà ñòåïåíåé ïîäñ÷èòàíû âåðîÿòíîñòè
αêð = Ð(Õ > Ò) (Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2). Òîãäà, åñëè αêð áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, ãèïîòåçà Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå îòêëîíÿåòñÿ. Ýòî æå çíà÷åíèå αêð ïîäñ÷èòûâàåò ôóíêöèÿ Excel
ХИ2ТЕСТ (ñì. ðàçäåë 4.8.4).
Êîììåíòàðèé. Ñóùåñòâóþò ðàçëè÷íûå ìíåíèÿ î òîì, êàêèìè äîëæíû áûòü âåëè÷èíû îæèäàåìûõ ÷àñòîò νi = nði (ñì., íàïðèìåð, [13]). “Ñðåäíåå” ìíåíèå òàêîâî,
÷òî áîëüøèíñòâî νi äîëæíî áûòü áîëüøå 5 è íå áîëåå 20% ýòèõ çíà÷åíèé ìîæåò
áûòü ìåíüøå 5. Åñëè ìàëûõ çíà÷åíèé ÷àñòîò ñëèøêîì ìíîãî, òî èõ ìîæíî îáúåäèíèòü. Òàêæå îòìåòèì, ÷òî åñëè îáúåì âûáîðêè äîñòàòî÷íî áîëüøîé, íàïðèìåð
n ≥ 50, è ïðè ýòîì k ≥ 10, òîãäà âîïðîñ î çíà÷åíèÿõ îæèäàåìûõ ÷àñòîò ñíèìàåòñÿ.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ. Íà ðèñ. 9.9 ïðèâåäåí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîêàçàíû âñå ýòàïû âûïîëíåíèÿ êðèòåðèÿ χ2.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà èç 100 çíà÷åíèé (ïîëó÷åííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных
чисел), èìåþùàÿ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 1. Äèàïàçîíó ÿ÷ååê,
ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка.  ñòîëáöå  ïîäñ÷èòàíû îáúåì âûáîðêè (ôîðìóëà =СЧЁТ(Выборка)), ñðåäíåå, ò.å. îöåíêà λ
(ôîðìóëà =СРЗНАЧ(Выборка)), è êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé â âûáîðêå
(ôîðìóëà ìàññèâà {=СУММ(1/СЧЁТЕСЛИ(Выборка;Выборка))}).  ñòîëáöå Ñ çàïèñàíû âñå ðàçëè÷íûå âûáîðî÷íûå çíà÷åíèÿ, äëÿ ÷åãî èñïîëüçîâàíà ôîðìóëà, ïðèâåäåííàÿ â ðàçäåëå 8.3.1 (â ýòîì ðàçäåëå ïîäðîáíî ðàññìîòðåí ïðîöåññ ñîçäàíèÿ
÷àñòîòíûõ òàáëèö). ×àñòîòû (ñòîëáåö D) ïîäñ÷èòûâàþòñÿ ñ ïîìîùüþ ôóíêöèè
ЧАСТОТА. Îæèäàåìûå ÷àñòîòû âû÷èñëÿþòñÿ ñ ïîìîùüþ ôóíêöèè ПУАССОН (ñì.
ðàçäåë 4.6.11).  ÿ÷åéêå Å2 çàïèñàíà ôîðìóëà =ПУАССОН(C2;$B$6;0)*$В$4, êîòîðàÿ çàòåì ñêîïèðîâàíà â ÿ÷åéêè Å3:Å7.
Äëÿ âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè Ò ìîæíî ïðèìåíèòü ôîðìóëó
ìàññèâà
{=СУММ(((Частоты-Ожидаемые_частоты)^2)/Ожидаемые_частоты)},
298 Часть III. Анализ одномерных выборок
åñëè èíòåðâàëó D2:D7, ñîäåðæàùåìó çíà÷åíèÿ ÷àñòîò, ïðèñâîèòü èìÿ Частоты,
à èíòåðâàëó E2:E7, ñîäåðæàùåìó çíà÷åíèÿ îæèäàåìûõ ÷àñòîò, — èìÿ
Ожидаемые_частоты.  ñòîëáöå G çàäàíî çíà÷åíèå óðîâíÿ çíà÷èìîñòè, ïîäñ÷èòàíû çíà÷åíèå ñòåïåíè ñâîáîäû (ôîðìóëà =B2-2) è têð, çíà÷åíèå êâàíòèëÿ ðàñïðåäåëåíèÿ χ2 (ôîðìóëà =ХИ2ОБР(G2;G4); îïèñàíèå ôóíêöèè ХИ2ОБР ïðèâåäåíî
â ðàçäåëå 4.7.8). Êàê âèäíî, â äàííîì ñëó÷àå âûáîðî÷íûå äàííûå íå ïðîòèâîðå÷àò ãèïîòåçå, ÷òî èõ ðàñïðåäåëåíèå ÿâëÿåòñÿ ðàñïðåäåëåíèåì Ïóàññîíà ñ ïàðàìåòðîì λ = 1,12.  ÿ÷åéêå G8 âû÷èñëåíî êðèòè÷åñêîå çíà÷åíèå αêð (ôîðìóëà
=ХИ2ТЕСТ(Частоты;Ожидаемые_частоты)). Ïîñêîëüêó αêð, ðàâíîå 0,78725, çíà÷èòåëüíî áîëüøå óðîâíÿ çíà÷èìîñòè 0,05, íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.
9.3.2. Критерий χ2 для непрерывных распределений
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u). Ôóíêöèÿ F(u) çàâèñèò îò m ïàðàìåòðîâ, èç êîòîðûõ m1
ïàðàìåòðîâ íåèçâåñòíî.
Ðèñ. 9.9. Êðèòåðèé χ2 äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ
Ãèïîòåçû
Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé
ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì.
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé ðàçáèâàåòñÿ íà k íåïåðåñåêàþùèõñÿ èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 = (õ(2), õ(3)), ..., ∆k = (õ(k), õ(k+1)).
(Îïðåäåëåíèå òàêèõ èíòåðâàëîâ ðàññìîòðåíî íèæå.)
Глава 9. Подбор распределения
299
2. Ïîäñ÷èòûâàåòñÿ, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé ïîïàëî â êàæäûé èíòåðâàë ∆i. Ïîëó÷àåì ðÿä ÷àñòîò n1, n2, ..., nk (ïðè ýòîì äîëæíî âûïîëíÿòüñÿ
ðàâåíñòâî n1 + n2 +...+ nk = n, ãäå n — îáúåì âûáîðêè).
3. Â ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå νi
= n[F(x(i+1)) – F(x(i))] âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò, ò.å. êîëè÷åñòâà ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i)
è x(i+1) — ãðàíèöû èíòåðâàëà ∆i.
k
4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑
i =1
(ni − ν i ) 2
.
νi
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû.
Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êðèòåðèÿ têð — êâàíòèëü ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû (äëÿ íàõîæäåíèÿ êâàíòèëÿ
ìîæíî èñïîëüçîâàòü ôóíêöèþ ХИ2ОБР). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.
 ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Íà îñíîâå çíà÷åíèÿ Ò ìîæíî òàêæå âû÷èñëèòü âåðîÿòíîñòü αêð = Ð(Õ > Ò)
(Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ ÷èñëîì ñòåïåíåé ñâîáîäû k – m1 – 1). Òîãäà, åñëè αêð áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, ãèïîòåçà
Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå îíà îòêëîíÿåòñÿ. Çíà÷åíèå αêð ïîäñ÷èòûâàåò ôóíêöèÿ Excel ХИ2ТЕСТ (ñì. ðàçäåë 4.8.4).
Êîììåíòàðèè
1. Ðàçáèåíèå îáëàñòè âûáîðî÷íûõ çíà÷åíèé íà èíòåðâàëû ∆k = (õ(k), õ(k+1))
ìîæíî âûïîëíèòü ìíîãèìè ñïîñîáàìè. Âîò äâà îñíîâíûõ ïîäõîäà. Èíòåðâàëû ∆k ïîäáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû âñå îæèäàåìûå ÷àñòîòû νk
áûëè ðàâíûìè (äðóãèìè ñëîâàìè, ÷òîáû áûëè ðàâíû âåðîÿòíîñòè ïîïàäàíèÿ âûáîðî÷íûõ çíà÷åíèé â ýòè èíòåðâàëû), ëèáî èíòåðâàëû ∆k ñòðîÿòñÿ ðàâíîé äëèíû. Ïåðâûé ïîäõîä èìååò îïðåäåëåííûå ïðåèìóùåñòâà,
ïîñêîëüêó ìîæíî çàðàíåå çàäàòü çíà÷åíèÿ νk, íàïðèìåð, ðàâíûìè 5
èëè 6. Îäíàêî â òàêîì ñëó÷àå èíòåðâàëû ∆k èìåþò ðàçíûå äëèíû (êðîìå
ñëó÷àÿ ðàâíîìåðíîãî ðàñïðåäåëåíèÿ) è ïðè èõ ïîñòðîåíèè ìîãóò âîçíèêíóòü îïðåäåëåííûå ñëîæíîñòè. Íà ïðàêòèêå ÷àùå èñïîëüçóåòñÿ âòîðîé
ïîäõîä, ïðè êîòîðîì èíòåðâàëû ∆k ïðåäïîëàãàþòñÿ ðàâíîé äëèíû. Çäåñü
ñóùåñòâóåò ñâîÿ ïðîáëåìà îïðåäåëåíèÿ êîëè÷åñòâà òàêèõ èíòåðâàëîâ.
Ïðàêòè÷åñêîå ïðàâèëî ðåêîìåíäóåò ïåðâîíà÷àëüíî âûáèðàòü äëèíó èíòåðâàëîâ ðàâíîé ïðèìåðíî 0,4s, ãäå s — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå âûáîðêè. Ïîñëå âû÷èñëåíèÿ îæèäàåìûõ ÷àñòîò êîëè÷åñòâî èíòåðâàëîâ (è, ñîîòâåòñòâåííî, äëèíà èíòåðâàëîâ) ìîæåò áûòü èçìåíåíî òàêèì
îáðàçîì, ÷òîáû ðàññ÷èòàííûå âåëè÷èíû îæèäàåìûõ ÷àñòîò áûëè íå
ìåíüøå íåêîòîðîé çàðàíåå çàäàííîé âåëè÷èíû (â êà÷åñòâå òàêîé âåëè÷èíû ÷àùå âñåãî îïÿòü âûñòóïàåò “ìàãè÷åñêîå” ÷èñëî 5). Ïîâòîðèì ðåêîìåíäàöèþ èç êîììåíòàðèÿ ê ýòîìó êðèòåðèþ äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé: áîëüøèíñòâî νi äîëæíî áûòü íå ìåíüøå 5 è íå áîëåå 20% ýòèõ
çíà÷åíèé ìîæåò áûòü ìåíüøå 5 (íî îáÿçàòåëüíî íå ìåíüøå 1).
300 Часть III. Анализ одномерных выборок
2. Íåîáõîäèìî ïîìíèòü, ÷òî êðèòåðèé χ2 ÿâëÿåòñÿ âñå-òàêè ïðèáëèæåííûì.
Ïîýòîìó íàäî ïðîÿâëÿòü “áäèòåëüíîñòü” è îñòîðîæíîñòü, êîãäà çíà÷åíèå
êðèòåðèàëüíîé ñòàòèñòèêè Ò áëèçêî ê êðèòè÷åñêîìó çíà÷åíèþ têð. Êðîìå
òîãî, ýòîò êðèòåðèé íå ó÷èòûâàåò ïîðÿäîê âûáîðî÷íûõ çíà÷åíèé
(êðèòåðèé íå ïî÷óâñòâóåò íååñòåñòâåííîñòü âûáîðêè, åñëè, íàïðèìåð, âñå
ìàëûå âûáîðî÷íûå çíà÷åíèÿ ñîñðåäîòî÷åíû â íà÷àëå âûáîðêè, à áîëüøèå — â êîíöå). Ïîýòîìó, åñëè åñòü âîçìîæíîñòü, äëÿ ïðîâåðêè ãèïîòåçû
î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè çàäàííîìó êëàññó ðàñïðåäåëåíèé ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé è áîëåå ÷óâñòâèòåëüíûé êðèòåðèé
Êîëìîãîðîâà (ñì. ñëåäóþùèé ðàçäåë).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Êàê óêàçûâàëîñü âûøå â êîììåíòàðèÿõ, ñóùåñòâóþò äâà ïîäõîäà ê îïðåäåëåíèþ èíòåðâàëîâ. Ïðè ïåðâîì ïîäõîäå èíòåðâàëû ñòðîÿòñÿ òàêèì îáðàçîì, ÷òîáû
îæèäàåìûå ÷àñòîòû äëÿ âñåõ èíòåðâàëîâ áûëè ðàâíûìè (ñëó÷àé ðàâíîâåðîÿòíûõ
èíòåðâàëîâ). Ïðè âòîðîì ïîäõîäå âñå èíòåðâàëû èìåþò ðàâíûå äëèíû. Ïîêàæåì
ðåàëèçàöèþ êðèòåðèÿ ñ èñïîëüçîâàíèåì ýòèõ äâóõ ïîäõîäîâ ê îïðåäåëåíèþ è ïîñòðîåíèþ èíòåðâàëîâ. Ðàññìîòðèì ñíà÷àëà ïåðâûé ïîäõîä.
Íà ðèñ. 9.10 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè äëÿ ðåàëèçàöèè êðèòåðèÿ.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà îáúåìîì 100
çíà÷åíèé, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå (ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел). Äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка.  ñòîëáöå  ñ ïîìîùüþ ñòàíäàðòíûõ ôîðìóë ïîäñ÷èòàíû îñíîâíûå õàðàêòåðèñòèêè âûáîðêè: ñðåäíåå,
ñòàíäàðòíîå îòêëîíåíèå, ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ, êîëè÷åñòâî
âûáîðî÷íûõ çíà÷åíèé. Çàäàåì âåëè÷èíó îæèäàåìîé ÷àñòîòû. Ïóñòü ýòî çíà÷åíèå ðàâíî 5 (ÿ÷åéêà Â12). Ïîäñ÷èòûâàåì îæèäàåìóþ ÷àñòîñòü (ôîðìóëà
=B12/B10 â ÿ÷åéêå Â14) è êîëè÷åñòâî èíòåðâàëîâ (ôîðìóëà =B10/B12 â ÿ÷åéêå
Â16). Ïóñòü íóëåâàÿ ãèïîòåçà ñîñòîèò â òîì, ÷òî ãåíåðàëüíàÿ ñîâîêóïíîñòü
èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. (Îáðàùàåì âíèìàíèå íà òî, ÷òî
çäåñü ïàðàìåòðû ãèïîòåòè÷åñêîãî (ñòàíäàðòíîãî íîðìàëüíîãî) ðàñïðåäåëåíèÿ
íå îïðåäåëÿþòñÿ íà îñíîâå âûáîðî÷íûõ çíà÷åíèé, ïîýòîìó êîëè÷åñòâî ñòåïåíåé ñâîáîäû áóäåò íà åäèíèöó ìåíüøå êîëè÷åñòâà èíòåðâàëîâ.)
Äàëåå íåîáõîäèìî îïðåäåëèòü ãðàíèöû èíòåðâàëîâ. Ýòî ìîæíî ñäåëàòü ñ ïîìîùüþ îäíîé ôîðìóëû ìàññèâà, èñïîëüçóþùåé ôóíêöèè СТРОКА è ДВССЫЛ
(êàê â ðàçäåëå 8.3.2 äëÿ îïðåäåëåíèÿ èíòåðâàëîâ ïðè ñîçäàíèè ãèñòîãðàìì).
Çäåñü (äëÿ ðàçíîîáðàçèÿ) èñïîëüçóåì ïðîñòûå è “ïðîçðà÷íûå” ôîðìóëû, íî çà
ýòó ïðîñòîòó çàïëàòèì äîïîëíèòåëüíûì ñòîëáöîì çíà÷åíèé — â ñòîëáöå Ñ ââåäåíû íîìåðà èíòåðâàëîâ îò 1 äî 20. Òîãäà ãðàíèöó ïåðâîãî èíòåðâàëà (ÿ÷åéêà D2)
âû÷èñëÿåò ôîðìóëà =НОРМСТОБР(C2*$B$14), êîòîðàÿ çàòåì ðàñïðîñòðàíÿåòñÿ
âíèç äî ÿ÷åéêè D20. Îáðàùàåì âíèìàíèå, ÷òî äëÿ èíòåðâàëà 20 ýòà ôîðìóëà íå
èñïîëüçóåòñÿ; äëÿ ýòîãî èíòåðâàëà áóäåò ïîäñ÷èòàíî ÷èñëî âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïðåâûøàþò âåðõíþþ ãðàíèöó 19-ãî èíòåðâàëà. Äëÿ âû÷èñëåíèÿ
÷àñòîò ïðèìåíÿåòñÿ ôîðìóëà ìàññèâà {=ЧАСТОТА(Выборка;Интервалы)} (çäåñü
äèàïàçîí ÿ÷ååê D2:D20 íàçâàí Интервалы). Ïîä÷åðêíåì, ÷òî ïðè ââîäå ýòîé
ôîðìóëû íåîáõîäèìî âûäåëèòü äèàïàçîí Å2:Å21, à íå Å2:Å20.
Ïîñêîëüêó â äàííîì ñëó÷àå ôîðìàëüíî íåò ìàññèâà îæèäàåìûõ ÷àñòîò, ôóíêöèÿ ХИ2ТЕСТ íå ïðèìåíèìà. Ïîýòîìó âû÷èñëèì êðèòåðèàëüíóþ ñòàòèñòèêó Ò
Глава 9. Подбор распределения
301
è êðèòè÷åñêîå çíà÷åíèå têð, ïî êîòîðûì áóäåì ñóäèòü î çíà÷èìîñòè íóëåâîé ãèïîòåçû. Ñòàòèñòèêà Ò âû÷èñëåíà â ÿ÷åéêå F2 ñ èñïîëüçîâàíèåì ôîðìóëû ìàññèâà
{=СУММ(((Частота-$B$12)^2)/$B$12)}.
Çäåñü äèàïàçîíó ÷àñòîò Å2:Å21 ïðèñâîåíî èìÿ Частота è â ÿ÷åéêå Â12 ñîäåðæèòñÿ
çàäàííîå çíà÷åíèå îæèäàåìûõ ÷àñòîò.  ÿ÷åéêå F4 çàäàíî çíà÷åíèå óðîâíÿ çíà÷èìîñòè, â ÿ÷åéêå F6 âû÷èñëåíî êîëè÷åñòâî ñòåïåíåé ñâîáîäû (íà åäèíèöó ìåíüøå
êîëè÷åñòâà èíòåðâàëîâ). Êðèòè÷åñêîå çíà÷åíèå têð çàïèñàíî â ÿ÷åéêå F8; îíî âû÷èñëÿåòñÿ ïî ôîðìóëå =ХИ2ОБР(F4;F6). Ñðàâíèâ çíà÷åíèÿ â ÿ÷åéêàõ F2 è F8, ïðèõîäèì ê âûâîäó, ÷òî ïðè çàäàííîì óðîâíå çíà÷èìîñòè íåò îñíîâàíèé îòâåðãàòü íóëåâóþ ãèïîòåçó. Êðèòè÷åñêîå çíà÷åíèå âåðîÿòíîñòè αêð, êîòîðîå îáû÷íî âû÷èñëÿåò
ôóíêöèÿ ХИ2ТЕСТ, ìîæíî âû÷èñëèòü ïî ôîðìóëå =ХИ2РАСП(F2;F6) (ÿ÷åéêà F10).
Ýòî çíà÷åíèå òàêæå ïîêàçûâàåò, ÷òî ñëåäóåò ïðèíÿòü íóëåâóþ ãèïîòåçó.
Ðèñ. 9.10. Êðèòåðèé χ2 äëÿ ðàâíîâåðîÿòíûõ èíòåðâàëîâ
Òåïåðü ðàññìîòðèì äàííûé êðèòåðèé äëÿ ñëó÷àÿ ðàâíûõ èíòåðâàëîâ. Íà
ðèñ. 9.11 ïðåäñòàâëåí ðàáî÷èé ëèñò, ñîäåðæàùèé òó æå âûáîðêó, ÷òî è íà
ðèñ. 9.10. Äëèíó èíòåðâàëà âûáèðàåì ðàâíîé 0,4 ñòàíäàðòíîãî îòêëîíåíèÿ,
ò.å. ðàâíîé 0,4 (ÿ÷åéêà Â12). Äàëåå îïðåäåëÿåì íèæíþþ ãðàíèöó èíòåðâàëîâ; îíà äîëæíà áûòü áîëüøå ìèíèìàëüíîãî âûáîðî÷íîãî çíà÷åíèÿ. Çäåñü
ýòà íèæíÿÿ ãðàíèöà âûáðàíà ðàâíîé –2 (ÿ÷åéêà Â14). Âåðõíÿÿ ãðàíèöà èíòåðâàëîâ äîëæíà áûòü ìåíüøå ìàêñèìàëüíîãî çíà÷åíèÿ; ïðèíèìàåì âåðõíþþ
ãðàíèöó ðàâíîé 2 (ÿ÷åéêà Â16). Âû÷èñëÿåì êîëè÷åñòâî èíòåðâàëîâ (ôîðìóëà
=(B16-B14)/B12 â ÿ÷åéêå Â18). Çíà÷åíèÿ íèæíåé è âåðõíåé ãðàíèö âûáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû âû÷èñëåííîå êîëè÷åñòâî èíòåðâàëîâ áûëî öåëûì
÷èñëîì. Îòìåòèì, ÷òî îáùåå ÷èñëî èíòåðâàëîâ áóäåò íå 10, à 12, ïîñêîëüêó
302 Часть III. Анализ одномерных выборок
èìåþòñÿ åùå äâà èíòåðâàëà: îäèí, ñîäåðæàùèé çíà÷åíèÿ, ìåíüøèå íèæíåé
ãðàíèöû, è âòîðîé, ñîäåðæàùèé çíà÷åíèÿ, áîëüøèå âåðõíåé ãðàíèöû.
 ñòîëáöå D âû÷èñëÿþòñÿ ãðàíèöû èíòåðâàëîâ.  ÿ÷åéêå D2 çàïèñàíà ôîðìóëà =$B$14+(C2-1)*$B$12, êîòîðàÿ çàòåì êîïèðóåòñÿ â äèàïàçîí D3:D12.
Äèàïàçîíó D2:D12 ïðèñâîåíî èìÿ Границы.
Òåïåðü ïîäñ÷èòûâàþòñÿ çíà÷åíèÿ âûáîðî÷íûõ ÷àñòîò (ñòîëáåö Å, ôîðìóëà
ìàññèâà {=ЧАСТОТА(Выборка;Границы)}) è îæèäàåìûõ ÷àñòîò (ñòîëáåö F). Äëÿ
âû÷èñëåíèÿ îæèäàåìûõ ÷àñòîò èñïîëüçóþòñÿ òàêèå ôîðìóëû: â ÿ÷åéêå F2 —
=НОРМСТРАСП(D2)*$B$10, â ÿ÷åéêå F3 — =(НОРМСТРАСП(D3)-НОРМСТРАСП
(D2))*$B$10, êîòîðàÿ êîïèðóåòñÿ â äèàïàçîí F4:F12.  ÿ÷åéêå F13 çàïèñàíà ôîðìóëà =(1-НОРМСТРАСП(D12))*$B$10.
Äàëåå âû÷èñëÿåòñÿ çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè Ò ïî ôîðìóëå ìàññèâà (ÿ÷åéêà G2)
{=СУММ(((Частота-Ожидаемые_частоты)^2)/Ожидаемые_частоты)}.
 ÿ÷åéêå G8 âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð ïî ôîðìóëå
=ХИ2ОБР(G4;G6), à â ÿ÷åéêå G10 — êðèòè÷åñêîå çíà÷åíèå âåðîÿòíîñòè αêð ïî
ôîðìóëå =ХИ2ТЕСТ(Частота;Ожидаемые_частоты). Ñðàâíåíèå âû÷èñëåííûõ
çíà÷åíèé Ò è têð , à òàêæå çíà÷åíèÿ óðîâíÿ çíà÷èìîñòè ñî çíà÷åíèåì αêð ïîêàçûâàþò, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò íóëåâîé ãèïîòåçå. Îòìåòèì òàêæå, ÷òî çíà÷åíèå αêð çäåñü íàìíîãî ìåíüøå, ÷åì â ïðåäûäóùåì
ïðèìåðå. Ýòî ãîâîðèò î òîì, ÷òî äàííûé êðèòåðèé â ñëó÷àå ðàâíîâåðîÿòíûõ
èíòåðâàëîâ áîëåå òî÷åí, ÷åì â ñëó÷àå ðàâíûõ èíòåðâàëîâ.
Ðèñ. 9.11. Êðèòåðèé χ2 äëÿ ðàâíûõ èíòåðâàëîâ
Глава 9. Подбор распределения
303
9.4. Критерий Колмогорова
Äàííûé êðèòåðèé áîëåå ìîùíûé, ÷åì êðèòåðèé χ2. Îí ïðåäïîëàãàåò íåïðåðûâíîñòü ðàñïðåäåëåíèé. Îäíàêî íà ïðàêòèêå êðèòåðèé ÷àñòî èñïîëüçóåòñÿ äëÿ
ñãðóïïèðîâàííûõ äàííûõ (ò.å. äàííûõ, ïðåäñòàâëåííûõ â âèäå ÷àñòîòíîé òàáëèöû) è äàæå äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé. Îáùåå îïèñàíèå ýòîãî êðèòåðèÿ äàíî
â ðàçäåëå 2.4.3.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ
çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåíèå
êîòîðîé ïðåäïîëàãàåòñÿ íåïðåðûâíûì.
Ãèïîòåçû
Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé
ðàñïðåäåëåíèÿ F(u).
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî âûáîðêå õ1, õ2, ..., õn ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n).
2. Âû÷èñëÿþòñÿ êóìóëÿòèâíûå ðàçíîñòè: Dm+ =
m
m −1
− F ( x( m ) ) è Dm− = F ( x( m ) ) −
,
n
n
m = 1, 2, ..., n.
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Dn = max( Dm+ , Dm− ) .
1≤ m ≤ n
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Êîëìîãîðîâà–Ñìèðíîâà.
Íàõîäèòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Äëÿ íàõîæäåíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà ñóùåñòâóþò ñïåöèàëüíûå òàáëèöû, êîòîðûå ïðèâåäåíû âî ìíîãèõ êíèãàõ ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå. Ïðè n ≥ 10 è 0,01 ≤ α ≤ 0,2 ìîæíî âîñïîëüçîâàòüñÿ
ïðèáëèæåííîé ôîðìóëîé äëÿ âû÷èñëåíèÿ têð: tкр ≈
− ln(0,5α) 1
−
[4].
2n
6n
2.  ëèòåðàòóðå ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå ìîæíî âñòðåòèòü óïðîùåííûé
ïîäõîä ê âû÷èñëåíèþ êðèòåðèàëüíîé ñòàòèñòèêè Dn , êîòîðóþ ðåêîìåíäóþò âû÷èñëÿòü ëèáî êàê Dn = max( Dm+ ) , ëèáî êàê Dn = max( Dm− ) . Êàê óêàçà1≤ m ≤ n
1≤ m ≤ n
íî â [4], ýòî íåïðàâèëüíûé ïîäõîä, êîòîðûé ìîæåò ïðèâåñòè ê íåâåðíûì
ðåçóëüòàòàì, îñîáåííî ïðè ìàëûõ îáúåìàõ âûáîðêè.
3.  ýòîì êðèòåðèè ïðåäïîëàãàåòñÿ, ÷òî ãèïîòåòè÷åñêîå ðàñïðåäåëåíèå èçâåñòíî òî÷íî. Åñëè æå ïàðàìåòðû äàííîãî ðàñïðåäåëåíèÿ îïðåäåëÿþòñÿ íà
îñíîâå âûáîðî÷íûõ çíà÷åíèé, òî íåîáõîäèìà îñòîðîæíîñòü â ïðèìåíåíèè
êðèòåðèÿ, îñîáåííî â ñëó÷àå, êîãäà çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè
áëèçêî ê êðèòè÷åñêîìó çíà÷åíèþ.
304 Часть III. Анализ одномерных выборок
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Äëÿ èëëþñòðàöèè ïðèìåíåíèÿ îïèñûâàåìîãî êðèòåðèÿ èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì ðàçäåëå. Çäåñü òàêæå ïðîâåðèì ãèïîòåçó, ÷òî ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Âûáîðêà, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïîêàçàíà íà
ðèñ. 9.12 â ñòîëáöå À. Äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ,
ïðèñâîåíî èìÿ Выборка. Ýòîò äèàïàçîí ñêîïèðîâàí â ñòîëáåö Â, â êîòîðîì ïðîâåäåíà åãî ñîðòèðîâêà â ïîðÿäêå âîçðàñòàíèÿ.  ðåçóëüòàòå ïîëó÷åí âàðèàöèîííûé ðÿä.  ñòîëáöå Ñ çàïèñàíû ðàíãè âûáîðî÷íûõ çíà÷åíèé. Ïîñêîëüêó äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé âåðîÿòíîñòü ïîÿâëåíèÿ îäèíàêîâûõ çíà÷åíèé
â âûáîðêå ðàâíà íóëþ, ðàíãè â äàííîì ñëó÷àå ïðîñòî ñîâïàäàþò ñ íîìåðàìè ïîðÿäêîâûõ ñòàòèñòèê. Ïîýòîìó èõ ìîæíî íå âû÷èñëÿòü, à ââîäèòü êàê ÷ëåíû
àðèôìåòè÷åñêîé ïðîãðåññèè ñ øàãîì 1 è íà÷àëüíûì çíà÷åíèåì 1 (òàêàÿ ïðîãðåññèÿ ââîäèòñÿ ñ ïîìîùüþ êîìàíäû ПравкаÖЗаполнитьÖПрогрессия).
Äàëåå âû÷èñëÿþòñÿ êóìóëÿòèâíûå ðàçíîñòè Dm+ è Dm− (çàïèñàíû â ñòîëáöå D
è Å; ñîîòâåòñòâóþùèì äèàïàçîíàì ïðèñâîåíû èìåíà D_плюс è D_минус). Äëÿ âû÷èñëåíèÿ Dm+ â ÿ÷åéêå D2 ââåäåíà ôîðìóëà =C2/СЧЁТ(Выборка)-НОРМСТРАСП(B2),
êîòîðàÿ çàòåì ñêîïèðîâàíà â îñòàëüíûå ÿ÷åéêè äèàïàçîíà D_плюс. Àíàëîãè÷íî
äëÿ âû÷èñëåíèÿ Dm− â ÿ÷åéêó Å2 çàïèñàíà ôîðìóëà =НОРМСТРАСП(B2)-(C21)/СЧЁТ(Выборка), êîòîðàÿ êîïèðóåòñÿ âíèç íà âåñü äèàïàçîí D_минус.
Ðèñ. 9.12. Ðåàëèçàöèÿ êðèòåðèÿ Êîëìîãîðîâà
Глава 9. Подбор распределения
305
Çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè Dn âû÷èñëÿåòñÿ â ÿ÷åéêå F2 ïî ôîðìóëå
=МАКС(D_плюс;D_минус), à êðèòè÷åñêîå çíà÷åíèå têð — â ÿ÷åéêå F2 ïî ôîðìóëå
=КОРЕНЬ(-LN(0,5*F4)/(2*СЧЁТ(Выборка)))-1/(6*СЧЁТ(Выборка)).
Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, ïðè çàäàííîì óðîâíå çíà÷èìîñòè ñëåäóåò
ïðèíÿòü ãèïîòåçó î ñòàíäàðòíîì íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè.
306 Часть III. Анализ одномерных выборок
Глава
10
Интервальное оценивание
параметров распределения
Â
ãëàâå 8 â êà÷åñòâå îäíîãî èç ýòàïîâ ïðåäâàðèòåëüíîãî àíàëèçà îïèñàíî âû÷èñëåíèå òî÷å÷íûõ îöåíîê ïàðàìåòðîâ âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Íî äëÿ
“ïîëíîöåííîé” îöåíêè íåèçâåñòíûõ ïàðàìåòðîâ òîëüêî òî÷å÷íûõ îöåíîê íåäîñòàòî÷íî — íåîáõîäèìà êàêàÿ-íèáóäü ìåðà òî÷íîñòè ýòèõ îöåíîê. Êàê óêàçûâàëîñü â ãëàâå 2, òàêîé ìåðîé òî÷íîñòè ìîãóò ñëóæèòü äîâåðèòåëüíûå èíòåðâàëû.  ðàçäåëå 2.2
ãëàâû 2 äàíû îáùèå îïðåäåëåíèÿ, îòíîñÿùèåñÿ ê ïîñòðîåíèþ äîâåðèòåëüíûõ èíòåðâàëîâ. Â äàííîé ãëàâå ðàññìîòðèì êîíêðåòíûå ìåòîäû ïîñòðîåíèÿ òàêèõ èíòåðâàëîâ.
Íàèáîëåå òî÷íûå äîâåðèòåëüíûå èíòåðâàëû ñòðîÿòñÿ íà îñíîâå àïðèîðíûõ
ïðåäïîëîæåíèé î êëàññå ðàñïðåäåëåíèé, êîòîðîìó, âîçìîæíî, ïðèíàäëåæèò ðàñïðåäåëåíèå äàííîé âûáîðêè. (Òàêèå ïðåäïîëîæåíèÿ äîëæíû ïîäòâåðæäàòüñÿ íà
îñíîâå êðèòåðèåâ ïðîâåðêè ãèïîòåç î ðàñïðåäåëåíèÿõ, îïèñàííûõ â ãëàâå 9.) Äîâåðèòåëüíûå èíòåðâàëû, ïîñòðîåííûå áåç ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ
âûáîðêè (èëè ñ ìèíèìàëüíûìè ïðåäïîëîæåíèÿìè, íàïðèìåð ñ ïðåäïîëîæåíèåì
òîëüêî î ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ), êàê ïðàâèëî, îñíîâàíû íà àñèìïòîòè÷åñêèõ ñâîéñòâàõ âûáîðî÷íûõ ñòàòèñòèê è èìåþò ïðèåìëåìóþ òî÷íîñòü òîëüêî
äëÿ äîñòàòî÷íî áîëüøèõ âûáîðîê. Íèæå ïðèâåäåì íåñêîëüêî ñïîñîáîâ ïîñòðîåíèÿ òàêèõ èíòåðâàëîâ. Íî áîëüøèíñòâî ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ âñå-òàêè ðàçðàáîòàíî äëÿ êîíêðåòíûõ ðàñïðåäåëåíèé.
Äàëåå â ýòîé ãëàâå ïðåäïîëàãàåòñÿ, ÷òî íåîáõîäèìûå òî÷å÷íûå îöåíêè ïàðàìåòðîâ óæå ïîäñ÷èòàíû (ñì. ðàçäåë 8.4), çà èñêëþ÷åíèåì îöåíîê äëÿ íåêîòîðûõ
êîíêðåòíûõ ðàñïðåäåëåíèé. Òàêèå îöåíêè (â ÷àñòíîñòè, äëÿ ïàðàìåòðîâ ðàâíîìåðíîãî ðàñïðåäåëåíèÿ) áóäóò ïîêàçàíû â ýòîé ãëàâå.
10.1. Общие доверительные интервалы
для математического ожидания
Îáùèå ïîëîæåíèÿ, íà îñíîâå êîòîðûõ ïîñòðîåíû îïèñûâàåìûå íèæå ìåòîäû,
ïðèâåäåíû â ðàçäåëå 2.3.1.
10.1.1. Общая модель при известной дисперсии
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íîé èçâåñòíîé äèñïåðñèåé σ2.
Äîâåðèòåëüíûé èíòåðâàë äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
2. Èç ðàâåíñòâà α = 1 – 1/k2 îïðåäåëÿåòñÿ çíà÷åíèå k: k =

σ

n
3. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k
,x +k
1
1− α
.
σ 
.
n
Êîììåíòàðèè
1.  ðàìêàõ òàêîé ìîäåëè äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ìîæíî ïîñòðîèòü òîëüêî íà îñíîâàíèè íåðàâåíñòâà
×åáûøåâà (ñì. ðàçäåë 1.2.4), êîòîðîå â äàííîì ñëó÷àå áóäåò èìåòü âèä
P(| x − MX | ≤ k
σ
n
) ≤ 1−
1
.
k2
2.  òàêîì ñëó÷àå íå ðåêîìåíäóåòñÿ áðàòü áîëüøîå çíà÷åíèå α, ïîñêîëüêó ýòî
çíà÷èòåëüíî ñíèæàåò òî÷íîñòü èíòåðâàëüíîé îöåíêè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel çäåñü òðèâèàëüíà è ïîýòîìó íå ïðèâîäèòñÿ.
10.1.2. Одномодальное симметричное распределение при
известной дисперсии
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñèììåòðè÷íîå îäíîìîäàëüíîå ðàñïðåäåëåíèå ñ èçâåñòíîé êîíå÷íîé äèñïåðñèåé σ2.
Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
2. Îïðåäåëÿåòñÿ çíà÷åíèå k: k =
3
2 1− α
.

σ

n
3. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k
,x +k
σ 
.
n
Êîììåíòàðèè
1.  ýòîé ñòàòèñòè÷åñêîé ìîäåëè ðàñïðåäåëåíèå ñòàòèñòèêè x òàêæå áóäåò
ñèììåòðè÷íûì è îäíîìîäàëüíûì. Ïîýòîìó äëÿ ïîñòðîåíèÿ èíòåðâàëüíûõ
îöåíîê ìîæíî âîñïîëüçîâàòüñÿ íåðàâåíñòâîì Ãàóññà, êîòîðîå â äàííîì
ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k
σ
n
) ≤ 1−
4
.
9k 2
2.  ýòîé ìîäåëè ñóùåñòâåííî óñëîâèå ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ, îò êîòîðîãî íåëüçÿ îñâîáîäèòüñÿ (ñì. ðàçäåë 2.3.1).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel òðèâèàëüíà.
10.1.3. Общая модель с неизвестной дисперсией
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì è íåèçâåñòíîé äèñïåðñèåé. Îáúåì âûáîðêè
n áîëüøå 30.
Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
308 Часть III. Анализ одномерных выборок
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x è Sn2 =
1 n
∑ ( xi − x )2 .
n i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ-
 1+ α 
,
 2 
äåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 
Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà.

Sn

n −1
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k
,x +k

.
n −1 
Sn
Êîììåíòàðèè
1.  äàííîé ìîäåëè èíòåðâàëüíûå îöåíêè ïîñòðîåíû íà îñíîâå àñèìïòîòè÷åñêèõ ñâîéñòâ ñòàòèñòèêè x (ñì. ðàçäåë 2.2).
2. Â ïðèíöèïå, ýòî òîò æå ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ
ìàòåìàòè÷åñêîãî îæèäàíèÿ íîðìàëüíîé ñîâîêóïíîñòè íà îñíîâå ðàñïðåäåëåíèÿ Ñòüþäåíòà (ñì. ðàçäåë 10.3.2), íî çäåñü â ñòàòèñòè÷åñêîé ìîäåëè
òðåáóåòñÿ äîñòàòî÷íî áîëüøîé îáúåì âûáîðêè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ïðàêòè÷åñêîå ïîñòðîåíèå ýòîãî äîâåðèòåëüíîãî èíòåðâàëà â Excel íå âûçûâàåò
îñîáûõ çàòðóäíåíèé. Íà ðèñ. 10.1 ïîêàçàí ðàáî÷èé ëèñò, ñîäåðæàùèé âñå íåîáõîäèìûå ôîðìóëû äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà, ðàâíîìåðíî ðàñïðåäåëåííàÿ íà èíòåðâàëå [0, 10]. (Ýòà âûáîðêà ñîçäàíà ñðåäñòâîì Генерация случайных чисел.) Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé
âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка.
Ðèñ. 10.1. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà
Глава 10. Интервальное оценивание параметров распределения
309
Äëÿ âûáîðêè ïîäñ÷èòàíû êîëè÷åñòâî çíà÷åíèé (ÿ÷åéêà Â2, ôîðìóëà
=СЧЁТ(Выборка)), âûáîðî÷íîå ñðåäíåå (ÿ÷åéêà Â4, ôîðìóëà =СРЗНАЧ(Выборка))
è âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå (ÿ÷åéêà Â6, ôîðìóëà
=СТАНДОТКЛОН(Выборка)).  ñòîëáöå D çàäàí äîâåðèòåëüíûé óðîâåíü (ÿ÷åéêà
D2), â ÿ÷åéêå D4 ïîäñ÷èòàí êîýôôèöèåíò k ïî ôîðìóëå
=ÑÒÜÞÄÐÀÑÏÎÁÐ((1-D2)/2;B2-1).
 ÿ÷åéêå D6 âû÷èñëÿåòñÿ âåëè÷èíà k
Sn
n −1
ïî ôîðìóëå =D4*B6/КОРЕНЬ(B2-1).
Íàêîíåö, âû÷èñëÿþòñÿ ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà: íèæíÿÿ ãðàíèöà —
ïî ôîðìóëå =B4-D6 (ÿ÷åéêà Â9) è âåðõíÿÿ — ïî ôîðìóëå =B4+D6 (ÿ÷åéêà D9).
Êîíå÷íî, ìîæíî èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé, âûïîëíåííûõ â ÿ÷åéêàõ
D4 è D6, è íàéòè ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà ñ ïîìîùüþ îäíîé ôîðìóëû. Îäíàêî ýòè äîïîëíèòåëüíûå âû÷èñëåííûå çíà÷åíèÿ ìîãóò èñïîëüçîâàòüñÿ
â àíàëèçå ïîëó÷åííîãî ðåçóëüòàòà.
10.2. Общий доверительный интервал для
дисперсии
Åñëè íåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ
íåèçâåñòíîé äèñïåðñèè ÿâëÿåòñÿ èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè
ðàñïðåäåëåíèÿ ñòàòèñòèê äëÿ âû÷èñëåíèÿ ìîìåíòîâ ãåíåðàëüíîé ñîâîêóïíîñòè
(ñì. ðàçäåë 2.3.2).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì. Îáúåì âûáîðêè — íå ìåíåå 50.
Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè
µ4 =
x , Sn2 è 4-ãî öåíòðàëüíîãî ìîìåíòà
1 n
∑ ( xi − x )4 .
n i =1
2. Âû÷èñëÿåòñÿ îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ñòàòèñòèêè S n2 ïî
ôîðìóëå σ(S n2 ) =
µ 4 − S 22
.
n
3. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíê 2 
íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
(
)
5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: S n2 − kσ( S n2 ), S n2 + kσ( S n2 ) .
310 Часть III. Анализ одномерных выборок
Êîììåíòàðèé. Ýòîò ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ
ïðèáëèæåííûì è äàåò óäîâëåòâîðèòåëüíûå ðåçóëüòàòû òîëüêî äëÿ äîñòàòî÷íî
áîëüøèõ âûáîðîê.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.2 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë äëÿ äèñïåðñèè âûáîðêè, ðàâíîìåðíî ðàñïðåäåëåííîé íà èíòåðâàëå [0, 10]. Ýòà
âûáîðêà, çàïèñàííàÿ â ñòîëáöå À, ñîçäàíà ñðåäñòâîì Генерация случайных чисел.
Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка.
Ðèñ. 10.2. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ äèñïåðñèè
 ñòîëáöå  ïîäñ÷èòàíû íåîáõîäèìûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè: îáúåì âûáîðêè, ñðåäíåå, ñòàíäàðòíîå îòêëîíåíèå, âûáîðî÷íàÿ äèñïåðñèÿ
(ÿ÷åéêà Â8, ôîðìóëà =ДИСПР(Выборка)), âûáîðî÷íûé 4-é öåíòðàëüíûé ìîìåíò
(ÿ÷åéêà Â10, ôîðìóëà ìàññèâà {=СУММ((Выборка-B4)^4)/B2}) è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äèñïåðñèè (ÿ÷åéêà Â12, ôîðìóëà =КОРЕНЬ((B10-B8*B8)/B2)).
 ñòîëáöå D çàïèñàíî çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ (ÿ÷åéêà D2), ïîäñ÷èòàíû
çíà÷åíèå êîýôôèöèåíòà k (ÿ÷åéêà D4, ôîðìóëà =НОРМСТОБР((1+D2)/2)) è çíà÷åíèå âåëè÷èíû kσ( S n2 ) (ÿ÷åéêà D6, ôîðìóëà =D4*B12).
Ïîñëå ïðîâåäåííûõ âû÷èñëåíèé ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà (ÿ÷åéêè
D9 è Å9) âû÷èñëÿþòñÿ ïî ïðîñòûì ôîðìóëàì: =B8-D6 — äëÿ íèæíåé ãðàíèöû
è =B8+D6 — äëÿ âåðõíåé ãðàíèöû.  ÿ÷åéêå Å12 ïðèâåäåíî èñòèííîå çíà÷åíèå
äèñïåðñèè. Êàê âèäíî, òî÷å÷íàÿ îöåíêà äèñïåðñèè çíà÷èòåëüíî äàëåêà îò èñòèííîãî çíà÷åíèÿ äèñïåðñèè, íî äîâåðèòåëüíûé èíòåðâàë ïîêðûâàåò ýòî çíà÷åíèå
äàæå ñ âåðîÿòíîñòüþ 0,9 (ðèñ. 10.3).
Îòìåòèì, ÷òî ïðè íåîáõîäèìîñòè ëþáóþ ãðàíèöó äîâåðèòåëüíîãî èíòåðâàëà
ìîæíî âû÷èñëèòü ñ ïîìîùüþ îäíîé ôîðìóëû Excel áåç ïîêàçàííûõ çäåñü ïðîìåæóòî÷íûõ âû÷èñëåíèé.
Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ äèñïåðñèé êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò
ïîêàçàíû íèæå.
Глава 10. Интервальное оценивание параметров распределения
311
Ðèñ. 10.3. Äîâåðèòåëüíûé èíòåðâàë ñ äîâåðèòåëüíûì óðîâíåì 0,9
10.3. Интервальные оценки параметров
нормального распределения
Îáùèå òåîðåòè÷åñêèå ïîëîæåíèÿ, íà îñíîâå êîòîðûõ ñòðîÿòñÿ îïèñûâàåìûå
íèæå äîâåðèòåëüíûå èíòåðâàëû, ïðèâåäåíû â ðàçäåëå 2.3.6.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2.
10.3.1. Интервальные оценки для неизвестного
математического ожидания при известной дисперсии
Ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m ðàñïðåäåëåíèÿ ãåíåðàëüíîé
ñîâîêóïíîñòè íåèçâåñòíî, íî èçâåñòíà åå äèñïåðñèÿ σ2. Äîâåðèòåëüíûé èíòåðâàë
äëÿ m ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x =
1 n
∑ xi .
n i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíêöèÿ,
2


íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 
îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.

σ

n
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k
,x +k
σ 
.
n
Êîììåíòàðèè
1. Ýòîò ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè.
312 Часть III. Анализ одномерных выборок
2. Ïîñêîëüêó ðàñïðåäåëåíèå âûáîðî÷íîãî ñðåäíåãî àñèìïòîòè÷åñêè íîðìàëüíî, ýòîò ìåòîä ìîæíî ïðèìåíÿòü äëÿ ëþáûõ âûáîðîê, åñëè èõ îáúåì äîñòàòî÷íî áîëüøîé (ïî êðàéíåé ìåðå, áîëüøå 30) è èçâåñòíà äèñïåðñèÿ.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà ðèñ. 10.4. Â äàííîì ïðèìåðå âûáîðêà èìååò
íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è äèñïåðñèåé σ2 = 4. Îòìåòèì,
÷òî â Excel äëÿ âû÷èñëåíèÿ çíà÷åíèÿ k
σ
n
ïðåäóñìîòðåíà ôóíêöèÿ ДОВЕРИТ
(ñì. ðàçäåë 4.11.2), êîòîðàÿ èñïîëüçîâàíà çäåñü â ÿ÷åéêå Ñ10.
Ðèñ. 10.4. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ
ìàòåìàòè÷åñêîãî îæèäàíèÿ ïðè èçâåñòíîé äèñïåðñèè
10.3.2. Интервальные оценки для неизвестного
математического ожидания при неизвестной дисперсии
Çäåñü ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû. Äîâåðèòåëüíûé èíòåðâàë äëÿ
m ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x =
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 .
∑
n i =1
n i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
Глава 10. Интервальное оценивание параметров распределения
313
3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ-
 1+ α 
,
 2 
äåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 
Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà.

Sn

n −1
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k
,x +k

.
n −1 
Sn
Êîììåíòàðèè
1. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè.
2. Ïîñêîëüêó ðàñïðåäåëåíèå âûáîðî÷íîãî ñðåäíåãî àñèìïòîòè÷åñêè íîðìàëüíî, ýòîò ìåòîä ìîæíî ïðèìåíÿòü äëÿ ëþáûõ ðàñïðåäåëåíèé, åñëè îáúåì
âûáîðêè äîñòàòî÷íî áîëüøîé (ïî êðàéíåé ìåðå, áîëüøå 30) è ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ðàñïðåäåëåíèÿ íåçàâèñèìû.
3. Åñëè äèñïåðñèÿ èçâåñòíà èëè îöåíèâàåòñÿ íà îñíîâàíèè êàêèõ-ëèáî èíûõ
äàííûõ, êðîìå âûáîðî÷íûõ çíà÷åíèé, òî ñëåäóåò ïðèìåíÿòü ìåòîä, îïèñàííûé â ïðåäûäóùåì ðàçäåëå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Äëÿ èëëþñòðàöèè ìåòîäà èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì
ïðèìåðå (îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è äèñïåðñèåé σ2 = 4). Ðåàëèçàöèÿ ìåòîäà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà
ðèñ. 10.5. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ êîýôôèöèåíòà k èñïîëüçóåòñÿ ôóíêöèÿ
СТЬЮДРАСПОБР (ñì. ðàçäåë 4.7.7).
Ðèñ. 10.5. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî
îæèäàíèÿ ïðè èçâåñòíîé äèñïåðñèè
314 Часть III. Анализ одномерных выборок
10.3.3. Интервальные оценки для неизвестной дисперсии при
известном математическом ожидании
Ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m ðàñïðåäåëåíèÿ ãåíåðàëüíîé
ñîâîêóïíîñòè èçâåñòíî, íî íåèçâåñòíà åå äèñïåðñèÿ σ2. Äîâåðèòåëüíûé èíòåðâàë
äëÿ σ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ âûáîðî÷íîå ñðåäíåå x =
âû÷èñëÿåòñÿ ïî ôîðìóëå Sn2 =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + α)/2.
1 n
∑ xi ; òî÷å÷íàÿ îöåíêà äèñïåðñèè
n i =1
1 n 2
∑ xi − m(2 x − m) .
n i =1
óðîâåíü
α
è
âû÷èñëÿþòñÿ
βí = (1 – α)/2
3. Îïðåäåëÿþòñÿ tн = Fn−1 ( β н ) è tв = Fn−1 ( β в ) , ãäå Fn−1 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ n ñòåïåíÿìè ñâîáîäû.
n 2 n 2
S n , Sn  .
tн 
 tв
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèè
1. Ìåòîä íå óñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè.
2. Åñëè ìàòåìàòè÷åñêîå îæèäàíèå íåèçâåñòíî, ïðèìåíÿåòñÿ ìåòîä ïîñòðîåíèÿ
äîâåðèòåëüíûõ èíòåðâàëîâ èç ñëåäóþùåãî ðàçäåëà.
3. Çíàíèå òî÷íîãî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ â îáùåì ñëó÷àå íåñóùåñòâåííî óìåíüøàåò äëèíó äîâåðèòåëüíîãî èíòåðâàëà (ïî ñðàâíåíèþ,
íàïðèìåð, ñ äîâåðèòåëüíûì èíòåðâàëîì, ïîñòðîåííûì áåç èñïîëüçîâàíèÿ
òî÷íîãî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ). Ïîýòîìó, åñëè åñòü ñîìíåíèÿ â òî÷íîì çíà÷åíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ, ñëåäóåò èñïîëüçîâàòü
ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ èç ðàçäåëà 10.3.4.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.6 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè
äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  êà÷åñòâå “ïîäîïûòíîé” âûáîðêè
èñïîëüçóåòñÿ âûáîðêà èç ïðåäûäóùèõ ðàçäåëîâ. Íàïîìíèì, ÷òî òî÷íîå çíà÷åíèå
äèñïåðñèè ðàâíî 4. Î òî÷íîñòè äîâåðèòåëüíîãî èíòåðâàëà ÷èòàòåëü ìîæåò ñóäèòü
ñàìîñòîÿòåëüíî. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8).
10.3.4. Интервальные оценки для неизвестной дисперсии
при неизвестном математическом ожидании
Ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ ãåíåðàëüíîé
ñîâîêóïíîñòè íåèçâåñòíû. Äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
Глава 10. Интервальное оценивание параметров распределения
315
Ðèñ. 10.6. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ äèñïåðñèè
ïðè èçâåñòíîì ìàòåìàòè÷åñêîì îæèäàíèè
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + α)/2.
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 .
∑
n i =1
n i =1
óðîâåíü
α
è
âû÷èñëÿþòñÿ
βí = (1 – α)/2
3. Îïðåäåëÿþòñÿ tн = Fn−−11 ( β н ) è tв = Fn−−11 ( β в ) , ãäå Fn−−11 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíÿìè ñâîáîäû.
 n −1 2 n −1 2 
Sn ,
Sn  .
tн
 tв

4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèè
1. Ìåòîä íå óñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè.
2. Åñëè èçâåñòíî òî÷íîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ, ìîæíî èñïîëüçîâàòü ìåòîä èç ïðåäûäóùåãî ðàçäåëà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.7 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè
äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà. Äëÿ ïðèìåðà èñïîëüçóåòñÿ âûáîðêà
èç ïðåäûäóùèõ ðàçäåëîâ. Íàïîìíèì, ÷òî òî÷íîå çíà÷åíèå äèñïåðñèè ðàâíî 4.
Äëÿ âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8).
316 Часть III. Анализ одномерных выборок
Ðèñ. 10.7. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ
äèñïåðñèè ïðè èçâåñòíîì ìàòåìàòè÷åñêîì îæèäàíèè
10.4. Оценка параметров логарифмически
нормального распределения
Íàïîìíèì, ÷òî åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãíîðìàëüíîå ðàñïðåäåëåíèå, òî åå ëîãàðèôì Y = lnX ðàñïðåäåëåí ïî íîðìàëüíîìó çàêîíó
ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2. Ïîýòîìó îöåíèâàíèå ïàðàìåòðîâ m è σ2 ìîæíî ïðîâîäèòü òî÷íî òàê, êàê îöåíèâàíèå ïàðàìåòðîâ m è σ2 íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 10.3), åñëè âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ...,
xn çàìåíèòü çíà÷åíèÿìè lnõ1, lnõ2, ..., lnxn. Íàïðèìåð, ïîñòðîèì äîâåðèòåëüíûé
èíòåðâàë äëÿ ïàðàìåòðà m, ïðåäïîëàãàÿ, ÷òî çíà÷åíèå ïàðàìåòðà σ2 íåèçâåñòíî.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ëîãàðèôìè÷åñêè
íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8).
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè m =
1 n
1 n
ln xi è Sn2 = ∑ (ln xi − m) .
∑
n i =1
n i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ-
 1+ α 
,
 2 
äåíòà ñ (n – 1) ñòåïåíÿìè ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 
Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà.

Sn

n −1
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  m − k
,m + k

.
n −1 
Sn
Глава 10. Интервальное оценивание параметров распределения
317
Êîììåíòàðèé. Â ñóùíîñòè, çäåñü ïîâòîðÿåòñÿ ìåòîä èç ðàçäåëà 10.3.2.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.8 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ëîãàðèôìè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è σ2 = 4. Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà
{=ЛОГНОРМОБР(СЛЧИС();–1;2)},
çàòåì ðåçóëüòàòû âû÷èñëåíèÿ ïî ýòîé ôîðìóëå ïðåîáðàçîâàíû â çíà÷åíèÿ (ïîñëå êîïèðîâàíèÿ äèàïàçîíà, ñîäåðæàùåãî âû÷èñëåíèÿ, âûïîëíÿåòñÿ êîìàíäà ПравкаÖ
Специальная вставкаÖЗначения). Â Excel ìîæíî ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë,
íå âû÷èñëÿÿ ñïåöèàëüíî ïî âûáîðî÷íûì çíà÷åíèÿì õ1, õ2, ..., xn çíà÷åíèÿ lnõ1, lnõ2,
..., lnxn. Äëÿ ýòîãî îïÿòü íàäî âîñïîëüçîâàòüñÿ ôîðìóëàìè ìàññèâà. Äëÿ îïðåäåëåíèÿ
âûáîðî÷íîãî çíà÷åíèÿ ïàðàìåòðà m =
1 n
∑ ln xi â ÿ÷åéêå Â4 èñïîëüçîâàíà ôîðìóëà
n i =1
ìàññèâà
äëÿ
Sn2 =
{=СРЗНАЧ(LN(Выборка))},
âû÷èñëåíèÿ
êîðíÿ
èç
âåëè÷èíû
n
1
∑ (ln xi − m) â ÿ÷åéêå Â6 ïðèìåíåíà ôîðìóëà {=СТАНДОТКЛОН(LN(Выборка))}.
n i =1
Ïîä÷åðêíåì íåîáõîäèìîñòü èñïîëüçîâàíèÿ èìåííî ôîðìóë ìàññèâîâ — èõ èñïîëüçîâàíèå â êà÷åñòâå “îáû÷íûõ” ôîðìóë ïðèâåäåò ê íåâåðíûì ðåçóëüòàòàì.
Îñòàëüíûå ðàñ÷åòíûå ôîðìóëû â ñòîëáöå D íè÷åì íå îòëè÷àþòñÿ îò àíàëîãè÷íûõ ôîðìóë äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà èç ðàçäåëà 10.3.2.
Ðèñ. 10.8. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà m ëîãíîðìàëüíîãî ðàñïðåäåëåíèÿ
10.5. Оценка параметра показательного
распределения
Íàïîìíèì, ÷òî ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå îïðåäåëÿåòñÿ îäíèì ïàðàìåòðîì λ (ñì. ðàçäåë 1.5.3), ïðè ýòîì äëÿ ñëó÷àéíîé âåëè÷èíû Õ,
ïîä÷èíÿþùåéñÿ ýòîìó ðàñïðåäåëåíèþ, ÌÕ = 1/λ, DX = 1/λ2. Äëÿ ýòîãî ðàñïðå-
318 Часть III. Анализ одномерных выборок
äåëåíèÿ îáû÷íî îöåíèâàåòñÿ íå ïàðàìåòð λ, à îáðàòíàÿ ê íåìó âåëè÷èíà θ = 1/λ
(÷òî åñòåñòâåííî ñ ó÷åòîì ðàâåíñòâà ÌÕ = θ). Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðn
âàëà äëÿ ïàðàìåòðà θ îñíîâàíî íà òîì, ÷òî ñëó÷àéíàÿ âåëè÷èíà 2 ∑ xi /θ, ãäå xi —
i =1
âûáîðî÷íûå çíà÷åíèÿ, èìåþùèå ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ,
íå çàâèñèò îò θ è èìååò ðàñïðåäåëåíèå χ2 ñ 2n ñòåïåíÿìè ñâîáîäû.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ.
Äîâåðèòåëüíûé èíòåðâàë äëÿ θ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + α)/2.
1 n
∑ xi .
n i =1
óðîâåíü
α
è
âû÷èñëÿþòñÿ
βí = (1 – α)/2
3. Îïðåäåëÿþòñÿ tн = F2−n1 ( β н ) è tв = F2−n1 ( β в ) , ãäå F2n−1 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíÿìè ñâîáîäû.
 2n 2n 
x, x  .
tн 
 tв
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèè
1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ
îöåíêó äèñïåðñèè.
2. Ïî òîé æå ïðè÷èíå èíòåðâàë ñòðîèòñÿ íà îñíîâå âûáîðî÷íîãî ñðåäíåãî,
à íå âûáîðî÷íîé äèñïåðñèè, êîòîðàÿ ñ íåîáõîäèìîñòüþ áóäåò èñïîëüçîâàòü
çíà÷åíèå ñðåäíåãî.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.9 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();1;2)}. Â Excel íåò ñïåöèàëüíîé ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà (åñòü ôóíêöèÿ
ЭКСПРАСП, âû÷èñëÿþùàÿ çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ), íî, ïîñêîëüêó ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì ãàììàðàñïðåäåëåíèÿ ïðè α = 1, ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé ГАММАОБР (ñì. ðàçäåë 4.7.3), åñëè ïîëîæèòü â íåé âòîðîé àðãóìåíò ðàâíûì 1. Ïîïóòíî îòìåòèì, ÷òî
òðåòèé àðãóìåíò â ýòîé ôóíêöèè çàäàåò ïàðàìåòð θ, à íå λ. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.9.
10.6. Оценка параметров гаммараспределения
Íàïîìíèì, ÷òî ãàììà-ðàñïðåäåëåíèå çàâèñèò îò ïàðàìåòðîâ α è λ (α > 0,
λ > 0), ïðè ýòîì ÌÕ = α/λ, DX = α/λ2 (ñì. ðàçäåë 1.5.10). Åñëè α = 1, òî ãàììàðàñïðåäåëåíèå ñîâïàäàåò ñ ïîêàçàòåëüíûì, îöåíêè äëÿ êîòîðîãî ðàññìîòðåíû
Глава 10. Интервальное оценивание параметров распределения
319
â ïðåäûäóùåì ðàçäåëå. Òàê æå, êàê è â ñëó÷àå ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ,
çäåñü âìåñòî ïàðàìåòðà λ îöåíèâàåòñÿ îáðàòíûé ïàðàìåòð θ = 1/λ. Ðàññìîòðèì
ñíà÷àëà âàðèàíò, êîãäà èçâåñòåí ïàðàìåòð α.
Ðèñ. 10.9. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ
10.6.1. Оценка параметра λ при известном параметре α
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ (ñì. ðàçäåë 1.5.10). Ïàðàìåòð α ïðåäïîëàãàåòñÿ èçâåñòíûì.
Äîâåðèòåëüíûé èíòåðâàë äëÿ θ = 1/λ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà θ =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + ð)/2.
1 n
∑ xi .
nα i =1
óðîâåíü
ð
è
âû÷èñëÿþòñÿ
βí = (1 – ð)/2
3. Îïðåäåëÿþòñÿ tн = F −1 ( β н ) è tв = F −1 ( β в ) , ãäå F–1 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α1 = nα, λ = 1.
 nαθ nαθ 
,
.
tн 
 tв
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèè
1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ
îöåíêó äèñïåðñèè.
320 Часть III. Анализ одномерных выборок
2. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî ñëó÷àéíàÿ âåëè÷èíà
nαθ
θ
òàêæå èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α1 = nα
è λ = 1, ò.å. íå çàâèñèò îò íåèçâåñòíîãî ïàðàìåòðà θ.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.10 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ãàììà-ðàñïðåäåëåíèå
ñ ïàðàìåòðàìè α = 3 è λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();3;2)}. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.10.
Ðèñ. 10.10. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà θ ãàììà-ðàñïðåäåëåíèÿ
10.6.2. Оценка параметра α при известном параметре λ
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ. Ïàðàìåòð λ
ïðåäïîëàãàåòñÿ èçâåñòíûì.
Äîâåðèòåëüíûé èíòåðâàë äëÿ α ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà α =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + ð)/2.
λ n
∑ xi .
n i =1
óðîâåíü
ð
è
âû÷èñëÿþòñÿ
βí = (1 – ð)/2
3. Îïðåäåëÿþòñÿ tн = F −1 ( β н ) è tв = F −1 ( β в ) , ãäå F–1 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α = n/λ è λ = 1.
Глава 10. Интервальное оценивание параметров распределения
321
 nα nα 
,
.
 λtв λtн 
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèè
1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ
îöåíêó äèñïåðñèè.
2. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî ñëó÷àéíàÿ âåëè÷èíà
nα
òàêæå èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α1 = n/λ
αλ
è λ = 1, ò.å. íå çàâèñèò îò íåèçâåñòíîãî ïàðàìåòðà α.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.11 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ãàììà-ðàñïðåäåëåíèå
ñ ïàðàìåòðàìè α = 3 è λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();3;2)}. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.11.
Ðèñ. 10.11. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà α ãàììà-ðàñïðåäåëåíèÿ
10.6.3. Совместная оценка параметров α и λ
Åñëè íåèçâåñòíû îáà ïàðàìåòðà (α è λ), òî ïðîñòûõ ìåòîäîâ ïîëó÷åíèÿ èõ îöåíîê íå ñóùåñòâóåò. Ïîñêîëüêó äëÿ äàííîãî ðàñïðåäåëåíèÿ ÌÕ = α/λ è DX = α/λ2,
íà îñíîâå çíà÷åíèé âûáîðî÷íîãî ñðåäíåãî x è âûáîðî÷íîé äèñïåðñèè sn2 ìîæíî
ïîëó÷èòü îöåíêè ýòèõ ïàðàìåòðîâ: λ =
322 Часть III. Анализ одномерных выборок
x
è α = λ x . Îäíàêî “òåîðèÿ” ñîâåòóåò
sn2
èñïîëüçîâàòü ñîîòíîøåíèÿ ÌÕ = α/λ è ÌÕ2 = α(1 + α)/λ2. Íà îñíîâå çíà÷åíèé
âûáîðî÷íîãî ñðåäíåãî x è âûáîðî÷íîãî âòîðîãî ìîìåíòà m2 =
α=
1 n 2
∑ xi íàõîäèì
n i =1
x2
x
1
, λ=
.
2
m2 − x
m2 − x 2
Ïîñòðîèòü ñîâìåñòíóþ äîâåðèòåëüíóþ îáëàñòü äëÿ ýòèõ îöåíîê âåñüìà ñëîæíî [17, ðàçäåë 6.4]. Ìîæíî, êîíå÷íî, çíà÷åíèå λ ïðèíÿòü çà òî÷íîå çíà÷åíèå ïàðàìåòðà λ è ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ α, êàê ïîêàçàíî âûøå. Îäíàêî òî÷íîñòü òàêîãî èíòåðâàëà îöåíèòü íåâîçìîæíî.
10.7. Оценка параметров равномерного
распределения
 îáùåì ñëó÷àå ðàâíîìåðíîå ðàñïðåäåëåíèå çàäàåòñÿ ãðàíèöàìè êîíå÷íîãî
èíòåðâàëà [a, b], íà êîòîðîì ñîñðåäîòî÷åíî ýòî ðàñïðåäåëåíèå (ñì. ðàçäåë 1.5.1).
Åñëè ãðàíèöû íå èçâåñòíû, òî âîçíèêàåò ñëåäóþùàÿ çàäà÷à: ïî âûáîðî÷íûì çíà÷åíèÿì, èìåþùèì ðàâíîìåðíîå ðàñïðåäåëåíèå, îöåíèòü çíà÷åíèÿ ãðàíèö.
Ñíà÷àëà ðàññìîòðèì ñëó÷àé, êîãäà íåèçâåñòíà òîëüêî îäíà ãðàíèöà.
10.7.1. Оценка границы равномерного распределения
 ýòîì ñëó÷àå ñ ïîìîùüþ ëèíåéíîé çàìåíû èñõîäíîå ðàñïðåäåëåíèå ìîæíî
ïðèâåñòè ê ðàñïðåäåëåíèþ, ñîñðåäîòî÷åííîìó íà èíòåðâàëå [0, θ], ãäå θ — íåèçâåñòíûé ïàðàìåòð.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, θ]. Ïàðàìåòð θ
ïðåäïîëàãàåòñÿ íåèçâåñòíûì.
Äîâåðèòåëüíûé èíòåðâàë äëÿ θ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ ìàêñèìàëüíîå âûáîðî÷íîå çíà÷åíèå xn* = max xi .
1≤ i ≤ n
2. Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ ïàðàìåòðà θ áóäåò ñòàòèñòèêà
θ=
n +1 *
xn . (Äèñïåðñèÿ ýòîé ñòàòèñòèêè ðàâíà Dθ = θ 2 /n(n + 2) .)
n
3. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α è âû÷èñëÿåòñÿ

4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  xn* ,
n

n
1− α .

.
1− α 
xn*
Êîììåíòàðèé. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî
ñëó÷àéíàÿ âåëè÷èíà θ/θ èìååò ðàñïðåäåëåíèå, íå çàâèñÿùåå îò ïàðàìåòðà θ. Åå
ôóíêöèÿ ðàñïðåäåëåíèÿ çàäàåòñÿ ôîðìóëîé [8]
1
Ýòè îöåíêè ñîîòâåòñòâóþò îöåíêàì ìåòîäà ìîìåíòîâ. Èõ èñïîëüçóþò êàê íà÷àëüíîå ïðèáëèæåíèå äëÿ èòåðàöèîííîãî ïðîöåññà íàõîæäåíèÿ îöåíîê ïî ìåòîäó ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ [17, ðàçäåë 6.4].
Глава 10. Интервальное оценивание параметров распределения
323

если u ≤ 0,
0,

2
1
 un 

F (u ) = 
 , если u ∈ 0, 1 +  ,
n

 n + 1 

1
если u > 1 + .
1,
n

Íåñëîæíî íàéòè â ÿâíîì âèäå êîðåíü óðàâíåíèÿ Ð( θ/θ > u) = 1 – F(u) = α:
u=
n +1 n
1 − α . Îòñþäà ïîëó÷àåì ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà.
n
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïîñòðîåíèÿ â Excel äîâåðèòåëüíîãî èíòåðâàëà íå
ïðåäñòàâëÿåò òðóäíîñòåé. Åñëè âûáîðî÷íûå çíà÷åíèÿ çàïèñàíû â äèàïàçîíå ÿ÷ååê ñ èìåíåì Выборка, à çíà÷åíèÿ äîâåðèòåëüíîãî óðîâíÿ α — â ÿ÷åéêå ñ èìåíåì
Альфа, òî îöåíêà θ âû÷èñëÿåòñÿ ïî ôîðìóëå
=МАКС(Выборка)*(СЧЁТ(Выборка)+1)/СЧЁТ(Выборка),
íèæíÿÿ ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà:
=МАКС(Выборка),
âåðõíÿÿ ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà:
=МАКС(Выборка)/СТЕПЕНЬ(1-Альфа;1/СЧЁТ(Выборка)).
10.7.2. Оценка обеих границ равномерного распределения
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [à, b] ñ íåèçâåñòíûìè ïàðàìåòðàìè à è b. Ïðåäïîëàãàåòñÿ, ÷òî 0 < a < b.
Íåñìåùåííûìè è ýôôåêòèâíûìè îöåíêàìè äëÿ ïàðàìåòðîâ à è b áóäóò ñîîòâåòñòâåííî îöåíêè
a=
x*
nx*
nx1*
x*
− n , b= n − 1 ,
n −1 n −1
n −1 n −1
ãäå x1* = min xi , xn* = max xi . Ñîâìåñòíóþ äîâåðèòåëüíóþ îáëàñòü äëÿ ýòèõ îöåíîê
1≤ i ≤ n
1≤ i ≤ n
ïîñòðîèòü ñëîæíî.
Ïðèâåäåì åùå íåñìåùåííóþ è ýôôåêòèâíóþ îöåíêó äëÿ ðàçìàõà R = b – a:
R=
n +1 *
( xn − x1* ) .
n −1
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ïðèâåäåííûõ ôîðìóë íåñëîæíà è î÷åâèäíà.
10.8. Оценки параметра распределения Бернулли
Íàïîìíèì, ÷òî ðàñïðåäåëåíèå Áåðíóëëè îáû÷íî ðàññìàòðèâàåòñÿ êàê ìîäåëü
ñëó÷àéíîãî ýêñïåðèìåíòà, â ðåçóëüòàòå êîòîðîãî ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.2). Êàê
ïðàâèëî, öåëüþ ñòàòèñòè÷åñêîãî àíàëèçà âûáîðî÷íûõ çíà÷åíèé ÿâëÿåòñÿ îïðåäåëåíèå çíà÷åíèÿ áèíîìèàëüíîé âåðîÿòíîñòè ð. Îáùèå òåîðåòè÷åñêèå ïîëîæåíèÿ,
íà îñíîâå êîòîðûõ ñòðîÿòñÿ îïèñûâàåìûå íèæå äîâåðèòåëüíûå èíòåðâàëû, ïðèâåäåíû â ðàçäåëå 2.3.7.
324 Часть III. Анализ одномерных выборок
Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð íåñêîëüêî îòëè÷àåòñÿ äëÿ ñëó÷àåâ, êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì
è êîãäà âûáîðêà ñîäåðæèò ðåçóëüòàòû íåñêîëüêèõ íåçàâèñèìûõ ýêñïåðèìåíòîâ.
Ðàññìîòðèì ýòè ñëó÷àè îòäåëüíî.
10.8.1. Оценивание вероятности р по одному эксперименту
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä
“1”, è 0 â ïðîòèâíîì ñëó÷àå.
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
pˆ = r / n , ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (ñì. ðàçäåë 1.4.3). Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n.
Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîÿòñÿ
èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ .
Использование биномиального распределения
Äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ ñëåäóþùèì
îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n , òî÷íåå, äëÿ äàëüíåéøèõ âû÷èñëåíèé íåîáõîäèìà âåëè÷èíà r — êîëè÷åñòâî èñõîäîâ “1”.
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + α)/2.
óðîâåíü
α
è
âû÷èñëÿþòñÿ
βí = (1 – α)/2
3. Îïðåäåëÿþòñÿ tн = Fk−1,1k 2 ( β н ) è tв = Fk−3,1k 4 ( β в ) , ãäå Fm−1,1 m 2 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè F-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m1 è m2 (ñì. ðàçäåë 1.5.9),
k1 = r, k2 = n – r + 1, k3 = r + 1, k4 = n – r.
4. Äîâåðèòåëüíûì èíòåðâàëîì áóäåò èíòåðâàë ( tн , tв ) .
Êîììåíòàðèé. Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó áèíîìèàëüíûì ðàñïðåäåëåíèåì è F-ðàñïðåäåëåíèåì. Ïóñòü Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Òîãäà Ð(Õ ≤ k) = Fn–k,k+1(1 –
p), ãäå Fn–k,k+1 — ôóíêöèÿ F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.12 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 100 íàáëþäåíèé çà
ýêñïåðèìåíòîì, ãäå ñ âåðîÿòíîñòüþ 0,4 ïðîèñõîäèò ñîáûòèå “1”. Ýòà âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà ïàêåòà àíàëèçà Генерация случайных чисел. Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, òàêæå ïîêàçàíû íà ðèñ. 10.12. Ìîæíî îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé,
ïðèìåíèâ äëÿ âû÷èñëåíèÿ íèæíåé ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà ôîðìóëó
=FРАСПОБР((1-C2)/2;СУММ(Выборка);СЧЁТ(Выборка)-СУММ(Выборка)+1),
Глава 10. Интервальное оценивание параметров распределения
325
à äëÿ âåðõíåé — ôîðìóëó
=FРАСПОБР((1+C2)/2;СУММ(Выборка)+1;СЧЁТ(Выборка)-СУММ(Выборка)).
Ýòè ôîðìóëû èñïîëüçóþò òîëüêî âûáîðî÷íûå çíà÷åíèÿ (äèàïàçîí Выборка)
è çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ (ÿ÷åéêà Ñ2).
Ðèñ. 10.12. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ð
Асимптотические оценки
Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë
äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ òàêèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n .
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíê2


íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà

pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
 pˆ − k
 .
n
n


Êîììåíòàðèé. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà áèíîìèàëüíîå ðàñïðåäåëåíèå àïïðîêñèìèðóåòñÿ íîðìàëüíûì, íåèçâåñòíîå çíà÷åíèå äèñïåðñèè
Dpˆ = p (1 − p) / n çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n .
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
326 Часть III. Анализ одномерных выборок
Íà ðèñ. 10.13 ïîêàçàíû ôîðìóëû Excel, ïîçâîëÿþùèå ïîñòðîèòü àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë. Çäåñü èñïîëüçîâàíà òà æå âûáîðêà, ÷òî
è â ïðåäûäóùåì ïðèìåðå, è îñòàâëåíû âû÷èñëåíèÿ òî÷íîãî äîâåðèòåëüíîãî èíòåðâàëà. Êàê âèäíî íà ðèñ. 10.13, àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë
(ÿ÷åéêè Í13 è ²13), íà ïåðâûé âçãëÿä, êàæåòñÿ áîëåå òî÷íûì, ÷åì èíòåðâàë, ïîñòðîåííûé ïî òî÷íûì ôîðìóëàì. Îäíàêî íåîáõîäèìî ïîìíèòü, ÷òî ýòîò èíòåðâàë
ïðèáëèæåííûé è îí ìîæåò áûòü êàê ìåíüøå, òàê è áîëüøå òî÷íîãî èíòåðâàëà.
Ðèñ. 10.13. Àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà ð
10.8.2. Оценивание вероятности р по нескольким
экспериментам
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ñîñòîèò èç ðåçóëüòàòîâ n ýêñïåðèìåíòîâ, â êàæäîì èç êîòîðûõ ïðîâîäèëîñü N èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî ÷èñëó èñõîäîâ “1” â i-ì ýêñïåðèìåíòå.
Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà
pˆ =
1
nN
n
∑x
i
. Äèñïåðñèÿ ñòàòèñòèêè p̂ : Dpˆ = p (1 − p) / nN . Ðàñïðåäåëåíèå ñòàòè-
i =1
ñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/nN.
Ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, áîëüøå 30, íàèáîëåå ïðîñòîé
äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ íà
îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ .
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ =
1
nN
n
∑x
i
.
i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
Глава 10. Интервальное оценивание параметров распределения
327
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî-
1+ α 
–1
 , Ô — ôóíê 2 
ãî íîðìàëüíîãî çàêîíà, íàõîäèòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.

4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë  pˆ − k


pˆ (1 − pˆ )
pˆ (1 − pˆ ) 
, pˆ + k
.
nN
nN 
Êîììåíòàðèè
1. Ïðè íåîáõîäèìîñòè ìîæíî ïîñòðîèòü òî÷íûé äîâåðèòåëüíûé èíòåðâàë,
àíàëîãè÷íûé òî÷íîìó èíòåðâàëó èç ïðåäûäóùåãî ðàçäåëà. Íî ïîñêîëüêó
çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, âåëèêî, íà ïðàêòèêå îáû÷íî èñïîëüçóþò àñèìïòîòè÷åñêèå èíòåðâàëû êàê íàèáîëåå ïðîñòûå â âû÷èñëèòåëüíîì
îòíîøåíèè è âìåñòå ñ òåì äîñòàòî÷íî íàäåæíûå.
2. Çäåñü ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, à íåèçâåñòíîå çíà÷åíèå
äèñïåðñèè Dpˆ çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / nN .
3.  ñëó÷àå, êîãäà â ýêñïåðèìåíòàõ ïðîâîäèòñÿ ðàçíîå êîëè÷åñòâî èñïûòàíèé
N1, N2, ..., Nn, âñå âûøåïðèâåäåííûå ôîðìóëû ñîõðàíÿþò ñâîþ ñèëó, åñëè
â íèõ âåëè÷èíó nN çàìåíèòü ñóììîé N1 + N2 +...+ Nn.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà
ñ íåáîëüøèìè î÷åâèäíûìè èçìåíåíèÿìè ïîâòîðÿåò ðåàëèçàöèþ ìåòîäà ïîñòðîåíèÿ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà èç ïðåäûäóùåãî ðàçäåëà.
10.8.3. Применение преобразования арксинуса
 ðàçäåëå 2.3.7 îïèñàíû ïðåîáðàçîâàíèÿ îöåíêè
è y = 2 n arcsin
p̂
âèäà
z = arcsin pˆ
pˆ , ïðè ýòîì ðàñïðåäåëåíèÿ âåëè÷èí z è y áëèæå ê íîðìàëüíî-
ìó, ÷åì ðàñïðåäåëåíèå îöåíêè p̂ . Íàïîìíèì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû z ïðèáëèæåííî ðàâíî arcsin
p , à äèñïåðñèÿ ïðèáëèæåííî
ðàâíà 1/4n. Äëÿ âåëè÷èíû y ìàòåìàòè÷åñêîå îæèäàíèå ïðèáëèæåííî ðàâíî
2 n arcsin p , äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1. Ýòè ïðåîáðàçîâàíèÿ ìîæíî èñïîëüçîâàòü äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð.
Ïðåäâàðèòåëüíî îòìåòèì, ÷òî åñëè äèñïåðñèþ âåëè÷èíû z ïðèíÿòü ðàâíîé
â òî÷íîñòè 1/4n, à âåëè÷èíû y — òî÷íî ðàâíîé 1, òî, êàê íåòðóäíî ïðîâåðèòü,
äîâåðèòåëüíûå èíòåðâàëû, ïîñòðîåííûå íà îñíîâàíèè ýòèõ ïðåîáðàçîâàíèé,
áóäóò ñîâïàäàòü. Ïîýòîìó íå èìååò çíà÷åíèÿ, êàêîå ïðåîáðàçîâàíèå èñïîëüçîâàòü. Ïîêàæåì ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà ñ ïîìîùüþ ïðåîáðàçîâàíèÿ àðêñèíóñà z = arcsin
pˆ .
Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà âûïîëíÿþòñÿ ñëåäóþùèå äåéñòâèÿ.
1. Âû÷èñëÿþòñÿ òî÷å÷íàÿ îöåíêà p̂ è åå ïðåîáðàçîâàíèå z = arcsin
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
328 Часть III. Анализ одномерных выборок
pˆ .
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíê 2 
íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.




4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë:  sin 2  z −
k 
k 
2
 , sin  z +
 .
2 n
2 n 

Êîììåíòàðèé. Íåîáõîäèìî ïîìíèòü, ÷òî, âî-ïåðâûõ, õîòÿ ðàñïðåäåëåíèå âåëè÷èíû z áëèæå ê íîðìàëüíîìó, ÷åì ðàñïðåäåëåíèå p̂ , îíî âñå-òàêè íå ñîâïàäàåò ñ íèì. Âî-âòîðûõ, äèñïåðñèÿ ýòîé âåëè÷èíû òîëüêî ïðèáëèæåííî ðàâíà 1/4n.
Ïîýòîìó äàííûé ìåòîä ÿâëÿåòñÿ ïðèáëèæåííûì.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 10.14 ïîêàçàíû ôîðìóëû Excel, ïîçâîëÿþùèå ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë íà îñíîâàíèè ïðåîáðàçîâàíèÿ z = arcsin
pˆ . Çäåñü èñïîëüçîâàíà òà
æå âûáîðêà, ÷òî è â ðàçäåëå 10.8.1. Êàê âèäíî íà ðèñ. 10.14, ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë (ÿ÷åéêè F6 è G6) áëèçîê àñèìïòîòè÷åñêîìó äîâåðèòåëüíîìó
èíòåðâàëó, ïîñòðîåííîìó â ðàçäåëå 10.8.1.
Ðèñ. 10.14. Äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà ð íà îñíîâå ïðåîáðàçîâàíèÿ
àðêñèíóñà
10.9. Оценка параметра распределения Пуассона
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (ñì. ðàçäåë 1.4.4).
1 n
∑ xi áóäåò íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé
n i =1
äëÿ íåèçâåñòíîãî ïàðàìåòðà λ. Äèñïåðñèÿ ýòîé îöåíêè ðàâíà D x = λ/n. Ñëó÷àéÂûáîðî÷íîå ñðåäíåå x =
n
íàÿ âåëè÷èíà
∑x
i
èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì nλ, à ñëó÷àéíàÿ
i =1
âåëè÷èíà
n
( x − λ ) àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1).
λ
Глава 10. Интервальное оценивание параметров распределения
329
Äîâåðèòåëüíûå èíòåðâàëû äëÿ ïàðàìåòðà λ ñòðîÿòñÿ èëè íà îñíîâå ðàñïðåäån
ëåíèÿ Ïóàññîíà, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà
∑x
i
, èëè íà îñíîâå àñèì-
i =1
ïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû
n
( x − λ) .
λ
Использование распределения Пуассона
Äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà λ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x =
2. Çàäàåòñÿ äîâåðèòåëüíûé
è βâ = (1 + α)/2.
1 n
∑ xi .
n i =1
óðîâåíü
α
è
âû÷èñëÿþòñÿ
βí = (1 – α)/2
3. Îïðåäåëÿþòñÿ tн = Fk−1 ( β н ) è tв = Fk−1 ( β в ) , ãäå Fk−1 — ôóíêöèÿ, îáðàòíàÿ
ê ôóíêöèè χ2-ðàñïðåäåëåíèÿ ñ k = 2(n x + 1) ñòåïåíüþ ñâîáîäû.
 tн tв 
,
.
 2n 2n 
4. Äîâåðèòåëüíûì èíòåðâàëîì áóäåò èíòåðâàë 
Êîììåíòàðèé. Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó ðàñïðåäåëåíèåì Ïóàññîíà è ðàñïðåäåëåíèåì χ2, ïðèâåäåííûå â ðàçäåëå 1.4.4.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà ðèñ. 10.15.  ñòîëáöå À ñîäåðæàòñÿ 100 âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 2. Âûáîðêà ñîçäàíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел; äèàïàçîíó ÿ÷ååê,
ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка. Îòìåòèì, ÷òî äëÿ
âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8).
Асимптотические оценки
Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë
äëÿ çíà÷åíèÿ λ ñòðîèòñÿ òàêèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x =
1 n
∑ xi .
n i =1
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíê 2 
íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.

4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë:  x − k


330 Часть III. Анализ одномерных выборок
x
x
, x +k
.
n
n 
Ðèñ. 10.15. Ïîñòðîåíèå òî÷íîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà λ ðàñïðåäåëåíèÿ Ïóàññîíà
Êîììåíòàðèè
1. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ
ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì, ïðè ýòîì íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dx = λ / n çàìåíÿåòñÿ âåëè÷èíîé x / n .
2. Ìîæíî ñòðîèòü äîâåðèòåëüíûé èíòåðâàë âèäà


k2 k
k2 k
−
k 2 + 4nx , x +
+
k 2 + 4nx  ,
x +
2
n
2
n
2
n
2
n


ãäå èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì.
3. Ýòîò ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì; ïî âîçìîæíîñòè ñëåäóåò èñïîëüçîâàòü òî÷íûé ìåòîä.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.16 â ñòîëáöàõ G è H. Äëÿ ïðèìåðà èñïîëüçóåòñÿ òà æå âûáîðêà, ÷òî è â ïðåäûäóùåì ïðèìåðå.
10.10. Оценки параметра геометрического
распределения
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì ð (0 < p < 1) (ñì. ðàçäåë 1.4.5).
Ïðè n > 10 äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ ð ñòðîèòñÿ òàêèì îáðàçîì.
1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà p =
1
1 n
, ãäå x = ∑ xi .
1+ x
n i =1
Глава 10. Интервальное оценивание параметров распределения
331
Ðèñ. 10.16. Ïîñòðîåíèå àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ðàñïðåäåëåíèÿ Ïóàññîíà
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî-
1+ α 
–1
, Ô —
 2 
ãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 
ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî
çàêîíà.
 1 
k
x
1−
 1 + x 
n 1+ x


4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë: 
 1 
k
x
 ,
1 +
n 1+ x
 1+ x 

  .

Êîììåíòàðèè
1. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîò ôàêò, ÷òî ñëó÷àéíàÿ âåëè÷èíà T =
n ( px − 1 + p)
1− p
èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîð-
ìàëüíîå ðàñïðåäåëåíèå. Åñëè ïðèðàâíÿòü Ò ê êâàíòèëÿì tí è tâ ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî
ðàñïðåäåëåíèÿ, òî ïîëó÷èì äâà óðàâíåíèÿ îòíîñèòåëüíî ð. Êîðíè ýòèõ óðàâíåíèé ñîñòàâëÿþò ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà. Îòìåòèì, ÷òî ïðèâåäåííûå âûøå ãðàíèöû ïîëó÷åíû ïðè çàìåíå â ôîðìóëå Ò âûðàæåíèÿ
âûðàæåíèåì
1− p
x /(1 + x ) . Áåç ïîñëåäíåé çàìåíû ìîæíî ïîëó÷èòü áîëåå òî÷íûå
ãðàíèöû, îäíàêî ôîðìóëû äëÿ íèõ ñòàíîâÿòñÿ âåñüìà ãðîìîçäêèìè.
2. Ýòîò ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì,
íî óæå ïðè n > 10 äàåò óäîâëåòâîðèòåëüíóþ òî÷íîñòü. Äëÿ ìàëûõ âûáîðîê
ìîæíî ïðèìåíèòü òî÷íûé ìåòîä, èñïîëüçóþùèé äëÿ âû÷èñëåíèÿ ãðàíèö äîâåðèòåëüíîãî èíòåðâàëà îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå [14].
332 Часть III. Анализ одномерных выборок
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî ìåòîäà ïîäîáíà ïîñòðîåíèþ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà λ ðàñïðåäåëåíèÿ Ïóàññîíà èç
ïðåäûäóùåãî ðàçäåëà è íå äîëæíà âûçûâàòü çàòðóäíåíèé.
10.11. Доверительные интервалы для квантилей
 ýòîì ðàçäåëå ðàññìîòðèì äîâåðèòåëüíûå èíòåðâàëû äëÿ êâàíòèëåé. Ýòè èíòåðâàëû õàðàêòåðíû òåì, ÷òî íå çàâèñÿò îò âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Íàïîìíèì, ÷òî êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî
ξð, ÷òî Ð(Õ < ξð) = F(ξð) = ð, ãäå F — ôóíêöèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ (ñì. ðàçäåë 1.2.3).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íåïðåðûâíîå ðàñïðåäåëåíèå.
Ñîñòîÿòåëüíîé îöåíêîé äëÿ êâàíòèëè ξð ÿâëÿåòñÿ ïîðÿäêîâàÿ ñòàòèñòèêà
(÷ëåí âàðèàöèîííîãî ðÿäà) x(k(p)) ñ ðàíãîì k(p); k(p) = nð, åñëè nð — öåëîå ÷èñëî
è k(p) = [nð] + 1 â ïðîòèâíîì ñëó÷àå ([nð] — öåëàÿ ÷àñòü ÷èñëà nð).
Äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ ξð ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Äëÿ âñåõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., xn âû÷èñëÿþòñÿ ðàíãè r1, r2, ..., rn.
2. Âû÷èñëÿåòñÿ k(p): k(p) = nð, åñëè nð — öåëîå ÷èñëî; k(p) = [nð] + 1 â ïðîòèâíîì ñëó÷àå.
3. Îïðåäåëÿåòñÿ âûáîðî÷íîå çíà÷åíèå x(k(p)) ñ ðàíãîì, ðàâíûì k(p). Ýòî çíà÷åíèå ïðèíèìàåòñÿ çà òî÷å÷íóþ îöåíêó êâàíòèëè ξð.
4.  êà÷åñòâå äîâåðèòåëüíîãî èíòåðâàëà áåðåòñÿ èíòåðâàë (x(s), x(t)), ãðàíèöû êîòîðîãî ñîñòàâëÿþò ïîðÿäêîâûå ñòàòèñòèêè x(s) è x(t) è êîòîðûé ñîäåðæèò çíà÷åíèå x(k(p)). Âû÷èñëÿåòñÿ äîâåðèòåëüíûé óðîâåíü ýòîãî èíòåðâàëà ïî ôîðìóëå
β = F(t) – F(s), ãäå F — ôóíêöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p. Ïîðÿäêîâûå ñòàòèñòèêè x(s) è x(t) âûáèðàþòñÿ òàêèì îáðàçîì,
÷òîáû âåðîÿòíîñòü β áûëà íå ìåíüøå çàäàííîãî äîâåðèòåëüíîãî óðîâíÿ α.
Êîììåíòàðèè
1. Ìåòîä ïîñòðîåí íà îñíîâå ñâîéñòâ ïîðÿäêîâûõ ñòàòèñòèê (ñì. íàïðèìåð, [17]).
2. Îáû÷íî èíòåðâàë (x(s), x(t)) áåðóò ñèììåòðè÷íûì ïî ðàíãàì s è t îòíîñèòåëüíî x(k(p)), ò.å. êîãäà t – k(p) = k(p) – s. Îäíàêî òàêîé èíòåðâàë íå âñåãäà
èìååò ìèíèìàëüíóþ äëèíó.
3.  ñëó÷àå ð = 0,5 ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë äëÿ ìåäèàíû.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Âñå ôîðìóëû Excel, èñïîëüçóåìûå ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà
äëÿ êâàíòèëè ξð, ïîêàçàíû íà ðèñ. 10.17. Äëÿ ïðèìåðà èñïîëüçóåòñÿ âûáîðêà,
ñîñòîÿùàÿ èç ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 10] ñëó÷àéíûõ ÷èñåë
(â ýòîì ñëó÷àå èñòèííîå çíà÷åíèå êâàíòèëè ξð ðàâíî 10ð).
 äàííîì ñëó÷àå äëÿ òîãî, ÷òîáû â äàëüíåéøåì ìîæíî áûëî ïðèìåíèòü
ôóíêöèþ ВПР, âûáîðêà çàïèñàíà â ñòîëáöå Â, à â ñòîëáöå À âû÷èñëåíû ðàíãè
âûáîðî÷íûõ çíà÷åíèé ïî ôîðìóëå ìàññèâà {=РАНГ(Выборка;Выборка;1)}.
(Ôóíêöèÿ РАНГ îïèñàíà â ðàçäåëå 4.2.5; äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáî-
Глава 10. Интервальное оценивание параметров распределения
333
ðî÷íûå çíà÷åíèÿ, íàçâàí Выборка.)  ÿ÷åéêå Å3 âû÷èñëÿåòñÿ ðàíã âûáîðî÷íîãî çíà÷åíèÿ, êîòîðîå ïðèíèìàåòñÿ çà îöåíêó êâàíòèëè, à â ÿ÷åéêå Å4 ïðèâîäèòñÿ ñàìî ýòî çíà÷åíèå.
Ðèñ. 10.17. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êâàíòèëè
 äèàïàçîíå Ñ6:F18 ïîñòðîåíû èíòåðâàëû äëÿ êâàíòèëè è ïîäñ÷èòàíû âåðîÿòíîñòè, ñ êîòîðîé îíè ñîäåðæàò íåèçâåñòíîå çíà÷åíèå êâàíòèëè.  ïåðâîé ñòðîêå ýòîãî äèàïàçîíà çàïèñàíû òàêèå ôîðìóëû.
 ÿ÷åéêå D7: =ВПР($E$3-C7;$A$2:$B$51;2;0).
 ÿ÷åéêå Å7: =ВПР($E$3+C7;$A$2:$B$51;2;0).
Â
ÿ÷åéêå
F7:
=БИНОМРАСП($E$3+C7;$E$2;$E$1;1)-БИНОМРАСП($E$3C7;$E$2;$E$1;1).
Ýòè ôîðìóëû çàòåì ñêîïèðîâàíû âíèç äî êîíöà äèàïàçîíà D7:F18.
Èíòåðâàëû ñèììåòðè÷íû îòíîñèòåëüíî îöåíêè êâàíòèëè (ñèììåòðè÷íîñòü
èíòåðâàëîâ îïðåäåëåíà â êîììåíòàðèÿõ). Ñòîëáåö Номер èñïîëüçóåòñÿ òîëüêî
äëÿ óäîáñòâà âû÷èñëåíèÿ ðàíãîâ s è t; ïóòåì óñëîæíåíèÿ ôîðìóë îò íåãî
ìîæíî îòêàçàòüñÿ.
Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå âûáèðàåòñÿ òîò èíòåðâàë, äëÿ êîòîðîãî
âåðîÿòíîñòü íå ìåíüøå äîâåðèòåëüíîãî óðîâíÿ. Íàïðèìåð, åñëè äîâåðèòåëüíûé
óðîâåíü çàäàí êàê 0,95, òî â êà÷åñòâå èñêîìîãî èíòåðâàëà ñëåäóåò âçÿòü èíòåðâàë ïîä íîìåðîì 7 (ñì. ðèñ. 10.17).
334 Часть III. Анализ одномерных выборок
Глава
11
Проверка гипотез о параметрах
распределений
Î
äíîé èç çàäà÷ ñòàòèñòè÷åñêîãî àíàëèçà ÿâëÿåòñÿ ïðîâåðêà àäåêâàòíîñòè
èìåþùèõñÿ âûáîðî÷íûõ çíà÷åíèé, ÿâëÿþùèõñÿ ðåàëèçàöèåé íåêîòîðîé
ñëó÷àéíîé âåëè÷èíû, âûäâèíóòûì ãèïîòåçàì î ðàñïðåäåëåíèè ýòîé ñëó÷àéíîé
âåëè÷èíû, ò.å. ïðîâåðêà ãèïîòåç î ïàðàìåòðàõ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðîâåðÿåìûå ãèïîòåçû îáû÷íî ôîðìóëèðóþòñÿ íà îñíîâàíèè íåêîòîðûõ àïðèîðíûõ èëè òåîðåòè÷åñêèõ ïðåäïîëîæåíèé ëèáî íà ðåçóëüòàòàõ ïðåäâàðèòåëüíîãî àíàëèçà äàííûõ. Òåîðåòè÷åñêèå îñíîâû ïðîâåðêè ñòàòèñòè÷åñêèõ
ãèïîòåç äàíû â ãëàâå 2, ðàçäåë 2.4. Çäåñü ìû ïðèâåäåì êîíêðåòíûå êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
Êðèòåðèè ïðîâåðêè ãèïîòåç î òèïå çàêîíà ðàñïðåäåëåíèÿ îïèñàíû â ãëàâå 9.
Îòìåòèì, ÷òî áîëüøèíñòâî ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ
äëÿ ïàðàìåòðîâ ðàñïðåäåëåíèé, ïðèâåäåííûõ â ãëàâå 10, ìîæíî ïåðåôîðìóëèðîâàòü êàê êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ ïàðàìåòðîâ (ñì. ðàçäåë 2.4.1). Íà òàêîé îñíîâå ïîñòðîåíû îïèñàííûå â ýòîé ãëàâå êðèòåðèè ïðîâåðêè ãèïîòåç î ïàðàìåòðàõ íîðìàëüíîãî ðàñïðåäåëåíèÿ è êðèòåðèé ïðîâåðêè
ãèïîòåçû î çíà÷åíèè ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ. Êðîìå ýòèõ êðèòåðèåâ, ðàññìîòðåíû äâà íåïàðàìåòðè÷åñêèõ êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû, êîòîðûå íå çàâèñÿò îò ðàñïðåäåëåíèé.
Ïîä÷åðêíåì åùå ðàç (ñì. ðàçäåë 2.4), ÷òî ñòàòèñòè÷åñêèå êðèòåðèè íà îñíîâàíèè
âûáîðî÷íûõ íàáëþäåíèé íå äîêàçûâàþò òó èëè èíóþ ãèïîòåçó. Îíè ïîçâîëÿþò
òîëüêî óòâåðæäàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò ïðèíÿòîé ãèïîòåçå.
Êðîìå òîãî, åñëè èìååòñÿ âîçìîæíîñòü ê îäíèì è òåì æå äàííûì ïðèìåíèòü äâà
ðàçëè÷íûõ êðèòåðèÿ äëÿ ïðîâåðêè îäíîé è òîé æå ãèïîòåçû, òî â ýòîì ñëó÷àå ñëåäóåò âîñïîëüçîâàòüñÿ ëèøü îäíèì êðèòåðèåì, êîòîðûé ÿâëÿåòñÿ áîëåå ìîùíûì.
11.1. Критерии проверки гипотез о параметрах
нормального распределения
Ïîñêîëüêó íà ïðàêòèêå î÷åíü ÷àñòî ïðåäïîëàãàåòñÿ, ÷òî âûáîðêà èìååò íîðìàëüíîå ðàñïðåäåëåíèå (îáîñíîâàíî èëè íåò — îòäåëüíûé âîïðîñ), ïðèâåäåííûå
íèæå êðèòåðèè, ïî-âèäèìîìó, ÿâëÿþòñÿ íàèáîëåå âîñòðåáîâàííûìè êðèòåðèÿìè
ïðîâåðêè ãèïîòåç.
11.1.1. Критерий проверки значения математического
ожидания нормальной совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèì
îæèäàíèåì µ è äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: µ = m0
Í0: µ ≤ m0
Í0: µ ≥ m0
Í1: µ ≠ m0
Í1: µ > m0
Í1: µ < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
x=
n ( x − m0 )
, ãäå
Sn
1 n
1 n
xi è Sn2 = ∑ ( xi − x ) 2 .
∑
n i =1
n i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü t ïîðÿäêà 1 – α/2
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tâ ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tí ïîðÿäêà α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Êîììåíòàðèè
1. Èíîãäà èçâåñòíà äèñïåðñèÿ ãåíåðàëüíîé ñîâîêóïíîñòè σ2. Òîãäà âìåñòî
ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóþò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ ñòàòèñòèêè Ò çàìåíÿþò Sn íà σ.  ýòîì ñëó÷àå äëÿ ïîñòðîåíèÿ êðèòåðèÿ ìîæíî èñïîëüçîâàòü ôóíêöèþ Excel ZТЕСТ.
2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.1 ïîêàçàí ðàáî÷èé ëèñò Excel ñ ôîðìóëàìè, íåîáõîäèìûìè äëÿ
ðåàëèçàöèè êðèòåðèÿ.  êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà âûáîðêà îáúåìîì 50
çíà÷åíèé, èìåþùàÿ íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì –1
è äèñïåðñèåé σ2 = 4, ïîëó÷åííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел.
Çíà÷åíèå m0 çàäàåòñÿ â ÿ÷åéêå Ñ1, à óðîâåíü çíà÷èìîñòè êðèòåðèÿ — â ÿ÷åéêå Ñ2. Îáúåì âûáîðêè, âûáîðî÷íûå ñðåäíåå è ñòàíäàðòíîå îòêëîíåíèå âû÷èñëÿþòñÿ ñ ïîìîùüþ ôóíêöèé СЧЁТ, СРЗНАЧ è СТАНДОТКЛОН.
 ñòîëáöàõ Å:G âûïîëíÿþòñÿ âû÷èñëåíèÿ äëÿ êðèòåðèÿ: â ÿ÷åéêå F2 âû÷èñëÿåòñÿ çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè ïî ôîðìóëå
=КОРЕНЬ(C3)*(C4-C1)/C5,
â ÿ÷åéêàõ Å5:G5 — êðèòè÷åñêèå çíà÷åíèÿ ïî ôîðìóëàì ñîîòâåòñòâåííî
=СТЬЮДРАСПОБР($C$2/2;$C$3-1)
äëÿ ñëó÷àÿ ðàâåíñòâà è
=СТЬЮДРАСПОБР($C$2;$C$3-1)
äëÿ ñëó÷àÿ íåðàâåíñòâ (â ÿ÷åéêàõ F5 è G5 îäèíàêîâûå ôîðìóëû).  ÿ÷åéêàõ Å7:G7
ïðîâåðÿþòñÿ óñëîâèÿ âûïîëíåíèÿ êðèòåðèÿ (ôîðìóëû ïîêàçàíû íà ðèñ. 11.1).
336 Часть III. Анализ одномерных выборок
Ðèñ. 11.1. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ
Êàê âèäíî íà ðèñ. 11.1, äëÿ m0 = –0,5 íóëåâûå ãèïîòåçû â ñëó÷àå ðàâåíñòâà è íåðàâåíñòâà á) ïðèíèìàþòñÿ (íàïîìíèì, ÷òî èñòèííîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ ðàâíî –1), à íóëåâàÿ ãèïîòåçà äëÿ íåðàâåíñòâà â) îòêëîíÿåòñÿ. Ïîñìîòðèì,
êàê ñðåàãèðóåò êðèòåðèé, åñëè ïîëîæèòü m0 = 0. Ðåçóëüòàò ïðèìåíåíèÿ êðèòåðèÿ
äëÿ ýòîãî ñëó÷àÿ ïîêàçàí íà ðèñ. 11.2. Çäåñü ãèïîòåçà î ðàâåíñòâå îòâåðãàåòñÿ.
Ðèñ. 11.2. Ñðàâíåíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ ñ íóëåâûì çíà÷åíèåì
11.1.2. Критерий проверки значения дисперсии нормальной
совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèì
îæèäàíèåì µ è äèñïåðñèåé σ2.
Ãèïîòåçû
à) Ðàâåíñòâî
2
2
á) Íåðàâåíñòâî
2
â) Íåðàâåíñòâî
Í0: σ = σ0
Í0: σ ≤ σ0
2
Í0: σ2 ≥ σ02
Í1: σ2 ≠ σ02
Í1: σ2 > σ02
Í1: σ2 < σ02
Çäåñü σ02 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Глава 11. Проверка гипотез о параметрах распределений
337
Âû÷èñëåíèÿ.
Sn2 =
Âû÷èñëÿåòñÿ
êðèòåðèàëüíàÿ
ñòàòèñòèêà
T=
(n − 1) S n2
,
σ 20
ãäå
1 n
∑ ( xi − x )2 .
n i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ êàê êâàíòèëè tí ïîðÿäêà α/2 è tâ
ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tâ ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tí ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Êîììåíòàðèé. Êðèòåðèé íå óñòîé÷èâ, åñëè íå âûïîëíÿåòñÿ óñëîâèå íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.3 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè
äëÿ ðåàëèçàöèè êðèòåðèÿ. Âûáîðêà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 1 è äèñïåðñèåé 4. Çíà÷åíèå σ02 çàäàíî â ÿ÷åéêå Ñ1, à óðîâåíü çíà÷èìîñòè — â ÿ÷åéêå Ñ2. Îòìåòèì, ÷òî âûáîðî÷íàÿ äèñïåðñèÿ â ÿ÷åéêå Ñ5 âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèè ДИСПР (ñì. ðàçäåë 4.5.2).
Ðèñ. 11.3. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ äèñïåðñèè
Êàê âèäíî íà ðèñ. 11.3, äëÿ ñëó÷àÿ σ02 = 4 ïðèíèìàþòñÿ âñå òðè íóëåâûå ãèïîòåçû. Íà ðèñ. 11.4 ïîêàçàíû ðåçóëüòàòû âû÷èñëåíèÿ êðèòåðèÿ äëÿ σ02 = 2. Çäåñü
íóëåâûå ãèïîòåçû ðàâåíñòâà è íåðàâåíñòâà á) îòêëîíÿþòñÿ, à ãèïîòåçà Í0: σ2 ≥ σ02
ïðèíèìàåòñÿ. Âûïîëíåíèå êðèòåðèÿ äëÿ ñëó÷àÿ σ02 = 7 ïîêàçàíî íà ðèñ. 11.5.
338 Часть III. Анализ одномерных выборок
Ðèñ. 11.4. Ïðîâåðêà çíà÷åíèÿ äèñïåðñèè äëÿ σ02 = 2
Ðèñ. 11.5. Ïðîâåðêà çíà÷åíèÿ äèñïåðñèè äëÿ σ02 = 7
11.2. Проверка гипотезы о значении параметра
показательного распределения
Ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå îïðåäåëÿåòñÿ ïàðàìåòðîì λ
(ñì. ðàçäåë 1.5.3), ïðè ýòîì äëÿ ñëó÷àéíîé âåëè÷èíû Õ, ïîä÷èíÿþùåéñÿ ýòîìó
ðàñïðåäåëåíèþ, ÌÕ = 1/λ, DX = 1/λ2. Äëÿ ýòîãî ðàñïðåäåëåíèÿ îáû÷íî ñòðîÿòñÿ
êðèòåðèè îöåíêè íå ïàðàìåòðà λ, à îáðàòíàÿ ê íåìó âåëè÷èíà θ = 1/λ, ïîñêîëüêó ÌÕ = θ. Ïîñòðîåíèå êðèòåðèåâ äëÿ ïàðàìåòðà θ îñíîâàíî íà òîì, ÷òî ñëó÷àén
íàÿ âåëè÷èíà 2 ∑ xi /θ, ãäå xi — âûáîðî÷íûå çíà÷åíèÿ, èìåþùèå ïîêàçàòåëüíîå
i =1
ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ, íå çàâèñèò îò ïàðàìåòðà θ è èìååò ðàñïðåäåëåíèå
χ2 ñ 2n ñòåïåíÿìè ñâîáîäû.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ.
Глава 11. Проверка гипотез о параметрах распределений
339
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: θ = θ0
Í0: θ ≤ θ0
Í0: θ ≥ θ0
Í1: θ ≠ θ0
Í1: θ > θ0
Í1: θ < θ0
Çäåñü θ0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
2nx
1 n
, ãäå x = ∑ xi .
θ0
n i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ 2n ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ tí êàê êâàíòèëü ïîðÿäêà α/2
ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû è tâ êàê êâàíòèëü ïîðÿäêà 1 – α/2 òîãî
æå ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü tâ ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êâàíòèëü tí ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò.
Êîììåíòàðèé. Êðèòåðèé ïðàêòè÷åñêè òîæäåñòâåí ìåòîäó ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà θ (ñì. ðàçäåë 10.5).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.6 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû
ìàññèâà {=ГАММАОБР(СЛЧИС();1;2)}. Â Excel íåò ôóíêöèè, îáðàòíîé ê ôóíêöèè
ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà, íî ïîñêîëüêó ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ
÷àñòíûì ñëó÷àåì ãàììà-ðàñïðåäåëåíèÿ ïðè α = 1, ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé ГАММАОБР (ñì. ðàçäåë 4.7.3), åñëè ïîëîæèòü â íåé âòîðîé àðãóìåíò ðàâíûì 1.
Îòìåòèì, ÷òî òðåòèé àðãóìåíò â ýòîé ôóíêöèè çàäàåò ïàðàìåòð θ, à íå λ. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 11.6.
Ðèñ. 11.6. Êðèòåðèè ïðîâåðêè çíà÷åíèÿ ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ
340 Часть III. Анализ одномерных выборок
11.3. Проверка гипотезы о значении параметра
биномиального распределения
Ïîñòðîåíèå êðèòåðèÿ ïðîâåðêè ãèïîòåçû î çíà÷åíèè ïàðàìåòðà áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êàê è ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ áèíîìèàëüíîé âåðîÿòíîñòè (ñì. ðàçäåë 10.8), ìîæíî ðàññìîòðåòü îòäåëüíî äëÿ ñëó÷àåâ,
êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì è êîãäà âûáîðêà
ñîäåðæèò ðåçóëüòàòû íåñêîëüêèõ íåçàâèñèìûõ ýêñïåðèìåíòîâ. Îäíàêî, ïîñêîëüêó êðèòåðèè â îáîèõ ñëó÷àÿõ ñ âû÷èñëèòåëüíîé òî÷êè çðåíèÿ ïðàêòè÷åñêè íå
îòëè÷àþòñÿ, ðàññìîòðèì òîëüêî ñëó÷àé, êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà
îäíèì ýêñïåðèìåíòîì.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ
(1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä
“1”, è 0 â ïðîòèâíîì ñëó÷àå.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: ð = ð0
Í0: ð ≤ ð0
Í0: ð ≥ ð0
Í1: ð ≠ ð0
Í1: ð > ð0
Í1: ð < ð0
Çäåñü ð0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Êàê óêàçûâàëîñü â ðàçäåëå 10.8, íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà pˆ = r / n , ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Ñëó÷àéíàÿ
âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Ðàñïðåäåëåíèå
ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n.
Òàê æå, êàê è äîâåðèòåëüíûå èíòåðâàëû äëÿ âåðîÿòíîñòè ð, êðèòåðèè ïðîâåðêè çíà÷åíèÿ ýòîé âåðîÿòíîñòè ñòðîÿòñÿ èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà r, èëè íà îñíîâå àñèìïòîòè÷åñêîé
íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ .
11.3.1. Использование биномиального распределения
Ñðàçó îòìåòèì, ÷òî çäåñü áèíîìèàëüíîå ðàñïðåäåëåíèå çàìåíÿåòñÿ Fðàñïðåäåëåíèåì ïî èçâåñòíîìó ñîîòíîøåíèþ Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Õ —
ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n
è p, à Fn–k,k+1 — ôóíêöèÿ F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè.
Ýòî æå ñîîòíîøåíèå èñïîëüçîâàëîñü â ðàçäåëå 10.8.1 ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð.
Âû÷èñëåíèÿ.
Z=
Âû÷èñëÿþòñÿ
êðèòåðèàëüíûå
ñòàòèñòèêè
Y=
1 − p0
r
,
n + 1 − r p0
n − r p0
. Îáå ñòàòèñòèêè ïðèìåíÿþòñÿ äëÿ êðèòåðèÿ ðàâåíñòâà; äëÿ êðèr + 1 1 − p0
òåðèÿ íåðàâåíñòâà á) èñïîëüçóåòñÿ ñòàòèñòèêà Y, äëÿ êðèòåðèÿ íåðàâåíñòâà â) —
ñòàòèñòèêà Z.
Глава 11. Проверка гипотез о параметрах распределений
341
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Äëÿ âû÷èñëåíèÿ êâàíòèëåé ýòîãî ðàñïðåäåëåíèÿ, êîòîðûå íåîáõîäèìû äëÿ ïîñòðîåíèÿ
êðèòè÷åñêîé îáëàñòè, èñïîëüçóåòñÿ F-ðàñïðåäåëåíèå ñ ñîîòâåòñòâóþùèìè çíà÷åíèÿìè ñòåïåíåé ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t1 êàê êâàíòèëü ïîðÿäêà 1 –
α/2 F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – r) è 2r ñòåïåíÿìè ñâîáîäû è t2 êàê êâàíòèëü
ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(r + 1) è 2(n – r) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿþòñÿ íåðàâåíñòâà Y ≤ t1 è Z ≤ t2. Åñëè õîòÿ
áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α
F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – r) è 2r ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Y ≤ tâ.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α Fðàñïðåäåëåíèÿ ñ 2(r + 1) è 2(n – r) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Z.
Êîììåíòàðèé. Äàííûé êðèòåðèé, â îñíîâíîì, ïðèìåíÿåòñÿ ê âûáîðêàì ìàëîãî îáúåìà. Äëÿ âûáîðîê áîëüøîãî îáúåìà ÷àùå ïðèìåíÿåòñÿ àñèìïòîòè÷åñêèé
êðèòåðèé, îñíîâàííûé íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì (ñì. ñëåäóþùèé ðàçäåë).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.7 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 30 íàáëþäåíèé çà ýêñïåðèìåíòîì, ãäå ñ âåðîÿòíîñòüþ 0,4 ïðîèñõîäèò ñîáûòèå “1”. Ýòà âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà ïàêåòà àíàëèçà Генерация случайных чисел. Âñå ôîðìóëû
Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, òàêæå ïîêàçàíû íà ðèñ. 11.7.
 ÿ÷åéêàõ Ñ4:Ñ7 äëÿ óïðîùåíèÿ ôîðìóë, âû÷èñëÿþùèõ êâàíòèëè, ïîäñ÷èòàíû
ñîîòâåòñòâóþùèå çíà÷åíèÿ ñòåïåíåé ñâîáîäû: 2(n + 1 – r), 2r, 2(r + 1) è 2(n – r).
Ðèñ. 11.7. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ âåðîÿòíîñòè ð
342 Часть III. Анализ одномерных выборок
11.3.2. Асимптотический критерий
Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé êðèòåðèé äëÿ ïðîâåðêè
çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ òàêèì îáðàçîì.
Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
r − np0
np0 (1 − p0 )
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
|T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò.
Êîììåíòàðèé. Äàííûé êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è ïðèìåíÿåòñÿ, â
îñíîâíîì, ê âûáîðêàì áîëüøîãî îáúåìà. Äëÿ ìàëûõ âûáîðîê ïðèìåíÿåòñÿ êðèòåðèé, îïèñàííûé â ïðåäûäóùåì ðàçäåëå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.8 â ñòîëáöå À ïîêàçàíà âûáîðêà, êîòîðàÿ èñïîëüçîâàëàñü â ïðåäûäóùåì ïðèìåðå. Âåðîÿòíîñòü ñîáûòèÿ “1” çäåñü ðàâíà 0,4. Âñå ôîðìóëû Excel,
íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, òàêæå ïîêàçàíû íà ðèñ. 11.8.
Ðèñ. 11.8. Àñèìïòîòè÷åñêèé êðèòåðèé ïðîâåðêè çíà÷åíèÿ âåðîÿòíîñòè ð
11.4. Критерии проверки гипотез о значении
медианы
Ðàññìîòðèì äâà êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû, êîòîðûå
â ñòàòèñòè÷åñêîì àíàëèçå èñïîëüçóþòñÿ íå òîëüêî äëÿ íåïîñðåäñòâåííîé ïðîâåð-
Глава 11. Проверка гипотез о параметрах распределений
343
êè çíà÷åíèÿ ìåäèàíû, íî è äëÿ äðóãèõ öåëåé, íàïðèìåð êàê îöåíêà öåíòðà ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèÿ, åñëè ïî êàêèì-ëèáî ïðè÷èíàì íåëüçÿ äëÿ ýòèõ
öåëåé èñïîëüçîâàòü ìàòåìàòè÷åñêîå îæèäàíèå. (Äëÿ íåêîòîðûõ ðàñïðåäåëåíèé
ìàòåìàòè÷åñêîå îæèäàíèå ìîæåò ïðîñòî íå ñóùåñòâîâàòü, êàê, íàïðèìåð, ó ðàñïðåäåëåíèè Êîøè.) Êðîìå òîãî, îïèñàííûå íèæå êðèòåðèè ÿâëÿþòñÿ ñâîáîäíûìè
îò ðàñïðåäåëåíèÿ, ò.å. íåïàðàìåòðè÷åñêèìè. Ïîýòîìó èõ ìîæíî èñïîëüçîâàòü
“áåç îãëÿäêè” íà èñõîäíîå ðàñïðåäåëåíèå âûáîðêè, òèï êîòîðîãî ÷àñòî òðóäíî
îïðåäåëèòü. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé ìåäèàíà è ìàòåìàòè÷åñêîå îæèäàíèå ñîâïàäàþò, ïîýòîìó äàííûå êðèòåðèè òàêæå ìîæíî èñïîëüçîâàòü äëÿ ïðîâåðêè çíà÷åíèé ìàòåìàòè÷åñêèõ îæèäàíèé òàêèõ ðàñïðåäåëåíèé. Íî åñëè âñåòàêè èçâåñòåí òèï ðàñïðåäåëåíèÿ, òî â ïîñëåäíåì ñëó÷àå íàäåæíåå ïðèìåíÿòü
êðèòåðèè, èñïîëüçóþùèå èíôîðìàöèþ î òèïå ðàñïðåäåëåíèÿ.
11.4.1. Критерий знаков
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn íåçàâèñèìû
è âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Çíà÷åíèå ìåäèàíû m íåèçâåñòíî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: m = m0
Í0: m ≤ m0
Í0: m ≥ m0
Í1: m ≠ m0
Í1: m > m0
Í1: m < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
 ýòîì êðèòåðèè â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ ïîäñ÷èòàííîå ÷èñëî R âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áîëüøå m0. Åñëè ñïðàâåäëèâû íóëåâûå ãèïîòåçû, òî ñëó÷àéíàÿ âåëè÷èíà R èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå
ñ ïàðàìåòðàìè n è ð = 0,5. Êàê è â êðèòåðèÿõ ïðîâåðêè áèíîìèàëüíûõ âåðîÿòíîñòåé, çäåñü ìîæíî ïîñòðîèòü èëè òî÷íûé êðèòåðèé, îñíîâàííûé íà áèíîìèàëüíîì ðàñïðåäåëåíèè âåëè÷èíû R, ëèáî àñèìïòîòè÷åñêèé, èñïîëüçóþùèé àïïðîêñèìàöèþ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Ðàññìîòðèì ñíà÷àëà òî÷íûé êðèòåðèé.
Точный критерий знаков
Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà R, ðàâíàÿ êîëè÷åñòâó
âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïî âåëè÷èíå áîëüøå m0. Äîïîëíèòåëüíî âû÷èñëÿþòñÿ ñòàòèñòèêè Y =
n−R
R
, Z=
. Îáå ñòàòèñòèêè ïðèìåíÿþòñÿ äëÿ
R +1
n +1− R
êðèòåðèÿ ðàâåíñòâà; äëÿ êðèòåðèÿ íåðàâåíñòâà á) èñïîëüçóåòñÿ ñòàòèñòèêà Y,
äëÿ êðèòåðèÿ íåðàâåíñòâà â) — ñòàòèñòèêà Z.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà R èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è 0,5. Îäíàêî
äëÿ ïîëó÷åíèÿ êðèòè÷åñêèõ çíà÷åíèé, êîòîðûå îñíîâàíû íà êâàíòèëÿõ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êàê è â êðèòåðèè î çíà÷åíèè áèíîìèàëüíîé âåðîÿòíîñòè
(ðàçäåë 11.3.1), èñïîëüçóåòñÿ F-ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t1 êàê êâàíòèëü ïîðÿäêà 1 – α/2
F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – R) è 2R ñòåïåíÿìè ñâîáîäû è t2 êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(R + 1) è 2(n – R) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿþòñÿ íåðàâåíñòâà Y ≤ t1 è Z ≤ t2. Åñëè õîòÿ áû
îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, ãèïîòåçà Í0 îòêëîíÿåòñÿ.
344 Часть III. Анализ одномерных выборок
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α
F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – R) è 2R ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Y ≤ tâ.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α Fðàñïðåäåëåíèÿ ñ 2(R + 1) è 2(n – R) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Z.
Êîììåíòàðèè
1. Åñëè êàêîå-ëèáî âûáîðî÷íîå çíà÷åíèå ðàâíî m0, òî îíî íå ó÷èòûâàåòñÿ,
à çíà÷åíèå n óìåíüøàåòñÿ íà 1.
2. Äàííûé êðèòåðèé, â îñíîâíîì, ïðèìåíÿåòñÿ ê âûáîðêàì ìàëîãî îáúåìà.
Äëÿ âûáîðîê áîëüøîãî îáúåìà ÷àùå ïðèìåíÿåòñÿ àñèìïòîòè÷åñêèé êðèòåðèé, îñíîâàííûé íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì (ñì. ñëåäóþùèé ðàçäåë).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.9 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 30 çíà÷åíèé, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 10] (òàêèì îáðàçîì, èñòèííîå çíà÷åíèå
ìåäèàíû ðàâíî 5). Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ,
òàêæå ïîêàçàíû íà ðèñ. 11.9. Çíà÷åíèå ñòàòèñòèêè R âû÷èñëÿåòñÿ ñ ïîìîùüþ
ôîðìóëû ìàññèâà
{=СЧЁТ(ЕСЛИ(Выборка>E1;Выборка;""))}.
Ðàáîòà ïîäîáíûõ ôîðìóë îïèñàíà â ðàçäåëå 6.1.4. Ïîñêîëüêó äëÿ íåïðåðûâíûõ
ðàñïðåäåëåíèé âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà ïðèìåò êàêîå-ëèáî
êîíêðåòíîå çíà÷åíèå, ðàâíà íóëþ, òî çäåñü ïðîâåðêà íà ñîâïàäåíèå âûáîðî÷íîãî
çíà÷åíèÿ è m0 íå âûïîëíÿåòñÿ. Äîáàâèòü ïîäîáíóþ ïðîâåðêó â ðàñ÷åòíûå ôîðìóëû íåñëîæíî, íî âîçíèêàåò íåîáõîäèìîñòü â íåêîòîðûõ ïðîìåæóòî÷íûõ âû÷èñëåíèÿõ.  ÿ÷åéêàõ Ñ4:Ñ7 äëÿ óïðîùåíèÿ ôîðìóë, âû÷èñëÿþùèõ êâàíòèëè,
îòäåëüíî ïîäñ÷èòàíû ñîîòâåòñòâóþùèå çíà÷åíèÿ ñòåïåíåé ñâîáîäû: 2(n + 1 – r),
2r, 2(r + 1) è 2(n – r).
Ðèñ. 11.9. Òî÷íûé êðèòåðèé çíàêîâ
Глава 11. Проверка гипотез о параметрах распределений
345
Асимптотический критерий знаков
Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ ñòàòèñòèêà R, ðàâíàÿ êîëè÷åñòâó âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïî âåëè÷èíå áîëüøå m0. Äàëåå âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
2R − n
n
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
|T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò.
Êîììåíòàðèè
1. Åñëè êàêîå-ëèáî âûáîðî÷íîå çíà÷åíèå ðàâíî m0, òî îíî íå ó÷èòûâàåòñÿ,
à çíà÷åíèå n óìåíüøàåòñÿ íà 1.
2. Äàííûé êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è ïðèìåíÿåòñÿ, â îñíîâíîì,
ê âûáîðêàì áîëüøîãî îáúåìà (n > 50). Åñëè n ≤ 50, ðåêîìåíäóåòñÿ èñïîëüçîâàòü “èñïðàâëåííóþ” ñòàòèñòèêó Ò âèäà T =
2R − n + 1
n
, êîòîðàÿ òàêæå èìå-
åò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äëÿ ìàëûõ âûáîðîê (n ≤ 20) ïðèìåíÿåòñÿ êðèòåðèé, îïèñàííûé â ïðåäûäóùåì ðàçäåëå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ äàííîãî êðèòåðèÿ, åñëè ïîäñ÷èòàíî çíà÷åíèå R, íå
âûçûâàåò òðóäíîñòåé. Ôîðìóëà äëÿ âû÷èñëåíèÿ çíà÷åíèÿ R ïîêàçàíà â ïðåäûäóùåì ðàçäåëå.
11.4.2. Критерий знаковых рангов Уилкоксона
Ñ÷èòàåòñÿ, ÷òî êðèòåðèé çíàêîâ, îïèñàííûé â ïðåäûäóùåì ðàçäåëå, íå ó÷èòûâàåò çíà÷èòåëüíóþ ÷àñòü èíôîðìàöèè, ñîäåðæàùåéñÿ â âûáîðêå. Êðèòåðèé
çíàêîâûõ ðàíãîâ Óèëêîêñîíà íå òîëüêî ñ÷èòàåò êîëè÷åñòâî îòðèöàòåëüíûõ èëè
ïîëîæèòåëüíûõ ðàçíîñòåé xi – m0, íî è ó÷èòûâàåò ÷åðåç çíà÷åíèÿ ðàíãîâ îòíîñèòåëüíûå ðàçìåðû ýòèõ ðàçíîñòåé.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn íåçàâèñèìû
è âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Çíà÷åíèå ìåäèàíû m íåèçâåñòíî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: m = m0
Í0: m ≤ m0
Í0: m ≥ m0
Í1: m ≠ m0
Í1: m > m0
Í1: m < m0
Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
346 Часть III. Анализ одномерных выборок
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ ðàíãè ri âåëè÷èí |xi – m0|. Çíà÷åíèÿ, äëÿ êîòîðûõ xi –
m0 = 0, èãíîðèðóþòñÿ.
2. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè V+ è V–, ðàâíûå ñóììå ðàíãîâ ri
ïîëîæèòåëüíûõ ðàçíîñòåé xi – m0 è ñóììå ðàíãîâ îòðèöàòåëüíûõ ðàçíîñòåé xi – m0 ñîîòâåòñòâåííî.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêè V+ è V– ðàñïðåäåëåíû îäèíàêîâî. Äëÿ âû÷èñëåíèÿ êðèòè÷åñêèõ çíà÷åíèé èñïîëüçóþòñÿ êâàíòèëè ñïåöèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìåþò âåëè÷èíû V+ è V– [9]. Ýòè âåëè÷èíû òàêæå èìååò àñèìïòîòè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå
ñ
ìàòåìàòè÷åñêèì
îæèäàíèåì
n(n + 1)/2
è
äèñïåðñèåé
n(n + 1)(2n + 1)/24. Ïîñêîëüêó ñòàòèñòèêè V+ è V– èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, òî äëÿ ïðîâåðêè ãèïîòåç èñïîëüçóåòñÿ îäíà èç ýòèõ ñòàòèñòèê. Âîçüìåì
â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè âåëè÷èíó V+ è èñïîëüçóåì åå àñèìïòîòè÷åñêóþ íîðìàëüíîñòü. Äëÿ óäîáñòâà âû÷èñëèì âåëè÷èíó T =
V+ − n(n + 1) / 4
n(n + 1)(2n + 1) / 24
,
êîòîðàÿ èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
|T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1.
Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò.
Êîììåíòàðèè
1. Îïèñàííûé êðèòåðèé ñ èñïîëüçîâàíèåì íîðìàëüíîãî ðàñïðåäåëåíèÿ ïðèìåíÿåòñÿ äëÿ âûáîðîê, îáúåì êîòîðûõ áîëüøå 20. Äëÿ ìàëûõ âûáîðîê íåîáõîäèìî èñïîëüçîâàòü òî÷íîå ðàñïðåäåëåíèå ñòàòèñòèê V+ è V–.
2.  [18, ñ. 124] ïðèâîäèòñÿ äðóãàÿ àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ âåëè÷èí
V+ è V–, ïîñòðîåííàÿ íà îñíîâå ðàñïðåäåëåíèÿ Ñòüþäåíòà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 11.10 â ñòîëáöå À ïîêàçàíà âûáîðêà èç 30 çíà÷åíèé, èìåþùèõ ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 10], è îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ ðåàëèçàöèè êðèòåðèÿ. Ê ñîæàëåíèþ, â Excel íå óäàåòñÿ ïîäñ÷èòàòü çíà÷åíèå V+ ñ ïîìîùüþ îäíîé ôîðìóëû òîëüêî ïî âûáîðî÷íûì çíà÷åíèÿì. Äëÿ
âû÷èñëåíèÿ ýòîãî çíà÷åíèÿ ïðèøëîñü îòäåëüíî ïîäñ÷èòàòü àáñîëþòíûå âåëè÷èíû ðàçíîñòåé xi – m0 (ñòîëáåö Â, ôîðìóëà ìàññèâà {=ABS(Выборка-G1)}, äèàïàçîí
ÿ÷ååê ñ âûáîðî÷íûìè çíà÷åíèÿìè íàçâàí Выборка).  ñòîëáöå Ñ ïîäñ÷èòàíû
ðàíãè àáñîëþòíûõ âåëè÷èí ðàçíîñòåé xi – m0 ïî ôîðìóëå ìàññèâà
{=РАНГ(Разности;Разности;1)} (çäåñü äèàïàçîí ÿ÷ååê ñî çíà÷åíèÿìè â ñòîëáöå Â
íàçâàí Разности, ôóíêöèÿ РАНГ îïèñàíà â ðàçäåëå 4.2.5). Ïîñëå ýòèõ ïðåäâàðèòåëüíûõ âû÷èñëåíèé çíà÷åíèå V+ âû÷èñëÿåòñÿ â ÿ÷åéêå Å2 ñ ïîìîùüþ ôîðìóëû
ìàññèâà
{=СУММ(ЕСЛИ(Выборка>G1;Ранги;""))}
(â
ÿ÷åéêå G1
ñîäåðæèòñÿ
çíà÷åíèå m0, äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ðàíãè, íàçâàí Ранги). Îñòàëüíûå ôîðìóëû ïîêàçàíû íà ðèñ. 11.10.
Глава 11. Проверка гипотез о параметрах распределений
347
Ðèñ. 11.10. Ðåàëèçàöèÿ êðèòåðèÿ çíàêîâûõ ðàíãîâ Óèëêîêñîíà
348 Часть III. Анализ одномерных выборок
Глава
12
Сравнение одномерных выборок
Å
ñëè èìååòñÿ íåñêîëüêî îäíîìåðíûõ âûáîðîê, òî, ïðåæäå ÷åì ïðèñòóïèòü
ê èõ ñòàòèñòè÷åñêîìó àíàëèçó, îáû÷íî ñòàâÿò äâà ñëåäóþùèõ îáùèõ âîïðîñà.
•
Èìåþò ëè ýòè âûáîðêè îäèíàêîâûå ðàñïðåäåëåíèÿ, èëè, äðóãèìè ñëîâàìè,
ïîëó÷åíû ëè îíè èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè?
•
Èìåþò ëè çíà÷åíèÿ âûáîðî÷íûõ ïàðàìåòðîâ çíà÷èìûå ðàçëè÷èÿ èëè èõ
ìîæíî ñ÷èòàòü ðàâíûìè?
Íà ïåðâûé âîïðîñ ïîìîãàþò îòâåòèòü ìåòîäû ñðàâíåíèÿ âûáîðî÷íûõ ðàñïðåäåëåíèé, îïèñàííûå â ðàçäåëå 12.1. Íà âòîðîé âîïðîñ ìîæíî îòâåòèòü äâóìÿ ñïîñîáàìè: ïóòåì ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé èëè îòíîøåíèé
ñðàâíèâàåìûõ ïàðàìåòðîâ ëèáî ñ ïîìîùüþ êðèòåðèåâ ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ðàçíîñòåé èëè îòíîøåíèé ýòèõ ïàðàìåòðîâ. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ ïîêàçàíî â ðàçäåëå 12.2, à êðèòåðèè ïðîâåðêè ãèïîòåç — â ðàçäåëå 12.3.
12.1. Сравнение выборочных распределений
Äëÿ ñðàâíåíèÿ âûáîðî÷íûõ ðàñïðåäåëåíèé ðàçðàáîòàíî ìíîãî êðèòåðèåâ (èõ
÷àñòî íàçûâàþò êðèòåðèÿìè îäíîðîäíîñòè), èìåþùèõ ðàçëè÷íûå òåîðåòè÷åñêèå
îñíîâû. Ýòè êðèòåðèè, êàê ïðàâèëî, íåïàðàìåòðè÷åñêèå, ïîñêîëüêó, åñëè èçâåñòåí êëàññ ðàñïðåäåëåíèé, êîòîðîìó ïîä÷èíÿþòñÿ âûáîðî÷íûå çíà÷åíèÿ, â ýòîì
ñëó÷àå ñòàâèòñÿ çàäà÷à ñðàâíåíèÿ íå ñàìèõ ðàñïðåäåëåíèé, à èõ ïàðàìåòðîâ,
è ýòà çàäà÷à ðåøàåòñÿ èíûìè ìåòîäàìè.
 ïðèíöèïå, îïèñàííûå íèæå êðèòåðèè ìîæíî ïðèìåíÿòü è äëÿ ñðàâíåíèÿ
ïàðàìåòðîâ ðàñïðåäåëåíèé, åñëè àïðèîðè ïðåäïîëîæèòü, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ïðèíàäëåæàò îäíîìó êëàññó ðàñïðåäåëåíèé è íåîáõîäèìî ñðàâíèòü
çíà÷åíèÿ îäíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ.  ýòîì ñëó÷àå îòêëîíåíèå íóëåâîé
ãèïîòåçû, ñîñòîÿùåé â òîì, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ñîâïàäàþò, ãîâîðèò
î òîì, ÷òî çíà÷åíèÿ äàííîãî ïàðàìåòðà ðàçëè÷íû. Îäíàêî ñ ïîìîùüþ ýòèõ êðèòåðèåâ íåâîçìîæíî îöåíèòü ñòåïåíü ðàçëè÷èÿ çíà÷åíèé ïàðàìåòðîâ.
Ðàññìîòðèì íåñêîëüêî êðèòåðèåâ, íà÷èíàÿ ñ íàèáîëåå ïðîñòûõ (è ìåíåå òî÷íûõ). Îáðàùàåì âíèìàíèå, ÷òî áîëüøèíñòâî îïèñàííûõ êðèòåðèåâ ðàññ÷èòàíî íà
íåïðåðûâíûå ðàñïðåäåëåíèÿ ëèáî òðåáóþò íåêîòîðûõ ìîäèôèêàöèé äëÿ ðàáîòû
ñ äèñêðåòíûìè ðàñïðåäåëåíèÿìè. Äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé ðåêîìåíäóåì ñðàçó îáðàòèòüñÿ ê êðèòåðèþ õè-êâàäðàò (ðàçäåë 12.5), åñëè íåò êàêèõ-ëèáî “ïðîòèâîïîêàçàíèé” èëè åñëè ñ ïîìîùüþ ýòèõ êðèòåðèåâ âû íå ïðîâåðÿåòå ðàçëè÷èå â çíà÷åíèÿõ ïàðàìåòðîâ ðàñïðåäåëåíèé, êàê ñêàçàíî âûøå.
12.1.1. Непараметрический критерий медианы
Ýòîò êðèòåðèé ÿâëÿåòñÿ ìîäèôèêàöèåé êðèòåðèÿ çíàêîâ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû (ñì. ðàçäåë 11.4.1), îáîáùåííûé äëÿ ñëó÷àÿ íåñêîëüêèõ âûáîðîê.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk.
Ãèïîòåçû
Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âñå k âûáîðîê îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå
k
âû÷èñëÿåòñÿ âûáîðî÷íàÿ ìåäèàíà m ñëåäóþùèì îáðàçîì (äàëåå n = ∑ ni ).
i =1
a) Äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ
âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Âûáîðî÷íàÿ ìåäèàíà m = õ(k+1),
åñëè n = 2k + 1, è m = (õ(k) + õ(k+1))/2, åñëè n = 2k.
b) Äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé ïî îáúåäèíåííîé âûáîðêå ðàññ÷èòûâàåòñÿ ÷àñòîòíàÿ òàáëèöà, êîòîðàÿ ñîðòèðóåòñÿ ïî âîçðàñòàíèþ çíà÷åíèé.
Âû÷èñëÿåòñÿ çíà÷åíèå õm, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà
Fm, ìåíüøàÿ n/2, è ñëåäóþùåå ïî âåëè÷èíå çíà÷åíèå õm+1, êîòîðîìó
ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm+1, áîëüøàÿ èëè ðàâíàÿ n/2. Òîãäà ìåäèàíà m âû÷èñëÿåòñÿ ïî ôîðìóëå M = xm + ( xm +1 − xm )
n / 2 − Fm
.
Fm +1
2. Äëÿ êàæäîé i-é âûáîðêè ïîäñ÷èòûâàåòñÿ ÷èñëî çíà÷åíèé Ri, ïðåâîñõîäÿùèõ m. Åñëè åñòü îäèíî÷íûå âûáîðî÷íûå çíà÷åíèÿ, ñîâïàäàþùèå ñî çíà÷åíèåì m, òî ýòè çíà÷åíèÿ èñêëþ÷àþòñÿ èç ïîäñ÷åòîâ, à çíà÷åíèå îáúåìà
ñîîòâåòñòâóþùåé âûáîðêè óìåíüøàåòñÿ íà åäèíèöó. Äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé âåðîÿòíî ñîâïàäåíèå ñ âûáîðî÷íîé ìåäèàíîé m ñðàçó íåñêîëüêèõ çíà÷åíèé â îäíîé âûáîðêå.  ýòîì ñëó÷àå, åñëè òàêèõ çíà÷åíèé ÷åòíîå
÷èñëî, ïîëîâèíà èç íèõ ñ÷èòàåòñÿ ìåíüøèìè m, à ïîëîâèíà áîëüøèìè m.
Åñëè æå òàêèõ çíà÷åíèé íå÷åòíîå ÷èñëî, òî îòáðàñûâàåòñÿ îäíî çíà÷åíèå
(îáúåì âûáîðêè òàêæå óìåíüøàåòñÿ íà åäèíèöó), à îñòàëüíûå äåëÿòñÿ ïîïîëàì è ñ÷èòàåòñÿ, ÷òî îäíà ïîëîâèíà áîëüøå m, à äðóãàÿ — ìåíüøå m.
Îáû÷íî äëÿ óäîáñòâà âû÷èñëåíèé ñîñòàâëÿåòñÿ òàáëèöà ñëåäóþùåãî âèäà.
×èñëî çíà÷åíèé,
áîëüøèõ m
×èñëî çíà÷åíèé,
ìåíüøèõ m
Âñåãî
Âûáîðêà 1
R1
n1 – R 1
n1
Âûáîðêà 2
...
R2
...
n2 – R 2
...
n2
...
Rk
nk – R k
nk
k
n = ∑ ni
Âûáîðêà k
Âñåãî
k
∑R
i
i =1
350 Часть III. Анализ одномерных выборок
n − ∑ Ri
i =1
k
i =1
k
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑
i =1
Ri2 + (ni − Ri ) 2
−n.
ni / 2
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû.
Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ tí êàê êâàíòèëü ïîðÿäêà α/2 ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû è tâ êàê êâàíòèëü ïîðÿäêà 1 – α/2 òîãî æå
ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèé. Êàê è êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè (ñì. ñëåäóþùèé ðàçäåë), ýòîò êðèòåðèé ñêîðåå “óëàâëèâàåò” ðàçëè÷èÿ â ïîëîæåíèè ìåäèàí âûáîðîê,
à íå ðàçëè÷èÿ â ôîðìå ðàñïðåäåëåíèé. Ïîýòîìó, ñ îäíîé ñòîðîíû, åìó ñëåäóåò, ïî
âîçìîæíîñòè, ïðåäïî÷åñòü áîëåå íàäåæíûå êðèòåðèè, à ñ äðóãîé ñòîðîíû, åãî
ìîæíî èñïîëüçîâàòü êàê êðèòåðèé ñîâïàäåíèÿ “ñðåäíèõ çíà÷åíèé” âûáîðîê.
Ïðàêòè÷åñêóþ ðåàëèçàöèþ ïîêàæåì îòäåëüíî äëÿ íåïðåðûâíûõ è äèñêðåòíûõ ðàñïðåäåëåíèé.
Реализация критерия для непрерывных распределений
Ñíà÷àëà ïîêàæåì, êàê ïîäñ÷èòàòü çíà÷åíèå âûáîðî÷íîé ìåäèàíû. Íà ðèñ. 12.1
ïîêàçàíû òðè âûáîðêè îáúåìîì ñîîòâåòñòâåííî 20, 30 è 40 çíà÷åíèé. Âñå âûáîðêè
èìåþò íîðìàëüíûå ðàñïðåäåëåíèÿ, ïðè÷åì ïåðâûå äâå âûáîðêè — ñòàíäàðòíîå,
à òðåòüÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íîé äèñïåðñèåé è ìàòåìàòè÷åñêèì
îæèäàíèåì, ðàâíûì 1. Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ôîðìóë ìàññèâîâ
{=НОРМСТОБР(СЛЧИС())} и {=НОРМОБР(СЛЧИС();1;1)}.
Ðèñ. 12.1. Âû÷èñëåíèå âûáîðî÷íîé ìåäèàíû
Ê ñîæàëåíèþ, íàéòè çíà÷åíèå âûáîðî÷íîé ìåäèàíû íå óäàåòñÿ áåç ÿâíîãî âû÷èñëåíèÿ ðàíãîâ çíà÷åíèé îáúåäèíåííîé âûáîðêè. Ýòè ðàíãè âû÷èñëÿþòñÿ â ñòîëáöàõ
Глава 12. Сравнение одномерных выборок
351
D:F ñ ïîìîùüþ ôîðìóëû ìàññèâîâ {=РАНГ(A2:C41;A2:C41;1)}, îõâàòûâàþùåé äèàïàçîí D2:F41. Çäåñü A2:C41 — äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âñå âûáîðî÷íûå çíà÷åíèÿ.
Ïîñêîëüêó âûáîðêè èìåþò ðàçíûå îáúåìû, ÷àñòü ÿ÷ååê äèàïàçîíà D2:F41 áóäåò ñîäåðæàòü çíà÷åíèå îøèáêè #Н/Д (â òåõ ÿ÷åéêàõ, êîòîðûå ñîîòâåòñòâóþò ïóñòûì ÿ÷åéêàì äèàïàçîíà A2:C41), îäíàêî ýòî íå ïîâëèÿåò íà ïîñëåäóþùèå âû÷èñëåíèÿ.
 ÿ÷åéêàõ Í2:Í4 âû÷èñëÿþòñÿ îáúåìû âûáîðîê, à â ÿ÷åéêå Í5 — îáúåì îáúåäèíåííîé âûáîðêè (ôîðìóëû ïðèâåäåíû íà ðèñ. 12.1).  ÿ÷åéêàõ Í6 è Í7 â çàâèñèìîñòè
îò ÷åòíîñòè èëè íå÷åòíîñòè çíà÷åíèÿ îáúåìà îáúåäèíåííîé âûáîðêè îïðåäåëÿþòñÿ
ðàíãè âûáîðî÷íûõ çíà÷åíèé, ïî êîòîðûì áóäåò âû÷èñëÿòüñÿ âûáîðî÷íàÿ ìåäèàíà. Åñëè çíà÷åíèå îáúåìà îáúåäèíåííîé âûáîðêè íå÷åòíî, òî ðàíãè áóäóò ñîâïàäàòü.
Äàëåå ïî ýòèì çíà÷åíèÿì ðàíãîâ íàäî íàéòè ñîîòâåòñòâóþùèå èì âûáîðî÷íûå
çíà÷åíèÿ. Äëÿ îäíîé âûáîðêè ñäåëàòü ýòî íåñëîæíî ñ ïîìîùüþ ôóíêöèè ВПР
(ïîäîáíûå âû÷èñëåíèÿ îïèñàíû â ðàçäåëå 10.11).  äàííîì ñëó÷àå ïðèìåíåíèå
ôóíêöèè ВПР çàòðóäíåíî (ïîñêîëüêó ïîèñê íåîáõîäèìî âåñòè íå ïî îäíîìó
ñòîëáöó, à ïî íåñêîëüêèì), íî òàêæå âîçìîæíî. Îäíàêî ïðèìåíèì ôóíêöèþ
БИЗВЛЕЧЬ (ýòî ôóíêöèÿ èç êàòåãîðèè ôóíêöèé áàç äàííûõ).
Ñèíòàêñèñ äàííîé ôóíêöèè:
БИЗВЛЕЧЬ(Áàçà_äàííûõ;Ïîëå;Êðèòåðèé)
Ýòà ôóíêöèÿ â áàçå äàííûõ (äèàïàçîí ÿ÷ååê, ñîäåðæàùèé áàçó äàííûõ, çàäàåòñÿ
ïåðâûì àðãóìåíòîì ôóíêöèè) èçâëåêàåò çíà÷åíèå èç óêàçàííîãî ïîëÿ (âòîðîé
àðãóìåíò) òîé çàïèñè, êîòîðàÿ óäîâëåòâîðÿåò êðèòåðèÿì ïîèñêà (äèàïàçîí ÿ÷ååê,
ñîäåðæàùèé êðèòåðèé ïîèñêà, çàäàåòñÿ â êà÷åñòâå òðåòüåãî àðãóìåíòà).  äàííîì ñëó÷àå ñëîæíîñòü ïðèìåíåíèÿ ýòîé ôóíêöèè ñîñòîèò â òîì, ÷òî çàðàíåå íåèçâåñòíî, èç êàêîãî ïîëÿ (ò.å. âûáîðêè) èçâëåêàòü çíà÷åíèå. Èç ýòîãî ïîëîæåíèÿ
ìîæíî âûéòè ñ ïîìîùüþ ôîðìóëû (îíà çàïèñàíà â ÿ÷åéêå Í8; ôîðìóëà â ÿ÷åéêå
Í9 ïðàêòè÷åñêè ñîâïàäàåò ñ äàííîé)
=БИЗВЛЕЧЬ(A1:F41;ЕСЛИ(ЕНД(ПОИСКПОЗ(H6;Ранги1;0));
ЕСЛИ(ЕНД(ПОИСКПОЗ(H6;Ранги2;0));3;2);1);J1:L4).
Çäåñü äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âû÷èñëåííûå ðàíãè, íàçâàíû ñîîòâåòñòâåííî Ранги1, Ранги2 è Ранги3.
×òîáû ðàçîáðàòüñÿ, êàê ðàáîòàåò ýòà ôîðìóëà, ðàçîáüåì åå íà îòäåëüíûå ÷àñòè. Íà ðèñ. 12.2 òàêèå ÷àñòè-ôîðìóëû âûïîëíÿþòñÿ â ÿ÷åéêàõ Í12:Í16
(ôîðìóëà èç ÿ÷åéêè Í14 íå èñïîëüçóåòñÿ â êîíå÷íîé ôîðìóëå — îíà ïðèâåäåíà
äëÿ ïîëíîòû êàðòèíû). Ôîðìóëû â ÿ÷åéêàõ Í12:Í14 îïðåäåëÿþò, êàêîé âûáîðêå ïðèíàäëåæèò âûáîðî÷íîå çíà÷åíèå ñ ðàíãîì, çíà÷åíèå êîòîðîãî çàïèñàíî
â ÿ÷åéêå Í6. Îíè âîçâðàùàþò ÷èñëî, ðàâíîå ïîçèöèè âûáîðî÷íîãî çíà÷åíèÿ â
âûáîðêå, åñëè ýòîò ðàíã ïðèíàäëåæèò äàííîé âûáîðêå.  ïðîòèâíîì ñëó÷àå ôîðìóëà âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. (Äëÿ ïîÿñíåíèÿ â ñîñåäíèõ ÿ÷åéêàõ
G12:G14 çàïèñàíû ÷èñëà (íå ôîðìóëû), ñîîòâåòñòâóþùèå íîìåðó âûáîðêè.) Òàêèì
îáðàçîì, èìååì “èíäèêàòîð”, óêàçûâàþùèé íîìåð âûáîðêè, — âûáîðî÷íîå çíà÷åíèå ñ äàííûì ðàíãîì ïðèíàäëåæèò òîé âûáîðêå, äëÿ êîòîðîé ôîðìóëà âîçâðàùàåò
÷èñëî, à íå çíà÷åíèå îøèáêè. Íà îñíîâàíèè ýòîãî “èíäèêàòîðà” ïîñòðîåíà ôîðìóëà â ÿ÷åéêå Í15, êîòîðàÿ è âû÷èñëÿåò íîìåð âûáîðêè (ñðàâíèòå çíà÷åíèÿ â ýòîé
ÿ÷åéêå è â ÿ÷åéêàõ G12:G14). Çäåñü èñïîëüçîâàíà ôóíêöèÿ ЕНД, êîòîðàÿ âîçâðàùàåò çíà÷åíèå ИСТИНА, åñëè åå àðãóìåíò èìååò çíà÷åíèå îøèáêè #Н/Д.
Íàêîíåö, ôîðìóëà â ÿ÷åéêå Í16, àíàëîãè÷íàÿ ôîðìóëå â ÿ÷åéêå Í8, âîçâðàùàåò âûáîðî÷íîå çíà÷åíèå, ñîîòâåòñòâóþùåå óêàçàííîìó ðàíãó. Íîìåð âûáîðêè
352 Часть III. Анализ одномерных выборок
îïðåäåëåí â ÿ÷åéêå Í15, êðèòåðèé îòáîðà çàäàí â äèàïàçîíå J1:L4. Êðèòåðèé ñîñòîèò èç óñëîâèé ðàâåíñòâà çíà÷åíèé ðàíãîâ â ïîëÿõ Ранги1, Ранги2 è Ранги3
çíà÷åíèþ ðàíãà â ÿ÷åéêå Í6. Óñëîâèÿ çàïèñàíû â îòäåëüíûõ ñòðîêàõ — ýòî îçíà÷àåò, ÷òî äëÿ îòáîðà çàïèñè äîëæíî âûïîëíÿòüñÿ õîòÿ áû îäíî èç ýòèõ óñëîâèé. Åñëè áû óñëîâèÿ áûëè çàïèñàíû â îäíó ñòðîêó, ýòî îçíà÷àëî áû, ÷òî äëÿ
îòáîðà çàïèñè íåîáõîäèìî îäíîâðåìåííîå âûïîëíåíèå âñåõ óñëîâèé.
Ðèñ. 12.2. Èçâëå÷åíèå çíà÷åíèÿ èç âûáîðîê
Èòàê, çíà÷åíèå âûáîðî÷íîé ìåäèàíû ïîäñ÷èòàíî â ÿ÷åéêå Í10. Î÷åâèäíî, ÷òî
âû÷èñëåíèÿ â ÿ÷åéêàõ Í8 è Í9 ÿâëÿþòñÿ ïðîìåæóòî÷íûìè è îò íèõ ìîæíî îñâîáîäèòüñÿ, ñîçäàâ îäíó áîëüøóþ ôîðìóëó äëÿ âû÷èñëåíèÿ ìåäèàíû. Îäíàêî òàêàÿ
ôîðìóëà áóäåò ïðàêòè÷åñêè íå ÷èòàåìîé è ñòàíåò èñòî÷íèêîì ïîòåíöèàëüíûõ
îøèáîê (õîòÿ áû ïðè ââîäå òàêîé ôîðìóëû). ×òîáû íåìíîãî îñâîáîäèòü ðàáî÷èé
ëèñò, ñòîëáöû D:F, ñîäåðæàùèå ðàíãè, ìîæíî ñêðûòü, à ÿ÷åéêè ñ êðèòåðèÿìè äëÿ
ôóíêöèè БИЗВЛЕЧЬ ïåðåìåñòèòü “çà ýêðàí” (íà âû÷èñëåíèÿ ýòî íå ïîâëèÿåò).
Ïîñëå âû÷èñëåíèÿ çíà÷åíèÿ ìåäèàíû íåòðóäíî ïîäñ÷èòàòü çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè è êðèòè÷åñêèå çíà÷åíèÿ. Íà ðèñ. 12.3 ïîêàçàí çàêîí÷åííûé
ðàáî÷èé ëèñò è ôîðìóëû äëÿ âû÷èñëåíèé. Îòìåòèì, ÷òî òàáëèöà (äèàïàçîí
I2:L6), ñîäåðæàùàÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, áîëüøèõ è ìåíüøèõ âûáîðî÷íîé ìåäèàíû, íå îáÿçàòåëüíà äëÿ âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè — ìîæíî ñîçäàòü îäíó óíèâåðñàëüíóþ ôîðìóëó. Îäíàêî çíà÷åíèÿ â ýòîé òàáëèöå óïðîùàþò äàëüíåéøèå âû÷èñëåíèÿ è, êðîìå òîãî, ïîçâîëÿþò
êîíòðîëèðîâàòü ïðàâèëüíîñòü âû÷èñëåíèÿ, ïîñêîëüêó ñóììû â ÿ÷åéêàõ J6 è K6
âñåãäà äîëæíû áûòü ðàâíûìè [n/2]. Äëÿ ýòèõ æå öåëåé â ÿ÷åéêå Í11 âû÷èñëÿåòñÿ íîìåð âûáîðêè, êîòîðîé ïðèíàäëåæèò ìåäèàííîå çíà÷åíèå (åñëè ñóììàðíûé
îáúåì îáúåäèíåííîé âûáîðêè âûðàæàåòñÿ ÷åòíûì ÷èñëîì, òî ýòî çíà÷åíèå íå
èñïîëüçóåòñÿ).  ÿ÷åéêàõ L3:L5 âû÷èñëÿþòñÿ îáúåìû âûáîðîê ñ ó÷åòîì òîãî, ÷òî
åñëè ìåäèàííîå çíà÷åíèå ñîâïàäàåò ñ âûáîðî÷íûì çíà÷åíèåì äàííîé âûáîðêè, òî
îáúåì ýòîé âûáîðêè óìåíüøàåòñÿ íà 1. Ïîñêîëüêó äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé âåðîÿòíîñòü ñîâïàäàþùèõ çíà÷åíèé ðàâíà íóëþ, çäåñü íå ïðåäóñìîòðåíà
ïðîâåðêà íàëè÷èÿ äðóãèõ ñîâïàäåíèé âûáîðî÷íûõ çíà÷åíèé ñ ìåäèàíîé.
Глава 12. Сравнение одномерных выборок
353
Íà ðèñ. 12.4 ïîêàçàí òîò æå ðàáî÷èé ëèñò äëÿ íîâûõ âûáîðîê, èìåþùèõ îäèíàêîâûå ñòàíäàðòíûå íîðìàëüíûå ðàñïðåäåëåíèÿ è íå÷åòíîå ÷èñëî çíà÷åíèé
â îáúåäèíåííîé âûáîðêå.
Ðèñ. 12.3. Ðàáî÷èé ëèñò äëÿ êðèòåðèÿ ìåäèàíû
Ðèñ. 12.4. Êðèòåðèé ìåäèàíû äëÿ íîâûõ äàííûõ
Реализация критерия для дискретных распределений
Çäåñü òàêæå ñíà÷àëà ïîäñ÷èòàåì çíà÷åíèå âûáîðî÷íîé ìåäèàíû. Íà ðèñ. 12.5
ïîêàçàíû äâå âûáîðêè îáúåìîì ñîîòâåòñòâåííî 30 è 50 çíà÷åíèé, ïðåäñòàâëåííûõ â âèäå ÷àñòîòíûõ òàáëèö è èìåþùèõ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì
λ = 2. Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, çàòåì
äëÿ íèõ ïîäñ÷èòàíû ÷àñòîòíûå òàáëèöû òàê, êàê ïîêàçàíî â ðàçäåëå 8.3.1. Ïî
ýòèì ÷àñòîòíûì òàáëèöàì ïîäñ÷èòûâàþòñÿ ÷àñòîòû è íàêîïëåííûå ÷àñòîòû îáúåäèíåííîé âûáîðêè: ÷àñòîòû ïðîñòî ñêëàäûâàþòñÿ äëÿ îäèíàêîâûõ çíà÷åíèé,
à íàêîïëåííûå ÷àñòîòû âû÷èñëÿþòñÿ òàê, êàê îïèñàíî â ðàçäåëå 8.3.1. Ñïîñîá
354 Часть III. Анализ одномерных выборок
âû÷èñëåíèÿ ìåäèàíû îïèñàí âûøå, â ðàçäåëå Вычисления â ï. 1, b. Ôîðìóëû,
íåîáõîäèìûå äëÿ âû÷èñëåíèÿ ìåäèàíû, ïîêàçàíû íà ðèñ. 12.5. Çäåñü èíòåðâàë
G3:G10, ñîäåðæàùèé çíà÷åíèÿ íàêîïëåííûõ ÷àñòîò, íàçâàí Нч. Òàêæå îòìåòèì
ôîðìóëû â ÿ÷åéêàõ I3 è I4, â äàííîì ñëó÷àå âûïîëíÿþùèå ðîëü ôóíêöèè ВПР,
êîòîðóþ íåëüçÿ ïðèìåíèòü íåïîñðåäñòâåííî áåç ïåðåñòàíîâêè ñòîëáöîâ òàê, ÷òîáû ñòîëáåö ñ íàêîïëåííûìè ÷àñòîòàìè ïðåäøåñòâîâàë ñòîëáöó ñî çíà÷åíèÿìè.
Ðèñ. 12.5. Âû÷èñëåíèå ìåäèàíû äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé
Íà ðèñ. 12.6 ïîêàçàí çàêîí÷åííûé ðàáî÷èé ëèñò è ôîðìóëû äëÿ âû÷èñëåíèé.
Îòìåòèì, ÷òî ñóììû çíà÷åíèé ïî ñòîëáöàì â òàáëèöå K3:L5, â îòëè÷èå îò ñëó÷àÿ
íåïðåðûâíûõ ðàñïðåäåëåíèé, íå îáÿçàíû ðàâíÿòüñÿ [n/2], ïîñêîëüêó çäåñü âûáîðî÷íàÿ ìåäèàíà âû÷èñëÿåòñÿ áåç ïðèâëå÷åíèÿ ïîðÿäêîâûõ ñòàòèñòèê. Ïî ýòîé
æå ïðè÷èíå çíà÷åíèå âûáîðî÷íîé ìåäèàíû òîëüêî â èñêëþ÷èòåëüíûõ ñëó÷àÿõ
(êîãäà íàêîïëåííàÿ ÷àñòîòà äëÿ ïåðâîãî çíà÷åíèÿ ðàâíà n/2) áóäåò ñîâïàäàòü
ñ âûáîðî÷íûìè çíà÷åíèÿìè. Äàííîå îáñòîÿòåëüñòâî çíà÷èòåëüíî îáëåã÷àåò âû÷èñëåíèå Ri. Åñëè çíà÷åíèå âûáîðî÷íîé ìåäèàíû âñå-òàêè ñîâïàäàåò ñ êàêèìëèáî âûáîðî÷íûì çíà÷åíèåì, ìîæíî íåìíîãî óâåëè÷èòü çíà÷åíèå âûáîðî÷íîé
ìåäèàíû (ýòî íå ïîâëèÿåò íà ðåçóëüòàò âû÷èñëåíèÿ êðèòåðèÿ).
12.1.2. Критерий Уилкоксона–Манна–Уитни
Ýòîò êðèòåðèé ÿâëÿåòñÿ ìîäèôèêàöèåé êðèòåðèÿ çíàêîâûõ ðàíãîâ Óèëêîêñîíà äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû (ñì. ðàçäåë 11.4.2), îáîáùåííîãî
äëÿ ñëó÷àÿ äâóõ âûáîðîê1. Êðàòêî êðèòåðèé îïèñàí â ðàçäåëå 2.4.2.
1
Ýòîò êðèòåðèé è åãî ìîäèôèêàöèè òàêæå íàçûâàþò êðèòåðèåì Óèëêîêñîíà è êðèòåðèåì
Ìàííà–Óèòíè. Ïåðâîíà÷àëüíî îí áûë ðàçðàáîòàí Óèëêîêñîíîì (Wilcoxon, 1945 ã.) äëÿ âûáîðîê îäèíàêîâûõ îáúåìîâ, à çàòåì îáîáùåí äëÿ ñëó÷àÿ âûáîðîê ïðîèçâîëüíûõ îáúåìîâ Ìàííîì
è Óèòíè (Mann, Whitney, 1947 ã.).
Глава 12. Сравнение одномерных выборок
355
Ðèñ. 12.6. Ðàáî÷èé ëèñò êðèòåðèÿ ìåäèàíû äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè îáúåìîì
ñîîòâåòñòâåííî n1 è n2, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ.
Ãèïîòåçû
Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå
ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè. Çäåñü è äàëåå n = n1 + n2.
2. Äëÿ îäíîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ R, êîòîðûå ïîëó÷èëè åå
âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå. Åñëè îáîçíà÷èòü ÷åðåç R1
ñóììó ðàíãîâ ïåðâîé âûáîðêè, à ÷åðåç R2 — ñóììó ðàíãîâ âòîðîé âûáîðêè,
òî ýòè ñóììû áóäóò ñâÿçàíû ñîîòíîøåíèåì R1 + R2 = n(n + 1)/2. Ïîýòîìó
äîñòàòî÷íî âû÷èñëèòü ñóììó ðàíãîâ òîëüêî îäíîé âûáîðêè. Îáû÷íî âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðêè, èìåþùåé ìåíüøèé îáúåì, à ñóììà ðàíãîâ
äðóãîé âûáîðêè âû÷èñëÿåòñÿ íà îñíîâàíèè ïðèâåäåííîãî ñîîòíîøåíèÿ.
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà.
a) Äëÿ ìàëûõ âûáîðîê:
1
1
U1 = n1 n2 + n1 (n1 + 1) − R1 , U 2 = n1n2 + n2 (n2 + 1) − R2 , U = max(U1, U2).
2
2
á) Äëÿ áîëüøèõ âûáîðîê:
1
U − n1n2
2
T=
.
n1n2 (n + 1)
12
356 Часть III. Анализ одномерных выборок
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà U èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Ìàííà–Óèòíè, à ñòàòèñòèêà Ò
èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
a) Äëÿ ìàëûõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü
ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ìàííà–Óèòíè. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè âûïîëíÿåòñÿ íåðàâåíñòâî U ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
á) Äëÿ áîëüøèõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü
ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0
îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Äëÿ ìàëûõ âûáîðîê, íåñìîòðÿ íà òî ÷òî âû÷èñëÿåòñÿ òîëüêî îäíî êðèòè÷åñêîå çíà÷åíèå, êðèòåðèé ÿâëÿåòñÿ äâóõñòîðîííèì ñ óðîâíåì çíà÷èìîñòè α.
2. Êðèòåðèé ñ÷èòàåòñÿ áîëåå òî÷íûì, ÷åì êðèòåðèé ìåäèàíû.
3. Ñóùåñòâóþò ðàçëè÷íûå ìíåíèÿ î òîì, êàêîãî îáúåìà âûáîðîê äîñòàòî÷íî
äëÿ òîãî, ÷òîáû ïðèìåíÿòü íîðìàëüíóþ àïïðîêñèìàöèþ. “Ñðåäíÿÿ” îöåíêà — îáúåì êàæäîé âûáîðêè äîëæåí áûòü íå ìåíåå 20.
4. Òàáëèöû ñî çíà÷åíèÿìè êâàíòèëåé ðàñïðåäåëåíèÿ Ìàííà–Óèòíè ïðèâîäÿòñÿ âî ìíîãèõ èñòî÷íèêàõ, íàïðèìåð [4, 9, 14].  [18] ïîêàçàí ñïîñîá
âû÷èñëåíèÿ ýòèõ êâàíòèëåé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ïîêàæåì ðåàëèçàöèþ êðèòåðèÿ ñ èñïîëüçîâàíèåì êðèòåðèàëüíîé ñòàòèñòèêè
Ò, ò.å. ñ èñïîëüçîâàíèåì íîðìàëüíîé àïïðîêñèìàöèè. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïîêàçàíû íà ðèñ. 12.7.  êà÷åñòâå òåñòîâûõ âçÿòû äâå âûáîðêè, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå: îäíà — ñòàíäàðòíîå, âòîðàÿ —
ñ åäèíè÷íûìè ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1 è Выборка2.
 ñòîëáöàõ Ñ è D âû÷èñëåíû ðàíãè çíà÷åíèé îáúåäèíåííîé âûáîðêè ñ ïîìîùüþ
ôîðìóëû ìàññèâà {=РАНГ(A2:B41;A2:B41;1)} (â äèàïàçîíå A2:B41 ñîäåðæàòñÿ çíà÷åíèÿ îáåèõ âûáîðîê). Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå ðàíãè äëÿ ïåðâîé è âòîðîé
âûáîðîê, íàçâàíû ñîîòâåòñòâåííî Ранг1 è Ранг2. Êàê âèäíî íà ðèñ. 12.7, íóëåâàÿ
ãèïîòåçà î ñîâïàäåíèè ðàñïðåäåëåíèé â äàííîì ñëó÷àå îòâåðãàåòñÿ.
12.1.3. Критерий Краскала–Уоллиса
Ýòîò êðèòåðèé ÿâëÿåòñÿ îáîáùåíèåì êðèòåðèÿ Óèëêîêñîíà–Ìàííà–Óèòíè
äëÿ ñëó÷àÿ íåñêîëüêèõ (áîëåå äâóõ) âûáîðîê.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì
ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íåïðåðûâíûå ðàñïðåäåëåíèÿ.
Ãèïîòåçû
Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Глава 12. Сравнение одномерных выборок
357
Ðèñ. 12.7. Êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè
Âû÷èñëåíèÿ
1. Âñå k âûáîðîê îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è íàõîäÿòñÿ ðàíãè
âûáîðî÷íûõ çíà÷åíèé. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì
k
ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè. Çäåñü è äàëåå n = ∑ ni .
i =1
2. Äëÿ êàæäîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ Ri, êîòîðûå ïîëó÷èëè åå âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå.
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
k
Ri2
12
∑ − 3(n + 1) .
n(n + 1) i =1 ni
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Êðàñêàëà–Óîëëèñà. Àñèìïòîòè÷åñêè ýòà ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû.
a) Äëÿ ìàëûõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü
ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êðàñêàëà–Óîëëèñà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
á) Äëÿ áîëüøèõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü
ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0
ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Òàáëèöû ñî çíà÷åíèÿìè êâàíòèëåé ðàñïðåäåëåíèÿ Êðàñêàëà–Óîëëèñà ïðèâîäÿòñÿ â [9, 14].
2.  [22] ïîêàçàíà áîëåå òî÷íàÿ àïïðîêñèìàöèÿ, îñíîâàííàÿ íà ïðåîáðàçîâàíèè ñòàòèñòèêè Ò ñ èñïîëüçîâàíèåì F-ðàñïðåäåëåíèÿ.
358 Часть III. Анализ одномерных выборок
3. Êðèòåðèé ñ÷èòàåòñÿ áîëåå òî÷íûì, ÷åì êðèòåðèé ìåäèàíû.
4. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, òî êðèòåðèé íå ïîçâîëÿåò îïðåäåëèòü,
êàêèå ñîâîêóïíîñòè èìåþò ðàçëè÷íûå ðàñïðåäåëåíèÿ. Îäíàêî ïðèìåíåíèå
äëÿ îïðåäåëåíèÿ ðàçëè÷íûõ ðàñïðåäåëåíèé ïîïàðíûõ ñðàâíåíèé âûáîðîê
ìåòîäîì Óèëêîêñîíà–Ìàííà–Óèòíè íåæåëàòåëüíî, ïîñêîëüêó ïðè ìíîãîêðàòíîì ïðèìåíåíèè îäíîãî êðèòåðèÿ ðåçêî âîçðàñòàåò âåðîÿòíîñòü îøèáêè ïåðâîãî ðîäà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî êðèòåðèÿ ïî÷òè ïîëíîñòüþ ñîâïàäàåò ñ ðåàëèçàöèåé ìåòîäà Óèëêîêñîíà–Ìàííà–Óèòíè (çà èñêëþ÷åíèåì âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè è êðèòè÷åñêîãî çíà÷åíèÿ).
12.1.4. Критерий серий Вальда–Вольфовица
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè îáúåìîì
ñîîòâåòñòâåííî n1 è n2, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ.
Ãèïîòåçû
Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå
ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) (n = n1 + n2).
2. Ïî âàðèàöèîííîìó ðÿäó ïîäñ÷èòûâàåòñÿ êîëè÷åñòâî ñåðèé U — êîëè÷åñòâî
ó÷àñòêîâ âàðèàöèîííîãî ðÿäà, â êîòîðûõ ïðèñóòñòâóþò çíà÷åíèÿ òîëüêî
îäíîé âûáîðêè.
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
2n1n2
−1
n
.
2n1n2 (2n1n2 − n)
n 2 (n + 1)
U−
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî
íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé íå òàê ÷óâñòâèòåëåí ê ôîðìå ðàñïðåäåëåíèé, êàê ê ïàðàìåòðàì ïîëîæåíèÿ ðàñïðåäåëåíèé. Ïîýòîìó åãî ÷àñòî èñïîëüçóþò êàê íåïàðàìåòðè÷åñêèé êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê.
2. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì. Îí ïðèìåíÿåòñÿ, åñëè êàæäàÿ èç
âûáîðîê èìååò áîëüøå 20 çíà÷åíèé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.8 ïîêàçàí ðàáî÷èé ëèñò, ðåàëèçóþùèé êðèòåðèé ñåðèé.  ñòîëáöàõ
À è  ñîäåðæàòñÿ äâå âûáîðêè îáúåìîì ñîîòâåòñòâåííî 20 è 30 çíà÷åíèé.
 ñòîëáöàõ C è D, êàê è â êðèòåðèè Óèëêîêñîíà–Ìàííà–Óèòíè, ïîäñ÷èòàíû ðàíãè
Глава 12. Сравнение одномерных выборок
359
çíà÷åíèé îáúåäèíåííîé âûáîðêè. Çàòåì ýòè ðàíãè îòñîðòèðîâàíû ïî âîçðàñòàíèþ, ïðè÷åì êàæäûé ñòîëáåö â îòäåëüíîñòè (ìîæíî ñîðòèðîâàòü ïî óáûâàíèþ —
ýòî íå ñóùåñòâåííî). Çíà÷åíèÿ ðàíãîâ, èäóùèå â íàòóðàëüíîì ïîðÿäêå, îáðàçóþò
ñåðèè. Ýòè ñåðèè íà ðèñ. 12.8 ïîêàçàíû ðàçíûìè öâåòàìè. Òåïåðü íàäî ïîäñ÷èòàòü êîëè÷åñòâî ñåðèé. Äëÿ ýòîãî â ñîñåäíèõ ñòîëáöàõ â ÿ÷åéêå Å2 è F2 ââåäåíû
çíà÷åíèÿ 1. Äàëåå â ÿ÷åéêàõ Å3 è F3 ââåäåíû ôîðìóëû =ЕСЛИ(C3=C2+1;0;1)
è =ЕСЛИ(D3=D2+1;0;1) ñîîòâåòñòâåííî, êîòîðûå çàòåì ñêîïèðîâàíû âíèç. Òàêèì
îáðàçîì ñòàâèòñÿ åäèíèöà â íà÷àëå ñåðèè, à îñòàëüíûì ýëåìåíòàì ñåðèè ñòàâèòñÿ
â ñîîòâåòñòâèå íóëü. Êîëè÷åñòâî ñåðèé ïîäñ÷èòûâàåòñÿ â ÿ÷åéêå Í5 êàê ñóììà
åäèíèö â äèàïàçîíàõ Серии1 è Серии2. Îñòàëüíûå ôîðìóëû êðèòåðèÿ, âû÷èñëÿþùèå êðèòåðèàëüíóþ ñòàòèñòèêó è êðèòè÷åñêîå çíà÷åíèå, ïîêàçàíû íà ðèñ. 12.8.
Ðèñ. 12.8. Êðèòåðèé ñåðèé
12.1.5. Критерий χ2
Äàííûé êðèòåðèé ÿâëÿåòñÿ îáîáùåíèåì äëÿ ñëó÷àÿ íåñêîëüêèõ âûáîðîê îäíîèìåííîãî êðèòåðèÿ, îïèñàííîãî â ðàçäåëàõ 2.4.3 è 9.3. Êðèòåðèé ìîæíî ïðèìåíÿòü äëÿ ñðàâíåíèÿ êàê íåïðåðûâíûõ, òàê è äèñêðåòíûõ ðàñïðåäåëåíèé. Îäíàêî
÷àùå åãî ïðèìåíÿþò äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  ñëó÷àå íåïðåðûâíûõ ðàñïðåäåëåíèé, åñëè îïðåäåëåíû èíòåðâàëû, íà êîòîðûå ðàçáèâàåòñÿ îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé, è ïîäñ÷èòàíû ÷àñòîòû ïîïàäàíèÿ âûáîðî÷íûõ çíà÷åíèé â ýòè èíòåðâàëû (ñì. ðàçäåë 9.3), êðèòåðèàëüíûå âû÷èñëåíèÿ
ñîâïàäàþò ñ àíàëîãè÷íûìè âû÷èñëåíèÿìè äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé. Ïîýòîìó îïèøåì äàííûé êðèòåðèé äëÿ ñëó÷àÿ äèñêðåòíûõ ðàñïðåäåëåíèé.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì
ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ äèñêðåòíûå ðàñïðåäåëåíèÿ. Ïðåäïîëàãàåòñÿ, ÷òî âûáîðêè çàäàíû ó âèäå ÷àñòîòíûõ òàáëèö. (Î âû÷èñëåíèè ÷àñòîòíûõ
òàáëèö ðå÷ü èäåò â ðàçäåëå 8.3.1.)
360 Часть III. Анализ одномерных выборок
Ãèïîòåçû
Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âñå k ÷àñòîòíûõ òàáëèö îáúåäèíÿþòñÿ â åäèíóþ òàáëèöó ñëåäóþùåãî âèäà.
Çíà÷åíèÿ
×àñòîòû âûáîðêè 1
õ1
f11
õm
...
õ2
f12
...
Âñåãî
f1m
m
n1 = ∑ f1 j
j =1
×àñòîòû âûáîðêè 2
f21
f22
...
f2m
m
n2 = ∑ f 2 j
j =1
...
...
...
...
...
...
×àñòîòû âûáîðêè k
fk1
fk2
...
fkm
nk = ∑ f kj
m
j =1
Âñåãî
k
f1 = ∑ f i1
i =1
k
k
f 2 = ∑ fi 2
f m = ∑ f im
i =1
i =1

m

j =1 i =1
k
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = n  ∑∑

k
n = ∑ ni
i =1

− 1 .

ni f j

f ji2
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (m – 1)(k – 1) ñòåïåíüþ
ñâîáîäû.
Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ têð êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (m – 1)(k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèé. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì. Ñ÷èòàåòñÿ, ÷òî åãî ìîæíî ïðèìåíÿòü, åñëè îáúåì êàæäîé âûáîðêè — íå ìåíåå 15.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.9 ïîêàçàí ðàáî÷èé ëèñò ñ äâóìÿ âûáîðêàìè, ïðåäñòàâëåííûìè
â âèäå ÷àñòîòíûõ òàáëèö, êîòîðûå èñïîëüçîâàëèñü â ïðèìåðå êðèòåðèÿ ìåäèàíû
äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  ñòîëáöå Å âû÷èñëÿþòñÿ ñóììû ÷àñòîò äëÿ êàæäîãî çíà÷åíèÿ (ñîîòâåòñòâóþò ñòðîêå Всего â ïðèâåäåííîé âûøå òàáëèöå).
 ÿ÷åéêå G4 âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà ñ ïîìîùüþ ôîðìóëû ìàññèâà, ïîêàçàííîé íà ðèñ. 12.9.  ñëó÷àå áîëüøåãî êîëè÷åñòâà âûáîðîê ýòó ôîðìóëó, ïî-âèäèìîìó, ñëåäóåò ðàçáèòü íà íåñêîëüêî (ïî êîëè÷åñòâó âûáîðîê), ÷òîáû ñäåëàòü åå áîëåå ÷èòàåìîé è ïðîñòîé.
Глава 12. Сравнение одномерных выборок
361
Ðèñ. 12.9. Êðèòåðèé χ2
12.1.6. Критерий Смирнова
Ýòîò êðèòåðèé, êàê è êðèòåðèé Êîëìîãîðîâà (ñì. ðàçäåë 9.3), ïîñòðîåí íà ñðàâíåíèè íå îòäåëüíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ (ïðèâåäåííûå âûøå êðèòåðèè îñíîâàíû íà ñðàâíåíèè ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé), à ôóíêöèé ðàñïðåäåëåíèÿ.
 äàííîì êðèòåðèè ñðàâíèâàþòñÿ ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2,
..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ.
Ãèïîòåçû
Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî êàæäîé âûáîðêå â îòäåëüíîñòè ñòðîÿòñÿ âàðèàöèîííûå ðÿäû õ(1) ≤ õ(2) ≤
... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(m).
2. Âû÷èñëÿþòñÿ
è Dm− , r = Fx ( y( r ) ) −
ðàçíîñòè
Dm+ , r =
r
− Fx ( y( r ) )
m
(èëè
Dn+, s = Fy ( x( s ) ) −
s −1
)
n
r −1
s
(èëè Dn−, s = − Fy ( x( s ) ) ), r = 1, 2, ..., n, s = 1, 2, ..., m. Çäåñü
m
n
Fx è Fy — ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ ñîîòâåòñòâåííî ïåðâîé è âòîðîé
âûáîðîê. Ìîæíî âû÷èñëÿòü ðàçíîñòè Dm+ , r è Dm− , r ëèáî ðàçíîñòè Dn+, s è Dn−, s .
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà ïî ôîðìóëå Dn, m = max( Dm+ , r , Dm− , r )
1≤ r ≤ m
ëèáî Dn, m = max( Dn+, s , Dn−, s ) .
1≤ s ≤ n
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn,m èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Ñìèðíîâà.
362 Часть III. Анализ одномерных выборок
Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn,m ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Äëÿ âû÷èñëåíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ Ñìèðíîâà ñóùåñòâóþò ñïåöèàëüíûå òàáëèöû, êîòîðûå ïðèâåäåíû âî ìíîãèõ êíèãàõ ïî ìàòåìàòè÷åñêîé
nm
Dn , m àñèìïòîòè÷åñêè
n+m
èìååò ðàñïðåäåëåíèå Êîëìîãîðîâà, ïðè n, m ≥ 40 è 0,01 ≤ α ≤ 0,2 ìîæíî
âîñïîëüçîâàòüñÿ
ïðèáëèæåííîé
ôîðìóëîé
äëÿ
âû÷èñëåíèÿ
têð:
ñòàòèñòèêå. Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà
tкр ≈
− ln(0,5α)
1
nm
−
, ãäå N =
[4].
2N
6N
n+m
2. Ñóùåñòâóåò ìíîãî ïðåîáðàçîâàíèé âåëè÷èíû Dn,m è àïïðîêñèìàöèé ðàñïðåäåëåíèÿ Ñìèðíîâà, êîòîðûå ïîçâîëÿþò íå îáðàùàòüñÿ íåïîñðåäñòâåííî
ê ðàñïðåäåëåíèþ Ñìèðíîâà äëÿ íàõîæäåíèÿ êðèòè÷åñêèõ çíà÷åíèé. Ïîäðîáíîå îïèñàíèå êðèòåðèÿ Ñìèðíîâà è åãî âàðèàíòîâ ìîæíî íàéòè â [22].
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.10 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé êðèòåðèé Ñìèðíîâà.
 êà÷åñòâå òåñòîâûõ âûáîðîê âçÿòû äâå âûáîðêè, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Êðèòåðèàëüíûå âû÷èñëåíèÿ çíà÷èòåëüíî óïðîùàþòñÿ, åñëè
âûáîðêè ïðåäâàðèòåëüíî îòñîðòèðîâàíû ïî âîçðàñòàíèþ, êàê è ñäåëàíî íà ïðåäëàãàåìîì ðàáî÷åì ëèñòå.  ñòîëáöàõ Ñ è D ïîäñ÷èòàíû ðàíãè âûáîðî÷íûõ çíà÷åíèé.
Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôóíêöèþ РАНГ èëè, ïðåäïîëàãàÿ, ÷òî íåò ñîâïàäàþùèõ çíà÷åíèé, ìîæíî ïðîñòî ââåñòè ïîñëåäîâàòåëüíîñòü íàòóðàëüíûõ ÷èñåë.
Ðèñ. 12.10. Êðèòåðèé Ñìèðíîâà
 ñòîëáöàõ Å è F âû÷èñëÿþòñÿ çíà÷åíèÿ ðàçíîñòåé Dn−, s è Dn+, s . Îïèøåì, êàê
âû÷èñëÿþòñÿ ðàçíîñòè Dn−, s . Ñíà÷àëà â ÿ÷åéêó Å2 ââîäèòñÿ ôîðìóëà
=C2/$H$2-ЕСЛИ(A2<=МИН(Выборка2);0;ВПР(A2;$B$2:$D$31;3;1)/$H$3).
Глава 12. Сравнение одномерных выборок
363
Çäåñü ðåàëèçîâàíà ôîðìóëà Dn−, s =
s
− Fy ( x( s ) ) . ×àñòü ôîðìóëû C2/$H$2 âû÷èñëÿåò
n
s/n (s — ðàíã âûáîðî÷íîãî çíà÷åíèÿ, n — îáúåì âûáîðêè). Ôîðìóëà
ВПР(A2;$B$2:$D$31;3;1)/$H$3 ïîäñ÷èòûâàåò Fy ( x( s ) ) . Ôóíêöèÿ ВПР íàõîäèò ðàíã t
íàèáîëüøåãî âûáîðî÷íîãî çíà÷åíèÿ âòîðîé âûáîðêè, êîòîðîå íå ïðåâîñõîäèò âûáîðî÷íîãî çíà÷åíèÿ ïåðâîé âûáîðêè ñ ðàíãîì s (çäåñü íåîáõîäèìà óïîðÿäî÷åííîñòü âûáîðîê). Çíà÷åíèå Fy ( x( s ) ) âû÷èñëÿåòñÿ êàê t/m (m — îáúåì âòîðîé âûáîðêè). Ôóíêöèÿ ЕСЛИ ñ óñëîâèåì A2<=МИН(Выборка2) èñïîëüçóåòñÿ äëÿ òîãî,
÷òîáû ïðåäîòâðàòèòü ïîÿâëåíèå çíà÷åíèÿ îøèáêè #Н/Д, ïîðîæäàåìîãî ôóíêöèåé
ВПР â ñëó÷àå, åñëè âî âòîðîé âûáîðêå íåò çíà÷åíèé, ìåíüøèõ x(s).
Ôîðìóëà, ââåäåííàÿ â ÿ÷åéêó Å2, çàòåì êîïèðóåòñÿ âíèç äî êîíöà äèàïàçîíà,
ñîäåðæàùåãî ñòîëüêî ÿ÷ååê, êàêîâ îáúåì ïåðâîé âûáîðêè. Àíàëîãè÷íî âû÷èñëÿþòñÿ ðàçíîñòè Dn+, s . Ôîðìóëû, ïî êîòîðûì âû÷èñëÿþòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà è êðèòè÷åñêîå çíà÷åíèå â ñòîëáöå Í, ïîêàçàíû íà ðèñ. 12.10.
12.2. Доверительные интервалы для параметров
распределений
 ýòîì ðàçäåëå ðàññìîòðåíû ìåòîäû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ
äëÿ ðàçíîñòåé èëè îòíîøåíèé îäíîòèïíûõ ïàðàìåòðîâ (íàïðèìåð, ìàòåìàòè÷åñêèõ îæèäàíèé èëè äèñïåðñèé) ðàçëè÷íûõ âûáîðîê. Ïî âåëè÷èíå ýòèõ ðàçíîñòåé
(îòíîøåíèé) òàêæå ìîæíî ñóäèòü î òîì, ñîâïàäàþò ëè âûáîðî÷íûå ðàñïðåäåëåíèÿ, åñëè ïðåäïîëîæèòü, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ïðèíàäëåæàò îäíîìó
êëàññó ðàñïðåäåëåíèé è îñòàëüíûå ïàðàìåòðû ðàñïðåäåëåíèé ñîâïàäàþò. Êàê
âñåãäà ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ, áîëüøóþ ðîëü èãðàþò àïðèîðíûå ïðåäïîëîæåíèÿ î òîì, êàêîìó êëàññó ïðèíàäëåæàò âûáîðî÷íûå ðàñïðåäåëåíèÿ. Ïðîâåðêó òàêèõ ïðåäïîëîæåíèé ìîæíî îñóùåñòâèòü ìåòîäàìè, îïèñàííûìè â ãëàâå 9. Íèæå áóäåò ïîêàçàíî ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ
ïàðàìåòðîâ íîðìàëüíûõ ðàñïðåäåëåíèé è áèíîìèàëüíûõ âåðîÿòíîñòåé.
12.2.1. Доверительный интервал для разности средних
нормальных совокупностей (равные дисперсии)
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2,
..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå. Ïðåäïîëàãàåòñÿ ðàâåíñòâî äèñïåðñèé îáåèõ âûáîðîê.
Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = µ1 – µ2 ìàòåìàòè÷åñêèõ îæèäàíèé
µ1 è µ2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ìàòåìàòè÷åñêèõ îæèäàíèé è äèñïåðñèé
n
m
i =1
i =1
x = ∑ xi , y = ∑ yi , S x2 =
δ̂ = x − y è An , m =
1 n
1 m
( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 è äîïîëíèòåëüíî
∑
n i =1
m i =1
(n + m)(nS x2 + mS y2 )
nm(n + m − 2)
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
364 Часть III. Анализ одномерных выборок
.
3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà
 1+ α 
,
 2 
ñ (n + m – 2) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 
Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà.
(
)
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m .
Êîììåíòàðèè
1. Åñëè èçâåñòíî çíà÷åíèå îáùåé äèñïåðñèè σ2, òî âìåñòî ðàñïðåäåëåíèÿ
Ñòüþäåíòà èñïîëüçóåòñÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ An,m S x2 è S y2 çàìåíÿþòñÿ çíà÷åíèåì σ2.
2. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè, åñëè âûïîëíÿþòñÿ òðåáîâàíèÿ ðàâåíñòâà äèñïåðñèé è îáúåìû âûáîðîê ïðèìåðíî ðàâíû.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé
(îáðàòèòå âíèìàíèå íà ïðàêòè÷åñêóþ ðåàëèçàöèþ ïîñòðîåíèÿ äîâåðèòåëüíîãî
èíòåðâàëà, ïðèâåäåííóþ â ñëåäóþùåì ðàçäåëå, êîòîðàÿ â çíà÷èòåëüíîé ñòåïåíè
ñîâïàäàåò ñ ðåàëèçàöèåé äàííîãî ìåòîäà).
12.2.2. Доверительный интервал для разности средних
нормальных совокупностей (разные дисперсии)
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2,
..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå. Ðàâåíñòâî äèñïåðñèé íå ïðåäïîëàãàåòñÿ.
Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = µ1 – µ2 ìàòåìàòè÷åñêèõ îæèäàíèé
µ1 è µ2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ìàòåìàòè÷åñêèõ îæèäàíèé è äèñïåðñèé
n
m
i =1
i =1
x = ∑ xi , y = ∑ yi , S x2 =
δ̂ = x − y , An , m =
1 n
1 m
( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 è äîïîëíèòåëüíî
∑
n i =1
m i =1
2
S x2 S y
è
+
n
m
ν=
 S x2 S y2 
 +

m 
 n
2
2
1  S x2 
1  Sy
+

 
n − 1  n  m − 1  m
2



2
−2.
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Âû÷èñëÿåòñÿ çíà÷åíèå k êàê êâàíòèëü ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ
Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû, ðàâíîé ν.
(
)
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m .
Глава 12. Сравнение одномерных выборок
365
Êîììåíòàðèè
1. Ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé îòâåðãàòü ïðåäïîëîæåíèå î ðàâåíñòâå äèñïåðñèé, òî ïðåäïî÷òèòåëüíåå
èñïîëüçîâàòü òî÷íûé äîâåðèòåëüíûé èíòåðâàë èç ïðåäûäóùåãî ðàçäåëà.
2. Åñëè èçâåñòíû çíà÷åíèÿ äèñïåðñèé σõ2 è σó2, òî âìåñòî ðàñïðåäåëåíèÿ
Ñòüþäåíòà èñïîëüçóåòñÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ An,m S x2 è S y2 çàìåíÿþòñÿ çíà÷åíèÿìè σõ2 è σó2.
3. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè.
4. Äëÿ äîñòàòî÷íî áîëüøèõ îáúåìîâ âûáîðîê, íàïðèìåð ïðè n + m > 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî èñïîëüçîâàòü ñòàíäàðòíîå íîðìàëüíîå
ðàñïðåäåëåíèå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.11 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé. Âñå ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, ïîêàçàíû íà ýòîì ðèñóíêå. Îòìåòèì, ÷òî
ïåðâàÿ âûáîðêà èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à âòîðàÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé, ðàâíîé 4.
Òàêèì îáðàçîì, çäåñü δ = –1. Òàêæå îáðàùàåì âíèìàíèå íà ïåðâûé àðãóìåíò ôóíêöèè СТЬЮДРАСПОБР — ýòà ôóíêöèÿ íå ÿâëÿåòñÿ îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà, à íàõîäèò êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p (ñì. ðàçäåë 4.7.7).
Ðèñ. 12.11. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê
12.2.3. Доверительный интервал для отношения дисперсий
нормальных совокупностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2,
..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå.
366 Часть III. Анализ одномерных выборок
Äîâåðèòåëüíûé èíòåðâàë äëÿ îòíîøåíèÿ γ = σõ2/σó2 äèñïåðñèé σõ2 è σó2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ
è S y2 =
òî÷å÷íûå
îöåíêè
äèñïåðñèé
S x2 =
1 n
( xi − x ) 2
∑
n i =1
(m − 1)nS x2
1 m
( yi − y ) 2 è äîïîëíèòåëüíî Bn , m =
.
∑
m i =1
(n − 1)mS y2
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Âû÷èñëÿþòñÿ êâàíòèëè t1 è t2 ïîðÿäêà ñîîòâåòñòâåííî (1 – α)/2 è (1 + α)/2
F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû n – 1 è m – 1.
 Bn , m Bn , m 
,
.
t1 
 t2
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: 
Êîììåíòàðèé. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íå óñòîé÷èâ ïðè îòêëîíåíèÿõ îò íîðìàëüíîñòè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.12 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ îòíîøåíèÿ äèñïåðñèé. Âñå ôîðìóëû, ïî
êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, ïîêàçàíû íà ýòîì ðèñóíêå. Îòìåòèì, ÷òî
ïåðâàÿ âûáîðêà èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à âòîðàÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé,
ðàâíîé 4. Òàêèì îáðàçîì, çäåñü γ = 0,25.
Ðèñ. 12.12. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ îòíîøåíèÿ äèñïåðñèé äâóõ âûáîðîê
12.2.4. Доверительный интервал для разности двух
биномиальных вероятностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ äâå ñåðèè íàáëþäåíèé çà ýêñïåðèìåíòîì.
 ïåðâîé ñåðèè â êàæäîì ýêñïåðèìåíòå ñ âåðîÿòíîñòüþ ð1 ïðîèñõîäèò ñîáûòèå
“1” (“óñïåõ”), âî âòîðîé ñåðèè ýòî ñîáûòèå ïðîèñõîäèò ñ âåðîÿòíîñòüþ ð2. Ïóñòü
Глава 12. Сравнение одномерных выборок
367
â ïåðâîé ñåðèè çàôèêñèðîâàíî n ýêñïåðèìåíòîâ, èç íèõ â r1 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Âî âòîðîé ñåðèè çàôèêñèðîâàíî m ýêñïåðèìåíòîâ, èç íèõ â r2
ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Ðàçìåðû ñåðèé áîëüøå 20.
Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = ð1 – ð2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè âåðîÿòíîñòåé ð1 è ð2: pˆ1 = r1 / n , pˆ 2 = r2 / m
è äîïîëíèòåëüíî δˆ = pˆ1 − pˆ 2 , An , m =
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
+
.
n
m
2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
3. Âû÷èñëÿåòñÿ çíà÷åíèå k êàê êâàíòèëü ïîðÿäêà (1 + α)/2 ñòàíäàðòíîãî
íîðìàëüíîãî ðàñïðåäåëåíèÿ.
(
)
4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m .
Êîììåíòàðèé. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì è îñíîâûâàåòñÿ íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåìû âûáîðîê áûëè íå ìåíüøå 20.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé.
12.3. Проверка гипотез о параметрах
распределений
 äàííîì ðàçäåëå ñðàâíèâàþòñÿ âûáîðêè â âèäå êðèòåðèåâ ïðîâåðêè ãèïîòåç
î ðàâåíñòâå èëè ðàçëè÷èè ïàðàìåòðîâ ðàñïðåäåëåíèé îòäåëüíûõ îäíîìåðíûõ âûáîðîê.  ýòîì ñëó÷àå, êàê è ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé èëè îòíîøåíèé ïàðàìåòðîâ ðàñïðåäåëåíèé, áîëüøóþ ðîëü èãðàþò ïðåäïîëîæåíèÿ î òèïå âûáîðî÷íûõ ðàñïðåäåëåíèé. Áîëüøèíñòâî êðèòåðèåâ,
îïèñàííûõ íèæå, îòíîñèòñÿ ê íîðìàëüíûì ñîâîêóïíîñòÿì è ïðîâåðÿåò ñîâïàäåíèå èëè ìàòåìàòè÷åñêèõ îæèäàíèé, èëè äèñïåðñèé.
12.3.1. Проверка гипотез о математических ожиданиях
нормальных распределений
 ýòîì ðàçäåëå áóäóò ïðèâåäåíû êðèòåðèè äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ
îæèäàíèé äâóõ èëè áîëåå âûáîðîê, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå.
Критерий проверки гипотезы о равенстве математических ожиданий при
известных дисперсиях
Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.6, ïîñâÿùåííîì ñðåäñòâó
Двухвыборочный z-тест для средних.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è
µ2 ñîîòâåòñòâåííî.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
368 Часть III. Анализ одномерных выборок
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Í1: µ1 > µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî
y=
êàæäîé
âûáîðêå
âû÷èñëÿþòñÿ
âûáîðî÷íûå
ñðåäíèå
x=
1 n
∑ xi ,
n i =1
1 m
∑ yi .
m i =1
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà z =
(x − y)
σ / n + σ 22 / m
2
1
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
âûïîëíÿåòñÿ íåðàâåíñòâî |z| ≤ zêð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t.
Êîììåíòàðèé. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ
ñðåäñòâà Двухвыборочный z-тест для средних, êîòîðîå îïèñàíî â ðàçäåëå 5.6. Òàì
æå ïðèâåäåí ïðèìåð ðåàëèçàöèè êðèòåðèÿ.
Критерий Стьюдента проверки гипотезы о равенстве математических
ожиданий (случай равных дисперсий)
Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.7, ïîñâÿùåííîì ñðåäñòâó
ïàêåòà àíàëèçà Двухвыборочный t-тест с одинаковыми дисперсиями.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè, íî ðàâíûìè äèñïåðñèÿìè σ2 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
Í1: µ1 > µ2
1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x =
1 n
1 n
1 m
1 m
xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 .
∑
n i =1
n i =1
m i =1
m i =1
Глава 12. Сравнение одномерных выборок
369
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
n + m − 2( x − y )
n+m
(n − 1) S x2 + (m − 1) S y2
nm
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t.
Êîììåíòàðèè
1. Åñëè èçâåñòíà äèñïåðñèÿ ñîâîêóïíîñòåé σ2, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóþò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ ñòàòèñòèêè Ò çàìåíÿþò çíà÷åíèÿ âûáîðî÷íûõ äèñïåðñèé íà σ2.
2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî.
3. Êðèòåðèé òàêæå óñòîé÷èâ, åñëè äèñïåðñèè ãåíåðàëüíûõ ñîâîêóïíîñòåé íåçíà÷èòåëüíî îòëè÷àþòñÿ, à çíà÷åíèÿ n è m ïðèáëèçèòåëüíî ðàâíû.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ
ñðåäñòâà Двухвыборочный z-тест с одинаковыми дисперсиями, êîòîðîå îïèñàíî
â ðàçäåëå 5.7. Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèÿ.
Критерий Беренса–Фишера проверки гипотезы о равенстве математических ожиданий (случай неравных дисперсий)
Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.8, ïîñâÿùåííîì ñðåäñòâó
Двухвыборочный t-тест с различными дисперсиями.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè
ñîîòâåòñòâåííî µ1 è µ2. Ðàâåíñòâî äèñïåðñèé íå ïðåäïîëàãàåòñÿ.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: µ1 = µ2
Í0: µ1 ≤ µ2
Í1: µ1 ≠ µ2
Í1: µ1 > µ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x =
1 n
1 n
1 m
1 m
xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 .
∑
n i =1
n i =1
m i =1
m i =1
370 Часть III. Анализ одномерных выборок
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
íî çíà÷åíèå k =
( S x2 / n + S y2 / m)2
2
2
( S x2 / n) 2 ( S y / m)
+
n −1
m −1
x−y
S / n + S y2 / m
2
x
è äîïîëíèòåëü-
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ k ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñ k ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
|Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñ k ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé ïðåäïîëàãàòü, ÷òî
äèñïåðñèè íå ðàâíû (êðèòåðèé ïðîâåðêè ðàâåíñòâà äèñïåðñèé îïèñàí íèæå), ñëåäóåò ïðèìåíèòü òî÷íûé êðèòåðèé ïðîâåðêè ñðåäíèõ ïðè ðàâíûõ
äèñïåðñèÿõ. Åñëè ñóììà îáúåìîâ âûáîðîê áîëüøå 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî èñïîëüçîâàòü íîðìàëüíîå ðàñïðåäåëåíèå.
2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî.
3. Åñëè óñëîâèÿ ïðèìåíèìîñòè êðèòåðèÿ ÿâíî íå âûïîëíÿþòñÿ, ñëåäóåò îáðàòèòü
âíèìàíèå íà íåïàðàìåòðè÷åñêèå êðèòåðèè, îïèñàííûå â ðàçäåëå 12.1, êîòîðûå
ìîæíî èñïîëüçîâàòü êàê êðèòåðèè ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ
ñðåäñòâà Двухвыборочный t-тест с различными дисперсиями, êîòîðîå îïèñàíî
â ðàçäåëå 5.8. Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèè.
Критерий проверки гипотезы о равенстве нескольких математических
ожиданий (случай равных дисперсий)
Äàííûé êðèòåðèé ÿâëÿåòñÿ ìåòîäîì îäíîôàêòîðíîãî äèñïåðñèîííîãî àíàëèçà
(ñì. ðàçäåë 3.5.2).
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì
ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûk
ìè, íî ðàâíûìè äèñïåðñèÿìè. Îáîçíà÷èì n = ∑ ni .
i =1
Ãèïîòåçû
Í0: µ1 = µ2 = ... = µk;
Í1: ìàòåìàòè÷åñêèå îæèäàíèÿ µ1, µ2, ..., µk ðàçëè÷íû.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 .
Глава 12. Сравнение одномерных выборок
371
2. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x =
s2 =
1 k
∑ ni xi è îáùàÿ âûáîðî÷íàÿ äèñïåðñèÿ
n i =1
1 k
∑ (ni − 1) si2 .
n − k i =1
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
1 1 k
∑ ni ( xi − x )2 .
s 2 k − 1 i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k.
Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû
ν1 = k – 1 è ν2 = n – k. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1.  ñëó÷àå äâóõ âûáîðîê êðèòåðèé ýêâèâàëåíòåí êðèòåðèþ Ñòüþäåíòà ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé (ñì. âûøå).
2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè
îò íîðìàëüíîãî, åñëè âûáîðêè äîñòàòî÷íîãî áîëüøîãî îáúåìà.
3. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ ðàâåíñòâà
äèñïåðñèé, åñëè âûáîðêè ïðèìåðíî îäíîãî îáúåìà.
4. Ìîæíî ïðîâåðÿòü äðóãèå êðèòåðèè, íàïðèìåð:
Í0: µ1 – µ2 = δ, µ2 = µ3 = ... = µk;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
 ýòîì ñëó÷àå ñëåäóåò âû÷åñòü δ èç çíà÷åíèé ïåðâîé âûáîðêè è çàòåì ïðèìåíèòü êðèòåðèé.
5. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, òî äëÿ îïðåäåëåíèÿ òîãî, êàêèå ñðåäíèå ðàçëè÷àþòñÿ, íåîáõîäèìî ïðèìåíèòü êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå, îïèñàííûé â ñëåäóþùåì ðàçäåëå.
6. Åñëè ïðåäïîëîæåíèÿ äàííîãî êðèòåðèÿ ÿâíî íå âûïîëíÿþòñÿ, ñëåäóåò îáðàòèòü âíèìàíèå íà íåïàðàìåòðè÷åñêèé êðèòåðèé Êðàñêàëà–Óîëëèñà
(ðàçäåë 12.1.3), êîòîðûé ìîæíî èñïîëüçîâàòü êàê êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.13 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïîêàçàíû íà ýòîì ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âûñòóïàþò òðè âûáîðêè. Ïåðâàÿ èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è åäèíè÷íîé
äèñïåðñèåé, âòîðàÿ è òðåòüÿ — ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1,
Выборка2,
Выборка3.
Îáðàùàåì
âíèìàíèå
íà
ïðèìåíåíèå
ôóíêöèè
СУММПРОИЗВ (ñì. ðàçäåë 6.1.6), â òîì ÷èñëå â ôîðìóëàõ ìàññèâà, ÷òî ïîçâîëÿåò
èñêëþ÷èòü èñïîëüçîâàíèå ïðîìåæóòî÷íûõ âû÷èñëåíèé.
372 Часть III. Анализ одномерных выборок
Ðèñ. 12.13. Êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íåñêîëüêèõ ìàòåìàòè÷åñêèõ îæèäàíèé
Ýòîò êðèòåðèé ðåàëèçóåò òàêæå ñðåäñòâî Однофакторный дисперсионный
анализ, îïèñàííîå â ðàçäåëå 5.11. Òàì æå ïðèâîäèòñÿ ïðèìåð èñïîëüçîâàíèÿ ýòîãî ñðåäñòâà.
Критерий множественных сравнений Шеффе
Åñëè ïðåäûäóùèé êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé îòâåðãàåò
íóëåâóþ ãèïîòåçó î ðàâåíñòâå âñåõ ìàòåìàòè÷åñêèõ îæèäàíèé, òî êðèòåðèé
ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå ïîçâîëÿåò îïðåäåëèòü, ìàòåìàòè÷åñêèå îæèäàíèÿ êàêèõ âûáîðîê âûäåëÿþòñÿ èç îáùåãî ðÿäà. Ñ ïîìîùüþ ýòîãî ìåòîäà
ìîæíî ïðîâåñòè íåñêîëüêî ïàðíûõ ñðàâíåíèé âûáîðîê, íå óâåëè÷èâàÿ ïðè ýòîì
âåðîÿòíîñòü îøèáêè ïåðâîãî ðîäà.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì
ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûk
ìè, íî ðàâíûìè äèñïåðñèÿìè. Îáîçíà÷èì n = ∑ ni .
i =1
Ãèïîòåçû
Í0: ñ1µ1 + ñ2µ2 + ... + ñkµk = 0, ãäå ñ1, ñ2, ..., ñk — çàäàííûå ïîñòîÿííûå, ñóììà
êîòîðûõ ðàâíà íóëþ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 .
Глава 12. Сравнение одномерных выборок
373
2. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x =
s2 =
1 k
∑ ni xi è îáùàÿ âûáîðî÷íàÿ äèñïåðñèÿ
n i =1
1 k
∑ (ni − 1) si2 .
n − k i =1
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
 k

 ∑ ci xi 
 i =1

k
2
s 2 (k − 1)∑ ci2 /ni
.
i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k.
Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû
ν1 = k – 1 è ν2 = n – k. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÷àñòî ïðèìåíÿþò äëÿ ñåðèè ñðàâíåíèé òèïà
Í0: µ1 – µ2 = 0;
Í1: µ1 – µ2 ≠ 0.
Ïðè ïîïàðíûõ ñðàâíåíèÿõ îáû÷íî ñíà÷àëà ñðàâíèâàþò âûáîðêó ñ íàèìåíüøèì âûáîðî÷íûì ñðåäíèì ñ êàæäîé ïîñëåäóþùåé, îòìå÷àÿ òå âûáîðêè, äëÿ êîòîðûõ êðèòåðèé Øåôôå íå îòâåðãàåò íóëåâóþ ãèïîòåçó. Çàòåì
ïîâòîðÿþò ñðàâíåíèÿ ñ âûáîðêîé, èìåþùåé âòîðîå ïî âåëè÷èíå çíà÷åíèå
âûáîðî÷íîãî ñðåäíåãî, è ò.ä.
2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ ðàâåíñòâà
äèñïåðñèé, åñëè âûáîðêè ïðèìåðíî îäíîãî îáúåìà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ðåàëèçàöèÿ ýòîãî êðèòåðèÿ â Excel íåçíà÷èòåëüíî îòëè÷àåòñÿ îò ðåàëèçàöèè
ïðåäûäóùåãî êðèòåðèÿ. Íà ðèñ. 12.14 ïîêàçàí ðàáî÷èé ëèñò, ðåàëèçóþùèé êðèòåðèé Øåôôå. Êðîìå ôîðìóëû âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè â ÿ÷åéêå
G7 (ôîðìóëà ïðèâåäåíà íà ðèñóíêå), âñå îñòàëüíûå ôîðìóëû ñîâïàäàþò ñ àíàëîãè÷íûìè ôîðìóëàìè, ïîêàçàííûìè íà ðèñ. 12.13.  êà÷åñòâå òåñòîâûõ äàííûõ
òàêæå èñïîëüçóþòñÿ âûáîðêè èç ïðåäûäóùåãî ðàçäåëà. Íà ðèñ. 12.14 ïîêàçàíî
ñðàâíåíèå âòîðîé è òðåòüåé âûáîðîê — ðàçëè÷èå ìåæäó íèìè íåçíà÷èìî. Íà
ðèñ. 12.15 ñðàâíèâàþòñÿ ïåðâàÿ è òðåòüÿ âûáîðêè, çäåñü ðàçëè÷èå çíà÷èìî —
íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ.
12.3.2. Проверка гипотез о дисперсиях нормальных
распределений
 ýòîì ðàçäåëå ïðèâåäåíû êðèòåðèè ïðîâåðêè ðàâåíñòâà äèñïåðñèé íîðìàëüíûõ ñîâîêóïíîñòåé.
374 Часть III. Анализ одномерных выборок
Ðèñ. 12.14. Êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå: ñðàâíåíèå âòîðîé
è òðåòüåé âûáîðîê
Ðèñ. 12.15. Ñðàâíåíèå ïåðâîé è òðåòüåé âûáîðîê
Критерий Фишера проверки равенства дисперсий
Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.10, ïîñâÿùåííîì ñðåäñòâó
Двухвыборочный F-тест для дисперсий èç ïàêåòà àíàëèçà.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1
è µ2 ñîîòâåòñòâåííî.
Глава 12. Сравнение одномерных выборок
375
Ãèïîòåçû
à) Ðàâåíñòâî
2
á) Íåðàâåíñòâî
2
Í0: σ12 ≤ σ22
Í1: σ12 ≠ σ22
Í1: σ12 > σ22
Í0: σ1 = σ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Äëÿ
êàæäîé
âûáîðêè
âû÷èñëÿþòñÿ
âûáîðî÷íûå
äèñïåðñèè
1 n
1 m
S x2 = ∑ ( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 .
n i =1
m i =1
2.  êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè âû÷èñëÿåòñÿ äèñïåðñèîííîå îòíîøåíèå Ôèøåðà F =
S x2
.
S y2
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè.  ñëó÷àå èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà F èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k1 è k2, ãäå k1 = n – 1,
k2 = m – 1, åñëè F ≥ 1, è k1 = m – 1, k2 = n – 1, åñëè F < 1.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α/2 F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 è k2. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 è k2. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè F ≤ têð.
Êîììåíòàðèè
1. Åñëè èçâåñòíû ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê, òî â ôîðìóëàõ âû÷èñëåíèÿ âûáîðî÷íûõ äèñïåðñèé ñðåäíèå âûáîðîê çàìåíÿþòñÿ èçâåñòíûìè
çíà÷åíèÿìè ìàòåìàòè÷åñêèõ îæèäàíèé.  ýòîì ñëó÷àå êðèòè÷åñêèå çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1
è k2, ãäå k1 = n, k2 = m, åñëè F ≥ 1, è k1 = m, k2 = n, åñëè F < 1.
2. Êðèòåðèé íåóñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ
ñðåäñòâà Двухвыборочный F-тест для дисперсий, êîòîðîå îïèñàíî â ðàçäåëå 5.10.
Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèÿ.
Критерий Бартлета проверки равенства нескольких дисперсий
Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì
ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ äèñïåðñèÿìè
k
σ12, σ22, ..., σk2. Îáîçíà÷èì n = ∑ ni .
i =1
Ãèïîòåçû
Í0: σ12 = σ22 = ... = σk2;
Í1: äèñïåðñèè ðàçëè÷íû.
Çàäàí óðîâåíü çíà÷èìîñòè α.
376 Часть III. Анализ одномерных выборок
Âû÷èñëåíèÿ
1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 .
2. Âû÷èñëÿþòñÿ âåëè÷èíû С = 1 +
1  k 1
1 
1 k
2
(ni − 1) si2 .
−
∑
 èS =
∑
n − k i =1
3(k − 1)  i =1 ni − 1 n − k 
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
 S2 
1 k
n
(
1)
ln
−
 2 .
∑ i
C i =1
 si 
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû.
Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ
ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å
ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì.  ñëó÷àå äâóõ âûáîðîê ñëåäóåò ïðèìåíÿòü òî÷íûé êðèòåðèé Ôèøåðà.
2. Êðèòåðèé î÷åíü ÷óâñòâèòåëåí ê îòêëîíåíèÿì ðàñïðåäåëåíèÿ âûáîðîê îò
íîðìàëüíîãî.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.16 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, òàêæå ïîêàçàíû íà ýòîì
ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âûñòóïàþò òðè âûáîðêè, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå
çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1, Выборка2, Выборка3. Îáðàùàåì
âíèìàíèå íà ïðèìåíåíèå ôîðìóë ìàññèâîâ, ÷òî äàåò âîçìîæíîñòü èñêëþ÷èòü
ïðîìåæóòî÷íûå âû÷èñëåíèÿ.
Ðèñ. 12.16. Êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íåñêîëüêèõ äèñïåðñèé
Глава 12. Сравнение одномерных выборок
377
12.3.3. Непараметрический критерий Ансари–Бредли
проверки гипотезы о равенстве дисперсий
Ýòîò êðèòåðèé èñïîëüçóåòñÿ òîãäà, êîãäà íå âûïîëíÿåòñÿ ïðåäïîëîæåíèå
î íîðìàëüíîñòè ðàñïðåäåëåíèé âûáîðîê.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íåïðåðûâíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22. Ïðåäïîëàãàåòñÿ, ÷òî ðàñïðåäåëåíèÿ
èìåþò îäèíàêîâûå ìåäèàíû. Òàêæå ïðåäïîëàãàåòñÿ, ÷òî N = n + m ≥ 20.
Ãèïîòåçû
Í0: σ12 = σ22;
Í1: σ12 ≠ σ22.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå
ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(N).
2. Âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé ñëåäóþùèì îáðàçîì. Íàèáîëüøåìó è íàèìåíüøåìó çíà÷åíèÿì â îáúåäèíåííîé âûáîðêå ïðèñâàèâàåòñÿ
ðàíã 1. Ñëåäóþùèì ïî âåëè÷èíå íàèìåíüøèì è íàèáîëüøèì çíà÷åíèÿì
ïðèñâàèâàåòñÿ ðàíã 2 è ò.ä. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì
ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè.
3. Äëÿ îäíîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ R, êîòîðûå ïîëó÷èëè
åå âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå. Ïóñòü äëÿ îïðåäåëåííîñòè ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ ïåðâîé âûáîðêè.
4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà
T=
1
R − n( N + 2)
4
, åñëè N — ÷åòíîå ÷èñëî, è
mn( N + 2)( N − 2)
48( N − 1)
T=
n( N + 1) 2
4N
, åñëè N — íå÷åòíîå ÷èñëî.
mn( N + 1)(3 + N 2 )
48 N 2
R−
(Åñëè âû÷èñëÿåòñÿ ñóììà ðàíãîâ âòîðîé âûáîðêè, òî â ýòèõ ôîðìóëàõ
â ÷èñëèòåëå n çàìåíÿåòñÿ íà m.)
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å
ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì (îòñþäà òðåáîâàíèå, ÷òîáû
N = n + m ≥ 20). Ïðè ìàëûõ N â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñ-
378 Часть III. Анализ одномерных выборок
ïîëüçóåòñÿ âåëè÷èíà R, èìåþùàÿ ñïåöèàëüíîå ðàñïðåäåëåíèå, êâàíòèëè
êîòîðîãî èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ êðèòè÷åñêîé îáëàñòè [22].
2.  ñëó÷àå, åñëè åñòü ñîâïàäàþùèå çíà÷åíèÿ, ñòàòèñòèêó Ò ìîæíî âû÷èñëèòü ïî áîëåå ñëîæíûì ôîðìóëàì, ó÷èòûâàþùèì ýòè ñîâïàäåíèÿ [13].
3. Åñëè ðàñïðåäåëåíèÿ èìåþò ðàçëè÷íûå ìåäèàíû è çíà÷åíèÿ ýòèõ ìåäèàí èçâåñòíû (èëè õîòÿ áû èçâåñòíû èõ îöåíêè), ýòîò ìåòîä òàêæå ìîæíî ïðèìåíÿòü, åñëè âìåñòî èñõîäíûõ âûáîðîê èñïîëüçîâàòü âûáîðêè, çíà÷åíèÿ êîòîðûõ
óìåíüøåíû íà âåëè÷èíû ìåäèàí (äëÿ êàæäîé âûáîðêè — ñâîÿ ìåäèàíà).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 12.17 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, òàêæå ïîêàçàíû íà ýòîì
ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âçÿòû äâå âûáîðêè, èìåþùèå ðàâíîìåðíîå ðàñïðåäåëåíèå: ïåðâàÿ íà èíòåðâàëå [–1, 1], âòîðàÿ — íà èíòåðâàëå [–2, 2].
Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî
Выборка1 è Выборка2. Â ñòîëáöàõ Ñ è D ñ ïîìîùüþ ôîðìóëû ìàññèâîâ
{=ЕСЛИ(РАНГ(A2:B26;A2:B26;1)>ЦЕЛОЕ($F$4/2);$F$4РАНГ(A2:B26;A2:B26;1)+1;РАНГ(A2:B26;A2:B26;1))}
âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé, êàê îïèñàíî âûøå, â ï. 2. Çäåñü ôóíêöèÿ
РАНГ(A2:B26;A2:B26;1) ñòðîèò âèðòóàëüíûé ìàññèâ “ñòàíäàðòíûõ” ðàíãîâ îáúåäèíåííîé âûáîðêè. Åñëè çíà÷åíèÿ ýòèõ ðàíãîâ Ri ïðåâûøàþò ïîëîâèíó ÷èñëà N îáùåãî
îáúåìà âûáîðîê, òî îíè çàìåùàþòñÿ çíà÷åíèåì N – Ri + 1.  ïðîòèâíîì ñëó÷àå çíà÷åíèÿ ðàíãîâ îñòàþòñÿ áåç èçìåíåíèÿ. Îáðàùàåì âíèìàíèå, ÷òî çíà÷åíèå ñòàòèñòèêè
Ò âû÷èñëÿåòñÿ ïî ðàçíûì ôîðìóëàì â ÿ÷åéêàõ Í4 è Í5 äëÿ ÷åòíîãî è íå÷åòíîãî
çíà÷åíèé N. Êîíå÷íî, ýòè ôîðìóëû ìîæíî îáúåäèíèòü â îäíó ñ ïîìîùüþ ôóíêöèè
ЕСЛИ, îäíàêî òàêàÿ îáúåäèíåííàÿ ôîðìóëà áóäåò âåñüìà ñëîæíîé è íå÷èòàåìîé.
Âûáîð çíà÷åíèÿ Ò, â çàâèñèìîñòè îò ÷åòíîñòè èëè íå÷åòíîñòè N, îñóùåñòâëÿåòñÿ
â ôîðìóëå ÿ÷åéêè G8 ïðè îïðåäåëåíèè, îòâåðãàåòñÿ íóëåâàÿ ãèïîòåçà èëè ïðèíèìàåòñÿ.  äàííîì ñëó÷àå ãèïîòåçà î ðàâåíñòâå äèñïåðñèé îòâåðãàåòñÿ.
Ðèñ. 12.17. Êðèòåðèé Àíñàðè–Áðåäëè ïðîâåðêè ãèïîòåçû î ðàâåíñòâå äèñïåðñèé
Глава 12. Сравнение одномерных выборок
379
12.3.4. Проверка гипотез о равенстве биномиальных
вероятностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ äâå ñåðèè íàáëþäåíèé çà ýêñïåðèìåíòîì.
 ïåðâîé ñåðèè â êàæäîì ýêñïåðèìåíòå ñ âåðîÿòíîñòüþ ð1 ïðîèñõîäèò ñîáûòèå
“1” (“óñïåõ”), âî âòîðîé ñåðèè ýòî ñîáûòèå ïðîèñõîäèò ñ âåðîÿòíîñòüþ ð2. Ïóñòü
â ïåðâîé ñåðèè çàôèêñèðîâàíî n ýêñïåðèìåíòîâ, èç íèõ â r1 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Âî âòîðîé ñåðèè çàôèêñèðîâàíî m ýêñïåðèìåíòîâ, èç íèõ â r2
ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Ðàçìåðû ñåðèé áîëüøå 20.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
Í0: ð1 – ð2 = δ
Í0: ð1 – ð2 ≤ δ
Í1: ð1 – ð2 ≠ δ
Í1: ð1 – ð2 > δ
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè âåðîÿòíîñòåé ð1 è ð2: pˆ1 = r1 / n , pˆ 2 = r2 / m
è äîïîëíèòåëüíî δˆ = pˆ1 − pˆ 2 , An , m =
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
+
.
n
m
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
δ̂ − δ
.
An, m
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî
|Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî
ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t,
èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è îñíîâûâàåòñÿ íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåìû âûáîðîê áûëè íå ìåíüøå 20.
2. Êðèòåðèé ïîñòðîåí íà îñíîâå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòåé áèíîìèàëüíûõ âåðîÿòíîñòåé (ñì. ðàçäåë 12.2.4).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé.
380 Часть III. Анализ одномерных выборок
Часть IV
Статистический
анализ зависимостей
В этой части...
Ãëàâà 13. Êîððåëÿöèîííûé àíàëèç
Ãëàâà 14. Ñðàâíåíèå çàâèñèìûõ âûáîðîê
Ãëàâà 15. Ðåãðåññèîííûé àíàëèç
Â
ýòîé ÷àñòè îïèñàíû ìåòîäû àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, âêëþ÷àþùèå â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ.  ãëàâå 13 ðàññìîòðåíû ìåòîäû êîððåëÿöèîííîãî àíàëèçà, êîòîðûå óñòàíàâëèâàþò ñàì ôàêò ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó äàííûìè, à òàêæå ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè.  ãëàâå 14 ïîêàçàíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé
çàâèñèìûõ êîìïîíåíòîâ ìíîãîìåðíûõ âûáîðîê.  ãëàâå 15 îïèñàí êðóã çàäà÷, ñâÿçàííûõ ñ ïîñòðîåíèåì ðåãðåññèé, íà÷èíàÿ ñ îáùåé âû÷èñëèòåëüíîé ñõåìû îïðåäåëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè è çàêàí÷èâàÿ êðèòåðèÿìè ïðîâåðêè
àäåêâàòíîñòè ïîñòðîåííîãî óðàâíåíèÿ ðåãðåññèè.
Глава
13
Корреляционный анализ
Í
àñòîÿùàÿ ãëàâà ïîñâÿùåíà çàäà÷å óñòàíîâëåíèÿ ñàìîãî ôàêòà íàëè÷èÿ ñòàòèñòè÷åñêè çíà÷èìîé ñâÿçè ìåæäó ïåðåìåííûìè.  îáùåì âèäå ýòà çàäà÷à
îïèñàíà â ãëàâå 3. Íàïîìíèì, ÷òî ìåòîäû, ïðèìåíÿåìûå äëÿ åå ðåøåíèÿ, çàâèñÿò îò ïðèðîäû èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ (êîëè÷åñòâåííûå, ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå), îò âûáðàííîãî ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (èíäåêñ èëè êîýôôèöèåíò êîððåëÿöèè, ðàíãîâûé êîýôôèöèåíò
êîððåëÿöèè è ò.ï.) è îò êîíêðåòíîé ðåøàåìîé çàäà÷è (òî÷å÷íîå èëè èíòåðâàëüíîå îöåíèâàíèå ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè, ïðîâåðêà ãèïîòåçû
î çíà÷åíèè ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè).
13.1. Критерии независимости
 ýòîì ðàçäåëå îïèñàíû êðèòåðèè ïðîâåðêè ãèïîòåç î íåçàâèñèìîñòè ìíîãîìåðíûõ ñëó÷àéíûõ âåëè÷èí. Äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí ýòî êðèòåðèè ïðîâåðêè ãèïîòåç î íóëåâîì çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè, äëÿ ïîðÿäêîâûõ ñëó÷àéíûõ âåëè÷èí àíàëîãè÷íûå êðèòåðèè ñòðîÿòñÿ íà îñíîâå
ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè, äëÿ êëàññèôèêàöèîííûõ âåëè÷èí ïðèìåíÿåòñÿ àíàëèç òàáëèö ñîïðÿæåííîñòè (ñì. ãëàâó 3). Äëÿ âñåõ ýòèõ ìåòîäîâ ñïðàâåäëèâî “ïðàâèëî âëîæåííîñòè” — ìåòîäû, ïðèìåíèìûå äëÿ êëàññèôèêàöèîííûõ ñëó÷àéíûõ âåëè÷èí, òàêæå ïðèìåíèìû äëÿ ïîðÿäêîâûõ è êîëè÷åñòâåííûõ
ñëó÷àéíûõ âåëè÷èí; ìåòîäû, ïðèìåíèìûå äëÿ ïîðÿäêîâûõ ñëó÷àéíûõ âåëè÷èí,
òàêæå ïðèìåíèìû äëÿ êîëè÷åñòâåííûõ âåëè÷èí. Îäíàêî ïî âîçìîæíîñòè ñëåäóåò
èñïîëüçîâàòü êðèòåðèè, ïðåäíàçíà÷åííûå äëÿ êîíêðåòíîãî òèïà ñëó÷àéíûõ ïåðåìåííûõ. Èñêëþ÷åíèå ñîñòàâëÿþò êðèòåðèè, ïîñòðîåííûå íà îñíîâå ðàíãîâûõ
êîýôôèöèåíòîâ êîððåëÿöèè, ïîñêîëüêó êðèòåðèé íåçàâèñèìîñòè äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ñëåäóþùèé ðàçäåë) ÿâëÿåòñÿ ïðèáëèæåííûì
è áóäåò òî÷íûì òîëüêî äëÿ íîðìàëüíî ðàñïðåäåëåííûõ âåëè÷èí. Êðîìå òîãî, íåïàðàìåòðè÷åñêèé êðèòåðèé íà îñíîâå êîýôôèöèåíòà êîíêîðäàöèè ïîçâîëÿåò
îöåíèòü âçàèìîçàâèñèìîñòü íåñêîëüêèõ (áîëüøå äâóõ) ñëó÷àéíûõ âåëè÷èí.
Òàêæå íåîáõîäèìî ïîìíèòü, ÷òî êðèòåðèè, ïîñòðîåííûå íà îñíîâå êîýôôèöèåíòà êîððåëÿöèè, íå äîêàçûâàþò íåçàâèñèìîñòü ñëó÷àéíûõ âåëè÷èí: íåçíà÷èìîå îòëè÷èå êîýôôèöèåíòà êîððåëÿöèè îò íóëÿ ãîâîðèò òîëüêî î òîì, ÷òî îòñóòñòâóåò ëèíåéíàÿ çàâèñèìîñòü ìåæäó ñëó÷àéíûìè âåëè÷èíàìè. Âîçìîæíû
âèäû íåëèíåéíîé çàâèñèìîñòè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, êîãäà êîýôôèöèåíò êîððåëÿöèè ìåæäó íèìè ðàâåí íóëþ. Íî íà ïðàêòèêå, êàê ïðàâèëî, íåêîððåëèðóåìîñòü îòîæäåñòâëÿþò ñ íåçàâèñèìîñòüþ.
382 Часть IV. Статистический анализ зависимостей
13.1.1. Критерий независимости на основе преобразования
Фишера
Íîðìàëèçóþùåå z-ïðåîáðàçîâàíèå Ôèøåðà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.1.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà è ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20.
Ãèïîòåçû
Í0: êîýôôèöèåíò êîððåëÿöèè ρ = 0;
Í1: êîýôôèöèåíò êîððåëÿöèè ρ ≠ 0.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x =
2. Âû÷èñëÿåòñÿ
òî÷å÷íàÿ
n
∑ ( x − x )( y
i
r=
i
∑ (x − x) ⋅ ∑ ( y
i
êîýôôèöèåíòà
êîððåëÿöèè
.
n
2
i =1
îöåíêà
− y)
i =1
n
1 n
1 n
xi è y = ∑ yi .
∑
n i =1
n i =1
i
− y)
2
i =1
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
n − 3 1+ r
ln
.
2
1− r
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ
íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé ïðèáëèæåííûé. Òî÷íîå ðàñïðåäåëåíèå ñòàòèñòèêè Ò çàâèñèò îò ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Z; îíî âåñüìà ñëîæíîå.
2. Äëÿ íîðìàëüíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû ñóùåñòâóåò òî÷íûé
êðèòåðèé (ñì. ñëåäóþùèé ðàçäåë).
3. Ïðåîáðàçîâàíèå Ôèøåðà z =
1 1+ r
ln
, ÿâëÿþùååñÿ îñíîâîé äàííîãî êðèòå2 1− r
ðèÿ, òîëüêî àñèìïòîòè÷åñêè èìååò íîðìàëüíîå ðàñïðåäåëåíèå. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåì âûáîðêè áûë íå ìåíåå 20. Òî÷íîñòü àïïðîêñèìàöèè
ðàñïðåäåëåíèÿ âåëè÷èíû z íîðìàëüíûì ðàñïðåäåëåíèåì çàâèñèò îò ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Z. Ïîýòîìó òî÷íîñòü ìîæåò áûòü ðàçëè÷íîé äëÿ ðàçíûõ âûáîðî÷íûõ ðàñïðåäåëåíèé.
Глава 13. Корреляционный анализ
383
4. Âî ìíîãèõ ñëó÷àÿõ, êîãäà ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Z î÷åíü äàëåêî îò íîðìàëüíîãî èëè äèñêðåòíî, ñëåäóåò ïðèìåíÿòü íåïàðàìåòðè÷åñêèå êðèòåðèè íåçàâèñèìîñòè, îïèñàííûå íèæå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè
â Excel ïðåäóñìîòðåíà ôóíêöèÿ КОРРЕЛ, à ïðåîáðàçîâàíèå Ôèøåðà âû÷èñëÿåò
ôóíêöèÿ ФИШЕР.
13.1.2. Критерий независимости для двумерных нормальных
совокупностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ.
Ãèïîòåçû
Í0: êîýôôèöèåíò êîððåëÿöèè ρ = 0;
Í1: êîýôôèöèåíò êîððåëÿöèè ρ ≠ 0.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x =
2. Âû÷èñëÿåòñÿ
òî÷å÷íàÿ
n
∑ ( x − x )( y
i
r=
i
∑ (x − x) ⋅ ∑ ( y
i
êîýôôèöèåíòà
êîððåëÿöèè
.
n
2
i =1
îöåíêà
− y)
i =1
n
1 n
1 n
xi è y = ∑ yi .
∑
n i =1
n i =1
i
− y)
2
i =1
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
r n−2
1− r2
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2).
âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t; èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé ìîæíî ïðèìåíÿòü ïðè óìåðåííûõ îòêëîíåíèÿõ âûáîðî÷íîãî ðàñïðåäåëåíèÿ îò íîðìàëüíîãî.
2.  ðàçäåëå 13.3.1 ïðèâåäåí êðèòåðèé ïðîâåðêè çíà÷åíèÿ êîýôôèöèåíòà
êîððåëÿöèè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. Äëÿ âû÷èñëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè â Excel ïðåäóñìîòðåíà ôóíêöèÿ КОРРЕЛ.
384 Часть IV. Статистический анализ зависимостей
13.1.3. Критерий независимости на основе рангового
коэффициента корреляции Спирмена
Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.2.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà. Îáúåì âûáîðêè — áîëåå 10.
Ãèïîòåçû
Í0: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà rS = 0;
Í1: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè rS ≠ 0.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi) ïóòåì
ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤
... ≤ ó(n). Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî ýòèì çíà÷åíèÿì
ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè
áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé.
2. Âû÷èñëÿåòñÿ
rS = 1 −
ðàíãîâûé
êîýôôèöèåíò
êîððåëÿöèè
Ñïèðìåíà
n
6
(ri − qi )2 .
∑
n − n i =1
3
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
rS n − 2
1 − rS2
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
êîýôôèöèåíò rS èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå; ñòàòèñòèêà Ò àñèìïòîòè÷åñêè
èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2).
Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ
êîýôôèöèåíò rS, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Ñïèðìåíà.
2. Åñëè íåò äîñòàòî÷íûõ îñíîâàíèé îòâåðãàòü ãèïîòåçó î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé èçâëåêàåòñÿ âûáîðêà, òî
öåëåñîîáðàçíî ïðèìåíÿòü áîëåå ìîùíûé ìåòîä, îñíîâàííûé íà êîýôôèöèåíòå êîððåëÿöèè (ñì. ïðåäûäóùèé ðàçäåë).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.1 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
 ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (â äàííîì ñëó÷àå çíà÷åíèÿ íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]). Äèàïàçîí
Глава 13. Корреляционный анализ
385
ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå  íàçâàí Y. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 13.1. Ïîÿñíèì ôîðìóëó ìàññèâà, âû÷èñëÿþùóþ ñóììó êâàäðàòîâ ðàçíîñòåé ðàíãîâ â ÿ÷åéêå D3:
{=СУММКВРАЗН(РАНГ(Х;Х;1);РАНГ(Y;Y;1))}
Ýòà ôîðìóëà ñ ïîìîùüþ ôóíêöèé РАНГ(Х;Х;1) è РАНГ(Y;Y;1) ñîçäàåò äâà âèðòóàëüíûõ ìàññèâà, ñîäåðæàùèõ ðàíãè çíà÷åíèé äèàïàçîíà Х è äèàïàçîíà Y (ôóíêöèÿ
РАНГ îïèñàíà â ðàçäåëå 4.2.5). Ôóíêöèÿ СУММКВРАЗН âû÷èñëÿåò ñóììó êâàäðàòîâ
ïîïàðíûõ ðàçíîñòåé çíà÷åíèé ýòèõ âèðòóàëüíûõ ìàññèâîâ (ôóíêöèÿ СУММКВРАЗН
îïèñàíà â ðàçäåëå 6.1.6). Ýòó ôîðìóëó ìîæíî áûëî áû íåïîñðåäñòâåííî âêëþ÷èòü
â ôîðìóëó âû÷èñëåíèÿ êîýôôèöèåíòà Ñïèðìåíà, íî íå ðåêîìåíäóåì ýòîãî äåëàòü,
ïîñêîëüêó â ñëó÷àå, åñëè âûáîðî÷íûå çíà÷åíèÿ áóäóò âû÷èñëÿòüñÿ ñ ïîìîùüþ
ôóíêöèè СЛЧИС, ìîãóò âîçíèêíóòü íåêîòîðûå ïðîáëåìû, ñâÿçàííûå ñ àâòîìàòè÷åñêèì ïåðåñ÷åòîì ôîðìóë. Îñòàëüíûå ôîðìóëû íà ðàáî÷åì ëèñòå î÷åâèäíû.
Ðèñ. 13.1. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå ðàíãîâîãî êîýôôèöèåíòà
êîððåëÿöèè Ñïèðìåíà
13.1.4. Критерий независимости на основе рангового
коэффициента корреляции Кендалла
Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.2.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà. Îáúåì âûáîðêè — áîëåå 10.
Ãèïîòåçû
Í0: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà rÊ = 0;
Í1: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè rÊ ≠ 0.
Çàäàí óðîâåíü çíà÷èìîñòè α.
386 Часть IV. Статистический анализ зависимостей
Âû÷èñëåíèÿ
1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi) ïóòåì
ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤
... ≤ ó(n). Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî ýòèì çíà÷åíèÿì
ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè
áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé.
2. Ïîëó÷åííàÿ ïîñëåäîâàòåëüíîñòü ðàíãîâ (r1, q1), (r2, q2), ..., (rn, qn) óïîðÿäî÷èâàåòñÿ ïî âîçðàñòàíèþ ðàíãîâ ri — ïîëó÷àåòñÿ ïîñëåäîâàòåëüíîñòü
(1, q(1)), (2, q(2)), ..., (n, q(n)).
3. Âû÷èñëÿåòñÿ
ðàíãîâûé
êîýôôèöèåíò
êîððåëÿöèè
Êåíäàëëà
n
n
2
rK =
sign(q( j ) − q( i ) ) , ãäå ôóíêöèÿ sign(x) ïðèíèìàåò çíà÷åíèå
∑
∑
n(n − 1) i =1 j = i +1
+1, åñëè õ > 0, è çíà÷åíèå –1, åñëè õ < 0.
4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = rK
9n(n − 1)
.
2(2n + 5)
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
êîýôôèöèåíò rÊ èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Êåíäàëëà, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ
êîýôôèöèåíò rÊ, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Êåíäàëëà.
2. Åñëè íåò äîñòàòî÷íûõ îñíîâàíèé îòâåðãàòü ãèïîòåçó î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé èçâëåêàåòñÿ âûáîðêà, òî
öåëåñîîáðàçíî ïðèìåíÿòü áîëåå ìîùíûé ìåòîä èç ðàçäåëà 13.1.2.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.2 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
 ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (êàê è â ïðåäûäóùåì ïðèìåðå,
âûáîðî÷íûå çíà÷åíèÿ íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]). Äèàïàçîí ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ,
íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå  íàçâàí Y. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 13.2.
Ê ñîæàëåíèþ, äëÿ ðåàëèçàöèè êðèòåðèÿ íåêîòîðûå äåéñòâèÿ íåîáõîäèìî âûïîëíèòü âðó÷íóþ è íåâîçìîæíî îáîéòèñü áåç íåêîòîðûõ ïðîìåæóòî÷íûõ âû÷èñëåíèé.  ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, à â ñòîëáöàõ Ñ è D
ïîäñ÷èòàíû ðàíãè ýòèõ çíà÷åíèé ñ ïîìîùüþ ôîðìóë ìàññèâîâ {=РАНГ(Х;Х;1)}
è {=РАНГ(Y;Y;1)}. (Äèàïàçîí ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ,
íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå Â íàçâàí Y.) Äàëåå íåîáõîäèìî
ñîðòèðîâàòü äâóõñòîëáöîâûé äèàïàçîí, ñîäåðæàùèé ðàíãè, ïî çíà÷åíèÿì ðàíãîâ
Глава 13. Корреляционный анализ
387
ñòîëáöà Ñ. Ýòî ìîæíî ñäåëàòü â òåõ æå ñòîëáöàõ Ñ è D, ïðåäâàðèòåëüíî ïðåîáðàçîâàâ ôîðìóëû, ïî êîòîðûì âû÷èñëÿëèñü ðàíãè, â çíà÷åíèÿ. Äëÿ ýòîãî íàäî âûäåëèòü äèàïàçîí Ñ2:D21, ñîäåðæàùèé ðàíãè, ñêîïèðîâàòü åãî è, íå îòìåíÿÿ åãî
âûäåëåíèå, âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка. Â îòêðûâøåìñÿ
îäíîèìåííîì äèàëîãîâîì îêíå ñëåäóåò óñòàíîâèòü ïåðåêëþ÷àòåëü Значения
è ùåëêíóòü íà êíîïêå ОК. Íà ðèñ. 13.2 äëÿ íàãëÿäíîñòè ðàíãè ñîðòèðóþòñÿ â
ñîñåäíèõ ñòîëáöàõ Å è F, â êîòîðûå îíè ñêîïèðîâàíû èç äèàïàçîíà Ñ2:D21 êàê
çíà÷åíèÿ (îïÿòü ñ ïîìîùüþ äèàëîãîâîãî îêíà Специальная вставка). Ñîðòèðîâêà
îñóùåñòâëÿåòñÿ ñ ïîìîùüþ êîìàíäû ДанныеÖСортировка. Â ñòîëáöå G ðåàëèçón
åòñÿ ÷àñòü ôîðìóëû
∑ sign(q
( j)
− q( i ) ) âû÷èñëåíèÿ êîýôôèöèåíòà Êåíäàëëà. Äëÿ
j = i +1
ýòîãî â ÿ÷åéêó G2 ââåäåíà ôîðìóëà ìàññèâà {=СУММ(ЗНАК(F3:$F$21-F2))}, êîòîðàÿ ñíà÷àëà ñîçäàåò âèðòóàëüíûé ìàññèâ çíà÷åíèé sign(q( j ) − q(1) ) (j ≥ 2), à çàòåì
ñóììèðóåò ýòè çíà÷åíèÿ. Ôóíêöèÿ ЗНАК — ýòî ýêâèâàëåíò ôóíêöèè sign. Îáðàùàåì âíèìàíèå, ÷òî â ýòîé ôîðìóëå èñïîëüçóþòñÿ îòíîñèòåëüíûå ññûëêè íà
ÿ÷åéêó F2 è íà íà÷àëî äèàïàçîíà F3:$F$21. Äàííàÿ ôîðìóëà êîïèðóåòñÿ âíèç äî
ÿ÷åéêè F20, ïðè ýòîì àäðåñà ÿ÷ååê F2 è F3 ñîîòâåòñòâóþùèì îáðàçîì ìîäèôèöèðóþòñÿ, à êîíå÷íàÿ ÿ÷åéêà $F$21 äèàïàçîíà ñóììèðîâàíèÿ îñòàåòñÿ íåèçìåííîé. Äèàïàçîí ÿ÷ååê â ñòîëáöå G íàçâàí Знаки, ýòî èìÿ èñïîëüçóåòñÿ â ôîðìóëå
ÿ÷åéêè I3. Îñòàëüíûå ôîðìóëû äàííîãî ðàáî÷åãî ëèñòà î÷åâèäíû.
Ðèñ. 13.2. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå ðàíãîâîãî êîýôôèöèåíòà êîððåëÿöèè Êåíäàëëà
Ïîñêîëüêó íåêîòîðûå äåéñòâèÿ âûïîëíÿþòñÿ âðó÷íóþ, äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè äëÿ íîâîé âûáîðêè èõ ïðèäåòñÿ ïîâòîðèòü ñíîâà (ýòî ïðåîáðàçîâàíèå ôîðìóë, âû÷èñëÿþùèõ ðàíãè, â çíà÷åíèÿ, è âûïîëíåíèå ñîðòèðîâêè).
Åñëè äàííûé êðèòåðèé èñïîëüçóåòñÿ ÷àñòî, òî ìîæíî íàïèñàòü ïðîñòûå ìàêðîñû, êîòîðûå áóäóò àâòîìàòèçèðîâàòü ýòè äåéñòâèÿ.
388 Часть IV. Статистический анализ зависимостей
13.1.5. Критерий независимости для многомерных выборок
Ýòîò êðèòåðèé îñíîâàí íà êîýôôèöèåíòå ñîãëàñîâàííîñòè (êîíêîðäàöèè),
îïèñàííîì â ðàçäåëå 3.3.2, è ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè äëÿ íåñêîëüêèõ (áîëüøå äâóõ) ñëó÷àéíûõ âåëè÷èí1.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà
Z = (X1, X2, ..., Xm). Â ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x11, x21, ..., xm1),
(x12, x22, ..., xm2), ..., (x1n, x2n, ..., xmn).
Ãèïîòåçû
Í0: êîýôôèöèåíò ñîãëàñîâàííîñòè W = 0;
Í1: êîýôôèöèåíò ñîãëàñîâàííîñòè W ≠ 0.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (x1i, x2i, ..., xmi) ïðèñâàèâàþòñÿ ðàíãè
(r1i, r2i, ..., rmi). Ðàíãè rji ïðèñâàèâàþòñÿ çíà÷åíèÿì xji íåçàâèñèìî ïóòåì
ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ äëÿ ðåàëèçàöèè êàæäîãî êîìïîíåíòà Xj òàê æå, êàê ïðè âû÷èñëåíèè êîýôôèöèåíòîâ Ñïèðìåíà è Êåíäàëëà. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ
îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé.
2. Âû÷èñëÿåòñÿ êîýôôèöèåíò ñîãëàñîâàííîñòè
2
n  m
12
m(n + 1) 
3. W = 2 3
 ∑ rji −
 .
∑
2
m (n − n) i =1  j =1

4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = m(n – 1)W.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
êîýôôèöèåíò W èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè
èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ
êîýôôèöèåíò W, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà.
2. Äëÿ ïðîâåðêè íåçàâèñèìîñòè äâóõ ñëó÷àéíûõ âåëè÷èí ðåêîìåíäóåòñÿ
ïðèìåíÿòü êðèòåðèè íà îñíîâå ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè
Ñïèðìåíà èëè Êåíäàëëà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.3 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
 ñòîëáöàõ À,  è Ñ çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (âûáîðî÷íûå çíà÷åíèÿ
1
Ïîïóòíî îòìåòèì, ÷òî äëÿ ìíîãîìåðíûõ âûáîðîê ñðåäñòâî Excel Корреляция ìîæåò âû÷èñëèòü êîððåëÿöèîííóþ ìàòðèöó, à ñðåäñòâî Ковариация — êîâàðèàöèîííóþ ìàòðèöó. Ýòè
ñðåäñòâà îïèñàíû â ãëàâå 5.
Глава 13. Корреляционный анализ
389
íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]).  ñòîëáöàõ D, E è F ïîäñ÷èòàíû ðàíãè ñ ïîìîùüþ ôóíêöèè РАНГ äëÿ çíà÷åíèé êàæäîãî
ñòîëáöà â îòäåëüíîñòè (òàê æå, êàê â ïðåäûäóùèõ êðèòåðèÿõ). Äàëåå â ÿ÷åéêó
G2 ââåäåíà ôîðìóëà
=(СУММ(D2:F2)-$I$3*($I$1+1)/2)^2

m

j =1
Îíà ðåàëèçóåò äëÿ i = 1 ÷àñòü ôîðìóëû  ∑ rji −
2
m(n + 1) 
 âû÷èñëåíèÿ êîýôôèöè2

åíòà ñîãëàñîâàííîñòè. Ýòà ôîðìóëà çàòåì ñêîïèðîâàíà âíèç äî êîíöà èíòåðâàëà
G2:G21. Îñòàëüíûå ôîðìóëû äàííîãî ðàáî÷åãî ëèñòà î÷åâèäíû.
Ðèñ. 13.3. Êðèòåðèé íåçàâèñèìîñòè äëÿ ìíîãîìåðíûõ âûáîðîê
13.1.6. Критерий независимости на основе таблиц
сопряженности
Ýòîò êðèòåðèé, èíîãäà íàçûâàåìûé êðèòåðèåì íåçàâèñèìîñòè χ2, ðàçðàáîòàí
äëÿ îïðåäåëåíèÿ íåçàâèñèìîñòè êëàññèôèêàöèîííûõ ñëó÷àéíûõ âåëè÷èí
(ñì. ðàçäåë 3.3.3). Îäíàêî åãî ìîæíî ïðèìåíÿòü ê ñëó÷àéíûì âåëè÷èíàì äðóãèõ
òèïîâ.  ÷àñòíîñòè, îí õîðîøî ïîäõîäèò äëÿ îïðåäåëåíèÿ íåçàâèñèìîñòè êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ äèñêðåòíûå ðàñïðåäåëåíèÿ íà êîíå÷íîì ìíîæåñòâå çíà÷åíèé. Ìû ïîêàæåò ýòîò êðèòåðèé íà ïðèìåðå èìåííî äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü èìååòñÿ âûáîðêà (õ1, ó1), (õ2, ó2), ..., (xn, yn),
êîòîðàÿ ÿâëÿåòñÿ ðåàëèçàöèåé äâóìåðíîé äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû
Z = (X, Y), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò êîíå÷íîå ÷èñëî çíà÷åíèé À1,
À2, ..., Às, à ñëó÷àéíàÿ âåëè÷èíà Y — òàêæå êîíå÷íîå ÷èñëî çíà÷åíèé B1, B2, ..., Br.
Ãèïîòåçû
Í0: ñëó÷àéíûå âåëè÷èíû Õ è Y íåçàâèñèìû;
Í1: ñëó÷àéíûå âåëè÷èíû Õ è Y çàâèñèìû.
Çàäàí óðîâåíü çíà÷èìîñòè α.
390 Часть IV. Статистический анализ зависимостей
Âû÷èñëåíèÿ
1. Ïî âûáîðêå ñîñòàâëÿåòñÿ òàáëèöà ñîïðÿæåííîñòè ñëåäóþùåãî âèäà.
B1
À1
À2
...
Às
Âñåãî
ν11
ν12
...
ν1s
n1* = ∑ ν1i
s
i =1
B2
ν21
ν22
...
ν2s
n2* = ∑ ν 2i
...
...
...
...
...
...
Br
νr1
νr2
...
νrs
nr * = ∑ ν ri
r
r
...
r
s
i =1
s
i =1
Âñåãî
n*1 = ∑ ν i1
i =1
n*2 = ∑ ν i 2
i =1
n*s = ∑ ν is
i =1
s
r
i =1
i =1
n = ∑ n*i = ∑ ni*
Çäåñü νij — êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (xk, yt), èìåþùèõ çíà÷åíèÿ
Aj è Bi.
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà
r
s
T = n∑∑
i =1 j =1
(ν ij − ni * n* j )2
ni* n* j
 r s ν ij2

= n  ∑∑
− 1 .
 i =1 j =1 ni * n* j



Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñî ñòåïåíüþ ñâîáîäû
(r – 1)(s – 1).
Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1)(s – 1). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèé
1. Ýòî àñèìïòîòè÷åñêèé êðèòåðèé. Ïîýòîìó íåîáõîäèìî, ÷òîáû îáúåì âûáîðêè áûë íå ìåíåå 20.
2. Ñóùåñòâóåò îïðåäåëåííàÿ ïðîáëåìà, ñâÿçàííàÿ ñ êîëè÷åñòâîì íàáëþäåíèé
â êàæäîé ÿ÷åéêå òàáëèöû ñîïðÿæåííîñòè. Ìîæíî âñòðåòèòü ðåêîìåíäàöèè
îáúåäèíÿòü ÿ÷åéêè ñ ìàëûì êîëè÷åñòâîì íàáëþäåíèé.  îáùåì ñëó÷àå çäåñü
íàäî ïðèäåðæèâàòüñÿ òåõ æå ïðàâèë, ÷òî è â êðèòåðèè χ2 (ñì. ðàçäåë 9.2.1).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.4 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
 êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà äâóìåðíàÿ âûáîðêà, êîìïîíåíòû êîòîðîé íåçàâèñèìû è èìåþò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 2. Âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Ïîñêîëüêó â äàííîì ñëó÷àå
ñëó÷àéíûå âåëè÷èíû ïðèíèìàþò íåîòðèöàòåëüíûå öåëî÷èñëåííûå çíà÷åíèÿ, äëÿ
îïðåäåëåíèÿ êîëè÷åñòâà ðàçëè÷íûõ çíà÷åíèé â âûáîðêàõ Õ è Y äîñòàòî÷íî
Глава 13. Корреляционный анализ
391
íàéòè ìàêñèìàëüíûå çíà÷åíèÿ, èìåþùèåñÿ â ýòèõ âûáîðêàõ. Ýòè çíà÷åíèÿ
ñ ïîìîùüþ ôóíêöèè МАКС ïîëó÷åíû â ÿ÷åéêàõ D1 è D2.  ÿ÷åéêå D3 ñ ïîìîùüþ ôóíêöèè СЧЁТ âû÷èñëåí îáúåì âûáîðêè.
Ðèñ. 13.4. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå òàáëèöû ñîïðÿæåííîñòè
Äàëåå ñîçäàåòñÿ òàáëèöà ñîïðÿæåííîñòè.  äèàïàçîíå D4:J4 çàïèñàíû çíà÷åíèÿ, êîòîðûå ïðèíèìàåò ïåðåìåííàÿ Y, à â äèàïàçîíå Ñ5:Ñ12 — ïåðåìåííàÿ
Õ. Äëÿ âû÷èñëåíèÿ çíà÷åíèé òàáëèöû ñîïðÿæåííîñòè â ÿ÷åéêó D5 ââîäèòñÿ
ôîðìóëà ìàññèâà {=СУММ((Х=$C5)*(Y=D$4))}, êîòîðàÿ çàòåì êîïèðóåòñÿ âî âñå
îñòàëüíûå ÿ÷åéêè òàáëèöû ñîïðÿæåííîñòè. Ýòà ôîðìóëà â ÿ÷åéêå D5 ïîäñ÷èòûâàåò êîëè÷åñòâî îäíîâðåìåííûõ ñîâïàäåíèé çíà÷åíèé â äèàïàçîíå Х ñî çíà÷åíèåì ÿ÷åéêè C5 è çíà÷åíèé â äèàïàçîíå Y ñî çíà÷åíèåì ÿ÷åéêè D4. Ïðè íàëè÷èè òàêèõ ñîâïàäåíèé ÷àñòü ôîðìóëû (Х=$C5)*(Y=D$4) ïðîäóöèðóåò
åäèíèöó, â ïðîòèâíîì ñëó÷àå — íóëü.
 äèàïàçîíå Ê5:Ê12 ïîäñ÷èòûâàþòñÿ ñóììû çíà÷åíèé ïî ñòðîêàì òàáëèöû
ñîïðÿæåííîñòè, à â äèàïàçîíå D13:J13 — ïî ñòîëáöàì. Âî èçáåæàíèå âîçìîæíîãî äåëåíèÿ íà íóëü â ôîðìóëå ÿ÷åéêè D14 ýòè ñóììû âû÷èñëÿþòñÿ ñ èñïîëüçîâàíèåì ôóíêöèè ЕСЛИ, êîòîðàÿ çàïèñûâàåò â ÿ÷åéêè çíà÷åíèå 0,01, åñëè ñóììà
ðàâíà íóëþ. Íàïðèìåð, â ÿ÷åéêå Ê5 çàïèñàíà ôîðìóëà
=ЕСЛИ(СУММ(D5:J5)=0;0,01;СУММ(D5:J5))
Àíàëîãè÷íûå ôîðìóëû èñïîëüçóþòñÿ â äðóãèõ ÿ÷åéêàõ, âû÷èñëÿþùèõ ñóììû ïî
ñòðîêàì è ñòîëáöàì òàáëèöû ñîïðÿæåííîñòè. Çíà÷åíèå 0,01 âçÿòî ïðîèçâîëüíî,
îíî íèêàê íå âëèÿåò íà ïîñëåäóþùèå âû÷èñëåíèÿ è ïðîñòî ïîêàçûâàåò, ÷òî
â äàííîé ñòðîêå èëè ñòîëáöå ñóììà ðàâíà íóëþ.  ÿ÷åéêå Ê13 äëÿ êîíòðîëÿ âû÷èñëÿåòñÿ ñóììà äèàïàçîíà D13:J13, à â ÿ÷åéêå L13 — ñóììà äèàïàçîíà Ê5:Ê12.
Öåëàÿ ÷àñòü çíà÷åíèÿ ýòèõ ñóìì äîëæíà ðàâíÿòüñÿ îáúåìó âûáîðêè.
392 Часть IV. Статистический анализ зависимостей
r
 ÿ÷åéêå D14 âû÷èñëÿåòñÿ ÷àñòü ôîðìóëû
s
∑∑ n
i =1 j =1
ν ij2
âû÷èñëåíèÿ êðèòåðè-
n
i* * j
àëüíîé ñòàòèñòèêè. Ôîðìóëà ìàññèâà â ÿ÷åéêå D14 èìååò âèä
{=СУММ(((D5:J12)^2)/((K5:K12)*(D13:J13)))}
Çäåñü â ïîëíîé ìåðå ðåàëèçóþòñÿ âîçìîæíîñòè ôîðìóë ìàññèâîâ — áåç èñïîëüçîâàíèÿ ôîðìóëû ìàññèâà ïðèøëîñü áû ñòðîèòü ïðîìåæóòî÷íóþ òàáëèöó (ïîäîáíóþ
òàáëèöå ñîïðÿæåííîñòè), ÷òîáû âûïîëíèòü âû÷èñëåíèÿ
ν ij2
ni* n* j
äëÿ êàæäîé ÿ÷åéêè
òàáëèöû ñîïðÿæåííîñòè. Ïîñëå âû÷èñëåíèÿ ýòîé ñóììû íàõîæäåíèå êðèòåðèàëüíîé ñòàòèñòèêè (ÿ÷åéêà D15) è êðèòè÷åñêîãî çíà÷åíèÿ (ÿ÷åéêà D17) íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé. Ôîðìóëû äëÿ èõ âû÷èñëåíèé ïîêàçàíû íà ðèñ. 13.4.
Îòìåòèì, ÷òî âñå ôîðìóëû íà ýòîì ðàáî÷åì ëèñòå “æèâûå” è àâòîìàòè÷åñêè
ïåðåñ÷èòûâàþòñÿ ïðè èçìåíåíèè âûáîðî÷íûõ çíà÷åíèé.
13.2. Оценивание коэффициента корреляции
Åñëè ñ ïîìîùüþ êðèòåðèåâ íåçàâèñèìîñòè óñòàíîâëåí ôàêò çàâèñèìîñòè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, òî äàëåå âîçíèêàåò âîïðîñ îöåíêè ñòåïåíè ýòîé
çàâèñèìîñòè.  êà÷åñòâå ìåðû ñòàòèñòè÷åñêîé çàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí
îáû÷íî âûñòóïàåò êîýôôèöèåíò êîððåëÿöèè. Ïîýòîìó âîïðîñ îá îöåíêå ñòåïåíè
ñòàòèñòè÷åñêîé çàâèñèìîñòè ìîæíî ïåðåôîðìóëèðîâàòü â âîïðîñ î òî÷íîñòè çíà÷åíèÿ âû÷èñëåííîãî âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè. Îòâåò íà ïîñëåäíèé âîïðîñ äàþò äîâåðèòåëüíûå èíòåðâàëû è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè.  ýòîì ðàçäåëå ðàññìîòðåíû ìåòîäû
ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ êîððåëÿöèè, à â ñëåäóþùåì — ìåòîäû ñðàâíåíèÿ âûáîðî÷íûõ êîýôôèöèåíòîâ êîððåëÿöèè.
13.2.1. Доверительные интервалы для коэффициента
корреляции
Åñëè êîýôôèöèåíò êîððåëÿöèè îòëè÷åí îò íóëÿ, òî òî÷íîå ðàñïðåäåëåíèå âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè äàæå â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ
çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí ÿâëÿåòñÿ âåñüìà ñëîæíûì è íåïðèìåíèìûì äëÿ
ïðàêòè÷åñêîãî èñïîëüçîâàíèÿ.  ýòîé ñèòóàöèè òîëüêî ïðèìåíåíèå zïðåîáðàçîâàíèÿ Ôèøåðà z =
1 1+ r
ln
(ñì. ðàçäåë 3.3.1) ïðåäîñòàâëÿåò âîçìîæ2 1− r
íîñòü ïîñòðîèòü ïðèáëèæåííûå äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî êîýôôèöèåíòà êîððåëÿöèè.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà è ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20.
Äîâåðèòåëüíûé èíòåðâàë äëÿ êîýôôèöèåíòà êîððåëÿöèè ρ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
Глава 13. Корреляционный анализ
393
2. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x =
3. Âû÷èñëÿåòñÿ
òî÷å÷íàÿ
n
∑ ( x − x )( y
i
r=
i
∑ (x − x) ⋅ ∑ ( y
i
êîýôôèöèåíòà
êîððåëÿöèè
.
n
2
i =1
îöåíêà
− y)
i =1
n
1 n
1 n
x
è
y
=
∑i
∑ yi .
n i =1
n i =1
i
− y)
2
i =1
4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî
1+ α 
–1
 , Ô — ôóíê2


íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 
öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà.
5. Âû÷èñëÿþòñÿ âåëè÷èíû z1 =
1 1+ r
k
1 1+ r
k
è z2 = ln
.
ln
−
+
2 1− r
2 1− r
n−3
n−3
6. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë (r1, r2), ãäå r1 =
e 2 z1 − 1
e 2 z2 − 1
=
r
è
.
2
e2 z1 + 1
e 2 z2 + 1
Êîììåíòàðèè
1. Åùå ðàç ïîä÷åðêíåì, ÷òî ýòî ïðèáëèæåííûé ìåòîä, êîòîðûé äàåò óäîâëåòâîðèòåëüíûå ðåçóëüòàòû äëÿ äîñòàòî÷íî áîëüøèõ âûáîðîê (îáúåìîì áîëåå
20 çíà÷åíèé).
2. Äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé ìîæíî èñïîëüçîâàòü ìåòîä, îïèñàííûé
â ñëåäóþùåì ðàçäåëå.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.5 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà. Òåñòîâàÿ âûáîðêà
èìååò ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5.
Âûáîðêà ïîñòðîåíà ìåòîäîì, îïèñàííûì â ðàçäåëå 7.5.1. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ â ÿ÷åéêàõ D7 è F7 ãðàíèö äîâåðèòåëüíîãî èíòåðâàëà ïî èçâåñòíûì
çíà÷åíèÿì z1 è z2 èñïîëüçóåòñÿ ôóíêöèÿ TANH, âû÷èñëÿþùàÿ çíà÷åíèÿ ãèïåðáîëè÷åñêîãî òàíãåíñà — ôîðìóëû r1 =
e 2 z1 − 1
e 2 z2 − 1
=
r
è
ÿâëÿþòñÿ ôîðìóëàìè
2
e2 z1 + 1
e 2 z2 + 1
ãèïåðáîëè÷åñêîãî òàíãåíñà. Òàêèå æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ
ФИШЕРОБР. Äëÿ âû÷èñëåíèÿ ïðåîáðàçîâàíèÿ Ôèøåðà â Excel ïðåäóñìîòðåíà
ñïåöèàëüíàÿ ôóíêöèÿ ФИШЕР, êîòîðàÿ èñïîëüçîâàíà â ôîðìóëå ÿ÷åéêè D3.
Î ôóíêöèÿõ ФИШЕР è ФИШЕРОБР ðå÷ü èäåò â ðàçäåëå 4.10.5.
13.2.2. Доверительные интервалы для коэффициента
корреляции нормальной совокупности
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå
ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20.
394 Часть IV. Статистический анализ зависимостей
Ðèñ. 13.5. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà
êîððåëÿöèè
Äîâåðèòåëüíûé èíòåðâàë äëÿ êîýôôèöèåíòà êîððåëÿöèè ρ ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
2. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x =
3. Âû÷èñëÿåòñÿ
òî÷å÷íàÿ
n
∑ ( x − x )( y
i
r=
i
∑ (x − x) ⋅ ∑ ( y
i
êîððåëÿöèè
.
n
2
i =1
êîýôôèöèåíòà
− y)
i =1
n
îöåíêà
1 n
1 n
x
è
y
=
∑i
∑ yi .
n i =1
n i =1
i
− y)
2
i =1
4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî-
1+ α 
–1
, Ô —
2


ãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 
ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî
çàêîíà.
5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë

r (1 − r 2 )
1− r2
r (1 − r 2 )
1− r2 
−k
,r +
+k
r +
.
2n
2n
n
n 

Êîììåíòàðèè
1. Ýòî àñèìïòîòè÷åñêèé ìåòîä, ïîýòîìó îáúåì âûáîðêè äîëæåí áûòü áîëüøå 20. Ìåòîä ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî â ñëó÷àå íîðìàëüíîé ñîâîêóïíîñòè âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè àñèìïòîòè÷åñêè èìååò
íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì ρ è äèñïåðñèåé
Глава 13. Корреляционный анализ
395
2
 1 − ρ2 
r (1 − r 2 )
ââåäåíà èç-çà ñìåùåíèÿ âûáîðî÷íîãî êîýôôè
 . Ïîïðàâêà
2n
 n 
öèåíòà êîððåëÿöèè r îòíîñèòåëüíî èñòèííîãî êîýôôèöèåíòà êîððåëÿöèè ρ.
2. Ìåòîä ïëîõî ðàáîòàåò, åñëè ρ áëèçêî ê ±1.  ýòîì ñëó÷àå îáúåì âûáîðêè
äîëæåí áûòü î÷åíü áîëüøèì, ÷òîáû ðàñïðåäåëåíèå r ñ ïðèåìëåìîé òî÷íîñòüþ àïïðîêñèìèðîâàëîñü íîðìàëüíûì ðàñïðåäåëåíèåì.
3. Åñëè ρ áëèçêî ê íóëþ, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ìîæíî
ïðèìåíèòü ðàñïðåäåëåíèå Ñòüþäåíòà, êàê ýòî ñäåëàíî â êðèòåðèè íåçàâèñèìîñòè äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé (ñì. ðàçäåë 13.1.2). Íî òàêîé äîâåðèòåëüíûé èíòåðâàë òàêæå áóäåò ïðèáëèæåííûì.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 13.6 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.
Ðèñ. 13.6. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà êîððåëÿöèè íîðìàëüíîé ñîâîêóïíîñòè
13.3. Критерии проверки гипотез о значениях
коэффициента корреляции
Ñäåëàåì îáùèé êîììåíòàðèé êî âñåì îïèñàííûì â ýòîì ðàçäåëå êðèòåðèÿì
ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè. Âñå ýòè êðèòåðèè ïîñòðîåíû ñ èñïîëüçîâàíèåì z-ïðåîáðàçîâàíèÿ Ôèøåðà. Ïîýòîìó âñå îíè ÿâëÿþòñÿ
àñèìïòîòè÷åñêèìè è òðåáóþò, ÷òîáû âûáîðêè áûëè äîñòàòî÷íî áîëüøîãî îáúåìà.
Äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íóëþ êîýôôèöèåíòà êîððåëÿöèè èñïîëüçóþòñÿ êðèòåðèè ïðîâåðêè íåçàâèñèìîñòè, êîòîðûå îïèñàíû â ðàçäåëå 13.1.
13.3.1. Критерий проверки значения коэффициента
корреляции
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå
396 Часть IV. Статистический анализ зависимостей
äâóìåðíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå
ìåíåå 20.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: ρ = ρ0
Í0: ρ ≤ ρ0
Í0: ρ ≥ ρ0
Í1: ρ ≠ ρ0
Í1: ρ > ρ0
Í1: ρ < ρ0
Çäåñü ρ0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿåòñÿ
òî÷å÷íàÿ
n
∑ ( x − x )( y
i
r=
i
− y)
, ãäå x =
i =1
n
n
∑ (x − x) ⋅ ∑ ( y
2
i
i =1
îöåíêà
i
− y )2
êîýôôèöèåíòà
êîððåëÿöèè
1 n
1 n
xi è y = ∑ yi .
∑
n i =1
n i =1
i =1
2. Âû÷èñëÿþòñÿ âåëè÷èíû z =
1 1+ r
1 1 + ρ0
è z0 = ln
.
ln
2 1− r
2 1 − ρ0
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
z − z0
n−3
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
|T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1.
Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé.
13.3.2. Критерий проверки равенства двух коэффициентов
корреляции
Ñòàòèñòè÷åñêàÿ ìîäåëü. Çàäàíû äâå âûáîðêè, ñäåëàííûå èç äâóìåðíûõ ñîâîêóïíîñòåé ñ êîýôôèöèåíòàìè êîððåëÿöèè ρ1 è ρ2 ñîîòâåòñòâåííî. Îáúåì ïåðâîé
âûáîðêè ðàâåí n1, îáúåì âòîðîé — n2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: ρ1 = ρ2
Í0: ρ1 ≤ ρ2
Í0: ρ1 ≥ ρ2
Í1: ρ1 ≠ ρ2
Í1: ρ1 > ρ2
Í1: ρ1 < ρ2
Çàäàí óðîâåíü çíà÷èìîñòè α.
Глава 13. Корреляционный анализ
397
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè êîýôôèöèåíòîâ êîððåëÿöèè ïåðâîé âûáîðêè r1 è âòîðîé âûáîðêè r2 ïî ñòàíäàðòíûì ôîðìóëàì.
2. Âû÷èñëÿþòñÿ âåëè÷èíû z1 =
1 1 + r1
1 1 + r2
, z2 = ln
è S=
ln
2 1 − r1
2 1 − r2
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
1
1
.
+
n1 − 3 n2 − 3
z1 − z 2
.
S
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè
|T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1.
Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ ïîêàçàíà íà ðèñ. 13.7.
Çäåñü æå ïðèâåäåíû âñå íåîáõîäèìûå äëÿ âû÷èñëåíèé ôîðìóëû.
Ðèñ. 13.7. Êðèòåðèé ïðîâåðêè ðàâåíñòâà äâóõ êîýôôèöèåíòîâ êîððåëÿöèè
398 Часть IV. Статистический анализ зависимостей
13.3.3. Критерий проверки равенства нескольких
коэффициентов корреляции
Ñòàòèñòè÷åñêàÿ ìîäåëü. Çàäàíû k âûáîðîê, ñäåëàííûõ èç äâóìåðíûõ ñîâîêóïíîñòåé ñ êîýôôèöèåíòàìè êîððåëÿöèè ρ1, ρ2, ..., ρk ñîîòâåòñòâåííî. Îáúåì
ïåðâîé âûáîðêè ðàâåí n1, îáúåì âòîðîé — n2, ..., k-é âûáîðêè — nk.
Ãèïîòåçû
Í0: ρ1 = ρ2 = ... = ρk;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè êîýôôèöèåíòîâ êîððåëÿöèè âñåõ âûáîðîê
r1, r2, ..., rk ïî ñòàíäàðòíûì ôîðìóëàì.
2. Âû÷èñëÿþòñÿ âåëè÷èíû z1 =
1 1 + r1
1 1 + r2
1 1 + rk
, z2 = ln
, ..., zk = ln
.
ln
2 1 − r1
2 1 − r2
2 1 − rk
2
 k

 ∑ (ni − 3) zi 
k
i =1
 .
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ (ni − 3) zi2 −  k
i =1
∑ (ni − 3)
i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû.
Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè T ≤ t.
 ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Êîììåíòàðèé.  ñëó÷àå k = 2 êðèòåðèé ýêâèâàëåíòåí êðèòåðèþ à) èç ïðåäûäóùåãî ðàçäåëà, ïðè ýòîì çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè äàííîãî êðèòåðèÿ
ðàâíÿåòñÿ êâàäðàòó ñòàòèñòèêè êðèòåðèÿ èç ïðåäûäóùåãî ðàçäåëà.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé.
Глава 13. Корреляционный анализ
399
Глава
14
Сравнение зависимых выборок
Â
ýòîé ãëàâå ðàññìîòðåíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé çàâèñèìûõ âûáîðîê. Åñëè ìåòîäàìè èç ãëàâû 13 óñòàíîâëåí ôàêò çàâèñèìîñòè
âûáîðî÷íûõ çíà÷åíèé, òî ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé, îïèñàííûå â ãëàâå 12, ïðèìåíÿòü íåëüçÿ. Äëÿ çàâèñèìûõ âûáîðîê ñóùåñòâóþò ñïåöèàëüíûå ìåòîäû. Èì è ïîñâÿùåíà äàííàÿ ãëàâà.  ïåðâîì ðàçäåëå ðàññìîòðåíû
ìåòîäû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé ìàòåìàòè÷åñêèõ
îæèäàíèé, âî âòîðîì — êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ìàòåìàòè÷åñêèõ
îæèäàíèé è â òðåòüåì — ìåòîäû äèñïåðñèîííîãî àíàëèçà.
14.1. Доверительные интервалы для разности
математических ожиданий нормальных
совокупностей
Òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé
çàâèñèìûõ âûáîðîê èçâåñòíû òîëüêî äëÿ ñëó÷àÿ íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé. Äëÿ ïðîèçâîëüíûõ ðàñïðåäåëåíèé ìîæíî ïðèìåíèòü
íåïàðàìåòðè÷åñêèå êðèòåðèè ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé, êîòîðûå õîòÿ è íå ñòðîÿò äîâåðèòåëüíûå èíòåðâàëû, íî ïîçâîëÿþò ïðîâåðèòü ãèïîòåçû
î ðàâåíñòâå èëè íåðàâåíñòâå ýòèõ ðàçíîñòåé íåêîòîðûì çàäàííûì çíà÷åíèÿì.
14.1.1. Доверительный интервал для разности математических
ожиданий
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå
µ1, ñëó÷àéíàÿ âåëè÷èíà Y — ìàòåìàòè÷åñêîå îæèäàíèå µ2.
Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè ∆µ = µ1 – µ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
2. Âû÷èñëÿþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn.
3. Âû÷èñëÿåòñÿ ñðåäíåå ýòèõ ðàçíîñòåé d =
ñèÿ Sd2 =
1 n
(di − d )2 .
∑
n − 1 i =1
1 n
∑ di è èõ âûáîðî÷íàÿ äèñïåðn i =1
4. Îïðåäåëÿåòñÿ êîýôôèöèåíò k — êâàíòèëü ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ
Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.

Sd

n
5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë  d − k
,d + k
Sd 
.
n
Êîììåíòàðèè
1. Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ íà òîì îñíîâàíèè, ÷òî ðàçíîñòü íîðìàëüíûõ ñëó÷àéíûõ âåëè÷èí (äàæå çàâèñèìûõ) òàêæå áóäåò èìåòü íîðìàëüíîå ðàñïðåäåëåíèå.
2. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè.
3. Ìåòîä íåïðèìåíèì äëÿ íåçàâèñèìûõ íàáëþäåíèé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 14.1 ïîêàçàí ðàáî÷èé ëèñò, íà êîòîðîì ðåàëèçîâàí äàííûé ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  ñòîëáöàõ À è  ñîäåðæàòñÿ âûáîðî÷íûå
çíà÷åíèÿ, èìåþùèå ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è êîýôôèöèåíòîì êîððåëÿöèè 0,5 (ñïîñîáû ñîçäàíèÿ òàêèõ âûáîðîê ïîêàçàíû â ðàçäåëå 7.5.1). Òàêèì îáðàçîì, çäåñü ðàçíîñòü ìàòåìàòè÷åñêèõ îæèäàíèé ðàâíà íóëþ. Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ïåðâîé
âûáîðêè, íàçâàí Х, à âòîðîé âûáîðêè — Y. Îáðàùàåì âíèìàíèå íà ôîðìóëû
ìàññèâîâ â ÿ÷åéêàõ D3 è D5, ñ ïîìîùüþ êîòîðûõ âû÷èñëÿþòñÿ ñðåäíåå ðàçíîñòåé è âûáîðî÷íàÿ äèñïåðñèÿ ðàçíîñòåé. Ïðèìåíåíèå ýòèõ ôîðìóë ïîçâîëÿåò èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé ñàìèõ ðàçíîñòåé.
Ðèñ. 14.1. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé
14.1.2. Доверительный интервал для математических
ожиданий нескольких совокупностей
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X1, X2, ..., Xm).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì
n (x11, x21, ..., xm1), (x12, x22, ..., xm2), ..., (x1n, x2n, ..., xmn). Îáîçíà÷èì ÷åðåç µ1, µ2,
..., µm íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ ñëó÷àéíûõ âåëè÷èí X1, X2, ..., Xm.
Глава 14. Сравнение зависимых выборок
401
Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ äëÿ ëèíåéíîé êîìáèíàöèè ìàòåìàòè÷åñêèõ
îæèäàíèé, ò.å. äëÿ âåëè÷èíû L = c1µ1+ c2µ2 + ... + cmµm, ãäå c1, c2, ..., cm — çàäàííûå ÷èñëà, ñóììà êîòîðûõ ðàâíà íóëþ.
Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ ñëåäóþùèì îáðàçîì.
1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α.
2. Âû÷èñëÿþòñÿ m ñðåäíèõ âèäà x1* =
1 n
1 n
1 n
x1i , x2* = ∑ x2i , ..., xm* = ∑ xni .
∑
n i =1
n i =1
n i =1
3. Âû÷èñëÿåòñÿ âåëè÷èíà L = c1 x1* + c2 x2* + ... + cm xm* .
4. Âû÷èñëÿþòñÿ n ñðåäíèõ âèäà x*1 =
5. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x =
1 m
1 m
1 m
xi1 , x*2 = ∑ xi 2 , ..., x*n = ∑ xin .
∑
m i =1
m i =1
m i =1
1 m n
∑∑ xij .
mn i =1 j =1
m
6. Âû÷èñëÿåòñÿ ñóììà êâàäðàòîâ
n
S = ∑∑ ( xij − xi* − x* j + x )2
è äèñïåðñèÿ
i =1 j =1
s2 =
S
.
(m − 1)(n − 1)
7. Îïðåäåëÿåòñÿ âåëè÷èíà t êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî
ñòåïåíÿìè ñâîáîäû 1 è (n – 1)(m – 1).
8. Âû÷èñëÿåòñÿ âåëè÷èíà T =
t (c12 + c22 + ... + cm2 ) s 2
.
n
9. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë ( L − T , L + T ) .
Êîììåíòàðèè
1. Â îñíîâå äàííîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ëåæèò
äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç (ñì. ðàçäåëû 3.5.3 è 14.3).
2. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè è ïðè íåáîëüøèõ îòêëîíåíèÿõ îò óñëîâèÿ ðàâåíñòâà äèñïåðñèé.
3. Ýòèì ìåòîäîì ìîæíî ñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äëÿ ïîïàðíûõ
ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé. Íàïðèìåð, åñëè ïîëîæèòü ñ1 = 1,
ñ2 = –1, à âñå îñòàëüíûå ci ïîëîæèòü ðàâíûìè íóëþ, òî áóäåò ïîñòðîåí
äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé ïåðâûõ
äâóõ âûáîðîê.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 14.2 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàí äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ëèíåéíîé êîìáèíàöèè ìàòåìàòè÷åñêèõ îæèäàíèé.  ñòîëáöàõ À:D çàïèñàíû èñõîäíûå äàííûå — âûáîðêà èç ÷åòûðåõ çàâèñèìûõ êîìïîíåíòîâ, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû
ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ ýòèõ êîìïîíåíòîâ, íàçâàíû ñîîòâåòñòâåííî Х1, Х2, Х3 è Х4.
402 Часть IV. Статистический анализ зависимостей
Ðèñ. 14.2. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ëèíåéíîé êîìáèíàöèè
ìàòåìàòè÷åñêèõ îæèäàíèé
Ê ñîæàëåíèþ, äëÿ ðåàëèçàöèè äàííîãî ìåòîäà íåëüçÿ îáîéòèñü áåç íåêîòîðûõ
ïðîìåæóòî÷íûõ âû÷èñëåíèé.  ñòîëáöå Å âû÷èñëåíû ñðåäíèå ïî ñòðîêàì
(ôîðìóëà =СРЗНАЧ(A2:D2) â ÿ÷åéêå Å2, êîòîðàÿ çàòåì ñêîïèðîâàíà âíèç),
â ÿ÷åéêàõ G7:J7 — ñðåäíèå ïî ñòîëáöàì (ôîðìóëà =СРЗНАЧ(Х1) â ÿ÷åéêå G7;
àíàëîãè÷íûå ôîðìóëû ñîäåðæàòñÿ â îñòàëüíûõ ÿ÷åéêàõ ýòîãî äèàïàçîíà), îáùåå
ñðåäíåå — â ÿ÷åéêå Í9.
m
 ñòîëáöå F âû÷èñëÿþòñÿ êâàäðàòû
∑ (x
ij
− xi* − x* j + x ) 2 (÷àñòü ôîðìóëû äëÿ
i =1
âû÷èñëåíèÿ S; ñì. ïðèâåäåííûé âûøå ï. 6 ïîñëåäîâàòåëüíîñòè ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà). Äëÿ ýòîãî â ÿ÷åéêå F2 ââåäåíà ôîðìóëà ìàññèâà
{=СУММКВ(A2:D2-$G$7:$J$7-E2+$H$9)},
êîòîðàÿ çàòåì ñêîïèðîâàíà âíèç. Ñàìà âåëè÷èíà S âû÷èñëÿåòñÿ êàê ÷àñòü ôîðìóëû â ÿ÷åéêå Í10, â êîòîðîé íàõîäèòñÿ çíà÷åíèå äèñïåðñèè s2. Ôîðìóëû äëÿ
äðóãèõ âû÷èñëåíèé ïðåäñòàâëåíû íà ðàáî÷åì ëèñòå.
Íà ðèñ. 14.2 ïîêàçàí äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1+ µ2 – µ3 – µ4.
Èçìåíÿÿ êîýôôèöèåíòû ci (äèàïàçîí G4:J4), ìîæíî ñðàçó ïîëó÷èòü äîâåðèòåëüíûå èíòåðâàëû äëÿ äðóãèõ êîìáèíàöèé ìàòåìàòè÷åñêèõ îæèäàíèé. Íàïðèìåð,
íà ðèñ. 14.3 ïîêàçàí äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1 – µ4.
14.2. Критерии проверки гипотез о равенстве
математических ожиданий
Êàê ïîêàçàíî â ïðåäûäóùåì ðàçäåëå, òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ
ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé çàâèñèìûõ âûáîðîê ìîæíî ïîñòðîèòü òîëüêî
ïðè îáðåìåíèòåëüíîì ïðåäïîëîæåíèè î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé
ñîâîêóïíîñòè. Òî÷íûå êðèòåðèè ïðîâåðêè ãèïîòåç î ðàâåíñòâå ìàòåìàòè÷åñêèõ
Глава 14. Сравнение зависимых выборок
403
îæèäàíèé òàêæå ñòðîÿòñÿ íà îñíîâå òàêîãî æå ïðåäïîëîæåíèÿ. Îäíàêî ñóùåñòâóþò íåïàðàìåòðè÷åñêèå êðèòåðèè, êîòîðûå íå òðåáóþò ïðåäïîëîæåíèé î íîðìàëüíîñòè ðàñïðåäåëåíèé.  ýòîì îòíîøåíèè êðèòåðèè ïðåäïî÷òèòåëüíåå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé çàâèñèìûõ íàáëþäåíèé.
Ðèñ. 14.3. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1 – µ4
14.2.1. Парный критерий Стьюдента
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå
µ1, ñëó÷àéíàÿ âåëè÷èíà Y — µ2.
Ãèïîòåçû
à) Ðàâåíñòâî
á) Íåðàâåíñòâî
â) Íåðàâåíñòâî
Í0: µ1 – µ2 = m
Í0: µ1 – µ2 ≤ m
Í0: µ1 – µ2 ≥ m
Í1: µ1 – µ2 ≠ m
Í1: µ1 – µ2 > m
Í1: µ1 – µ2 < m
Çäåñü m — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn.
2. Âû÷èñëÿåòñÿ ñðåäíåå ýòèõ ðàçíîñòåé d =
ñèÿ Sd2 =
1 n
∑ di è èõ âûáîðî÷íàÿ äèñïåðn i =1
1 n
∑ (di − d )2 .
n − 1 i =1
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
404 Часть IV. Статистический анализ зависимостей
n ( d − m)
.
Sd
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû.
Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 –
α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè Ò ≤ t1.
Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ,
åñëè t2 ≤ Ò.
Êîììåíòàðèè
1. Äëÿ ïðîâåðêè ãèïîòåçû î òîì, ÷òî µ1 = µ2, â ãèïîòåçå à) ñëåäóåò ïîëîæèòü
m = 0.
2. Êðèòåðèé íåïðèìåíèì äëÿ íåçàâèñèìûõ âûáîðîê.
3. Êðèòåðèé íå ÷óâñòâèòåëåí ê óìåðåííûì îòêëîíåíèÿì îò íîðìàëüíîñòè.
4. Ïðè çíà÷èòåëüíûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè ñëåäóåò ïðèìåíÿòü íåïàðàìåòðè÷åñêèé êðèòåðèé çíàêîâ èëè êðèòåðèé Óèëêîêñîíà (ñì. ñëåäóþùèå ðàçäåëû).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ êðèòåðèÿ â Excel íå ïðåäñòàâëÿåò òðóäíîñòåé è âî
ìíîãîì ñîâïàäàåò ñ âû÷èñëåíèåì äîâåðèòåëüíîãî èíòåðâàëà èç ðàçäåëà 14.1.1.
Êðîìå òîãî, â Excel ðåàëèçàöèÿ ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Парный двухвыборочный t-тест для средних, îïèñàíèå êîòîðîãî äàíî â ðàçäåëå 5.9. Òàì æå ïðèâåäåí ïðèìåð ðåàëèçàöèè êðèòåðèÿ.
14.2.2. Непараметрический критерий знаков
Ýòîò êðèòåðèé ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé
êîìïîíåíòîâ ñëó÷àéíîé âåëè÷èíû Z = (X, Y). Ìåðîé ðàçëè÷èÿ â ìåñòîïîëîæåíèè
ðàñïðåäåëåíèé ñëóæèò ìåäèàíà ñëó÷àéíîé âåëè÷èíû X – Y. Ïîñêîëüêó äëÿ áîëüøèíñòâà ðàñïðåäåëåíèé ìåäèàíà è ìàòåìàòè÷åñêîå îæèäàíèå áëèçêè, îñîáåííî åñëè ðàñïðåäåëåíèÿ ñèììåòðè÷íû èëè õîòÿ áû îäíîìîäàëüíû, òî â ñëó÷àå, êîãäà
ðàçëè÷èå íåçíà÷èìî (ò.å. ìåäèàíà áëèçêà ê íóëþ), ìîæíî ñ÷èòàòü, ÷òî ìàòåìàòè÷åñêèå îæèäàíèÿ ñëó÷àéíûõ âåëè÷èí X è Y òàêæå ðàçëè÷àþòñÿ íåçíà÷èìî.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå ðàñïðåäåëåíèå. Ðàññìàòðèâàþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn.
Ãèïîòåçû
Í0: ìåäèàíà ðàçíîñòåé ðàâíà íóëþ;
Í1: ìåäèàíà ðàçíîñòåé íå ðàâíà íóëþ.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïîäñ÷èòûâàåòñÿ êîëè÷åñòâî N ïîëîæèòåëüíûõ ðàçíîñòåé õ1 – ó1, õ2 – ó2,
..., xn – yn.
Глава 14. Сравнение зависимых выборок
405
2. Äëÿ ìàëûõ âûáîðîê ÷èñëî N áåðåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè. Äëÿ áîëüøèõ âûáîðîê êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå T =
2N − n
n
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà N èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è ð = 0,5, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòè÷åñêèõ çíà÷åíèé tí è tâ áåðóòñÿ ñîîòâåòñòâåííî êâàíòèëè ïîðÿäêà α/2 è 1 – α/2 áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è ð = 0,5. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ N ≤ tâ.  ïðîòèâíîì
ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ.
Äëÿ áîëüøèõ âûáîðîê â êà÷åñòâå êðèòè÷åñêîãî çíà÷åíèÿ t áåðåòñÿ êâàíòèëü
ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |Ò| ≤ t.  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ.
Êîììåíòàðèè
1. Åñëè åñòü ðàçíîñòè xi – yi, ðàâíûå íóëþ, òî çà êàæäóþ íóëåâóþ ðàçíîñòü
ê çíà÷åíèþ N íàäî ïðèáàâèòü 0,5.
2.  äàííîì êðèòåðèè áîëüøîé ñ÷èòàåòñÿ âûáîðêà îáúåìîì áîëåå 20 çíà÷åíèé.
3. Ñ ïîìîùüþ äàííîãî êðèòåðèÿ ìîæíî ïðîâåðÿòü äðóãèå ãèïîòåçû. Íàïðèìåð, Í0: ìåäèàíà ðàçíîñòåé ðàâíà δ (çàäàííîå ÷èñëî), Í1: ìåäèàíà ðàçíîñòåé íå ðàâíà δ. Äëÿ ïðîâåðêè òàêèõ ãèïîòåç èç êàæäîé ðàçíîñòè xi – yi
íåîáõîäèìî âû÷åñòü δ. Îñòàëüíûå âû÷èñëåíèÿ îñòàþòñÿ áåç èçìåíåíèé.
4. Åñëè íåò îñíîâàíèé îòêëîíÿòü ïðåäïîëîæåíèå î íîðìàëüíîñòè ãåíåðàëüíîé
ñîâîêóïíîñòè, òî ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé ïàðíûé êðèòåðèé
Ñòüþäåíòà (ñì. ïðåäûäóùèé ðàçäåë). Íåïàðàìåòðè÷åñêèé êðèòåðèé Óèëêîêñîíà, îïèñàííûé íèæå, òàêæå áîëåå ìîùíûé, íî îí ïðåäïîëàãàåò âûïîëíåíèÿ áîëåå ñèëüíîãî óñëîâèÿ, ÷åì êðèòåðèé çíàêîâ, à èìåííî — ñèììåòðè÷íîñòü ðàñïðåäåëåíèé.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 14.4 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé äëÿ
áîëüøèõ âûáîðîê. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïðèâåäåíû íà
ýòîì ëèñòå.
Ðèñ. 14.4. Íåïàðàìåòðè÷åñêèé êðèòåðèé çíàêîâ
406 Часть IV. Статистический анализ зависимостей
14.2.3. Непараметрический критерий Уилкоксона
Ýòîò êðèòåðèé ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé µ1 è µ2
êîìïîíåíòîâ ñëó÷àéíîé âåëè÷èíû Z = (X, Y). Îäíàêî ïðîâåðÿåìàÿ ñ ïîìîùüþ
äàííîãî êðèòåðèÿ ãèïîòåçà Í0 ñîñòîèò â òîì, ÷òî ðàñïðåäåëåíèå ðàçíîñòåé õ1 –
ó1, õ2 – ó2, ..., xn – yn ñèììåòðè÷íî îòíîñèòåëüíî íóëÿ (òîãäà ìàòåìàòè÷åñêîå
îæèäàíèå ðàçíîñòåé ðàâíî íóëþ è, ñëåäîâàòåëüíî, µ1 = µ2). Åñëè æå ýòà ãèïîòåçà
îòêëîíÿåòñÿ, òî âûâîä, ÷òî µ1 ≠ µ2, ìîæíî ñäåëàòü ëèøü òîãäà, êîãäà âûïîëíÿåòñÿ ïðåäïîëîæåíèå î òîì, ÷òî ðàñïðåäåëåíèÿ êîìïîíåíòîâ Õ è Y èìåþò îäèí
è òîò æå âèä (ðàçëè÷íû òîëüêî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ) ëèáî ýòè
ðàñïðåäåëåíèÿ ñèììåòðè÷íû îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ. Íà ïðàêòèêå, îäíàêî, äîïóñòèìû óìåðåííûå îòêëîíåíèÿ îò âûïîëíåíèÿ óêàçàííûõ òðåáîâàíèé, òàê êàê êðèòåðèé íåçíà÷èòåëüíî ÷óâñòâèòåëåí ê íèì.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå ðàñïðåäåëåíèå. Ðàññìàòðèâàþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn.
Ãèïîòåçû
Í0: ðàñïðåäåëåíèå ðàçíîñòåé ñèììåòðè÷íî îòíîñèòåëüíî íóëÿ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Ïî ñîâîêóïíîñòè ìîäóëåé ðàçíîñòåé d1 = |õ1 – ó1|, d2 = |õ2 – ó2|, ...,
dn = |xn – yn| ñòðîèòñÿ âàðèàöèîííûé ðÿä d(1) ≤ d(2) ≤ ... ≤ d(n), ïî êîòîðîìó
îïðåäåëÿþòñÿ ðàíãè âåëè÷èí di. Ðàâíûì ïî àáñîëþòíîé âåëè÷èíå ðàçíîñòÿì ïðèïèñûâàþòñÿ ñðåäíèå ðàíãè. Íóëåâûå ðàçíîñòè èãíîðèðóþòñÿ, ïðè
ýòîì çíà÷åíèå n óìåíüøàåòñÿ íà êîëè÷åñòâî íóëåâûõ ðàçíîñòåé.
2. Ïîäñ÷èòûâàåòñÿ ñóììà N ðàíãîâ, êîòîðûì ñîîòâåòñòâóþò ïîëîæèòåëüíûå
ðàçíîñòè xi – yi.
3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
N − n(n + 1)/4
n(n + 1)(2n + 1)/24
.
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
âåëè÷èíà N èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Óèëêîêñîíà, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.
 êà÷åñòâå êðèòè÷åñêîãî çíà÷åíèÿ t áåðåòñÿ êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |Ò| ≤ t.
 ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì è ïðèìåíÿåòñÿ äëÿ áîëüøèõ âûáîðîê
(îáúåìîì áîëåå 20). Äëÿ ìàëûõ âûáîðîê êðèòåðèàëüíîé ñòàòèñòèêîé ÿâëÿåòñÿ âåëè÷èíà N, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ ïî òàáëèöå ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Óèëêîêñîíà [14].
2. Ñ ïîìîùüþ äàííîãî êðèòåðèÿ ìîæíî ïðîâåðÿòü äðóãèå ãèïîòåçû, íàïðèìåð Í0: ðàñïðåäåëåíèå ðàçíîñòåé ñèììåòðè÷íî îòíîñèòåëüíî δ, ãäå δ — çàäàííîå ÷èñëî (ýòî ðàâíîñèëüíî ãèïîòåçå, ÷òî µ1 – µ2 = δ); Í1: íóëåâàÿ ãèïîòåçà
Глава 14. Сравнение зависимых выборок
407
íåâåðíà. Äëÿ ïðîâåðêè òàêèõ ãèïîòåç èç êàæäîé ðàçíîñòè xi – yi íåîáõîäèìî âû÷åñòü δ. Îñòàëüíûå âû÷èñëåíèÿ îñòàþòñÿ áåç èçìåíåíèé.
3. Åñëè íåò îñíîâàíèé îòêëîíÿòü ïðåäïîëîæåíèå î íîðìàëüíîñòè ãåíåðàëüíîé
ñîâîêóïíîñòè, òî ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé ïàðíûé êðèòåðèé
Ñòüþäåíòà (ñì. ðàçäåë 14.2.1).
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Ðåàëèçàöèÿ äàííîãî êðèòåðèÿ â Excel ïîêàçàíà íà ðèñ. 14.5, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ. Îòìåòèì, ÷òî çäåñü
íåâîçìîæíî îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé: â ñòîëáöå Ñ âû÷èñëÿþòñÿ
ìîäóëè ïîïàðíûõ ðàçíîñòåé âûáîðî÷íûõ çíà÷åíèé, â ñòîëáöå D — ðàíãè ýòèõ ìîäóëåé.  ÿ÷åéêå Å3 âû÷èñëÿåòñÿ êîëè÷åñòâî ñîâïàäàþùèõ ïàðíûõ çíà÷åíèé, ïîñêîëüêó ïðè ñîâïàäåíèè îáúåì âûáîðêè óìåíüøàåòñÿ íà ÷èñëî òàêèõ ñîâïàäåíèé.
Ðèñ. 14.5. Íåïàðàìåòðè÷åñêèé êðèòåðèé Óèëêîêñîíà
14.3. Дисперсионный анализ для зависимых
выборок
Îñíîâíûå ñòàòèñòè÷åñêèå ïðåäïîëîæåíèÿ, íà êîòîðûõ ñòðîèòñÿ äèñïåðñèîííûé
àíàëèç (ñì. ðàçäåë 3.5.1), çàêëþ÷àþòñÿ â òîì, ÷òî îøèáêè íàáëþäåíèé íåçàâèñèìû
è èìåþò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè. Èññëåäîâàíèÿ âëèÿíèÿ íàðóøåíèé îñíîâíûõ ïðåäïîëîæåíèé íà âûâîäû äèñïåðñèîííîãî àíàëèçà [24, ãë. 10] ïîêàçûâàþò, ÷òî äèñïåðñèîííûé àíàëèç íàèáîëåå ÷óâñòâèòåëåí ê íàðóøåíèÿì ïðåäïîëîæåíèé î íîðìàëüíîñòè
ðàñïðåäåëåíèé è ðàâåíñòâå äèñïåðñèé è íàèìåíåå ÷óâñòâèòåëåí ê íàðóøåíèÿì
ïðåäïîëîæåíèÿ î íåçàâèñèìîñòè íàáëþäåíèé1. Ïîýòîìó íà ïðàêòèêå äèñïåðñèîííûé àíàëèç ÷àñòî ïðèìåíÿåòñÿ ê çàâèñèìûì âûáîðêàì.
1
Ïîä÷åðêíåì, ÷òî çäåñü ðå÷ü èäåò íå î ìîäåëè ñî ñëó÷àéíûìè ôàêòîðàìè (ñì. ðàçäåë 3.5.1),
à î ìîäåëè ñ ïîñòîÿííûìè ôàêòîðàìè, íî ñëó÷àéíûìè îøèáêàìè íàáëþäåíèé.  ìîäåëè ñî
ñëó÷àéíûìè ôàêòîðàìè ïðèìåíÿåòñÿ ñõåìà âû÷èñëåíèé, îòëè÷íàÿ îò ñõåìû âû÷èñëåíèé
â ìîäåëè ñ ïîñòîÿííûìè ôàêòîðàìè.
408 Часть IV. Статистический анализ зависимостей
14.3.1. Двухфакторный дисперсионный анализ
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t
óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå
çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå
õij = µ + βi + γj + εij,
ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè
äèñïåðñèÿìè. Âñå âåëè÷èíû εij íåçàâèñèìû.
Ãèïîòåçû
à) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà β
á) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà γ
Í0: β1 = β2 = ... = βr;
Í0: γ1 = γ2 = ... = γt;
Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû.
Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âûáîðêó óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû, ïî çíà÷åíèÿì êîòîðîé âû÷èñëÿþòñÿ ñðåäíèå ïî ñòðîêàì è ñòîëáöàì è îáùåå ñðåäíåå.
γ1
γ2
...
γt
β1
x11
x12
...
x1t
β2
x21
x22
...
x2t
...
...
...
...
...
βr
xr1
xr2
...
xrt
Ñðåäíèå
x*1 = ∑ xi1
r
...
x*t = ∑ xit
r
i =1
x*2 = ∑ xi 2
i =1
Ñðåäíèå
x1* =
1 t
∑ x1i
t i =1
x2* =
1 t
∑ x2 i
t i =1
...
xr * =
r
i =1
x=
1 t
∑ xri
t i =1
1 r t
∑∑ xij
rt i =1 j =1
2. Âû÷èñëÿþòñÿ êîìïîíåíòû äèñïåðñèîííîé òàáëèöû.
Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ
(êîìïîíåíòû
äèñïåðñèè)
Âàðèàöèÿ ìåæäó
ñðåäíèìè ïî ñòðîêàì
(ðàçëè÷èÿ ìåæäó
óðîâíÿìè ôàêòîðà β)
r
SS1 = t ∑ ( xi* − x ) 2
i =1
×èñëî ñòåïåíåé Äèñïåðñèÿ
ñâîáîäû
r–1
s12 =
SS1
r −1
Глава 14. Сравнение зависимых выборок
409
Îêîí÷àíèå òàáë.
Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ
(êîìïîíåíòû
äèñïåðñèè)
Âàðèàöèÿ ìåæäó
ñðåäíèìè ïî ñòîëáöàì (ðàçëè÷èÿ ìåæäó
óðîâíÿìè ôàêòîðà γ)
×èñëî ñòåïåíåé Äèñïåðñèÿ
ñâîáîäû
t
SS 2 = r ∑ ( x*i − x ) 2
t–1
s22 =
i =1
Îñòàòî÷íàÿ âàðèàöèÿ (ðàçëè÷èÿ
âíóòðè âûáîðêè)
SS3 = ∑∑ ( xij − xi * − x* j + x )2
Ïîëíàÿ (îáùàÿ) âàðèàöèÿ
SS = ∑∑ ( xij − x )2
r
t
(r – 1)(t – 1)
i =1 j =1
r
t
rt – 1
i =1 j =1
3. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè Tβ =
s32 =
SS2
t −1
SS3
(r − 1)(t − 1)
s2 =
SS
rt − 1
s12
s22
è
.
T
=
γ
s32
s32
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
ñòàòèñòèêà Òβ èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1),
ñòàòèñòèêà Òγ èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (t – 1) è (r – 1)(t – 1).
Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 –
α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Òβ < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòêëîíÿåòñÿ.
Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α
F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (t – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ
íåðàâåíñòâî Òγ < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå —
îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ íîðìàëüíîñòè è ðàâåíñòâà äèñïåðñèé.
2. Äëÿ âûáîðîê, äëÿ êîòîðûõ íå âûïîëíÿþòñÿ òðåáîâàíèÿ íîðìàëüíîñòè
è ðàâåíñòâà äèñïåðñèé, íåîáõîäèìî ïðèìåíÿòü íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà èç ñëåäóþùåãî ðàçäåëà.
3. Ìîãóò ïðîâåðÿòüñÿ äðóãèå ãèïîòåçû, íàïðèìåð Í0: β1 – β2 = à,
β2 = β3 = ... = βr; Í1: íóëåâàÿ ãèïîòåçà íå âåðíà (à — çàäàííîå ÷èñëî).
 ýòîì ñëó÷àå ñíà÷àëà ÷èñëî à âû÷èòàåòñÿ èç âûáîðî÷íûõ çíà÷åíèé õ1i
(i = 1, 2, ..., t), à çàòåì âûïîëíÿþòñÿ âñå âû÷èñëåíèÿ êðèòåðèÿ áåç èçìåíåíèé. Àíàëîãè÷íûå ãèïîòåçû ìîæíî ïðîâåðÿòü îòíîñèòåëüíî çíà÷åíèé
óðîâíåé ôàêòîðà γ.
4. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, çíà÷èò, íå âñå çíà÷åíèÿ óðîâíåé ôàêòîðà îäèíàêîâû. Äëÿ òîãî ÷òîáû îïðåäåëèòü, êàêèå çíà÷åíèÿ óðîâíåé ôàêòîðà îòëè÷àþòñÿ îò äðóãèõ, ñëåäóåò ïðèìåíèòü ìåòîä ìíîæåñòâåííûõ
ñðàâíåíèé Øåôôå èç ðàçäåëà 14.3.3.
410 Часть IV. Статистический анализ зависимостей
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
 Excel äàííûé êðèòåðèé ðåàëèçóåò îïèñàííîå â ðàçäåëå 5.13 ñðåäñòâî
Двухфакторный дисперсионный анализ без повторений èç ïàêåòà àíàëèçà. Òàì æå
ïðèâåäåí ïðèìåð åãî ïðèìåíåíèÿ. Çäåñü ïîêàæåì âûïîëíåíèå êðèòåðèÿ áåç ñðåäñòâà Двухфакторный дисперсионный анализ без повторений. Åãî èñïîëüçîâàíèå
èìååò òîò íåäîñòàòîê, ÷òî ïðè èçìåíåíèè âûáîðî÷íûõ çíà÷åíèé èëè äëÿ äðóãîãî
óðîâíÿ çíà÷èìîñòè åãî íåîáõîäèìî ïðèìåíÿòü çàíîâî. Ðàáî÷èé ëèñò, ïîêàçàííûé
íà ðèñ. 14.6, ëèøåí ýòîãî íåäîñòàòêà — ëþáûå èçìåíåíèÿ â âûáîðêå ïðèâîäÿò ê
àâòîìàòè÷åñêîìó ïåðåñ÷åòó êðèòåðèÿ. Íàïðèìåð, íà ðèñ. 14.7 èçìåíåí ïåðâûé
ñòîëáåö âûáîðî÷íûõ çíà÷åíèé (“âîëþíòàðèñòñêè” ââåäåíû åäèíèöû2) — ðàáî÷èé
ëèñò àâòîìàòè÷åñêè ïåðåñ÷èòàí è ïîëó÷åí íîâûé ðåçóëüòàò. Çäåñü âåðíî îòâåðãàåòñÿ ãèïîòåçà î ðàâåíñòâå çíà÷åíèé óðîâíåé ôàêòîðà γ.
Ðèñ. 14.6. Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç
Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 14.6.
 ñòîëáöå df äèñïåðñèîííîé òàáëèöû âû÷èñëÿþòñÿ ñòåïåíè ñâîáîäû ñîîòâåòñòâóþùèõ ñóìì êâàäðàòîâ. Îáðàùàåì âíèìàíèå, ÷òî îñòàòî÷íàÿ ñóììà êâàäðàòîâ
(ÿ÷åéêà Â13) âû÷èñëÿåòñÿ, êàê ðàçíîñòü ìåæäó ïîëíîé ñóììîé êâàäðàòîâ (ÿ÷åéêà
Â14) è ñóììîé êâàäðàòîâ, âû÷èñëåííûõ äëÿ ôàêòîðîâ (ÿ÷åéêè Â11 è Â12).
14.3.2. Двухфакторный дисперсионный анализ Фридмана
Åñëè ïðåäïîëîæåíèÿ, íà êîòîðûõ îñíîâàí äâóõôàêòîðíûé äèñïåðñèîííûé
àíàëèç (ñì. ðàçäåë 3.5.3), íå âûïîëíÿþòñÿ, èñïîëüçóåòñÿ íåïàðàìåòðè÷åñêèé
êðèòåðèé Ôðèäìàíà. Íî íåîáõîäèìî îòìåòèòü, ÷òî îáû÷íûé äèñïåðñèîííûé
àíàëèç áîëåå ìîùíûé, ÷åì äàííûé êðèòåðèé. Ïîýòîìó êðèòåðèé Ôðèäìàíà ïðèìåíÿåòñÿ òîëüêî òîãäà, êîãäà åñòü âåñêèå îñíîâàíèÿ îòâåðãíóòü ñòàòèñòè÷åñêóþ
ìîäåëü îáû÷íîãî äèñïåðñèîííîãî àíàëèçà
2
Ýòè äàííûå íå óäîâëåòâîðÿþò óñëîâèÿì ïðèìåíèìîñòè ðàññìàòðèâàåìîãî êðèòåðèÿ.
Глава 14. Сравнение зависимых выборок
411
Ðèñ. 14.7. Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç äëÿ íîâûõ äàííûõ
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t
óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå
çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå
õij = µ + βi + γj + εij,
ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå îäèíàêîâûå ðàñïðåäåëåíèÿ ñ îäèíàêîâûìè äèñïåðñèÿìè (íîðìàëüíîñòü ðàñïðåäåëåíèÿ
íå ïðåäïîëàãàåòñÿ). Âñå âåëè÷èíû εij íåçàâèñèìû.
Ãèïîòåçû
à) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà β
á) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà γ
Í0: β1 = β2 = ... = βr;
Í0: γ1 = γ2 = ... = γt;
Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû.
Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
Âûáîðêó óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû.
γ1
γ2
...
γt
β1
x11
x12
...
x1t
β2
x21
x22
...
x2t
...
...
...
...
...
βr
xr1
xr2
...
xrt
1. Âû÷èñëåíèÿ äëÿ ïðîâåðêè ãèïîòåçû à).
a)  êàæäîì ñòîëáöå òàáëèöû ïî îòäåëüíîñòè âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé.
412 Часть IV. Статистический анализ зависимостей
á) Âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðî÷íûõ çíà÷åíèé êàæäîé ñòðîêè R1,
R2, ..., Rr.
r
1 r
r  i =1

2
â) Âû÷èñëÿåòñÿ âåëè÷èíà Sr = ∑ Ri2 −  ∑ Ri  .
i =1

ã) Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Tβ =
12Sr
.
tr (r + 1)
2. Âû÷èñëåíèÿ äëÿ ïðîâåðêè ãèïîòåçû á).
a)  êàæäîé ñòðîêå òàáëèöû ïî îòäåëüíîñòè âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé.
á) Âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðî÷íûõ çíà÷åíèé êàæäîãî ñòîëáöà R1 ,
R2 , ..., Rt .
t
1 t
t  i =1

2
â) Âû÷èñëÿåòñÿ âåëè÷èíà St = ∑ Ri2 −  ∑ Ri  .
i =1

ã) Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Tγ =
12St
.
rt (t + 1)
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç
âåëè÷èíû Sr è St èìåþò ñïåöèàëüíîå ðàñïðåäåëåíèå Ôðèäìàíà, ñòàòèñòèêè Òβ
è Òγ àñèìïòîòè÷åñêè èìåþò ðàñïðåäåëåíèå χ2 ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (t – 1)
ñîîòâåòñòâåííî.
Äëÿ ìàëûõ âûáîðîê êðèòè÷åñêèå çíà÷åíèÿ îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ Ôðèäìàíà [14].  ñëó÷àå áîëüøèõ âûáîðîê (r ≥ 5, t ≥ 5) äëÿ ïðîâåðêè ãèïîòåçû à) êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 –
α ðàñïðåäåëåíèÿ χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1). Åñëè Òβ ≤ têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Äëÿ ïðîâåðêè ãèïîòåçû á)
êðèòè÷åñêîå çíà÷åíèå têð íàõîäèòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ
χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1). Åñëè Òγ ≤ têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.
 ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ.
Êîììåíòàðèè
1. Åñëè â êàêîé-ëèáî ñòðîêå èëè ñòîëáöå èìåþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî
èì ïðèñâàèâàþòñÿ ñðåäíèå ðàíãè.
2. Êðèòåðèé ìàëî ÷óâñòâèòåëåí ê óìåðåííûì îòêëîíåíèÿì îò òðåáîâàíèÿ
îäèíàêîâîé ðàñïðåäåëåííîñòè âåëè÷èí εij.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 14.8 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.
 êà÷åñòâå èñõîäíûõ äàííûõ èñïîëüçîâàíà âûáîðêà èç ïðèìåðà ïðåäûäóùåãî
ðàçäåëà. Ê ñîæàëåíèþ, â äàííîì ñëó÷àå íå óäàëîñü îáîéòèñü áåç ïðîìåæóòî÷íûõ
âû÷èñëåíèé.  äèàïàçîíå G3:J7 âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé ïî
ñòîëáöàì. Äëÿ ýòîãî ñíà÷àëà âûäåëÿåòñÿ äèàïàçîí G3:G7 (êàê ïîêàçàíî íà
ðèñ. 14.8) è ââîäèòñÿ ôîðìóëà ìàññèâà {=РАНГ(B3:B7;B3:B7;1)}, êîòîðàÿ çàòåì
êîïèðóåòñÿ â ÿ÷åéêè âñåãî äèàïàçîíà G3:J7. Àíàëîãè÷íî â äèàïàçîíå Â9:Å13
âû÷èñëÿþòñÿ ðàíãè ïî ñòðîêàì — çäåñü ñíà÷àëà â äèàïàçîí Â9:Å9 ââîäèòñÿ ôîðìóëà ìàññèâà {=РАНГ(B3:Е3;B3:Е3;1)}, êîòîðàÿ çàòåì êîïèðóåòñÿ â ÿ÷åéêè âñåãî
Глава 14. Сравнение зависимых выборок
413
äèàïàçîíà Â9:Å13.  äèàïàçîíàõ Ê3:Ê7 è Â14:Å14 âû÷èñëÿþòñÿ ñóììû ñîîòâåòñòâóþùèõ ðàíãîâ. Îñòàëüíûå ôîðìóëû ïðèâåäåíû íà ðèñ. 14.8. Åñëè êðèòåðèé
âûïîëíÿåòñÿ ÷àñòî, òî, ÷òîáû îñâîáîäèòü äàííûé ðàáî÷èé ëèñò, äèàïàçîíû
G3:Ê7 è Â9:Å14, ñîäåðæàùèå ðàíãè âûáîðî÷íûõ çíà÷åíèé è èõ ñóììû, ìîæíî
ïåðåíåñòè â îòäàëåííóþ îáëàñòü ëèñòà. Âû÷èñëåíèÿ îò ýòîãî íå ïîñòðàäàþò.
Ðèñ. 14.8. Íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà
Íà ðèñ. 14.9 ïîêàçàí òîò æå ðàáî÷èé ëèñò ñ èçìåíåííûìè èñõîäíûìè äàííûìè: çíà÷åíèÿ â ïåðâîì ñòîëáöå âûáîðêè çàìåíåíû åäèíè÷íûìè çíà÷åíèÿìè. Êàê
è ñëåäîâàëî îæèäàòü, êðèòåðèé îòêëîíèë ãèïîòåçó î ðàâåíñòâå çíà÷åíèé óðîâíåé
ôàêòîðà β, íî òîëüêî ïðè óðîâíå çíà÷èìîñòè 0,13.
Ðèñ. 14.9. Íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà äëÿ íîâûõ äàííûõ
3
Ýòè äàííûå íå óäîâëåòâîðÿþò óñëîâèÿì ïðèìåíèìîñòè ðàññìàòðèâàåìîãî êðèòåðèÿ.
414 Часть IV. Статистический анализ зависимостей
14.3.3. Критерий множественных сравнений Шеффе для
зависимых выборок
Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ïîçâîëÿåò îáíàðóæèâàòü ðàçíûå çíà÷åíèÿ óðîâíåé ôàêòîðîâ, îäíàêî íå ïðåäñòàâëÿåò âîçìîæíîñòè óêàçûâàòü, êàêîé
èìåííî óðîâåíü âûäåëÿåòñÿ â ðÿäó îñòàëüíûõ óðîâíåé. Äëÿ ðåøåíèÿ ýòîé çàäà÷è
íåëüçÿ âûïîëíèòü ñåðèþ ïîñëåäîâàòåëüíûõ ïîïàðíûõ ñðàâíåíèé ñ ïîìîùüþ, íàïðèìåð, ïàðíîãî êðèòåðèÿ Ñòüþäåíòà, ïîñêîëüêó â ñåðèè ïîïàðíûõ ñðàâíåíèé
ðåçêî âîçðàñòàåò ãðóïïîâàÿ âåðîÿòíîñòü îòêëîíåíèÿ íóëåâîé ãèïîòåçû â ñëó÷àå
åå èñòèííîñòè. Ïîïàðíûå ñðàâíåíèÿ ñëåäóåò âûïîëíÿòü ñ ïîìîùüþ êðèòåðèÿ
ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå.
Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t
óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå
çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå
õij = µ + βi + γj + εij,
ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè
äèñïåðñèÿìè. Âñå âåëè÷èíû εij íåçàâèñèìû.
Ãèïîòåçû
Í0: c1β1+ c2β2 + ... + crβr, ãäå c1, c2, ..., cr — çàäàííûå ÷èñëà, ñóììà êîòîðûõ
ðàâíà íóëþ;
Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.
Çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ â çíà÷èòåëüíîé ìåðå ïîâòîðÿþò âû÷èñëåíèÿ äâóõôàêòîðíîãî
äèñïåðñèîííîãî àíàëèçà (ñì. ðàçäåë 14.3.1): ñíà÷àëà âû÷èñëÿþòñÿ ñðåäíèå ïî
ñòðîêàì xi* (i = 1, 2, ..., r) è ñòîëáöàì x* j (j = 1, 2, ..., t) è îáùåå ñðåäíåå x .
Äàëåå âû÷èñëÿþòñÿ êîìïîíåíòû äèñïåðñèîííîé òàáëèöû; õîòÿ äëÿ äàëüíåéøèõ
âû÷èñëåíèé íåîáõîäèìà òîëüêî îñòàòî÷íàÿ äèñïåðñèÿ s32 , åå ñëîæíî âû÷èñëèòü
áåç îñòàëüíûõ êîìïîíåíòîâ äèñïåðñèîííîé òàáëèöû.
r
∑c x
i i*
Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T =
i =1
r
(r − 1) s32 ∑ ci2 /t
.
i =1
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1).
Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ
íåðàâåíñòâî Ò < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå —
îòêëîíÿåòñÿ.
Êîììåíòàðèè
1. Êðèòåðèé îáû÷íî ïðèìåíÿåòñÿ äëÿ ñåðèè ñðàâíåíèé òèïà Í0: β1 – β2 = 0;
Í0: β1 – β2 ≠ 0.
Глава 14. Сравнение зависимых выборок
415
2. Î÷åâèäíî èñïîëüçîâàíèå ýòîãî êðèòåðèÿ äëÿ ñðàâíåíèÿ çíà÷åíèé óðîâíåé
ôàêòîðà γ.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ
Íà ðèñ. 14.10 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàí äàííûé
êðèòåðèé. Êîýôôèöèåíòû ñi çàäàþòñÿ â äèàïàçîíå G6:J6. Ôîðìóëû äëÿ âû÷èñëåíèÿ êîìïîíåíòîâ äèñïåðñèîííîé òàáëèöû ïîêàçàíû íà ðèñ. 14.6.
Ðèñ. 14.10. Êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå
416 Часть IV. Статистический анализ зависимостей
Глава
15
Регрессионный анализ
Ð
åãðåññèîííûé àíàëèç âûïîëíÿåòñÿ â ðàìêàõ ìîäåëè, â êîòîðîé ïåðåìåííûå
Õ è Y (âîçìîæíî, âåêòîðîçíà÷íûå) ñâÿçàíû çàâèñèìîñòüþ Y(Õ) = f(X) + ε,
ãäå ε — ñëó÷àéíàÿ ïåðåìåííàÿ. Ýòî óðàâíåíèå íàçûâàåòñÿ óðàâíåíèåì ðåãðåññèè,
à ôóíêöèÿ f(Õ) — ôóíêöèåé ðåãðåññèè. Îòíîñèòåëüíî ñëó÷àéíîé âåëè÷èíû ε
îáû÷íî äåëàåòñÿ ïðåäïîëîæåíèå, ÷òî îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Ýòà ìîäåëü è îñíîâíûå ïîíÿòèÿ ðåãðåññèîííîãî àíàëèçà îïèñàíû â ðàçäåëå 3.4.
Ïóñòü èìåþòñÿ èñõîäíûå äàííûå (íàáëþäåíèÿ) (õ1, y1), (õ2, y2), ..., (õn, yn),
ãäå õi è yi ìîãóò áûòü âåêòîðàìè. Ìåòîäû ðåãðåññèîííîãî àíàëèçà èñïîëüçóþòñÿ
äëÿ ðåøåíèÿ ñëåäóþùèõ çàäà÷.
1. Ïîäáîð ôóíêöèè ðåãðåññèè f(X), êîòîðàÿ íàèëó÷øèì îáðàçîì àïïðîêñèìèðóåò èñõîäíûå äàííûå. Êðèòåðèåì íàèëó÷øåãî ïîäáîðà îáû÷íî âûñòóïàåò
êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ (ðàçäåë 3.4.1). Ïðè ýòîì, êàê ïðàâèëî, ôóíêöèþ f(X) âûáèðàþò òàêèì îáðàçîì, ÷òîáû îíà èìåëà âèä
f(X) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X),
ãäå ôóíêöèè ϕi çàäàíû. Êîýôôèöèåíòû bi îïðåäåëÿþòñÿ íà îñíîâå èñõîäíûõ äàííûõ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ (ñì. ðàçäåë 3.4.2). Êîíå÷íî,
íè÷òî íå ìåøàåò âûáèðàòü ôóíêöèè ðåãðåññèè èç äðóãîãî êëàññà ôóíêöèé
èëè èñïîëüçîâàòü äðóãîé ìåòîä âû÷èñëåíèÿ êîýôôèöèåíòîâ bi. Îäíàêî òàêèå ôóíêöèè ëèíåéíû îòíîñèòåëüíî íåèçâåñòíûõ êîýôôèöèåíòîâ bi, ÷òî
çíà÷èòåëüíî îáëåã÷àåò âû÷èñëåíèå çíà÷åíèé ýòèõ êîýôôèöèåíòîâ. Êðîìå
òîãî, çíà÷åíèÿ êîýôôèöèåíòîâ, âû÷èñëåííûå ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ îáëàäàþò õîðîøèìè ñòàòèñòè÷åñêèìè ñâîéñòâàìè (åñëè âûïîëíÿåòñÿ
ïðåäïîëîæåíèå î íîðìàëüíîì ðàñïðåäåëåíèè ñëó÷àéíîé âåëè÷èíû ε), ÷òî
äàåò âîçìîæíîñòü ñòðîèòü äëÿ íèõ äîâåðèòåëüíûå èíòåðâàëû è ïðîâåðÿòü
ãèïîòåçû î èõ çíà÷èìîñòè.
2. Ïðîâåðêà ãèïîòåç î ñòàòèñòè÷åñêîé çíà÷èìîñòè óðàâíåíèÿ ðåãðåññèè, ò.å.
ïðîâåðêà òîãî, ÷òî âûáðàííàÿ ôóíêöèÿ ðåãðåññèè àäåêâàòíî îïèñûâàåò çàâèñèìîñòü ìåæäó ïåðåìåííûìè Õ è Y.
3. Ïðîâåðêà ãèïîòåç î ñòàòèñòè÷åñêîé çíà÷èìîñòè êîýôôèöèåíòîâ ðåãðåññèè.
 ÷àñòíîñòè, åñëè âñå êîýôôèöèåíòû íåçíà÷èìî îòëè÷àþòñÿ îò íóëÿ, ìîæíî óòâåðæäàòü, ÷òî ìåæäó ïåðåìåííûìè Õ è Y íåò çàâèñèìîñòè, ïî êðàéíåé ìåðå
òàêîé, êàêóþ ìîæíî ïðåäñòàâèòü â âèäå âûáðàííîé ôóíêöèè ðåãðåññèè.
4. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ çíà÷åíèé êîýôôèöèåíòîâ
ðåãðåññèè. Òàêèå èíòåðâàëû ïîêàçûâàþò òî÷íîñòü íàéäåííûõ çíà÷åíèé
êîýôôèöèåíòîâ. Ýòî îñîáåííî âàæíî, åñëè êîýôôèöèåíòû èìåþò îïðåäåëåííûé “ôèçè÷åñêèé” ñìûñë â ðàìêàõ îïðåäåëåííîé èíòåðïðåòàöèè ýêñïåðèìåíòàëüíûõ äàííûõ.
5. Îïðåäåëåíèå çíà÷åíèÿ ïåðåìåííîé Y ïðè òåõ çíà÷åíèÿõ ïåðåìåííîé Õ, êîòîðûå îòñóòñòâóþò â èñõîäíûõ äàííûõ. Ýòî çàäà÷à ïðîãíîçèðîâàíèÿ èëè
âîññòàíîâëåíèÿ çíà÷åíèé (ñì. ðàçäåë 3.4.5).
Ïðàêòè÷åñêèå ìåòîäû ðåøåíèÿ îïèñàííûõ çàäà÷ ïðèâåäåíû â ñëåäóþùèõ ðàçäåëàõ ãëàâû. Ñðàçó îòìåòèì, ÷òî â Excel èìååòñÿ äîñòàòî÷íî ñðåäñòâ äëÿ ðåøåíèÿ
äàííûõ çàäà÷, ïîýòîìó ïðàêòè÷åñêè íå âîçíèêàåò íåîáõîäèìîñòè ñîçäàâàòü ñîáñòâåííûå ôîðìóëû — äîñòàòî÷íî ïðèìåíèòü èìåþùèåñÿ ôóíêöèè è ñðåäñòâà.
15.1. Построение функции регрессии
Ïóñòü èìåþòñÿ èñõîäíûå äàííûå (íàáëþäåíèÿ) (õ1, y1), (õ2, y2), ..., (õn, yn).
Ïðåäïîëàãàåì, ÷òî èñõîäÿ èç êàêèõ-ëèáî ñîîáðàæåíèé âûáðàí âèä ôóíêöèè ðåãðåññèè Y(Õ) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X), ãäå ôóíêöèè ϕi èçâåñòíû (çàäàíû), è íóæíî âû÷èñëèòü êîýôôèöèåíòû b0, b1, ..., bm.  ñîîòâåòñòâèè
ñ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ äëÿ ýòîãî íåîáõîäèìî ðåøèòü ñèñòåìó íîðìàëüíûõ óðàâíåíèé (ñì. ðàçäåë 3.4.2)
n
n
n
 n 2
 b0 ∑ ϕ0 ( xi ) + b1 ∑ ϕ0 ( xi )ϕ1 ( xi ) + ... + bm ∑ ϕ0 ( xi )ϕm ( xi ) = ∑ yiϕ0 ( xi );
i =1
i =1
i =1
 i =1
n
n
n
n

2
 b0 ∑ ϕ0 ( xi )ϕ1 ( xi ) + b1 ∑ ϕ1 ( xi ) + ... + bm ∑ ϕ1 ( xi )ϕm ( xi ) = ∑ yiϕ1 ( xi );
 i =1
i =1
i =1
i =1

…

n
n
n
 n
2
b
ϕ
(
x
)
ϕ
(
x
)
+
b
ϕ
(
x
)
ϕ
(
x
)
+
...
+
b
ϕ
(
x
)
=
yiϕ m ( xi ).
∑
∑
∑
∑
i
m
i
i
m
i
m
m
i
0
1
1
 0
i =1
i =1
i =1
 i =1
Äëÿ ðåøåíèÿ ïîäîáíûõ ñèñòåì ñíà÷àëà ñëåäóåò ïîäñ÷èòàòü âñå ñóììû, êîòîðûå èìåþòñÿ â ýòîé ñèñòåìå, è çàòåì ïðèìåíèòü îäíî èç ñðåäñòâ Excel: èñïîëüçîâàòü ìàòðè÷íûå âû÷èñëåíèÿ (ñì. ðàçäåë 6.1.5) èëè ñðåäñòâî Поиск решения
(ðàçäåë 6.3.3). Ïîïóòíî îòìåòèì, ÷òî ñ ïîìîùüþ ñðåäñòâà Поиск решения ìîæíî
íàõîäèòü ïàðàìåòðû (êîýôôèöèåíòû) ôóíêöèé ðåãðåññèè, íåëèíåéíûõ îòíîñèòåëüíî ýòèõ ïàðàìåòðîâ.
Âìåñòå ñ òåì Excel ïîçâîëÿåò íàõîäèòü êîýôôèöèåíòû ðåãðåññèè áåç ïîñòðîåíèÿ íîðìàëüíîé ñèñòåìû óðàâíåíèé. Îñíîâíûìè ñðåäñòâàìè Excel, âû÷èñëÿþùèìè êîýôôèöèåíòû ðåãðåññèè, ÿâëÿþòñÿ ôóíêöèÿ ЛИНЕЙН (ñì. ðàçäåë 4.9.1)
è ñðåäñòâî Регрессия (ðàçäåë 5.16). Îíè ìîãóò âû÷èñëèòü êîýôôèöèåíòû ëþáîé
ôóíêöèè ðåãðåññèè, ëèíåéíîé îòíîñèòåëüíî ýòèõ êîýôôèöèåíòîâ. Äëÿ ýòîãî íåîáõîäèìî, ÷òîáû èñõîäíûå äàííûå èìåëè îïðåäåëåííóþ ñòðóêòóðó, à èìåííî,
÷òîáû â îòäåëüíûõ äèàïàçîíàõ áûëè çàðàíåå âû÷èñëåíû çíà÷åíèÿ ϕk(xi). Ïðèìåðû òàêèõ ñòðóêòóð äàííûõ äëÿ ìíîæåñòâåííîé ðåãðåññèè ïðèâåäåíû ïðè îïèñàíèè ôóíêöèè ЛИНЕЙН è ñðåäñòâà Регрессия. Çäåñü ïîêàæåì ñòðóêòóðó äàííûõ
äëÿ ôóíêöèè íåëèíåéíîé ðåãðåññèè Y = X2 + 2ln(1 + X).
Íà ðèñ. 15.1 ïðåäñòàâëåíû èñõîäíûå äàííûå: â ñòîëáöå À çàïèñàíû çíà÷åíèÿ
õi, â ñòîëáöå  — çíà÷åíèÿ õi2, â ñòîëáöå Ñ — çíà÷åíèÿ ln(1 + õi). Çíà÷åíèÿ yi
418 Часть IV. Статистический анализ зависимостей
ïîëó÷åíû ïî ôîðìóëå yi = xi2 + 2×ln(1 + xi) + εi, ãäå εi — ðåàëèçàöèè ñëó÷àéíîé
âåëè÷èíû, èìåþùåé ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Êîýôôèöèåíòû b1
è b2 ôóíêöèè ðåãðåññèè Y = b1X2 + b2ln(1 + X) îïðåäåëåíû ñ ïîìîùüþ ôóíêöèè
ЛИНЕЙН (èñòèííûå çíà÷åíèÿ êîýôôèöèåíòîâ b1 = 1 è b2 = 2). Ñíà÷àëà âûäåëÿåòñÿ
äèàïàçîí ÿ÷ååê, â êîòîðûé áóäóò çàïèñàíû çíà÷åíèÿ êîýôôèöèåíòîâ, çàòåì ââîäèòñÿ ôóíêöèÿ ЛИНЕЙН ñ íåîáõîäèìûìè àðãóìåíòàìè è íàæèìàåòñÿ êîìáèíàöèÿ
êëàâèø <Ctrl+Shift+Enter>, ïîñêîëüêó ôóíêöèÿ ââîäèòñÿ, êàê ôîðìóëà ìàññèâà.
Ðèñ. 15.1. Âû÷èñëåíèå êîýôôèöèåíòîâ ðåãðåññèè
 äèàïàçîíå F3:I7 ââåäåíà ôîðìóëà {=ЛИНЕЙН(D2:D16;A2:C16;;1)}; çäåñü â êà÷åñòâå èñõîäíûõ äàííûõ èñïîëüçîâàíû çíà÷åíèÿ èç ñòîëáöîâ À:Ñ. (Îáðàùàåì
âíèìàíèå, ÷òî çàãîëîâêè ñòîëáöîâ íå âêëþ÷àþòñÿ â èñõîäíûå äàííûå, èíà÷å
ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.) Ïðè òàêèõ èñõîäíûõ äàííûõ
b1,
b2
è
b3
ôóíêöèè
ðåãðåññèè
âû÷èñëÿþòñÿ
êîýôôèöèåíòû
b0,
Y = b0 + b1X + b2X2 + b3ln(1+X). Êàê âèäíî íà ðèñ. 15.1, âû÷èñëåííûå çíà÷åíèÿ
êîýôôèöèåíòîâ b2 è b3 âåñüìà äàëåêè îò èñòèííûõ çíà÷åíèé. Åñëè ñòîëáåö À íå
âêëþ÷àòü â èñõîäíûå äàííûå, òî áóäóò âû÷èñëåíû êîýôôèöèåíòû b0, b1 è b2
ôóíêöèè Y = b0 + b1X2 + b2ln(1+X), êàê ýòî ñäåëàíî â äèàïàçîíå F10:H14 ñ ïîìîùüþ ôîðìóëû {=ЛИНЕЙН(D2:D16;В2:C16;;1)}. Çäåñü êîýôôèöèåíòû b1 è b2 òàêæå åùå äàëåêè îò èñòèííûõ. Åñëè â ïîñëåäíåé ôîðìóëå â êà÷åñòâå òðåòüåãî àðãóìåíòà ôóíêöèè ЛИНЕЙН óêàçàòü 0 (ýòî îçíà÷àåò, ÷òî ïðèíóäèòåëüíî
ïîëàãàåòñÿ b0 = 0), òî ïîëó÷àòñÿ çíà÷åíèÿ êîýôôèöèåíòîâ b1 è b2, âåñüìà áëèçêèå
ê èñòèííûì (ÿ÷åéêè F17 è G17).
Õîòÿ â ïîñëåäíåì ñëó÷àå çíà÷åíèÿ êîýôôèöèåíòîâ b1 è b2 áëèçêè ê èñòèííûì, êîýôôèöèåíò äåòåðìèíàöèè R2, îïðåäåëÿþùèé ñòåïåíü òî÷íîñòè àïïðîêñèìàöèè èñõîäíûõ äàííûõ ôóíêöèåé ðåãðåññèè (ñì. ðàçäåë 3.4.3), íàèìåíüøèé
Глава 15. Регрессионный анализ
419
ñðåäè òðåõ âû÷èñëåííûõ (ÿ÷åéêè F5, F12 è F19). Ýòî âïîëíå îáúÿñíèìî: ÷åì
áîëüøå ÷ëåíîâ â ôóíêöèè ðåãðåññèè, òåì òî÷íåå àïïðîêñèìàöèÿ.
Àíàëîãè÷íûå ðåçóëüòàòû ìîæíî ïîëó÷èòü ñ ïîìîùüþ ñðåäñòâà Регрессия.
Ïðåèìóùåñòâî èñïîëüçîâàíèÿ ôóíêöèè ЛИНЕЙН ïî ñðàâíåíèþ ñî ñðåäñòâîì
Регрессия ñîñòîèò â òîì, ÷òî ïðè èçìåíåíèè èñõîäíûõ äàííûõ ôîðìóëû, ïîñòðîåííûå íà îñíîâå ôóíêöèè ЛИНЕЙН, àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ, â òî âðåìÿ
êàê ñðåäñòâî Регрессия ïðèøëîñü áû ïðèìåíÿòü ïîâòîðíî.
Êðîìå ôóíêöèè ЛИНЕЙН è ñðåäñòâà Регрессия, â Excel èìåþòñÿ è äðóãèå
ñðåäñòâà âû÷èñëåíèÿ êîýôôèöèåíòîâ ðåãðåññèè. Ýòî ôóíêöèÿ ЛГРФПРИБЛ, êîòîðàÿ âû÷èñëÿåò êîýôôèöèåíòû b0, m1, m2, ..., mk ýêñïîíåíöèàëüíîé ðåãðåññèè
âèäà Y = b0 ⋅ m1 1 ⋅ m2
X
X2
⋅ ... ⋅ mk
Xk
(ñì. ðàçäåë 4.9.6); ôóíêöèÿ òàêæå âû÷èñëÿåò ñòà-
òèñòè÷åñêèå
ïîêàçàòåëè
ðåãðåññèè.
Ôóíêöèè
ОТРЕЗОК
è
НАКЛОН
(ñì. ðàçäåë 4.9.2) âû÷èñëÿþò ñîîòâåòñòâåííî êîýôôèöèåíòû b è m óðàâíåíèÿ
ëèíåéíîé ðåãðåññèè Y = b + mX.
 Excel ôóíêöèþ ðåãðåññèè ìîæíî ïîñòðîèòü íåïîñðåäñòâåííî íà ãðàôèêå çàâèñèìîñòè Y îò Õ, ïîñòðîåííîì ïî ýêñïåðèìåíòàëüíûì äàííûì. Ðîëü ôóíêöèè
ðåãðåññèè âûïîëíÿåò ëèíèÿ òðåíäà (ñì. ðàçäåë 6.2.1). Òàêèì ñïîñîáîì ìîæíî
ïîñòðîèòü ôóíêöèþ ðåãðåññèè òîëüêî îäíîé ïåðåìåííîé. Ýòîò íåäîñòàòîê êîìïåíñèðóåòñÿ øèðîêèì íàáîðîì òèïîâ ôóíêöèè ðåãðåññèè:
•
ëèíåéíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b + mX;
•
ëîãàðèôìè÷åñêàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b + m ln(X);
•
ïîëèíîìèàëüíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b0 + b1X + b2X2 + ... + bkXk
(ñòåïåíü ïîëèíîìà k äîëæíà áûòü îò 2 äî 6);
•
ñòåïåííàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = m Xb;
•
ýêñïîíåíöèàëüíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = m ebX.
Íà ðèñ. 15.2 ïîêàçàíû òî÷å÷íûé ãðàôèê ýêñïåðèìåíòàëüíîé çàâèñèìîñòè Y îò Õ
è ôóíêöèÿ ðåãðåññèè ýêñïîíåíöèàëüíîãî âèäà. Íà ãðàôèêå òàêæå âûâîäÿòñÿ óðàâíåíèå ðåãðåññèè è çíà÷åíèå êîýôôèöèåíòà äåòåðìèíàöèè R2. Î òîì, êàê äîáàâèòü ê
äèàãðàììå ôóíêöèþ ðåãðåññèè (ëèíèþ òðåíäà) è êàê çàäàòü åå ïàðàìåòðû, ïîäðîáíî ðàññêàçàíî â ðàçäåëå 6.2.1. Íåäîñòàòêîì òàêîãî ñïîñîáà ïîñòðîåíèÿ ôóíêöèè
ðåãðåññèè ÿâëÿåòñÿ òî, ÷òî ïðè íåîáõîäèìîñòè ïðîäîëæèòü ðàáîòó ñ ýòîé ôóíêöèåé
ïðèõîäèòñÿ âðó÷íóþ ïåðåíîñèòü íà ðàáî÷èé ëèñò çíà÷åíèÿ åå êîýôôèöèåíòîâ.
15.2. Адекватность уравнения регрессии
Ñòàòèñòè÷åñêàÿ ìîäåëü. Ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè óðàâíåíèÿ ðåãðåññèè
è êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè îáû÷íî îïðåäåëÿþòñÿ ïðè óñëîâèè, ÷òî
ñëó÷àéíàÿ âåëè÷èíà ε èç óðàâíåíèÿ çàâèñèìîñòè Y(Õ) = f(X) + ε èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Äðóãèìè ñëîâàìè, åñëè íàáëþäåíèÿ yi ïðåäñòàâèìû â âèäå yi = f(xi) + εi, òî ñëó÷àéíûå âåëè÷èíû εi
äîëæíû áûòü íåçàâèñèìûìè è èìåòü îäèíàêîâûå íîðìàëüíûå ðàñïðåäåëåíèÿ
ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è îäèíàêîâûìè äèñïåðñèÿìè.
Îáû÷íî äîïóñêàåòñÿ íåêîòîðîå îòêëîíåíèå îò óñëîâèÿ íîðìàëüíîñòè, íî óñëîâèå ðàâåíñòâà äèñïåðñèé âñåõ âûáîðî÷íûõ çíà÷åíèé áîëåå æåñòêî. Åñëè ïîñëåäíåå óñëîâèå ÿâíî íå âûïîëíÿåòñÿ, òî, âî-ïåðâûõ, äëÿ âû÷èñëåíèÿ êîýôôèöèåíòîâ
420 Часть IV. Статистический анализ зависимостей
ôóíêöèè ðåãðåññèè ñëåäóåò ïðèìåíÿòü íå ñòàíäàðòíûé ìåòîä íàèìåíüøèõ êâàäðàòîâ, à åãî ìîäèôèêàöèþ — òàê íàçûâàåìûé âçâåøåííûé ìåòîä íàèìåíüøèõ
êâàäðàòîâ [14], êîòîðûé ó÷èòûâàåò íåðàâíîòî÷íîñòü íàáëþäåíèé yi. Âî-âòîðûõ,
îñíîâíûå ñòàòèñòè÷åñêèå ïîêàçàòåëè (ñì. äèñïåðñèîííóþ òàáëèöó èç ðàçäåëà 3.4.3) òàêæå âû÷èñëÿþòñÿ ïî èçìåíåííûì ôîðìóëàì [14].
Ðèñ. 15.2. Ïîñòðîåíèå ôóíêöèè ðåãðåññèè êàê ëèíèè òðåíäà
Äàëåå â ýòîì ðàçäåëå è â ïîñëåäóþùèõ ðàçäåëàõ áóäåì ïðåäïîëàãàòü, ÷òî âûïîëíÿåòñÿ îïèñàííàÿ âûøå ñòàòèñòè÷åñêàÿ ìîäåëü.
Êðèòåðèé ïðîâåðêè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè îïèñàí â ðàçäåëå 3.4.3.
Íàïîìíèì, ÷òî êðèòåðèé ïðîâåðÿåò íóëåâóþ ãèïîòåçó Í0: R2 = 0 (R2 — êîýôôèöèåíò äåòåðìèíàöèè) ïðîòèâ ãèïîòåçû Í1: R2 ≠ 0. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ (ñ çàäàííûì óðîâíåì çíà÷èìîñòè α), òî ñ÷èòàåòñÿ, ÷òî ôóíêöèÿ ðåãðåññèè
ñòàòèñòè÷åñêè çíà÷èìà, ò.å. àäåêâàòíî îïèñûâàåò èñõîäíûå äàííûå1. Ñ÷èòàåì,
÷òî çàäàí óðîâåíü çíà÷èìîñòè α.
Âû÷èñëåíèÿ
1. Âû÷èñëÿåòñÿ êîýôôèöèåíò äåòåðìèíàöèè R2. Ôîðìóëà äëÿ âû÷èñëåíèÿ
ïðèâåäåíà â ðàçäåëå 3.4.3. (Ìû íå ïðèâîäèì åå çäåñü, ïîñêîëüêó ðàññ÷èòûâàåì íà ïðèìåíåíèå ôóíêöèè ЛИНЕЙН èëè ñðåäñòâà Регрессия, êîòîðûå
âû÷èñëÿþò ýòîò êîýôôèöèåíò.)
2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà F =
n − k −1 R2
⋅
, ãäå n — êîëèk
1 − R2
÷åñòâî íàáëþäåíèé yi, k — êîëè÷åñòâî âû÷èñëÿåìûõ êîýôôèöèåíòîâ
ôóíêöèè ðåãðåññèè áåç ñâîáîäíîãî ÷ëåíà, ò.å. êîëè÷åñòâî ñòîëáöîâ ñî çíà÷åíèÿìè Õ â èñõîäíûõ äàííûõ. (Äðóãàÿ ôîðìóëà äëÿ âû÷èñëåíèÿ ñòàòèñòèêè F ïðèâåäåíà â ðàçäåëå 3.4.3. Ýòó ñòàòèñòèêó òàêæå âû÷èñëÿþò
ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия.)
1
Íà ïðàêòèêå ñ÷èòàåòñÿ, ÷òî åñëè R2 ≥ 0,7, òî òàêîå çíà÷åíèå çíà÷èìî àïðèîðè.
Глава 15. Регрессионный анализ
421
Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû
ñòàòèñòèêà F èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1).
Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1). Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè F ≤ t.  ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêîé
çíà÷èìîñòè ðåãðåññèè.
Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé,
åñëè âû÷èñëåíà êðèòåðèàëüíàÿ ñòàòèñòèêà F (ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èëè
ñðåäñòâà Регрессия). Äëÿ ðåàëèçàöèè êðèòåðèÿ íåîáõîäèìî íàéòè òîëüêî êâàíòèëü F-ðàñïðåäåëåíèÿ. Íà ðèñ. 15.3 ïîêàçàí ðàáî÷èé ëèñò Excel ñ èñõîäíûìè
äàííûìè è ôóíêöèåé ðåãðåññèè, ïîâòîðÿþùèìè ðàáî÷èé ëèñò íà ðèñ. 15.1. Çíà÷åíèÿ ñòàòèñòèêè F âû÷èñëåíû â ÿ÷åéêàõ F6 è F15 ñ ïîìîùüþ ôóíêöèè
ЛИНЕЙН, êðèòè÷åñêèå çíà÷åíèÿ — â ÿ÷åéêàõ Í8 è Í16 ñ ïîìîùüþ ôîðìóë, ïîêàçàííûõ íà ðèñ. 15.3. Êàê è ñëåäîâàëî îæèäàòü, ðåãðåññèÿ â îáîèõ ñëó÷àÿõ
çíà÷èìà (çíà÷åíèÿ ñòàòèñòèê F ñóùåñòâåííî ïðåâûøàþò êðèòè÷åñêèå çíà÷åíèÿ).
Ðèñ. 15.3. Ïðîâåðêà àäåêâàòíîñòè ðåãðåññèè
15.3. Доверительные интервалы и проверка
гипотез для коэффициентов функции регрессии
Ñòàòèñòè÷åñêàÿ ìîäåëü îïèñàíà â ïðåäûäóùåì ðàçäåëå. Ïðåäïîëîæèì, ÷òî
çíà÷åíèÿ êîýôôèöèåíòîâ è èõ ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ óæå ïîäñ÷èòàíû. Ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ êîýôôèöèåíòîâ ðåãðåññèè âû÷èñëÿþò
ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия. Íà ðèñ. 15.4, íà êîòîðîì ïðèâåäåíû ðåçóëüòàòû ðàñ÷åòîâ ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èç ïðåäûäóùåãî ïðèìåðà, çíà÷åíèÿ ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé çàïèñàíû â ÿ÷åéêàõ ïîä çíà÷åíèÿìè
êîýôôèöèåíòîâ (äèàïàçîíû F4:I4 è F13:G13).
422 Часть IV. Статистический анализ зависимостей
Äîâåðèòåëüíûå èíòåðâàëû è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè ñòðîÿòñÿ íà òîì îñíîâàíèè, ÷òî ïðè âûïîëíåíèè óñëîâèé
ñòàòèñòè÷åñêîé ìîäåëè îòíîøåíèå âû÷èñëåííîãî êîýôôèöèåíòà ê åãî ñðåäíåêâàäðàòè÷åñêîìó îòêëîíåíèþ èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû. Äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ íåîáõîäèìî âû÷èñëèòü òîëüêî êâàíòèëü t ïîðÿäêà (1 + α)/2 ýòîãî ðàñïðåäåëåíèÿ, ãäå α — çàäàííûé óðîâåíü
çíà÷èìîñòè. Íà ðèñ. 15.4 ïîêàçàíû äîâåðèòåëüíûå èíòåðâàëû äëÿ êîýôôèöèåíòîâ
ôóíêöèè ðåãðåññèè è ôîðìóëû, ïî êîòîðûì âû÷èñëÿþòñÿ ãðàíèöû ýòèõ èíòåðâàëîâ.
Ðèñ. 15.4. Äîâåðèòåëüíûå èíòåðâàëû äëÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè
Äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòà ôóíêöèè ðåãðåññèè âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà êàê ìîäóëü îòíîøåíèÿ çíà÷åíèÿ ýòîãî êîýôôèöèåíòà ê åãî ñðåäíåêâàäðàòè÷åñêîìó îòêëîíåíèþ. Ïî çàäàííîìó óðîâíþ
çíà÷èìîñòè α âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t — êâàíòèëü ïîðÿäêà 1 – α
ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû. Åñëè êðèòåðèàëüíàÿ
ñòàòèñòèêà ìåíüøå êðèòè÷åñêîãî çíà÷åíèÿ, ïðèíèìàåòñÿ ãèïîòåçà î òîì, ÷òî
äàííûé êîýôôèöèåíò ðàâåí íóëþ.  ïðîòèâíîì ñëó÷àå ñ÷èòàåòñÿ, ÷òî êîýôôèöèåíò çíà÷èìî îòëè÷àåòñÿ îò íóëÿ. Ðåàëèçàöèÿ êðèòåðèÿ ïîêàçàíà íà ðèñ. 15.5, íà
êîòîðîì ïðèâåäåíû âñå íåîáõîäèìûå ôîðìóëû. Èíòåðåñíî îòìåòèòü, ÷òî äëÿ
ôóíêöèè ðåãðåññèè Y = b0 + b1X + b2X2 + b3ln(1+X) âñå êîýôôèöèåíòû, êðîìå
îäíîãî, îêàçàëèñü íåçíà÷èìî îòëè÷íûìè îò íóëÿ, íåñìîòðÿ íà òî ÷òî èõ çíà÷åíèÿ âåñüìà âåëèêè ïî àáñîëþòíîé âåëè÷èíå.
15.4. Доверительный интервал для значения
прогноза
Ñòàòèñòè÷åñêàÿ ìîäåëü îïèñàíà â ðàçäåëå 15.2. Ïðåäïîëîæèì, ÷òî ïîäñ÷èòàíû çíà÷åíèÿ êîýôôèöèåíòîâ è îñòàòî÷íàÿ äèñïåðñèÿ sε2 (ñì. ðàçäåë 3.4.3). Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå îñòàòêîâ (êîðåíü èç îñòàòî÷íîé äèñïåðñèè) âû÷èñГлава 15. Регрессионный анализ
423
ëÿþò ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия. Íà ðèñ. 15.6, íà êîòîðîì ïðèâåäåíû ðåçóëüòàòû ðàñ÷åòîâ ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èç ïðåäûäóùåãî ïðèìåðà,
çíà÷åíèÿ ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé îñòàòêîâ çàïèñàíû â ÿ÷åéêàõ G5 è G12.
Ðèñ. 15.5. Êðèòåðèé ïðîâåðêè çíà÷èìîñòè êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè
×òîáû ñïðîãíîçèðîâàòü çíà÷åíèå ïåðåìåííîé Y â òî÷êå õ0, êîòîðàÿ íå âõîäèò
â èñõîäíîå ìíîæåñòâî çíà÷åíèé {x1, x2, ..., xn} ïåðåìåííîé Õ, èñïîëüçóåòñÿ ïîñòðîåííàÿ ôóíêöèÿ ðåãðåññèè f(X) è çà çíà÷åíèå ïåðåìåííîé Y â òî÷êå õ0 ïðèíèìàåòñÿ
âåëè÷èíà yˆ = f ( x0 ) . Âîçìîæíûå ïðîáëåìû, âîçíèêàþùèå ïðè ïðîãíîçèðîâàíèè,
îïèñàíû â ðàçäåëå 3.4.5. Çäåñü ïîêàæåì, êàê ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë
äëÿ âåëè÷èíû yˆ = f ( x0 ) ñ çàäàííûì äîâåðèòåëüíûì óðîâíåì α.
1. Âû÷èñëÿåòñÿ çíà÷åíèå yˆ = f ( x0 ) .
n
2. Âû÷èñëÿþòñÿ ñðåäíåå x çíà÷åíèé x1, x2, ..., xn è ñóììà SS x = ∑ ( xi − x ) 2 .
i =1
3. Âû÷èñëÿåòñÿ ñòàíäàðòíàÿ îøèáêà ïðîãíîçà s0 = sε 1 +
1 ( x0 − x ) 2
.
+
n
SS x
4. Îïðåäåëÿåòñÿ êâàíòèëü t ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà
ñ (n – k – 1) ñòåïåíüþ ñâîáîäû.
5. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà ( ŷ – t×s0, ŷ + t×s0).
Íà ðèñ. 15.6 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîñòðîåíû äîâåðèòåëüíûå èíòåðâàëû äëÿ çíà÷åíèé äâóõ ôóíêöèé ðåãðåññèè, âû÷èñëåííûõ ïðè õ0 = 5
(ÿ÷åéêà L5). Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ, òàêæå ïîêàçàíû íà ýòîì ðèñóíêå.
424 Часть IV. Статистический анализ зависимостей
Ðèñ. 15.6. Äîâåðèòåëüíûå èíòåðâàëû äëÿ çíà÷åíèé ïðîãíîçà
 çàêëþ÷åíèå îòìåòèì, ÷òî â Excel èìåþòñÿ òðè ôóíêöèè, êîòîðûå ìîãóò îïðåäåëÿòü çíà÷åíèÿ ïðîãíîçà áåç ÿâíîãî âû÷èñëåíèÿ óðàâíåíèÿ ðåãðåññèè.
•
ПРЕДСКАЗ âû÷èñëÿåò çíà÷åíèÿ ëèíåéíîé ôóíêöèè ðåãðåññèè Y = mX + b
(ñì. ðàçäåë 4.9.4).
•
ТЕНДЕНЦИЯ âû÷èñëÿåò çíà÷åíèÿ ïîëèíîìèàëüíîé ôóíêöèè ðåãðåññèè,
â òîì ÷èñëå ìíîæåñòâåííîé ðåãðåññèè (ôóíêöèÿ îïèñàíà â ðàçäåëå 4.9.5).
Òèï ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé âõîäíûõ äàííûõ ïåðåìåííîé Õ òàê æå, êàê äëÿ ôóíêöèè ЛИНЕЙН.
•
РОСТ âû÷èñëÿåò çíà÷åíèÿ ýêñïîíåíöèàëüíîé ôóíêöèè ðåãðåññèè, â òîì
÷èñëå ìíîæåñòâåííîé ðåãðåññèè (ôóíêöèÿ îïèñàíà â ðàçäåëå 4.9.7). Òèï
ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé âõîäíûõ äàííûõ ïåðåìåííîé
Õ òàê æå, êàê äëÿ ôóíêöèè ЛГРФПРИБЛ.
Âñå òðè ôóíêöèè ìîãóò èñïîëüçîâàòüñÿ â ôîðìóëàõ ìàññèâîâ è, òàêèì îáðàçîì,
ìîãóò âû÷èñëÿòü íå òîëüêî îòäåëüíûå çíà÷åíèÿ, íî è ìàññèâû çíà÷åíèé. Èõ óäîáíî
ïðèìåíÿòü äëÿ âû÷èñëåíèÿ îñòàòêîâ, ò.å. ðàçíîñòåé ìåæäó èñõîäíûìè çíà÷åíèÿìè
ïåðåìåííîé Y è çíà÷åíèÿìè, âû÷èñëåííûìè ïî ôóíêöèè ðåãðåññèè. Íà ðèñ. 15.7
ïîêàçàí ðàáî÷èé ëèñò Excel è ñîîòâåòñòâóþùèå ôîðìóëû, ñ ïîìîùüþ êîòîðûõ âû÷èñëÿþòñÿ ïðîãíîçèðóåìûå çíà÷åíèÿ ïåðåìåííîé Y è îñòàòêè äëÿ èñõîäíûõ äàííûõ è äâóõ ôóíêöèé ðåãðåññèè, ðàññìîòðåííûõ â ïðåäûäóùèõ ïðèìåðàõ.
Глава 15. Регрессионный анализ
425
Ðèñ. 15.7. Âû÷èñëåíèå ïðîãíîçèðóåìûõ çíà÷åíèé è îñòàòêîâ
426 Часть IV. Статистический анализ зависимостей
Литература
1. Àéâàçÿí Ñ.À., Åíþêîâ È.Ñ., Ìåøàëêèí Ë.Ä. Ïðèêëàäíàÿ ñòàòèñòèêà: èññëåäîâàíèå çàâèñèìîñòåé. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1985.
2. Àéâàçÿí Ñ.À., Ìõèòàðÿí Â.Ñ. Ïðèêëàäíàÿ ñòàòèñòèêà è îñíîâû ýêîíîìåòðèêè. — Ì. : ÞÍÈÒÈ-ÄÀÍÀ, 2001.
3. Àïòîí Ã. Àíàëèç òàáëèö ñîïðÿæåííîñòè. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1982.
4. Áîëüøåâ Ë.Í., Ñìèðíîâ Í.Â. Òàáëèöû ìàòåìàòè÷åñêîé ñòàòèñòèêè. — 3-å
èçä. — Ì. : Íàóêà, 1983.
5. Áîðîâêîâ À.À. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — Ì. : Íàóêà, 1984.
6. Ãèõìàí È.È., Ñêîðîõîä À.Â., ßäðåíêî Ì.È. Òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — 2-å èçä. — Ê. : Âèùà øê., 1988.
7. Èâ÷åíêî Ã.È., Ìåäâåäåâ Þ.È. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — Ì. : Âûñø.
øê., 1984.
8. Êîðîëþê Â.Ñ., Ïîðòåíêî Í.È., Ñêîðîõîä À.Â., Òóðáèí À.Ô. Ñïðàâî÷íèê ïî
òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå. — Ê. : Íàóê. äóìêà, 1978.
9. Ëèêåø È., Ëÿãà É. Îñíîâíûå òàáëèöû ìàòåìàòè÷åñêîé ñòàòèñòèêè. — Ì. :
Ôèíàíñû è ñòàòèñòèêà, 1985.
10. Ìàêàðîâà Í.Â., Òðîôèìåö Â.ß. Ñòàòèñòèêà â Excel. — Ì. : Ôèíàíñû
è ñòàòèñòèêà, 2002.
11. Ìèíüêî À.À., Ïåòóíèí Þ.È. Ñõîäèìîñòü ìåòîäà íàèìåíüøèõ êâàäðàòîâ
â ðàâíîìåðíîé ìåòðèêå // Ñèá. ìàòåì. æ. — 1990. — ¹ 2.
12. Ìóð Äæ., Óýäåðôîðä Ë. Ýêîíîìè÷åñêîå ìîäåëèðîâàíèå â Microsoft
Excel. — 6-å èçä. — Ì. : Èçäàò. äîì “Âèëüÿìñ”, 2004.
13. Ïåòðîâè÷ Ì.Ë., Äàâèäîâè÷ Ì.È. Ñòàòèñòè÷åñêîå îöåíèâàíèå è ïðîâåðêà
ãèïîòåç íà ÝÂÌ. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1989.
14. Ïîëëàðä Äæ. Ñïðàâî÷íèê ïî âû÷èñëèòåëüíûì ìåòîäàì ñòàòèñòèêè. —
Ì. : Ôèíàíñû è ñòàòèñòèêà, 1982.
15. Ñèãåë Ý.Ô. Ïðàêòè÷åñêàÿ
“Âèëüÿìñ”, 2002.
áèçíåñ-ñòàòèñòèêà. —
Ì. :
Èçäàò.
äîì
16. Ñîáîëü È.Ì. ×èñëåííûå ìåòîäû Ìîíòå-Êàðëî. — Ì. : Íàóêà, 1973.
17. Ñïðàâî÷íèê ïî ïðèêëàäíîé ñòàòèñòèêå. Ò.1. / Ïîä ðåä. Ý. Ëîéäà, Ó. Ëåäåðìàíà. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1989.
18. Ñïðàâî÷íèê ïî ïðèêëàäíîé ñòàòèñòèêå. Ò.2. / Ïîä ðåä. Ý. Ëîéäà, Ó. Ëåäåðìàíà. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1990.
19. Òþðèí Þ.Í., Ìàêàðîâ À.À. Ñòàòèñòè÷åñêèé àíàëèç äàííûõ íà êîìïüþòåðå. — Ì. : Èíôðà-Ì, 1998.
20. Óîêåíáàõ Äæ., Àíäåðäàë Á. Excel 2002. Áèáëèÿ ïîëüçîâàòåëÿ. — Ì. :
Äèàëåêòèêà, 2002.
21. Õàíê Äæ.Ý., Ðàéòñ À.Äæ., Óè÷åðíè Ä.Ó. Áèçíåñ-ïðîãíîçèðîâàíèå. — Ì. :
Èçäàò. äîì “Âèëüÿìñ”, 2003.
22. Õîëëåíäåð Ì., Âóëô Ä. Íåïàðàìåòðè÷åñêèå ìåòîäû ñòàòèñòèêè. — Ì. :
Ôèíàíñû è ñòàòèñòèêà, 1983.
23. Õüþáåðò Ï. Ðîáàñòíîñòü â ñòàòèñòèêå. — Ì. : Ìèð, 1984.
24. Øåôôå Ã. Äèñïåðñèîííûé àíàëèç. — Ì. : Íàóêà, 1980.
428 Литература
Предметный указатель
F
Fраспределение, 41
А
Адекватность уравнения регрессии, 420
Алгебра случайных событий, 22
Анализ
дисперсионный, 94; 408
корреляционный, 81; 382
регрессионный, 88; 181; 417
Фурье, 189
Анализ зависимостей между
классификационными переменными, 86
количественными переменными, 81
порядковыми переменными, 83
В
Вариационной ряд, 59; 65
Вероятность
ошибки второго рода, 66
ошибки первого рода, 66
условная, 22
Винзоризация, 258
Выборка, 49
размах, 65
широта, 65
Выборочная дисперсия, 50
Выборочное
пространство, 49
среднее, 50
Выборочный момент, 50
Выбросы, 250; 288
Г
Генеральная совокупность, 49
Гипотеза
альтернативная, 65
конкурирующая, 65
нулевая, 65
статистическая, 65
Гистограмма, 141; 286
с перекрытием, 215
Д
Дециль, 27
Диаграмма, 206
планки погрешностей, 210
Диалоговое окно
Анализ данных, 146; 147
Анализ Фурье, 191
Выборка, 160
Генерация случайных чисел, 155
Гистограмма, 152
Двухвыборочный Fтест для дисперсий, 172
Двухвыборочный tтест с одинаковыми
дисперсиями, 165
Двухвыборочный tтест с различными
дисперсиями, 167
Двухвыборочный zтест для средних, 163
Двухфакторный дисперсионный анализ
без повторений, 178
Двухфакторный дисперсионный анализ
с повторениями, 175
Добавление ограничения, 221
Ковариация, 181
Корреляция, 179
Линия тренда, 207
Однофакторный дисперсионный
анализ, 173
Описательная статистика, 147; 149; 151
Параметры поиска решения, 221
Парный двухвыборочный tтест для
средних, 170
Поиск решения, 221; 227
Присвоение имени, 196; 199; 200
Ранг и персентиль, 161
Регрессия, 182
Результаты поиска решения, 223
Скользящее среднее, 188
Создать имена, 200
Специальная вставка, 232
Таблица подстановки, 232
Формат линии тренда, 210
Формат планок погрешностей, 211
Формат ряда данных, 210; 212; 217; 270
Формат ячеек, 254
Экспоненциальное сглаживание, 189
Дисперсионное отношение Фишера, 75; 376
Дисперсионный анализ, 94
двухфакторный, 97; 175; 177; 409
многофакторный, 95
модель с постоянными факторами, 95
модель смешанная, 95
модель со случайными факторами, 95
однофакторный, 95; 173
статистическая модель, 94
таблица, 96
факторы, 94
Фридмана, 411
Дисперсия, 26
выборочная, 112
интервальные оценки, 57
точечная оценка, 56
Доверительная область, 53
Доверительные границы, 52
Доверительные интервалы
для дисперсий, 310; 315
для квантилей, 333
для математического ожидания, 307; 312
Доверительный интервал, 52
для значения прогноза, 423
для коэффициента корреляции, 393
для коэффициента корреляции
нормальной совокупности, 394
для коэффициентов функции
регрессии, 422
для математических ожиданий
нескольких совокупностей, 401
для математического ожидания, 140
для отношения дисперсий нормальных
совокупностей, 366
для разности двух биномиальных
вероятностей, 367
430 Предметный указатель
для разности математических
ожиданий, 400
для разности средних нормальных
совокупностей, 364; 365
З
Задача
восстановления значений, 93
экстраполяции, 94
Задачи статистического анализа
зависимостей, 79
Закон больших чисел, 21
Закон распределения, 23
И
Имена
диапазона, 197
переопределение, 200
создание, 199
ячеек, 197
Индекс корреляции, 83; 92; 183
Интервал
модальный, 285
К
Квантиль, 27; 65
доверительные интервалы, 333
Квартиль, 27; 104
Ковариация, 28
выборочная, 136
Корреляционный анализ, 81
Коэффициент
асимметрии, 26; 58; 110; 291
асимметрии Пирсона, 27; 28
детерминации, 83; 92; 96; 130; 184
конкордации, 85; 389
корреляции, 28; 81; 137;139; 170; 384
корреляции выборочный, 137
корреляции Кендалла, 85; 386
корреляции множественный, 183
корреляции Пирсона, 138
корреляции ранговый, 84
корреляции Спирмена, 84; 385
согласованности, 85; 389
эксцесса, 26; 58; 111; 291
Критерии
независимости, 382
однородности, 349
Критерии проверки статистических гипотез
непараметрические, 67
робастные, 67
свободные от распределений, 67
устойчивые, 67
Критерий
2
χ (Пирсона), 76
Ансари–Бредли проверки гипотезы о
равенстве дисперсий, 378
Бартлета проверки равенства
нескольких дисперсий, 376
Бартлетта, 95
Беренса–Фишера, 73
Беренса–Фишера проверки гипотезы о
равенстве математических
ожиданий, 370
знаков, 344; 405
знаковых рангов Уилкоксона, 346
Колмогорова, 77; 304
Краскала–Уоллиса, 357
медианы, 350
минимума суммы квадратов, 88
множественных сравнений Шеффе, 96;
373; 415
отклонения от распределения
Пуассона, 296
отклонения распределения от
нормального, 293
Пирсона, 297
проверки статистической гипотезы, 66
серий Вальда–Вольфовица, 359
Смирнова, 362
согласия хиквадрат, 297
Стьюдента модифицированный, 96
Стьюдента парный, 404
Уилкоксона, 407
Уилкоксона–Манна–Уитни, 74; 202; 355
Фишера, 95; 172
Фишера проверки равенства
дисперсий, 375
Фишера–Беренса, 167
Фридмана, 411
хиквадрат, 127; 226; 297; 299; 360
Критерий независимости
для двумерных нормальных
совокупностей, 384
для многомерных выборок, 389
на основе коэффициента корреляции
Кендалла, 386
на основе коэффициента корреляции
Спирмена, 385
на основе преобразования Фишера, 383
на основе таблиц сопряженности, 390
хиквадрат, 390
Критерий проверки
значения дисперсии нормальной
совокупности, 337
значения коэффициента корреляции, 396
равенства двух коэффициентов
корреляции, 397
равенства нескольких коэффициентов
корреляции, 399
Критерий проверки гипотез
о значении коэффициента корреляции, 396
о значении математического
ожидания, 124
о значении медианы, 343
о значении параметра биномиального
распределения, 341
о значении параметра показательного
распределения, 339
о параметрах нормального
распределения, 335
о равенстве биномиальных
вероятностей, 380
о равенстве математических
ожиданий, 368
о равенстве нескольких математических
ожиданий, 371
Критерий проверки гипотезы
о равенстве математических
ожиданий, 124
о равенстве математических ожиданий
для нормальных совокупностей, 71
Критерий проверки значения
дисперсии нормальной совокупности, 70
математического ожидания нормальной
совокупности, 69; 335
Предметный указатель
431
Критерий проверки статистической
гипотезы, 66
критическая область, 66
критические значения, 66
Критерий Стьюдента
парный, 194
проверки гипотезы о равенстве
математических ожиданий, 369
проверки гипотезы о равенстве
математических ожиданий для
зависимых нормальных
совокупностей, 73
проверки гипотезы о равенстве
математических ожиданий для
нормальных совокупностей, 71; 72
Критерий Фишера
проверки равенства дисперсий, 75; 126
Критическая точка
левосторонняя, 67
правосторонняя, 67
Л
Линия тренда, 207; 420
параметры, 209
форматирование, 209
М
Массив, 193
констант, 193; 196
Математическое ожидание
интервальные оценки, 55
точечная оценка, 54
Матрица
ковариационная, 180
корреляционная, 179; 246
Медиана, 27; 106
вычисление, 284
точечная оценка, 59
Метод
быстрого преобразования Фурье, 190
наименьших квадратов, 89; 417
Неймана, 242
непараметрические, 65
обратных функций, 234
отбора, 242
432 Предметный указатель
свободные от распределения, 65
скользящего среднего, 187
суперпозиций, 238
цензурирования Тьюки, 257
Мода, 27; 141
вычисление, 285
Моделирование случайных величин, 229
зависимых, 245
метод Неймана, 242
метод обратных функций, 234
метод отбора, 242
метод суперпозиций, 238
многомерных, 244
Модель статистических зависимостей, 78
Мощность критерия, 66
Н
Надстройка
Пакет анализа, 146
Поиск решения, 217
Начальные моменты
точечные оценки, 58
Неравенство
Гаусса, 28; 55; 251; 308
Маркова, 27
Пика, 28
Чебышева, 27; 55; 251; 252; 308
Несмещенность оценки, 50
О
Область
двухсторонняя критическая, 67
критическая, 66
левосторонняя критическая, 67
непринятия гипотезы, 66
правосторонняя критическая, 67
Однофакторный дисперсионный анализ, 371
Отклонение нормированное среднее
абсолютное, 292
Оценка
асимптотически несмещенная, 51
интервальная, 50; 52
квантилей, 65
несмещенная, 50
параметра распределения Бернулли, 61
параметра распределения Пуассона, 63
параметров нормального
распределения, 59
состоятельная, 51
точечная, 49
точечные, вычисление, 278; 283
эффективная, 51
Оценки параметров
гаммараспределения, 319
геометрического распределения, 331
логарифмически нормального
распределения, 317
нормального распределения, 312
показательного распределения, 318
равномерного распределения, 323
распределения Бернулли, 324
распределения Пуассона, 329
Ошибка
второго рода, 66
первого рода, 66
П
Переменные
классификационные, 79
количественные, 79
номинальные, 79
ординальные, 79
порядковые, 79
Пирсона коэффициент корреляции, 138
Планки погрешностей, 210
Плотность вероятности, 25
Порядковые статистики, 65
Построение
гистограмм, 212; 267; 273
полигонов, 267; 273
пробитграфика, 288
функции регрессии, 90
функций распределения, 212
эмпирических функций
распределения, 267
Правило трех сигм, 39
Преобразование
арксинуса, 63; 328
квадратного корня, 263
логарифмическое, 265
стандартизирующее, 267
Фишера, 82; 139; 383; 393
Фурье дискретное, 189
Энскомба, 63
Пробитграфик, 288
построение, 288
Проверка гипотез
для коэффициентов функции
регрессии, 422
Прогнозирование, 93
Процентиль, 27; 105
Р
Размах, 279
выборки, 65
интерквартильный, 279
Разности кумулятивные, 304
Ранг, 65; 107
вычисление, 202
процентный, 106
Распределение
безгранично делимое, 245
Бернулли, 32; 154; 230; 324
бета, 43; 114; 121; 234
биномиальное, 33; 115; 123; 154; 230; 341
Вейбулла–Гнеденко, 44; 115
гамма, 44; 116; 121; 234; 319
геометрическое, 34; 331
гипергеометрическое, 35; 116
двумерное, 28
дискретное, 155; 230
дискретное равномерное, 144
Кендалла, 387
Колмогорова–Смирнова, 77; 304
Краскала–Уоллиса, 358
логарифмически нормальное, 42; 117;
121; 234; 252; 317
логнормальное, 42
Манна–Уитти, 75; 357
модельное, 154
нормальное, 38; 117; 122; 154; 230; 234
одномодальное, 27; 55; 252; 308
отрицательное биномиальное, 35; 117
Паскаля, 35; 117
показательное, 37; 119; 318; 339
Пуассона, 34; 118; 154; 230; 263; 296;
329; 354
равномерное, 36; 144; 154; 230; 323
Предметный указатель
433
равномерное дискретное, 32
случайных величин, 23
Смирнова, 362
Снедекора, 41; 114; 120; 234; 342
Спирмена, 385
стандартное нормальное, 38; 117; 122
Стьюдента, 40; 118; 122; 169; 234; 295;
309; 317; 336; 347; 370; 384
треугольное, 37
Уилкоксона, 407
Фридмана, 413
хиквадрат, 39; 119; 122; 234; 264; 297;
330; 338; 351; 361
экспоненциальное, 37; 119
Распределения Пирсона, 45; 291
Регрессионный анализ, 88
Регрессия, 182; 417
линейная, 91
множественная, 90
нелинейная, 89
построение функции, 90
проверка адекватности, 91
статистические характеристики, 92
уравнение, 88
функция, 88
функция полиномиальная, 89
экспоненциальная, 134; 135
С
Система
нормальных уравнений, 418
Случайная величина
асимптотически нормальная, 32
дециль, 27
дискретная, 23
дисперсия, 26
квантиль, 27
квартиль, 27
коэффициент асимметрии, 26
коэффициент эксцесса, 26
линейное преобразование, 30
математическое ожидание, 26
медиана, 27
мода, 27
моменты, 26
непрерывная, 25
434 Предметный указатель
нормирование, 30
процентиль, 27
стандартизованная, 30
центральные моменты, 26
числовые характеристики, 25
Случайное событие, 20
Случайный опыт, 20
Состоятельность оценки, 51
Среднее
арифметическое, 109
гармоническое, 109
геометрическое, 109
скользящее, 187
Средство
Анализ Фурье, 189
Выборка, 160
Генерация случайных чисел, 154; 225;
229; 230; 235; 301; 309; 336; 354
Гистограмма, 151; 226; 270; 278
Двухвыборочный Fтест для дисперсий,
127; 172; 376
Двухвыборочный tтест с одинаковыми
дисперсиями, 126; 165
Двухвыборочный tтест с различными
дисперсиями, 73; 126; 167; 371
Двухвыборочный zтест для средних,
161; 369
Двухвыборочный zтест с одинаковыми
дисперсиями, 370
Двухфакторный дисперсионный анализ
без повторений, 177; 411
Двухфакторный дисперсионный анализ
с повторениями, 175
Ковариация, 180
Корреляция, 179
Однофакторный дисперсионный анализ,
173; 373
Описательная статистика, 149; 279
Парный двухвыборочный tтест для
средних, 125; 169
Подбор параметра, 236
Поиск решения, 236; 237; 418
Ранг и персентиль, 161; 202
Регрессия, 93; 181; 418; 422
Скользящее среднее, 187
Экспоненциальное сглаживание, 188
Средство Поиск решения
подбор параметров, 224
подбор параметров распределения, 225
поиск безусловного оптимума, 224
поиск допустимого решения, 224
поиск оптимума, 224
решение системы линейных
алгебраических уравнений, 225
Статистика, 50
критериальная, 68
оценивания дисперсии, 56
оценивания коэффициента
асимметрии, 58
оценивания коэффициента эксцесса, 58
оценивания математического
ожидания, 54
оценивания медианы, 59
оценивания моментов, 58
Статистики
порядковые, 65
ранговые, 65
Статистическая модель, 54
Сумма квадратов
остатков, 130
регрессии, 130
Суммы случайных величин, 30
Т
Таблица
дисперсионная, 91; 96
дисперсионного анализа, 96
сопряженности, 391
частотная, 268
Таблица
подстановки, 232
сопряженности, 86
Теорема
сложения вероятностей, 22
умножения вероятностей, 22
центральная предельная, 31
У
Уравнение регрессии, 88
Уровень
доверительный, 52
значимости, 52
значимости критерия, 66
Условное форматирование, 253
Ф
Фишера дисперсионное отношение, 75
Формула
массива, 141; 193; 196
Стерджесса, 152; 273
Функции
FРАСП, 114
FРАСПОБР, 120; 234
TANH, 394
ZТЕСТ, 124; 164; 336
БЕТАОБР, 121; 234
БЕТАРАСП, 114
БИЗВЛЕЧЬ, 352
БИНОМРАСП, 115
ВЕЙБУЛЛ, 115
вероятностей, 24
ВЕРОЯТНОСТЬ, 140
ВПР, 236; 352; 364
вычисления выборочной дисперсии
и отклонения, 111
вычисления геометрических
характеристик распределения, 110
вычисления значений функций
распределения, 113
вычисления ковариации, 136
вычисления коэффициента
корреляции, 136
вычисления средних, 109
гамма Эйлера, 142
ГАММАНЛОГ, 142
ГАММАОБР, 121; 234; 319; 340
ГАММАРАСП, 116
ГИПЕРГЕОМЕТ, 116
ДВССЫЛ, 302
ДИСП, 112
ДИСПА, 112
ДИСПР, 112; 338
ДИСПРА, 112
ДОВЕРИТ, 60; 140; 313
ЕНД, 352
ЗНАК, 388
КВАДРОТКЛ, 112
Предметный указатель
435
КВАРТИЛЬ, 104
КВПИРСОН, 138
КОВАР, 136; 180
КОРРЕЛ, 137; 180; 384
КРИТБИНОМ, 123
ЛГРФПРИБЛ, 134; 420; 425
ЛИНЕЙН, 93; 129; 132; 138; 418; 422
ЛОГНОРМОБР, 121; 234
ЛОГНОРМРАСП, 117
МАКС, 103; 392
МАКСА, 103
МЕДИАНА, 106
МИН, 103
МИНА, 103
МОБР, 204
МОДА, 141; 285
МОПРЕД, 204
МУМНОЖ, 204
НАИБОЛЬШИЙ, 103
НАИМЕНЬШИЙ, 103
НАКЛОН, 131; 420
нелинейной регрессии, 89
НОРМАЛИЗАЦИЯ, 142
НОРМОБР, 122; 234
НОРМРАСП, 117
НОРМСТОБР, 122; 234; 288
НОРМСТРАСП, 117
обратные к функциям распределения, 119
определения экстремальных значений
выборки, 102
ОСТАТ, 202
от случайных величин, 29
ОТРБИНОМРАСП, 117
ОТРЕЗОК, 131; 420
ПЕРЕСТ, 143
ПЕРСЕНТИЛЬ, 105
ПИРСОН, 137
построения уравнения регрессии, 128
ПРЕДСКАЗ, 133; 134; 425
проверки статистических критериев, 123
ПРОЦЕНТРАНГ, 106
ПУАССОН, 118; 298
работы с порядковыми статистиками, 104
РАНГ, 107; 202; 333; 347; 352; 379;
386; 390
распределения частная, 28
распределения, 24
436 Предметный указатель
регрессии, 88; 129
регрессии полиномиальная, 89
РОСТ, 135; 425
СКОС, 110
СЛУЧМЕЖДУ, 144; 230
СЛЧИС, 144; 229
СРГАМ, 109
СРГЕОМ, 109
СРЗНАЧ, 109
СРЗНАЧА, 109
СРОТКЛ, 113
СТАНДОТКЛОН, 112
СТАНДОТКЛОНА, 112
СТАНДОТКЛОНП, 113
СТАНДОТКЛОНПА, 113
СТОШYX, 132; 290
СТРОКА, 302
СТЬЮДРАСП, 118
СТЬЮДРАСПОБР, 122; 234; 235; 314; 366
СУММЕСЛИ, 200
СУММКВ, 204
СУММКВРАЗН, 205; 386
СУММПРОИЗВ, 205
СУММРАЗНКВ, 206
СУММСУММКВ, 206
СЧЁТ, 143; 392
СЧЁТЗ, 143
ТЕНДЕНЦИЯ, 133; 135; 425
ТТЕСТ, 124; 167; 169; 171
УРЕЗСРЕДНЕЕ, 110
ФИШЕР, 139; 384; 394
ФИШЕРОБР, 139; 394
ФТЕСТ, 126; 173
ХИ2ОБР, 122; 234; 300; 315; 330
ХИ2РАСП, 119
ХИ2ТЕСТ, 127; 298; 300; 303
ЧАСТОТА, 141; 277; 298
ЭКСПРАСП, 119; 319
ЭКСЦЕСС, 111
Функция регрессии
построение, 418
Ц
Цензурирование, 250
метод Тьюки, 257
на основе доверительных
интервалов, 251
непараметрическое, 257
Центральная предельная теорема, 31
Центральные моменты
точечные оценки, 58
Ч
Частости, 268
накопленные, 268; 288
накопленные относительные, 268
Частота события, 21
Частоты, 268
накопленные, 268
относительные, 268
относительные накопленные, 268
Ш
Широта выборки, 65
Э
Экспоненциальное сглаживание, 188
Эффективность оценки, 51
Предметный указатель
437
Íàó÷íî-ïîïóëÿðíîå èçäàíèå
Àëåêñàíäð Àëåêñàíäðîâè÷ Ìèíüêî
Ñòàòèñòè÷åñêèé àíàëèç â MS Excel
Ëèòåðàòóðíûé ðåäàêòîð
Âåðñòêà
Õóäîæåñòâåííûé ðåäàêòîð
Êîððåêòîðû
Ë.Í. Êðàñíîæîí
Â.È. Áîðäþê
Â.Ã. Ïàâëþòèí
Ç.Â. Àëåêñàíäðîâà, Ë.À. Ãîðäèåíêî,
Î.Â. Ìèøóòèíà
Èçäàòåëüñêèé äîì “Âèëüÿìñ”
101509, ã. Ìîñêâà, óë. Ëåñíàÿ, ä. 43, ñòð. 1
Èçä. ëèö. ËÐ ¹ 090230 îò 23.06.99
Ãîñêîìèòåòà ÐÔ ïî ïå÷àòè
Ïîäïèñàíî â ïå÷àòü 20.09.2004. Ôîðìàò 70õ100/16.
Ãàðíèòóðà Times. Ïå÷àòü îôñåòíàÿ.
Óñë. ïå÷. ë. 36,12. Ó÷.-èçä. ë. 27,5.
Òèðàæ 3000 ýêç. Çàêàç ¹
.
Îòïå÷àòàíî ñ äèàïîçèòèâîâ â ÔÃÓÏ “Ïå÷àòíûé äâîð”
Ìèíèñòåðñòâà ÐÔ ïî äåëàì ïå÷àòè,
òåëåðàäèîâåùàíèÿ è ñðåäñòâ ìàññîâûõ êîììóíèêàöèé.
197110, Ñ.-Ïåòåðáóðã, ×êàëîâñêèé ïð., 15.
Скачать