ПРОФЕССИОНАЛЬНАЯ РАБОТА СТАТИСТИЧЕСКИЙ АНАЛИЗ В MS EXCEL ПРОФЕССИОНАЛЬНАЯ РАБОТА А.А.МИНЬКО СТАТИСТИЧЕСКИЙ АНАЛИЗ В MS EXCEL Москва • СанктПетербург • Киев 2004 ÁÁÊ 32.973.26-018.2.75 M62 ÓÄÊ 681.3.07 Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà” Çàâ. ðåäàêöèåé À.Â. Ñëåïöîâ Ïî îáùèì âîïðîñàì îáðàùàéòåñü â èçäàòåëüñòâî “Äèàëåêòèêà” ïî àäðåñó: info@dialektika.com, http://www.dialektika.com Ìèíüêî, À.À. M62 Ñòàòèñòè÷åñêèé àíàëèç â MS Excel. : — Ì. : Èçäàòåëüñêèé äîì “Âèëüÿìñ”, 2004. — 448 ñ. : èë. — Ïàðàë. òèò. àíãë. ISBN 5-8459-0692-X (ðóñ.) Êíèãà ïðåäíàçíà÷åíà äëÿ âñåõ, êòî èñïîëüçóåò ìåòîäû ñòàòèñòè÷åñêîãî àíàëèçà â ñâîåé ðàáîòå. Îíà íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî ïðèìåíÿþòñÿ íà ïðàêòèêå è êîòîðûå ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ìåòîäû ïðåäñòàâëåíû â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî ïðîñòî ðåàëèçîâàòü ïðàêòè÷åñêèå ðàáîòíèêè, êîòîðûì íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ. Äëÿ ñòóäåíòîâ, àñïèðàíòîâ, ïðåïîäàâàòåëåé è ïðàêòè÷åñêèõ ðàáîòíèêîâ, çàíèìàþùèõñÿ âîïðîñàìè àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ. ÁÁÊ 32.973.26-018.2.75 Âñå íàçâàíèÿ ïðîãðàììíûõ ïðîäóêòîâ ÿâëÿþòñÿ çàðåãèñòðèðîâàííûìè òîðãîâûìè ìàðêàìè ñîîòâåòñòâóþùèõ ôèðì. Íèêàêàÿ ÷àñòü íàñòîÿùåãî èçäàíèÿ íè â êàêèõ öåëÿõ íå ìîæåò áûòü âîñïðîèçâåäåíà â êàêîé áû òî íè áûëî ôîðìå è êàêèìè áû òî íè áûëî ñðåäñòâàìè, áóäü òî ýëåêòðîííûå èëè ìåõàíè÷åñêèå, âêëþ÷àÿ ôîòîêîïèðîâàíèå è çàïèñü íà ìàãíèòíûé íîñèòåëü, åñëè íà ýòî íåò ïèñüìåííîãî ðàçðåøåíèÿ èçäàòåëüñòâà “Äèàëåêòèêà”. Copyright © 2004 by Dialektika Computer Publishing. All rights reserved including the right of reproduction in whole or in part in any form. ISBN 5-8459-0692-X (ðóñ.) © Êîìïüþòåðíîå èçä-âî “Äèàëåêòèêà”, 2004 Оглавление ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 19 Глава 1. Основные понятия теории вероятностей 20 Глава 2. Основные статистические методы 49 Глава 3. Анализ статистических зависимостей 78 ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА 101 Глава 4. Статистические функции 102 Глава 5. Надстройка Пакет анализа 146 Глава 6. Дополнительные возможности Excel для проведения статистического анализа 193 Глава 7. Моделирование случайных величин 229 ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК 249 Глава 8. Предварительный анализ 250 Глава 9. Подбор распределения 286 Глава 10. Интервальное оценивание параметров распределения 307 Глава 11. Проверка гипотез о параметрах распределений 335 Глава 12. Сравнение одномерных выборок 349 ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ 381 Глава 13. Корреляционный анализ 382 Глава 14. Сравнение зависимых выборок 400 Глава 15. Регрессионный анализ 417 Литература 427 Предметный указатель 429 Содержание Предисловие 15 ЧАСТЬ I. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ 19 Глава 1. Основные понятия теории вероятностей 20 1.1. Понятия случайного события и случайной величины 1.1.1. Вероятности 1.1.2. Алгебра случайных событий 1.1.3. Условные вероятности 1.2. Распределения случайных величин 1.2.1. Дискретные случайные величины 1.2.2. Непрерывные случайные величины 1.2.3. Числовые характеристики случайных величин 1.2.4. Вероятностные неравенства 1.2.5. Двумерные распределения 1.3. Функции от случайных величин 1.3.1. Линейное преобразование случайных величин 1.3.2. Суммы случайных величин 1.3.3. Центральная предельная теорема 1.4. Примеры дискретных распределений 1.4.1. Равномерное дискретное распределение 1.4.2. Распределение Бернулли 1.4.3. Биномиальное распределение 1.4.4. Распределение Пуассона 1.4.5. Геометрическое распределение 1.4.6. Гипергеометрическое распределение 1.4.7. Отрицательное биномиальное распределение (распределение Паскаля) 1.5. Примеры непрерывных распределений 1.5.1. Равномерное непрерывное распределение 1.5.2. Треугольное распределение 1.5.3. Показательное (экспоненциальное) распределение 1.5.4. Нормальное распределение 1.5.5. Распределение “хи/квадрат” 1.5.6. Распределение Стьюдента 1.5.7. F/распределение 1.5.8. Логарифмически нормальное распределение 1.5.9. Бета/распределение 1.5.10. Гамма/распределение Содержание 20 21 22 22 23 23 25 25 27 28 29 30 30 31 32 32 32 33 34 34 35 35 36 36 37 37 38 39 40 41 42 43 44 6 1.5.11. Распределение Вейбулла–Гнеденко 1.5.12. Распределения Пирсона Глава 2. Основные статистические методы 2.1. Точечное оценивание параметров распределения 2.1.1. Несмещенность оценки 2.1.2. Эффективность оценки 2.1.3. Состоятельность оценки 2.2. Интервальное оценивание параметров распределения 2.3. Выборочные статистики и интервальные оценки 2.3.1. Статистика для оценивания математического ожидания 2.3.2. Статистика для оценивания дисперсии 2.3.3. Статистики для оценивания моментов 2.3.4. Статистики для оценивания коэффициентов асимметрии и эксцесса 2.3.5. Статистика для оценивания медианы 2.3.6. Оценки параметров нормального распределения 2.3.7. Оценка параметра р распределения Бернулли 2.3.8. Оценка параметра λ распределения Пуассона 2.3.9. Порядковые статистики 2.4. Проверка статистических гипотез 2.4.1. Критерии проверки гипотез о значениях параметров генеральной совокупности 2.4.2. Критерии сравнения значений параметров генеральных совокупностей 2.4.3. Критерии проверки гипотез о принадлежности распределения выборки классу распределений Глава 3. Анализ статистических зависимостей 3.1. Общая модель статистических зависимостей 3.2. Задачи статистического анализа зависимостей 3.3. Корреляционный анализ 3.3.1. Анализ зависимостей между количественными переменными 3.3.2. Анализ зависимостей между порядковыми переменными 3.3.3. Анализ зависимостей между классификационными переменными 3.4. Регрессионный анализ 3.4.1. Выбор функции регрессии 3.4.2. Построение функции регрессии 3.4.3. Проверка адекватности функции регрессии 3.4.4. Статистические характеристики параметров функции регрессии 3.4.5. Прогнозирование 3.5. Дисперсионный анализ 3.5.1. Статистическая модель 7 Содержание 44 45 49 49 50 51 51 52 54 54 56 58 58 59 59 61 63 65 65 68 70 75 78 78 79 81 81 83 86 88 88 90 91 92 93 94 94 3.5.2. Однофакторный дисперсионный анализ 3.5.3. Двухфакторный дисперсионный анализ 95 97 ЧАСТЬ II. СРЕДСТВА EXCEL ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА 101 Глава 4. Статистические функции 102 4.1. Функции для определения экстремальных значений выборки 4.1.1. Функции МАКС, МАКСА, МИН, МИНА 4.1.2. Функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ 4.2. Функции для работы с порядковыми статистиками 4.2.1. Функция КВАРТИЛЬ 4.2.2. Функция ПЕРСЕНТИЛЬ 4.2.3. Функция МЕДИАНА 4.2.4. Функция ПРОЦЕНТРАНГ 4.2.5. Функция РАНГ 4.3. Функции для вычисления средних 4.3.1. Функция СРГАМ 4.3.2. Функция СРГЕОМ 4.3.3. Функции СРЗНАЧ и СРЗНАЧА 4.3.4. Функция УРЕЗСРЕДНЕЕ 4.4. Функции для вычисления геометрических характеристик распределения 4.4.1. Функция СКОС 4.4.2. Функция ЭКСЦЕСС 4.5. Функции для вычисления выборочной дисперсии и отклонения 4.5.1. Функции ДИСП и ДИСПА 4.5.2. Функции ДИСПР и ДИСПРА 4.5.3. Функция КВАДРОТКЛ 4.5.4. Функции СТАНДОТКЛОН и СТАНДОТКЛОНА 4.5.5. Функции СТАНДОТКЛОНП и СТАНДОТКЛОНПА 4.5.6. Функция СРОТКЛ 4.6. Функции для вычисления значений функций распределения 4.6.1. Функция FРАСП 4.6.2. Функция БЕТАРАСП 4.6.3. Функция БИНОМРАСП 4.6.4. Функция ВЕЙБУЛЛ 4.6.5. Функция ГАММАРАСП 4.6.6. Функция ГИПЕРГЕОМЕТ 4.6.7. Функция ЛОГНОРМРАСП 4.6.8. Функция НОРМРАСП 4.6.9. Функция НОРМСТРАСП 4.6.10. Функция ОТРБИНОМРАСП 4.6.11. Функция ПУАССОН 4.6.12. Функция СТЬЮДРАСП 4.6.13. Функция ХИ2РАСП 4.6.14. Функция ЭКСПРАСП Содержание 102 103 103 104 104 105 106 106 107 109 109 109 109 110 110 110 111 111 112 112 112 112 113 113 113 114 114 115 115 116 116 117 117 117 117 118 118 119 119 8 4.7. Функции, обратные к функциям распределения 4.7.1. Функция FРАСПОБР 4.7.2. Функция БЕТАОБР 4.7.3. Функция ГАММАОБР 4.7.4. Функция ЛОГНОРМОБР 4.7.5. Функция НОРМОБР 4.7.6. Функция НОРМСТОБР 4.7.7. Функция СТЬЮДРАСПОБР 4.7.8. Функция ХИ2ОБР 4.7.9. Функция КРИТБИНОМ 4.8. Функции для проверки статистических критериев 4.8.1. Функция ZТЕСТ 4.8.2. Функция ТТЕСТ 4.8.3. Функция ФТЕСТ 4.8.4. Функция ХИ2ТЕСТ 4.9. Функции для построения уравнения регрессии и прогнозирования 4.9.1. Функция ЛИНЕЙН 4.9.2. Функции НАКЛОН и ОТРЕЗОК 4.9.3. Функция СТОШYX 4.9.4. Функция ПРЕДСКАЗ 4.9.5. Функция ТЕНДЕНЦИЯ 4.9.6. Функция ЛГРФПРИБЛ 4.9.7. Функция РОСТ 4.10. Функции для вычисления ковариации и коэффициента корреляции 4.10.1. Функция КОВАР 4.10.2. Функция КОРРЕЛ 4.10.3. Функция ПИРСОН 4.10.4. Функция КВПИРСОН 4.10.5. Функции ФИШЕР и ФИШЕРОБР 4.11. Дополнительные функции 4.11.1. Функция ВЕРОЯТНОСТЬ 4.11.2. Функция ДОВЕРИТ 4.11.3. Функция МОДА 4.11.4. Функция ЧАСТОТА 4.12. Вспомогательные функции 4.12.1. Функция ГАММАНЛОГ 4.12.2. Функция НОРМАЛИЗАЦИЯ 4.12.3. Функция ПЕРЕСТ 4.12.4. Функции СЧЁТ и СЧЁТЗ 4.13. Функции для генерирования равномерно распределенных случайных чисел 4.13.1. Функция СЛЧИС 4.13.2. Функция СЛУЧМЕЖДУ 9 Содержание 119 120 121 121 121 122 122 122 122 123 123 124 124 126 127 128 129 131 132 133 133 134 135 136 136 137 137 138 139 139 140 140 141 141 142 142 142 143 143 143 144 144 Глава 5. Надстройка Пакет анализа 146 5.1. Описательная статистика 5.1.1. Опции диалогового окна Описательная статистика 5.2. Гистограмма 5.2.1. Опции диалогового окна Гистограмма 5.3. Генерация случайных чисел 5.3.1. Опции диалогового окна Генерация случайных чисел 5.4. Выборка 5.4.1. Опции диалогового окна Выборка 5.5. Ранг и персентиль 5.6. Двухвыборочный z/тест для средних 5.7. Двухвыборочный t/тест с одинаковыми дисперсиями 5.8. Двухвыборочный t/тест с различными дисперсиями 5.9. Парный двухвыборочный t/тест для средних 5.10. Двухвыборочный F/тест для дисперсий 5.11. Однофакторный дисперсионный анализ 5.12. Двухфакторный дисперсионный анализ с повторениями 5.13. Двухфакторный дисперсионный анализ без повторений 5.14. Корреляция 5.15. Ковариация 5.16. Регрессия 5.17. Скользящее среднее 5.18. Экспоненциальное сглаживание 5.19. Анализ Фурье Глава 6. Дополнительные возможности Excel для проведения статистического анализа 149 151 151 152 154 155 160 160 161 161 165 167 169 172 173 175 177 179 180 181 187 188 189 193 6.1. Массивы и формулы массивов 6.1.1. Редактирование формул массивов 6.1.2. Массивы констант 6.1.3. Поименованные массивы и диапазоны 6.1.4. Примеры использования формул массивов 6.1.5. Матричные вычисления 6.1.6. Функции суммирования 6.2. Диаграммы 6.2.1. Линии тренда 6.2.2. Планки погрешностей 6.2.3. Построение гистограмм и функций распределения дискретных случайных величин 6.2.4. Гистограммы с перекрытием 6.3. Надстройка Поиск решения 6.3.1. Задачи оптимизации и средство Поиск решения 6.3.2. Задачи, решаемые средством Поиск решения 6.3.3. Примеры применения средства Поиск решения Содержание 193 196 196 197 200 203 204 206 207 210 212 215 217 218 224 225 10 Глава 7. Моделирование случайных величин 7.1. Средства Excel для генерирования случайных чисел 7.2. Метод обратных функций моделирования случайных величин 7.3. Метод суперпозиций 7.4. Метод отбора 7.5. Моделирование многомерных случайных величин 7.5.1. Моделирование зависимых случайных величин с известным коэффициентом корреляции 229 229 234 238 242 244 245 ЧАСТЬ III. АНАЛИЗ ОДНОМЕРНЫХ ВЫБОРОК 249 Глава 8. Предварительный анализ 250 8.1. Цензурирование 8.1.1. Цензурирования на основе построения доверительных интервалов 8.1.2. Непараметрическое цензурирование 8.1.3. Винзоризация выборки 8.2. Преобразование данных 8.2.1. Преобразование квадратного корня 8.2.2. Логарифмическое преобразование 8.2.3. Стандартизирующее преобразование 8.3. Построение гистограмм, полигонов и эмпирических функций распределения 8.3.1. Построение гистограммы и эмпирической функции распределения для дискретных случайных величин 8.3.2. Построение гистограммы и полигона для непрерывных распределений 8.4. Вычисление точечных оценок параметров распределения 8.4.1. Точечные оценки дискретного распределения 8.4.2. Вычисление моды для непрерывных распределений Глава 9. Подбор распределения 9.1. Предварительное определение класса распределения 9.1.1. Построение пробит/графиков 9.2. Подбор функции распределения на основе числовых характеристик выборки 9.2.1. Критерии отклонения распределения от нормального 9.2.2. Критерий отклонения от распределения Пуассона 2 9.3. Критерий χ 2 9.3.1. Критерий χ для дискретных распределений 2 9.3.2. Критерий χ для непрерывных распределений 9.4. Критерий Колмогорова Глава 10. Интервальное оценивание параметров распределения 10.1. Общие доверительные интервалы для математического ожидания 10.1.1. Общая модель при известной дисперсии 11 Содержание 250 251 257 258 263 263 265 267 267 268 273 278 283 285 286 286 288 291 293 296 297 297 299 304 307 307 307 10.1.2. Одномодальное симметричное распределение при известной дисперсии 10.1.3. Общая модель с неизвестной дисперсией 10.2. Общий доверительный интервал для дисперсии 10.3. Интервальные оценки параметров нормального распределения 10.3.1. Интервальные оценки для неизвестного математического ожидания при известной дисперсии 10.3.2. Интервальные оценки для неизвестного математического ожидания при неизвестной дисперсии 10.3.3. Интервальные оценки для неизвестной дисперсии при известном математическом ожидании 10.3.4. Интервальные оценки для неизвестной дисперсии при неизвестном математическом ожидании 10.4. Оценка параметров логарифмически нормального распределения 10.5. Оценка параметра показательного распределения 10.6. Оценка параметров гамма/распределения 10.6.1. Оценка параметра λ при известном параметре α 10.6.2. Оценка параметра α при известном параметре λ 10.6.3. Совместная оценка параметров α и λ 10.7. Оценка параметров равномерного распределения 10.7.1. Оценка границы равномерного распределения 10.7.2. Оценка обеих границ равномерного распределения 10.8. Оценки параметра распределения Бернулли 10.8.1. Оценивание вероятности р по одному эксперименту 10.8.2. Оценивание вероятности р по нескольким экспериментам 10.8.3. Применение преобразования арксинуса 10.9. Оценка параметра распределения Пуассона 10.10. Оценки параметра геометрического распределения 10.11. Доверительные интервалы для квантилей Глава 11. Проверка гипотез о параметрах распределений 308 308 310 312 312 313 315 315 317 318 319 320 321 322 323 323 324 324 325 327 328 329 331 333 335 11.1. Критерии проверки гипотез о параметрах нормального распределения 11.1.1. Критерий проверки значения математического ожидания нормальной совокупности 11.1.2. Критерий проверки значения дисперсии нормальной совокупности 11.2. Проверка гипотезы о значении параметра показательного распределения 11.3. Проверка гипотезы о значении параметра биномиального распределения 11.3.1. Использование биномиального распределения 11.3.2. Асимптотический критерий 11.4. Критерии проверки гипотез о значении медианы 11.4.1. Критерий знаков 11.4.2. Критерий знаковых рангов Уилкоксона Содержание 335 335 337 339 341 341 343 343 344 346 12 Глава 12. Сравнение одномерных выборок 12.1. Сравнение выборочных распределений 12.1.1. Непараметрический критерий медианы 12.1.2. Критерий Уилкоксона–Манна–Уитни 12.1.3. Критерий Краскала–Уоллиса 12.1.4. Критерий серий Вальда–Вольфовица 2 12.1.5. Критерий χ 12.1.6. Критерий Смирнова 12.2. Доверительные интервалы для параметров распределений 12.2.1. Доверительный интервал для разности средних нормальных совокупностей (равные дисперсии) 12.2.2. Доверительный интервал для разности средних нормальных совокупностей (разные дисперсии) 12.2.3. Доверительный интервал для отношения дисперсий нормальных совокупностей 12.2.4. Доверительный интервал для разности двух биномиальных вероятностей 12.3. Проверка гипотез о параметрах распределений 12.3.1. Проверка гипотез о математических ожиданиях нормальных распределений 12.3.2. Проверка гипотез о дисперсиях нормальных распределений 12.3.3. Непараметрический критерий Ансари–Бредли проверки гипотезы о равенстве дисперсий 12.3.4. Проверка гипотез о равенстве биномиальных вероятностей 349 349 350 355 357 359 360 362 364 364 365 366 367 368 368 374 378 380 ЧАСТЬ IV. СТАТИСТИЧЕСКИЙ АНАЛИЗ ЗАВИСИМОСТЕЙ 381 Глава 13. Корреляционный анализ 382 13.1. Критерии независимости 13.1.1. Критерий независимости на основе преобразования Фишера 13.1.2. Критерий независимости для двумерных нормальных совокупностей 13.1.3. Критерий независимости на основе рангового коэффициента корреляции Спирмена 13.1.4. Критерий независимости на основе рангового коэффициента корреляции Кендалла 13.1.5. Критерий независимости для многомерных выборок 13.1.6. Критерий независимости на основе таблиц сопряженности 13.2. Оценивание коэффициента корреляции 13.2.1. Доверительные интервалы для коэффициента корреляции 13.2.2. Доверительные интервалы для коэффициента корреляции нормальной совокупности 13.3. Критерии проверки гипотез о значениях коэффициента корреляции 13.3.1. Критерий проверки значения коэффициента корреляции 13 Содержание 382 383 384 385 386 389 390 393 393 394 396 396 13.3.2. Критерий проверки равенства двух коэффициентов корреляции 13.3.3. Критерий проверки равенства нескольких коэффициентов корреляции Глава 14. Сравнение зависимых выборок 397 399 400 14.1. Доверительные интервалы для разности математических ожиданий нормальных совокупностей 14.1.1. Доверительный интервал для разности математических ожиданий 14.1.2. Доверительный интервал для математических ожиданий нескольких совокупностей 14.2. Критерии проверки гипотез о равенстве математических ожиданий 14.2.1. Парный критерий Стьюдента 14.2.2. Непараметрический критерий знаков 14.2.3. Непараметрический критерий Уилкоксона 14.3. Дисперсионный анализ для зависимых выборок 14.3.1. Двухфакторный дисперсионный анализ 14.3.2. Двухфакторный дисперсионный анализ Фридмана 14.3.3. Критерий множественных сравнений Шеффе для зависимых выборок Глава 15. Регрессионный анализ 400 400 401 403 404 405 407 408 409 411 415 417 15.1. Построение функции регрессии 15.2. Адекватность уравнения регрессии 15.3. Доверительные интервалы и проверка гипотез для коэффициентов функции регрессии 15.4. Доверительный интервал для значения прогноза 418 420 422 423 Литература 427 Предметный указатель 429 Содержание 14 Предисловие Ñ åãîäíÿ â ðàçëè÷íûõ ñôåðàõ îáùåñòâåííîé æèçíè ê ñòàòèñòè÷åñêèì ìåòîäàì ïðîÿâëÿåòñÿ ïîâûøåííûé èíòåðåñ êàê ê îäíîìó èç âàæíåéøèõ àíàëèòè÷åñêèõ èíñòðóìåíòîâ äëÿ ïîääåðæêè ïðîöåññîâ ïðèíÿòèÿ ðåøåíèé. Ñòàòèñòèêîé ïîëüçóþòñÿ âñå: îò áèçíåñìåíîâ, ñòðåìÿùèõñÿ îïòèìèçèðîâàòü ïðèáûëü îò èíâåñòèöèé, äî ïîëèòèêîâ, æåëàþùèõ ïðåäñêàçàòü èñõîä âûáîðîâ, èëè ñîöèîëîãîâ, îöåíèâàþùèõ äîâåðèå èçáèðàòåëåé ê ýòèì ïîëèòèêàì, íå ãîâîðÿ óæå î òðàäèöèîííûõ îáëàñòÿõ ïðèìåíåíèÿ ìàòåìàòè÷åñêîé ñòàòèñòèêè — íàóêå, òåõíèêå, ýêîíîìèêå. Î÷åâèäíî, ÷òî, êàê ïðàâèëî, ñòàòèñòè÷åñêèìè ìåòîäàìè â ñâîåé äåÿòåëüíîñòè ïîëüçóþòñÿ íå ïðîôåññèîíàëû-ñòàòèñòèêè (ãäå íàáðàòü ñòîëüêî ïðîôåññèîíàëîâ!), à “îáû÷íûå” ïðîôåññèîíàëû â ñâîåé îáëàñòè, êîòîðûå, âîçìîæíî, êîãäà-òî “ïðîõîäèëè” â ñâîèõ óíèâåðñèòåòàõ êóðñ ìàòåìàòè÷åñêîé ñòàòèñòèêè, íî “ýòî áûëî òàê äàâíî, ÷òî ñòàëî íåïðàâäîé”. Ìîé äîñòàòî÷íî áîëüøîé îïûò ïðèìåíåíèÿ ñòàòèñòè÷åñêèõ ìåòîäîâ â ñîâìåñòíîé ðàáîòå ñ áèîëîãàìè, ìåäèêàìè è â ïîñëåäíèå ãîäû ñ ýêîíîìèñòàìè ïîêàçûâàåò, ÷òî ðàñïðîñòðàíåííîå ìíåíèå î ñòàòèñòèêå êàê îá îäíîé èç ðàçíîâèäíîñòåé ëæè èäåò îò íåïðàâîìåðíîãî ïðèìåíåíèÿ òåõ èëè èíûõ ñòàòèñòè÷åñêèõ ìåòîäîâ â êîíêðåòíûõ ñèòóàöèÿõ. Äàæå îáùåóïîòðåáèòåëüíûé è “áåçîïàñíûé” êðèòåðèé Ñòüþäåíòà, ïðèìåíåííûé áåçäóìíî, íàïðèìåð, ê âûáîðêàì èç äèñêðåòíûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, ìîæåò â íåêîòîðûõ ñëó÷àÿõ ïîêàçàòü óäèâèòåëüíûå ðåçóëüòàòû. Ñ äðóãîé ñòîðîíû, ïî÷òè âî âñåé ëèòåðàòóðå ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå, âêëþ÷àÿ ïðàêòè÷åñêèå ðóêîâîäñòâà, ìàòåðèàë èçëàãàåòñÿ òàêèì îáðàçîì, ÷òî ñíà÷àëà èäåò “òåîðèÿ”, íàïðèìåð îñíîâû ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, à çàòåì â êà÷åñòâå èëëþñòðàöèè ê “òåîðèè” ïðåäëàãàåòñÿ íåñêîëüêî ïðàêòè÷åñêèõ ìåòîäîâ.  òàêîì ñëó÷àå ïðàêòèêó âåñüìà ñëîæíî âûáðàòü íåîáõîäèìûå ìåòîäû ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà, ñðàâíèòü ýòè ìåòîäû è òåì áîëåå îáîñíîâàòü èõ ïðèìåíåíèå. (Ðåäêèì èñêëþ÷åíèåì â îáùåì ðÿäó òàêîé ñòàòèñòè÷åñêîé ëèòåðàòóðû ÿâëÿåòñÿ êíèãà Äæ. Ïîëëàðäà Ñïðàâî÷íèê ïî âû÷èñëèòåëüíûì ìåòîäàì ñòàòèñòèêè, â êîòîðîé ïðåäñòàâëåíû ïðàêòè÷åñêèå ìåòîäû ñòàòèñòèêè è îïèñàíèå îáëàñòè ïðèìåíèìîñòè êàæäîãî èç íèõ.) Ýòà êíèãà çàäóìûâàëàñü è íàïèñàíà êàê “ñáîðíèê ðåöåïòîâ” ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå ÷àñòî èñïîëüçóþòñÿ íà ïðàêòèêå è ñðàâíèòåëüíî ïðîñòî ðåàëèçóþòñÿ â ýëåêòðîííîé òàáëèöå Excel. Äëÿ êàæäîãî ïðèâåäåííîãî ìåòîäà ÷åòêî îïèñàíà ñòàòèñòè÷åñêàÿ ìîäåëü, â ðàìêàõ êîòîðîé åãî ìîæíî ïðèìåíÿòü. Êðîìå òîãî, ìåòîäû ñãðóïïèðîâàíû ïî òèïó èñõîäíûõ äàííûõ, ïðåäúÿâëÿåìûõ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà. Òàêèì îáðàçîì, îòäåëüíî îïèñàíû ìåòîäû äëÿ àíàëèçà îäíîìåðíûõ âûáîðîê, îòäåëüíî — äëÿ çàâèñèìûõ íàáëþäåíèé è ò.ä. Ìåòîäû ïðåäñòàâëåíû â òàêîì âèäå, ÷òîáû èõ ìîãëè ëåãêî îòîáðàòü äëÿ ñâîèõ ïîòðåáíîñòåé è ñðàâíèòåëüíî ïðîñòî ðåàëèçîâàòü ïðàêòèêè (íåîáÿçàòåëüíî ïðîôåññèîíàëû-ñòàòèñòèêè), êîòîðûì íåîáõîäèìî ñàìîñòîÿòåëüíî ïðîâåñòè ñòàòèñòè÷åñêèé àíàëèç ñâîèõ äàííûõ.  ýòîé ñâÿçè íåîáõîäèìî îòìåòèòü âûáîð ýëåêòðîííîé òàáëèöû Excel êàê ñðåäñòâà ðåàëèçàöèè ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà. Ñóùåñòâóåò ìíîæåñòâî ñïåöèàëèçèðîâàííûõ ïðîãðàììíûõ ñðåäñòâ äëÿ ñòàòèñòè÷åñêèõ ðàñ÷åòîâ: îòå÷åñòâåííûå STADIA, ÑÈÃÀÌÄ, ÎËÈÌÏ:ÑòàòÝêñïåðò èëè çàðóáåæíûå STATGRAPHICS, STATISTICA, SPSS è îáùåìàòåìàòè÷åñêèå ïàêåòû (íàïðèìåð, Mathcad, Mathlab, Maple), êîòîðûå òàêæå èìåþò âñòðîåííûå ñòàòèñòè÷åñêèå ñðåäñòâà. Íî íàèáîëüøåå ðàñïðîñòðàíåíèå êàê ñðåäñòâî ïðîâåäåíèÿ ðàçëè÷íûõ ðàñ÷åòîâ, â òîì ÷èñëå è ñòàòèñòè÷åñêèõ, â íàñòîÿùåå âðåìÿ ïîëó÷èëè ýëåêòðîííûå òàáëèöû, ñðåäè êîòîðûõ áåçóñëîâíûì ëèäåðîì ÿâëÿåòñÿ Microsoft Excel. Ýòà ýëåêòðîííàÿ òàáëèöà âõîäèò â ïàêåò Microsoft Office, êîòîðûé óñòàíîâëåí ïðàêòè÷åñêè íà êàæäîì êîìïüþòåðå. Microsoft Excel èìååò äîñòàòî÷íîå êîëè÷åñòâî âñòðîåííûõ ñòàòèñòè÷åñêèõ ñðåäñòâ, âêëþ÷àÿ íàäñòðîéêó Пакет анализа è ïîðÿäêà 80 ñòàòèñòè÷åñêèõ ôóíêöèé. Ýòî îáóñëîâèëî âûáîð Excel â êà÷åñòâå îñíîâíîãî ñðåäñòâà äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Íåñìîòðÿ íà òî ÷òî â êíèãå âñå ïðèìåðû ðåàëèçîâàíû â Excel 2002, îíè áåç ñóùåñòâåííûõ èçìåíåíèé ìîãóò áûòü ïåðåíåñåíû íà äðóãèå âåðñèè Excel, íà÷èíàÿ ñ Excel 97 è çàêàí÷èâàÿ Excel 2003. Õîòÿ êíèãà çàäóìûâàëàñü òîëüêî êàê ñáîðíèê ñòàòèñòè÷åñêèõ ìåòîäîâ, îêàçàëîñü íåâîçìîæíûì îáîéòèñü áåç ââîäíîé ÷àñòè, ïîñâÿùåííîé îñíîâàì òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, è ñïåöèàëüíîé ÷àñòè, îïèñûâàþùåé ñòàòèñòè÷åñêèå âîçìîæíîñòè Excel. Ïîýòîìó êíèãà ñîñòîèò èç ÷åòûðåõ ÷àñòåé.  ÷àñòè I, Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Âåñü ìàòåðèàë ýòîé ÷àñòè ïðåäñòàâëåí êîíñïåêòèâíî; çäåñü ïðèâåäåíû âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå ïîçâîëÿò ÷èòàòåëþ âïîëíå îñîçíàííî è ïðîäóêòèâíî ïðèìåíÿòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ ÷àñòÿõ êíèãè. Êîíå÷íî, ýòà ÷àñòü ñîâñåì íå ïðåäíàçíà÷åíà äëÿ òîãî, ÷òîáû ïî íåé èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî), êàê òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. Åå ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íîå ïîñîáèå, ê êîòîðîìó ðàíî èëè ïîçäíî áóäåò âûíóæäåí îáðàòèòüñÿ êàê ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, òàê è ñïåöèàëèñò-ñòàòèñòèê (ó ëþáîãî ñïåöèàëèñòà ðàíî èëè ïîçäíî âîçíèêàåò íåîáõîäèìîñòü âåðíóòüñÿ ê “èñòîêàì” — áàçîâûì ïîíÿòèÿì). Êðîìå òîãî, ìàòåðèàë ýòîé ÷àñòè èñïîëüçóåòñÿ â ÷àñòè II äëÿ ññûëîê ïðè îïèñàíèè ñòàòèñòè÷åñêèõ ñðåäñòâ Excel.  ÷àñòè II, Ñðåäñòâà Excel äëÿ ñòàòèñòè÷åñêîãî àíàëèçà, îïèñàíû âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ïðåäïîëàãàåòñÿ, ÷òî ÷èòàòåëü çíàêîì ñ îñíîâàìè ðàáîòû â ýòîé ýëåêòðîííîé òàáëèöå õîòÿ áû â ñëåäóþùåì îáúåìå: îí ìîæåò ââîäèòü è ðåäàêòèðîâàòü äàííûå, ñîçäàâàòü ôîðìóëû, èñïîëüçîâàòü ôóíêöèè, ñòðîèòü äèàãðàììû è ãðàôèêè, ôîðìàòèðîâàòü ðàáî÷èé ëèñò è ò.ï. Ýòî áàçîâûå íàâûêè ðàáîòû ñ Excel, êîòîðûå èçâåñòíû êàæäîìó, êòî ïðîñëóøàë êóðñ èíôîðìàòèêè è âû÷èñëèòåëüíîé òåõíèêè (è ïðè ýòîì, êîíå÷íî, óñâîèë íåîáõîäèìûå çíàíèÿ) â ëþáîì âóçå ëþáîãî ïðîôèëÿ.  ýòîé ÷àñòè äîñòàòî÷íî ïîëíî îïèñàíû ñòàòèñòè÷åñêèå ôóíêöèè è ñðåäñòâà, ïðåäîñòàâëÿåìûå íàäñòðîéêîé Пакет анализа. Ê ñîæàëåíèþ, ñïðàâî÷íàÿ ñèñòåìà Excel íàñòîëüêî íåïîëíî è íåâíÿòíî (è äàæå ñ îøèáêàìè!) ïðåäñòàâëÿåò ýòè ôóíêöèè è ñðåäñòâà, ÷òî íåîáõîäèìîñòü èõ ïîëíîãî îïèñàíèÿ î÷åâèäíà. (Ñëåäóåò îòìåòèòü, ÷òî â Excel 2003 ñïðàâî÷íàÿ ñèñòåìà íàïèñàíà áîëåå ïðîôåññèîíàëüíî, ïðè ýòîì èñïðàâëåíû íåêîòîðûå îøèáêè.) Êðîìå ñòàòèñòè÷åñêèõ ôóíêöèé è ñðåäñòâ ïàêåòà àíàëèçà, â äàííîé ÷àñòè ðàññìîòðåíû îáùèå ñðåäñòâà è íàäñòðîéêè Excel, êîòîðûå “íå çàÿâëåíû” êàê èìåþùèå íåïîñðåäñòâåííîå îòíîøåíèå ê ñòàòèñòè÷åñêèì ìåòîäàì, íî êîòîðûå òàêæå ìîæíî èñïîëüçîâàòü â ñòàòèñòè÷åñêîì àíàëèçå. Ýòî ôîðìóëû ìàññèâîâ, ñïåöèàëüíîãî âèäà 16 Предисловие äèàãðàììû è ãðàôèêè, à òàêæå íàäñòðîéêà Поиск решения.  êîíöå ÷àñòè îïèñàíû ñïîñîáû ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí â Excel.  ÷àñòè III, Àíàëèç îäíîìåðíûõ âûáîðîê, ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê, ðàññìîòðåíû âîïðîñû ïðåäâàðèòåëüíîé îáðàáîòêè äàííûõ è ïîäáîðà ðàñïðåäåëåíèé ïî èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì, à òàêæå ïðèâåäåíû ìåòîäû èíòåðâàëüíîãî îöåíèâàíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ ïàðàìåòðîâ. Ïîñëåäíÿÿ ãëàâà ÷àñòè ïîñâÿùåíà ñðàâíåíèþ ðàñïðåäåëåíèé íåñêîëüêèõ îäíîìåðíûõ âûáîðîê.  ÷àñòè IV, Ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé, îïèñàíû ìåòîäû àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, êîòîðûå âêëþ÷àþò â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ. Çäåñü ðàññìîòðåíû ìåòîäû êîððåëÿöèîííîãî àíàëèçà, ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè, à òàêæå ïîêàçàíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé çàâèñèìûõ êîìïîíåíòîâ ìíîãîìåðíûõ âûáîðîê.  ïîñëåäíåé ãëàâå îïèñàí ðÿä çàäà÷, ñâÿçàííûõ ñ ïîñòðîåíèåì ðåãðåññèé, íà÷èíàÿ ñ îáùåé âû÷èñëèòåëüíîé ñõåìû îïðåäåëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè è çàêàí÷èâàÿ êðèòåðèÿìè ïðîâåðêè àäåêâàòíîñòè ïîñòðîåííîãî óðàâíåíèÿ ðåãðåññèè. Õîòÿ ÷èñëî ðàññìîòðåííûõ â ýòîé ÷àñòè ìåòîäîâ äîñòàòî÷íî âåëèêî è ñàìè ìåòîäû âåñüìà ãðîìîçäêè, ÷àñòü ïîëó÷èëàñü íà óäèâëåíèå íåáîëüøîé. “Âèíîé” ýòîìó Excel, â êîòîðîé åñòü ïðàêòè÷åñêè âñå ñðåäñòâà, íåîáõîäèìûå äëÿ ðåàëèçàöèè äàííûõ ìåòîäîâ.  êîíöå êíèãè ïðèâåäåí íåáîëüøîé ñïèñîê ëèòåðàòóðû, íà êîòîðóþ åñòü ññûëêè â òåêñòå èëè êîòîðàÿ ìîæåò äîïîëíèòü îïðåäåëåííûå òåìû, îñâåùåííûå íåäîñòàòî÷íî ïîëíî. ß áóäó ïðèçíàòåëåí âñåì, êòî ïîäåëèòñÿ ñâîèìè ñîîáðàæåíèÿìè ïî óëó÷øåíèþ ñîäåðæàíèÿ êíèãè è ñòèëÿ èçëîæåíèÿ ìàòåðèàëà, à òàêæå óêàæåò íà âîçìîæíûå îøèáêè (ê ñîæàëåíèþ, â êíèãàõ, ñîäåðæàùèõ áîëåå ñòà ôîðìóë, âåðîÿòíîñòü îøèáîê âñåãäà îòëè÷íà îò íóëÿ). Ìîé àäðåñ ýëåêòðîííîé ïî÷òû — aminko@dialektika.com. À.À. Ìèíüêî Предисловие 17 От издательства “Диалектика” Âû, ÷èòàòåëü ýòîé êíèãè, è åñòü ãëàâíûé åå êðèòèê. Ìû öåíèì âàøå ìíåíèå è õîòèì çíàòü, ÷òî áûëî ñäåëàíî íàìè ïðàâèëüíî, ÷òî ìîæíî áûëî ñäåëàòü ëó÷øå è ÷òî åùå âû õîòåëè áû óâèäåòü èçäàííûì íàìè. Íàì èíòåðåñíî óñëûøàòü è ëþáûå äðóãèå çàìå÷àíèÿ, êîòîðûå âàì õîòåëîñü áû âûñêàçàòü â íàø àäðåñ. Ìû æäåì âàøèõ êîììåíòàðèåâ è íàäååìñÿ íà íèõ. Âû ìîæåòå ïðèñëàòü íàì áóìàæíîå èëè ýëåêòðîííîå ïèñüìî ëèáî ïðîñòî ïîñåòèòü íàø Web-ñåðâåð è îñòàâèòü ñâîè çàìå÷àíèÿ òàì. Îäíèì ñëîâîì, ëþáûì óäîáíûì äëÿ âàñ ñïîñîáîì äàéòå íàì çíàòü, íðàâèòñÿ ëè âàì ýòà êíèãà, à òàêæå âûñêàæèòå ñâîå ìíåíèå î òîì, êàê ñäåëàòü íàøè êíèãè áîëåå èíòåðåñíûìè äëÿ âàñ. Ïîñûëàÿ ïèñüìî èëè ñîîáùåíèå, íå çàáóäüòå óêàçàòü íàçâàíèå êíèãè è åå àâòîðîâ, à òàêæå âàø îáðàòíûé àäðåñ. Ìû âíèìàòåëüíî îçíàêîìèìñÿ ñ âàøèì ìíåíèåì è îáÿçàòåëüíî ó÷òåì åãî ïðè îòáîðå è ïîäãîòîâêå ê èçäàíèþ ïîñëåäóþùèõ êíèã. Íàøè êîîðäèíàòû: E-mail: info@dialektika.com WWW: http://www.dialektika.com Èíôîðìàöèÿ äëÿ ïèñåì èç: 18 Ðîññèè: 115419, Ìîñêâà, à/ÿ 783 Óêðàèíû: 03150, Êèåâ, à/ÿ 152 Предисловие Часть I Основные понятия теории вероятностей и математической статистики В этой части... Ãëàâà 1. Îñíîâíûå ïîíÿòèÿ òåîðèè âåðîÿòíîñòåé Ãëàâà 2. Îñíîâíûå ñòàòèñòè÷åñêèå ìåòîäû Ãëàâà 3. Àíàëèç ñòàòèñòè÷åñêèõ çàâèñèìîñòåé  ãëàâå 1 ýòîé ÷àñòè ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé. Ìàòåðèàë ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðåäñòàâëåí â äâóõ ãëàâàõ: â ãëàâå 2 ïðèâîäÿòñÿ îáùèå ñâåäåíèÿ ïî ñòàòèñòèêå (áîëüøàÿ ÷àñòü ýòîé ãëàâû ïîñâÿùåíà èíòåðâàëüíîìó îöåíèâàíèþ è ïðîâåðêå ãèïîòåç), â ãëàâå 3 îïèñûâàåòñÿ ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé. Âåñü ìàòåðèàë ïðåäñòàâëåí êîíñïåêòèâíî è ïðåäíàçíà÷åí ñêîðåå äëÿ òîãî, ÷òîáû “îñâåæèòü” â ïàìÿòè ÷èòàòåëÿ òåîðèþ âåðîÿòíîñòåé è ìàòåìàòè÷åñêóþ ñòàòèñòèêó, íî, êîíå÷íî, ñîâñåì íå äëÿ òîãî, ÷òîáû ïî ýòèì ãëàâàì èçó÷àòü òàêóþ îáøèðíóþ è íàñûùåííóþ îáëàñòü ìàòåìàòèêè (õîòÿ íåêîòîðûå òåìû îñâåùåíû äîñòàòî÷íî ïîäðîáíî). Âìåñòå ñ òåì ëþáîé ïðàêòèê-“íåñòàòèñòèê”, êîòîðûé èñïîëüçóåò ñòàòèñòè÷åñêèé àíàëèç â ñâîåé ðàáîòå, íàéäåò çäåñü âñå íåîáõîäèìûå áàçîâûå ïîíÿòèÿ, îïðåäåëåíèÿ, òåîðåìû è ñòàòèñòè÷åñêèå ìîäåëè, êîòîðûå äàäóò åìó âîçìîæíîñòü âïîëíå îñîçíàííî è ïðîäóêòèâíî ïðèìåíèòü ñòàòèñòè÷åñêèå ìåòîäû, îïèñàííûå â ïîñëåäóþùèõ ÷àñòÿõ êíèãè. Ñïåöèàëèñò-ñòàòèñòèê ìîæåò èñïîëüçîâàòü ìàòåðèàë ýòîé ÷àñòè â êà÷åñòâå ñïðàâî÷íîãî ïîñîáèÿ. Глава 1 Основные понятия теории вероятностей  äàííîé ãëàâå ïðèâîäÿòñÿ îñíîâíûå ïîíÿòèÿ è ñâåäåíèÿ èç òåîðèè âåðîÿòíîñòåé, íåîáõîäèìûå äëÿ èçëîæåíèÿ îñíîâ ìàòåìàòè÷åñêîé ñòàòèñòèêè â ïîñëåäóþùèõ ãëàâàõ. Çíà÷èòåëüíàÿ ÷àñòü ãëàâû ïîñâÿùåíà ïðèìåðàì âåðîÿòíîñòíûõ ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà, â òîì ÷èñëå ïðèâåäåíî ïîëíîå îïèñàíèå ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ýòó ÷àñòü ãëàâû ìîæíî èñïîëüçîâàòü êàê ñïðàâî÷íûé ìàòåðèàë ïî âåðîÿòíîñòíûì ðàñïðåäåëåíèÿì. 1.1. Понятия случайного события и случайной величины Ñðåäè îñíîâíûõ ïîíÿòèé òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè ïîíÿòèÿ îïûò (ýêñïåðèìåíò) è ñîáûòèå ÿâëÿþòñÿ ôóíäàìåíòàëüíûìè. Áóäåì íàçûâàòü îïûòîì íàáëþäåíèå êàêîãî-ëèáî ÿâëåíèÿ ïðè âûïîëíåíèè íåêîòîðîãî êîìïëåêñà óñëîâèé, êîòîðûé äîëæåí êàæäûé ðàç ñòðîãî âûïîëíÿòüñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Íàáëþäåíèå òîãî æå ÿâëåíèÿ ïðè äðóãîì êîìïëåêñå óñëîâèé áóäåò óæå äðóãèì îïûòîì. Ðåçóëüòàò ñëó÷àéíîãî îïûòà íå èçâåñòåí äî åãî îêîí÷àíèÿ. Äàëåå áóäåì èìåòü äåëî òîëüêî ñî ñëó÷àéíûì îïûòîì. Ðåçóëüòàòû ñëó÷àéíîãî îïûòà ìîæíî îõàðàêòåðèçîâàòü êà÷åñòâåííî è êîëè÷åñòâåííî. Êà÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â ðåãèñòðàöèè êàêîãî-ëèáî ôàêòà. Ëþáîé òàêîé ôàêò íàçûâàåòñÿ ñëó÷àéíûì ñîáûòèåì. Ïðè ýòîì ãîâîðÿò, ÷òî “ñîáûòèå ïðîèçîøëî (ïîÿâèëîñü)” èëè “ñîáûòèå íå ïðîèçîøëî (íå ïîÿâèëîñü)” â ðåçóëüòàòå ñëó÷àéíîãî îïûòà. Ïðèìåðàìè ñîáûòèé ìîãóò ñëóæèòü âûïàäåíèå ðåøêè ïðè áðîñàíèè ìîíåòû èëè öèôðû “3” ïðè áðîñàíèè èãðàëüíîé êîñòè, îòêàç ïðèáîðà â çàäàííîì èíòåðâàëå âðåìåíè, ïîïàäàíèå èëè ïðîìàõ ïðè âûñòðåëå, ïîëó÷åíèå m ïîïàäàíèé ïðè n âûñòðåëàõ è ò.ä. Èòàê, ñëó÷àéíûì ñîáûòèåì (èëè ïðîñòî “ñîáûòèåì”) íàçûâàåòñÿ âñÿêèé ôàêò, êîòîðûé â ðåçóëüòàòå îïûòà ìîæåò ïðîèçîéòè èëè íå ïðîèçîéòè. Êîëè÷åñòâåííàÿ õàðàêòåðèñòèêà îïûòà ñîñòîèò â îïðåäåëåíèè çíà÷åíèé íåêîòîðûõ âåëè÷èí, ïîëó÷åííûõ â ðåçóëüòàòå îïûòà. Âåëè÷èíû, êîòîðûå ìîãóò ïðèíèìàòü â ðåçóëüòàòå îïûòà ðàçëè÷íûå çíà÷åíèÿ, ïðè÷åì äî îïûòà íåâîçìîæíî ïðåäâèäåòü, êàêèìè èìåííî îíè áóäóò, íàçûâàþòñÿ ñëó÷àéíûìè âåëè÷èíàìè. Ïðèìåðàìè ñëó÷àéíûõ âåëè÷èí ìîãóò ñëóæèòü êàê ðåçóëüòàòû, òàê è îøèáêè èçìåðåíèé, âðåìÿ áåçîòêàçíîé ðàáîòû ïðèáîðà èëè ñèñòåìû, ðîñò è âåñ íàóãàä âûáðàííîãî ÷åëîâåêà, ÷èñëî ïîïàäàíèé ïðè n âûñòðåëàõ è ò.ä. 20 Часть I. Основные понятия теории вероятностей и математической статистики Ñ êàæäîé ñëó÷àéíîé âåëè÷èíîé ìîæíî ñâÿçàòü ðàçëè÷íûå ñëó÷àéíûå ñîáûòèÿ. Òèïè÷íûì ñîáûòèåì, ñâÿçàííûì ñî ñëó÷àéíîé âåëè÷èíîé, ÿâëÿåòñÿ ñîáûòèå, ñîñòîÿùåå â òîì, ÷òî ýòà ñëó÷àéíàÿ âåëè÷èíà ïðèìåò â ðåçóëüòàòå îïûòà êàêîå-ëèáî çíà÷åíèå, ïðèíàäëåæàùåå çàäàííîìó ÷èñëîâîìó ìíîæåñòâó. Êðàòêî òàêîå ñîáûòèå íàçûâàåòñÿ ïîïàäàíèåì ñëó÷àéíîé âåëè÷èíû â äàííîå ìíîæåñòâî çíà÷åíèé. 1.1.1. Вероятности Åñòåñòâåííî ñðàâíèâàòü ñîáûòèÿ ïî òîìó, êàê ÷àñòî êàæäîå èç íèõ ïîÿâëÿåòñÿ ïðè ïîâòîðåíèè äàííîãî îïûòà. Åñëè ïðè ïîâòîðåíèè îïûòà îäíî ñîáûòèå ïîÿâëÿåòñÿ ÷àùå, ÷åì äðóãîå, òî ãîâîðÿò, ÷òî ïåðâîå ñîáûòèå âåðîÿòíåå âòîðîãî. Ïðè ýòîì ÿñíî, ÷òî äëÿ ñðàâíåíèÿ ñîáûòèé íåîáõîäèìî ïðåäïîëîæèòü, ÷òî äàííûé îïûò ìîæíî ïðîâîäèòü ñêîëüêî óãîäíî ðàç ïðè ñîáëþäåíèè îäíîãî è òîãî æå êîìïëåêñà óñëîâèé. ×àñòîòîé ïîÿâëåíèÿ ñîáûòèÿ À íàçûâàåòñÿ îòíîøåíèå ÷èñëà åãî ïîÿâëåíèé ê ÷èñëó âñåõ ïðîâåäåííûõ îïûòîâ. Òàêèì îáðàçîì, åñëè â n îïûòàõ ñîáûòèå À ïîÿâèëîñü m ðàç, òî ÷àñòîòà åãî ïîÿâëåíèÿ â äàííîé ñåðèè îïûòîâ ðàâíà m/n. Âàæíûì ýêñïåðèìåíòàëüíî óñòàíîâëåííûì ôàêòîì ÿâëÿåòñÿ ñâîéñòâî óñòîé÷èâîñòè ÷àñòîò. Ïðè óâåëè÷åíèè ÷èñëà îïûòîâ ÷àñòîòû ñîáûòèé êîëåáëþòñÿ îêîëî íåêîòîðûõ ÷èñåë, íå çàâèñÿùèõ íè îò êîëè÷åñòâà, íè îò ñåðèè îïûòîâ, ïðè÷åì ÷àñòîòû íåîãðàíè÷åííî ïðèáëèæàþòñÿ ê ýòèì ÷èñëàì, êîãäà ÷èñëî îïûòîâ ñòðåìèòñÿ ê áåñêîíå÷íîñòè. ( òåîðèè âåðîÿòíîñòåé ýòîò ôàêò íàçûâàåòñÿ çàêîíîì áîëüøèõ ÷èñåë.  êà÷åñòâå èëëþñòðàöèè íà ðèñ. 1.1 ïîêàçàíà ðàáî÷àÿ êíèãà Excel, ãäå ñìîäåëèðîâàíî 1 000 ïîäáðàñûâàíèé ìîíåòû è ïîñòðîåí ãðàôèê ÷àñòîò âûïàäåíèÿ ãåðáà.) Ýòè ÷èñëà åñòåñòâåííî ñâÿçàòü ñ êàæäûì ñîáûòèåì, ïðîèñõîäÿùèì â ñëó÷àéíîì îïûòå. Îíè íàçûâàþòñÿ âåðîÿòíîñòÿìè è â òåîðèè âåðîÿòíîñòåé îïðåäåëÿþòñÿ ÷èñòî àêñèîìàòè÷åñêè. Âåðîÿòíîñòü ñîáûòèÿ À îáîçíà÷àåòñÿ êàê Ð(À) è ìîæåò ïðèíèìàòü ëþáûå çíà÷åíèÿ îò íóëÿ äî åäèíèöû: 0 ≤ Ð(À) ≤ 1. Ðèñ. 1.1. Ìîäåëü ïîäáðàñûâàíèÿ ìîíåòû è ãðàôèê ÷àñòîòû âûïàäåíèÿ ãåðáà Глава 1. Основные понятия теории вероятностей 21 1.1.2. Алгебра случайных событий Ïðèâåäåì íåêîòîðûå âàæíûå îïðåäåëåíèÿ è òåîðåìû àëãåáðû ñëó÷àéíûõ ñîáûòèé. Ðàçëè÷àþò ñëåäóþùèå âèäû ñëó÷àéíûõ ñîáûòèé. Äîñòîâåðíûì íàçûâàåòñÿ ñîáûòèå U, êîòîðîå â ðåçóëüòàòå îïûòà íåïðåìåííî äîëæíî ïðîèçîéòè, â ýòîì ñëó÷àå Ð(U) = 1. Íåâîçìîæíûì íàçûâàåòñÿ ñîáûòèå V, êîòîðîå â ðåçóëüòàòå îïûòà íå ìîæåò ïðîèçîéòè íèêîãäà; òîãäà Ð(V) = 0. Ñîáûòèå } íàçûâàåòñÿ ïðîòèâîïîëîæíûì ñîáûòèþ À, åñëè îíî ñîñòîèò â íåïîÿâëåíèè ñîáûòèÿ À. Ñóììà âåðîÿòíîñòåé ïðîòèâîïîëîæíûõ ñîáûòèé âñåãäà ðàâíà åäèíèöå: Ð(}) + Ð(À) = 1. Íàïðèìåð, ïðè ïîäáðàñûâàíèè ìîíåòû ìîæåò ïðîèçîéòè òîëüêî îäíî èç äâóõ ñîáûòèé (âûïàäåíèå îðëà èëè âûïàäåíèå ðåøêè), êîòîðûå íå ìîãóò ïðîèçîéòè îäíîâðåìåííî. Ïîýòîìó äàííûå ñîáûòèÿ ïðîòèâîïîëîæíû. Íåñêîëüêî ñîáûòèé â äàííîì îïûòå íàçûâàþòñÿ íåñîâìåñòíûìè èëè âçàèìîèñêëþ÷àþùèìè, åñëè íèêàêèå äâà èç íèõ íå ìîãóò ïîÿâèòüñÿ âìåñòå. Êëàññè÷åñêèé ïðèìåð íåñîâìåñòíûõ ñîáûòèé: 6 ñîáûòèé, ñîñòîÿùèõ â òîì, ÷òî ïðè áðîñàíèè èãðàëüíîãî êóáèêà ïîÿâÿòñÿ öèôðû 1, 2, 3, 4, 5 èëè 6 ñîîòâåòñòâåííî. Ñóììà âåðîÿòíîñòåé âñåõ íåñîâìåñòíûõ ñîáûòèé, ñâÿçàííûõ ñ òåì èëè èíûì îïûòîì, ðàâíà åäèíèöå (â òàêîì ñëó÷àå ãîâîðÿò, ÷òî ýòè ñîáûòèÿ ñîñòàâëÿþò ïîëíóþ ãðóïïó ñîáûòèé). Åñëè À1, À2, ..., Àn — íåñîâìåñòíûå ñîáûòèÿ, òî Ð(À1 èëè À2 èëè ... èëè Àn) = Ð(À1) + Ð(À2) + ... + Ð(Àn). Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé ñëîæåíèÿ âåðîÿòíîñòåé.  ëåâîé ÷àñòè ïîñëåäíåãî ðàâåíñòâà çàïèñàíà âåðîÿòíîñòü ñóììû ñîáûòèé: ñóììîé (îáúåäèíåíèåì) äâóõ ñîáûòèé À è  íàçûâàåòñÿ ñîáûòèå “À èëè ” (òàêæå îáîçíà÷àåòñÿ êàê À +  èëè À J Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà, êîãäà ïðîèñõîäèò èëè ñîáûòèå À, èëè ñîáûòèå Â. Àíàëîãè÷íî îïðåäåëÿåòñÿ ñóììà ëþáîãî ÷èñëà ñîáûòèé.  àëãåáðå ñëó÷àéíûõ ñîáûòèé ââîäèòñÿ åùå îäíà îïåðàöèÿ íàä ñîáûòèÿìè. Ïðîèçâåäåíèåì (ïåðåñå÷åíèåì) ñîáûòèé À è  íàçûâàåòñÿ ñîáûòèå “À è ” (òàêæå îáîçíà÷àåòñÿ êàê À #  èëè À Â), ïðîèñõîäÿùåå òîãäà è òîëüêî òîãäà, êîãäà ïðîèñõîäèò è ñîáûòèå À, è ñîáûòèå Â. Ïîäîáíûì îáðàçîì îïðåäåëÿåòñÿ ïðîèçâåäåíèå ëþáîãî ÷èñëà ñîáûòèé. Ñîáûòèÿ À è  íàçûâàþòñÿ íåçàâèñèìûìè, åñëè ïîÿâëåíèå îäíîãî èç íèõ íå ìåíÿåò âåðîÿòíîñòè ïîÿâëåíèÿ äðóãîãî. Íàïðèìåð, íåçàâèñèìûìè áóäóò ñîáûòèÿ “ïðè ïåðâîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 2” è “ïðè âòîðîì áðîñàíèè èãðàëüíîãî êóáèêà îòêðîåòñÿ öèôðà 5”. Åñëè À1, À2, ..., Àn — âçàèìíî íåçàâèñèìûå ñëó÷àéíûå ñîáûòèÿ, òî Ð(À1 è À2 è ... è Àn) = Ð(À1)×Ð(À2)×...×Ð(Àn). Ýòî ðàâåíñòâî íàçûâàåòñÿ òåîðåìîé óìíîæåíèÿ âåðîÿòíîñòåé. 1.1.3. Условные вероятности Óñëîâíóþ âåðîÿòíîñòü ñîáûòèÿ À ïðè óñëîâèè, ÷òî ïðîèçîøëî ñîáûòèå Â, îáîçíà÷àþò êàê Ð(À|Â). Ïðèâåäåì ôîðìóëó, ñâÿçûâàþùóþ âåðîÿòíîñòü ñîâìåñòíîãî ïîÿâëåíèÿ ñîáûòèé À è  è óñëîâíûå âåðîÿòíîñòè ýòèõ ñîáûòèé: Ð(À è Â) = Ð(À) Ð(Â|À) = Ð(Â) Ð(À|Â). Åñëè ñîáûòèÿ À è  íåçàâèñèìû, òî Ð(À|Â) = Ð(À) è Ð(Â|À) = Ð(Â). 22 Часть I. Основные понятия теории вероятностей и математической статистики Ïðèìåð 1. Èãðîê áðîñàåò ïÿòü ðàç ñèììåòðè÷íóþ ìîíåòó. Ñ÷èòàÿ, ÷òî ïîäáðàñûâàíèÿ íåçàâèñèìû, êàêîâà âåðîÿòíîñòü ñîáûòèÿ, ÷òî ãåðá âûïàäåò òî÷íî äâà ðàçà? Ãåðá âûïàäåò òî÷íî äâà ðàçà òîëüêî ïðè ñëåäóþùèõ äåñÿòè âîçìîæíûõ ïîñëåäîâàòåëüíîñòÿõ âûïàäåíèÿ ãåðáà èëè ðåøêè (à — ãåðá, Ð — ðåøêà): ÃÃÐÐÐ, ÃÐÃÐÐ, ÃÐÐÃÐ, ÃÐÐÐÃ, ÐÃÃÐÐ, ÐÃÐÃÐ, ÐÃÐÐÃ, ÐÐÃÃÐ, ÐÐÃÐÃ, ÐÐÐÃÃ. Ïðè ëþáîì ïîäáðàñûâàíèè ìîíåòû âåðîÿòíîñòü âûïàäåíèÿ ãåðáà è âåðîÿòíîñòü âûïàäåíèÿ ðåøêè ðàâíû 1/32. Ïÿòü ïîäáðàñûâàíèé ìîíåòû íåçàâèñèìû. Èç òåîðåìû óìíîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî âåðîÿòíîñòü ïîëó÷åíèÿ ïîñëåäîâàòåëüíîñòè ÃÃÐÐÐ ìîæíî ïîäñ÷èòàòü ñëåäóþùèì îáðàçîì: Ð(ÃÃÐÐÐ) = Ð(Ã)·Ð(Ã)·Ð(Ð)·Ð(Ð)·Ð(Ð) = (1/2)5 = 1/32. Äëÿ êàæäîé èç îñòàëüíûõ äåñÿòè ïîñëåäîâàòåëüíîñòåé âåðîÿòíîñòü òàêæå ðàâíà 1/32. Êàæäàÿ èç ýòèõ äåñÿòè ïîñëåäîâàòåëüíîñòåé ñîäåðæèò ïî äâà âûïàäåíèÿ ãåðáà, è ýòè ïîñëåäîâàòåëüíîñòè ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè. Èç òåîðåìû ñëîæåíèÿ âåðîÿòíîñòåé ñëåäóåò, ÷òî èñêîìàÿ âåðîÿòíîñòü ïðåäñòàâëÿåò ñîáîé ñóììó ýòèõ äåñÿòè ðàâíûõ ìåæäó ñîáîé âåðîÿòíîñòåé, ò.å. îíà ðàâíà 10/32. Àíàëîãè÷íî ìîæíî ïîêàçàòü, ÷òî âåðîÿòíîñòü ñîáûòèÿ “ãåðá íå âûïàäåò íè ðàçó” ðàâíà 1/32; âåðîÿòíîñòü òîãî, ÷òî ãåðá âûïàäåò ðîâíî îäèí ðàç, ðàâíà 5/32; âåðîÿòíîñòü âûïàäåíèÿ ãåðáà ðîâíî òðè ðàçà ðàâíà 10/32; âåðîÿòíîñòè òîãî, ÷òî ãåðá âûïàäåò òî÷íî 4 è 5 ðàç, ðàâíû 5/32 è 1/32 ñîîòâåòñòâåííî. Âñå øåñòü ïåðå÷èñëåííûõ âûøå ñîáûòèé ÿâëÿþòñÿ âçàèìîèñêëþ÷àþùèìè è îáðàçóþò ïîëíóþ ãðóïïó ñîáûòèé. Êàê íå òðóäíî ïîäñ÷èòàòü, ñóììà èõ âåðîÿòíîñòåé ðàâíà 1. 1.2. Распределения случайных величин Åñëè ñëó÷àéíîå ñîáûòèå ïîëíîñòüþ õàðàêòåðèçóåòñÿ âåðîÿòíîñòüþ ïîÿâëåíèÿ ýòîãî ñîáûòèÿ, à ñîâîêóïíîñòü ñëó÷àéíûõ ñîáûòèé ìîæíî îïèñàòü ñ ïîìîùüþ âåðîÿòíîñòåé ýòèõ ñîáûòèé è òåîðåì àëãåáðû ñëó÷àéíûõ ñîáûòèé, òî îïèñàíèå âåðîÿòíîñòíûõ ñâîéñòâ ñëó÷àéíûõ âåëè÷èí ÿâëÿåòñÿ áîëåå ñëîæíîé çàäà÷åé. Íàïîìíèì, ÷òî ñëó÷àéíîé íàçûâàåòñÿ âåëè÷èíà, êîòîðàÿ â ðåçóëüòàòå îïûòà ìîæåò ïðèíèìàòü òî èëè èíîå çíà÷åíèå (çàðàíåå íåèçâåñòíî, êàêîå èìåííî). Âåðîÿòíîñòíûå ñâîéñòâà ñëó÷àéíûõ âåëè÷èí îïèñûâàþòñÿ çàêîíîì ðàñïðåäåëåíèÿ, ò.å. ñîîòíîøåíèåì, óñòàíàâëèâàþùèì ñâÿçü ìåæäó âîçìîæíûìè çíà÷åíèÿìè ñëó÷àéíîé âåëè÷èíû è ñîîòâåòñòâóþùèìè èì âåðîÿòíîñòÿìè. Çàêîí ðàñïðåäåëåíèÿ ìîæåò èìåòü ðàçëè÷íûå ôîðìû. Ðàçëè÷àþò äèñêðåòíûå è íåïðåðûâíûå ñëó÷àéíûå âåëè÷èíû. 1.2.1. Дискретные случайные величины Äèñêðåòíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàþò âåëè÷èíó, ïðèíèìàþùóþ òîëüêî êîíå÷íîå èëè ñ÷åòíîå ìíîæåñòâî çíà÷åíèé. Äëÿ îïèñàíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Õ, ïðèíèìàþùåé êîíå÷íîå ìíîæåñòâî çíà÷åíèé, ÷àñòî ïðèìåíÿåòñÿ òàáëèöà âèäà õi Ð(Õ = õi) õ1 p1 õ2 p2 ... ... õn–1 pn–1 xn pn Çäåñü õi — âîçìîæíûå çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ, ði = Ð(Õ = õi) — âåðîÿòíîñòü ñîáûòèÿ, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå õi (1 ≤ i ≤ n). Îòìåòèì, ÷òî Глава 1. Основные понятия теории вероятностей 23 n ∑p i = 1, P(X < u ) = i =1 ∑ pi . i : xi < u  ïîñëåäíåì âûðàæåíèè ñóììèðîâàíèå âåäåòñÿ ïî âñåì òàêèì íîìåðàì i, ÷òî õi < u. Ñîâîêóïíîñòü âåðîÿòíîñòåé ði = Ð(Õ = õi) ÷àñòî íàçûâàþò ôóíêöèåé âåðîÿòíîñòåé, à âåðîÿòíîñòü Ð(Õ < u) îáîçíà÷àþò êàê F(u) è íàçûâàþò ôóíêöèåé ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ. Îíà ÿâëÿåòñÿ íåóáûâàþùåé ðàçðûâíîé ñòóïåí÷àòîé ôóíêöèåé, ïðèíèìàþùåé çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1. Ïðèìåð 2. Êàê è â ïðèìåðå 1, èãðîê ïÿòü ðàç ïîäáðàñûâàåò ñèììåòðè÷íóþ ìîíåòó. Îáîçíà÷èì ÷åðåç Õ ñëó÷àéíóþ âåëè÷èíó, ðàâíóþ ÷èñëó âûïàäåíèÿ ãåðáà â ñåðèè ïîäáðàñûâàíèÿ ìîíåòû. Ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 0, 1, 2, 3, 4 è 5. Âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò êàêîå-ëèáî èç ýòèõ çíà÷åíèé, îïðåäåëåíà â ïðèìåðå 1. Ñîñòàâèì òàáëèöó ðàñïðåäåëåíèÿ ýòîé ñëó÷àéíîé âåëè÷èíû. (Íà ðèñ. 1.2 ïîêàçàíî ãðàôè÷åñêîå ïðåäñòàâëåíèå ýòîãî ðàñïðåäåëåíèÿ.) õi 0 1 2 3 4 5 Ð(Õ = õi) 1/32 5/32 10/32 10/32 5/32 1/32 Ðèñ. 1.2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé Ïðèâåäåì çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ: 0, u < 0, p = 1 32, 0 ≤ u < 1, 1 p1 + p2 = 6 32, 1 ≤ u < 2, F (u ) = P(X < n) = p1 + p2 + p3 = 16 32, 2 ≤ u < 3, p + p + p + p = 26 32, 3 ≤ u < 4, 2 3 4 1 p1 + p2 + p3 + p4 + p5 = 31 32, 4 ≤ u < 5, 1, u ≥ 5. Ãðàôèêîì ôóíêöèè F(u) áóäåò âîçðàñòàþùàÿ ñòóïåí÷àòàÿ ôóíêöèÿ ñî ñêà÷êàìè â òî÷êàõ õ = 1, 2, 3, 4, 5, ïîêàçàííàÿ íà ðèñ. 1.3. 24 Часть I. Основные понятия теории вероятностей и математической статистики Ðèñ. 1.3. Ãðàôèê ôóíêöèè ðàñïðåäåëåíèÿ Ïðèìåðû äðóãèõ äèñêðåòíûõ ðàñïðåäåëåíèé ïðèâåäåíû â ðàçäåëå 1.4. 1.2.2. Непрерывные случайные величины Íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíîé íàçûâàåòñÿ ñëó÷àéíàÿ âåëè÷èíà, âîçìîæíûå çíà÷åíèÿ êîòîðîé íåïðåðûâíî çàïîëíÿþò êàêîé-ëèáî èíòåðâàë (âîçìîæíî, áåñêîíå÷íûé). Äëÿ íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû Õ òàêæå â êà÷åñòâå çàêîíà ðàñïðåäåëåíèÿ âûñòóïàåò ôóíêöèÿ ðàñïðåäåëåíèÿ F(u), ÷èñëåííî ðàâíàÿ âåðîÿòíîñòè òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ îêàæåòñÿ ìåíüøå çàäàííîãî ÷èñëà u, ò.å. F(u) = Ð(Õ < u). Ôóíêöèÿ F(u) — íåïðåðûâíàÿ ôóíêöèÿ, íåóáûâàþùàÿ è ïðèíèìàþùàÿ çíà÷åíèÿ â èíòåðâàëå îò 0 äî 1, ïðè÷åì F(–∞) = 0 è F(+∞) = 1. Îòìåòèì, ÷òî ðàñïðåäåëåíèå íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû íåâîçìîæíî çàäàòü ñ ïîìîùüþ âåðîÿòíîñòåé îòäåëüíûõ çíà÷åíèé ïîäîáíî ðàñïðåäåëåíèÿì äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, ïîñêîëüêó Ð(Õ = õ) = 0 äëÿ ëþáîãî çíà÷åíèÿ õ. Íî åñëè ôóíêöèÿ F(u) äèôôåðåíöèðóåìàÿ, òî ìîæíî îïðåäåëèòü âåðîÿòíîñòü ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â êàêîé-ëèáî ìàëûé èíòåðâàë äëèíîé dx, ïðèìûêàþùèé ê òî÷êå õ, è ïðè ýòîì Ð(õ ≤ Õ < õ + dx) = f(x)dx, ãäå f(x) — ïðîèçâîäíàÿ ôóíêöèè F(u) â òî÷êå õ. Ôóíêöèÿ f(x) íàçûâàåòñÿ ïëîòíîñòüþ âåðîÿòíîñòè ñëó÷àéíîé âåëè÷èíû Õ. Îíà ìîæåò ïðèíèìàòü òîëüêî íåîòðèöàòåëüíûå çíà÷åíèÿ. Èç îïðåäåëåíèÿ ïëîòíîñòè âåðîÿòíîñòè ñëåäóåò, ÷òî +∞ u F (u ) = ∫ −∞ f ( x)dx, ∫ −∞ b f ( x)dx = 1, P (a ≤ X < b) = ∫ f ( x)dx = F (b) − F (a). a Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî, íàïðèìåð, ïîëîæèòåëüíûå çíà÷åíèÿ, òî äëÿ òàêîé ñëó÷àéíîé âåëè÷èíû çíà÷åíèÿ îáåèõ ôóíêöèé F(õ) è f(x) ïðè îòðèöàòåëüíûõ õ äîëæíû áûòü íóëåâûìè. Ïðèìåðû íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí ïðèâåäåíû â ðàçäåëå 1.5. 1.2.3. Числовые характеристики случайных величин Çàêîí ðàñïðåäåëåíèÿ ïîëíîñòüþ õàðàêòåðèçóåò ñëó÷àéíóþ âåëè÷èíó. ×òîáû îïðåäåëèòü çàêîí ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû, äîñòàòî÷íî çàäàòü åå ïëîòíîñòü âåðîÿòíîñòè èëè ôóíêöèþ ðàñïðåäåëåíèÿ. Îäíàêî òàêàÿ ïîëíàÿ, èñ÷åðïûâàþùàÿ õàðàêòåðèñòèêà ñëó÷àéíîé âåëè÷èíû äîâîëüíî ñëîæíà. Ìåæäó òåì äëÿ ðåøåíèÿ ìíîãèõ çàäà÷ ïðàêòè÷åñêè âîâñå íå íóæíî çíàòü ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû, à äîñòàòî÷íî çíàòü ëèøü íåêîòîðûå ÷èñëà, õàðàêòåðèçóþùèå ðàñГлава 1. Основные понятия теории вероятностей 25 ïðåäåëåíèå, òàê íàçûâàåìûå ÷èñëîâûå õàðàêòåðèñòèêè ñëó÷àéíîé âåëè÷èíû. Íàïðèìåð, äëÿ ãðóáîãî îïèñàíèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû ìîæíî îãðàíè÷èòüñÿ åå ñðåäíèì çíà÷åíèåì è âåëè÷èíîé ðàçáðîñà âîçìîæíûõ çíà÷åíèé. Èç ÷èñëîâûõ õàðàêòåðèñòèê íàèáîëåå ÷àñòî èñïîëüçóþòñÿ ìîìåíòû ñëó÷àéíîé âåëè÷èíû. Ïåðâûé ìîìåíò íàçûâàåòñÿ ìàòåìàòè÷åñêèì îæèäàíèåì (èëè ñðåäíèì ñëó÷àéíîé âåëè÷èíû) è âû÷èñëÿåòñÿ ïî îäíîé èç ñëåäóþùèõ ôîðìóë (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ): MX = ∑ xi pi , MX = i +∞ ∫ xf ( x)dx. −∞ Âåëè÷èíà ÌÕ õàðàêòåðèçóåò ñðåäíåå ïîëîæåíèå çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ. Âòîðîé öåíòðàëüíûé ìîìåíò (ò.å. ìîìåíò îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ ÌÕ) õàðàêòåðèçóåò ðàçáðîñ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû âîêðóã çíà÷åíèÿ ÌÕ è íàçûâàåòñÿ äèñïåðñèåé. Äèñïåðñèÿ DX (÷àñòî òàêæå èñïîëüçóþò îáîçíà÷åíèå σ2 èëè σÕ2) âû÷èñëÿåòñÿ ïî ôîðìóëàì (ïåðâàÿ ôîðìóëà ïðèìåíÿåòñÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí, à âòîðàÿ — äëÿ íåïðåðûâíûõ) DX = M(X − MX) 2 = ∑ ( xi − MX)2 pi =∑ xi2 pi − (MX) 2 , i DX = M(X − MX) 2 = i +∞ ∫ ( x − MX) +∞ 2 −∞ f ( x)dx = ∫ x 2 f ( x)dx − (MX) 2 . −∞ Íà ïðàêòèêå èíîãäà èñïîëüçóþò ìîìåíòû áîëåå âûñîêîãî ïîðÿäêà, íî, êàê ïðàâèëî, íå âûøå ÷åòâåðòîãî. Öåíòðàëüíûé ìîìåíò r-ãî ïîðÿäêà µr îïðåäåëÿåòñÿ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ñëó÷àéíîé âåëè÷èíû (Õ – ÌÕ)r è âû÷èñëÿåòñÿ ïî ôîðìóëàì µ r = M(X − MX) r = ∑ ( xi − MX) r pi , i µ r = M(X − MX) r = +∞ ∫ ( x − MX) dx, r −∞ ñîîòâåòñòâóþùèì äèñêðåòíîìó è íåïðåðûâíîìó ñëó÷àÿì.  ýòèõ îáîçíà÷åíèÿõ DX = µ2. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé âñå öåíòðàëüíûå ìîìåíòû íå÷åòíîãî ïîðÿäêà ðàâíû íóëþ. Îíè ïîëîæèòåëüíû, åñëè ðàñïðåäåëåíèå àñèììåòðè÷íî è èìååò äëèííûé “õâîñò” ñïðàâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåðîì òàêîãî ðàñïðåäåëåíèÿ ìîæåò ñëóæèòü F-ðàñïðåäåëåíèå, îïèñàííîå íèæå), è îòðèöàòåëüíû, åñëè ðàñïðåäåëåíèå èìååò äëèííûé “õâîñò” ñëåâà îò ìàòåìàòè÷åñêîãî îæèäàíèÿ (ïðèìåð — ëîãèñòè÷åñêîå ðàñïðåäåëåíèå). Ïîýòîìó ôóíêöèÿ ìîìåíòîâ β1 = µ3/µ23/2 ÷àñòî ñëóæèò ìåðîé àñèììåòðèè è íàçûâàåòñÿ êîýôôèöèåíòîì àñèììåòðèè. Öåíòðàëüíûå ìîìåíòû ÷åòíûõ ïîðÿäêîâ âñåãäà ïîëîæèòåëüíû, ÷åðåç íèõ âûðàæàþò êîýôôèöèåíò ýêñöåññà, êîòîðûé õàðàêòåðèçóåò îñòðîòó ïèêà ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè è çàäàåòñÿ âûðàæåíèåì β 2 = µ4/µ22 – 3. Äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. íèæå) β 1 = 0 è β 2 = 0. Ðàñïðåäåëåíèÿ ñ ïîëîæèòåëüíûì ýêñöåññîì îáû÷íî èìåþò áîëåå îñòðûé ïèê, ÷åì ãðàôèê ôóíêöèè ïëîòíîñòè íîðìàëüíîãî ðàñïðåäåëåíèÿ, à ðàñïðåäåëåíèÿ ñ îòðèöàòåëüíûì β 2 — 26 Часть I. Основные понятия теории вероятностей и математической статистики áîëåå ñãëàæåííûé ïèê ïî ñðàâíåíèþ ñ íîðìàëüíûì (íàïðèìåð — ðàñïðåäåëåíèå Ñòüþäåíòà, êîòîðîå îïèñàíî íèæå). Äðóãèìè õàðàêòåðèñòèêàìè ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé ìîãóò ñëóæèòü ìåäèàíà è ìîäà. Ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2. Îòìåòèì, ÷òî äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ ìåäèàíà íå âñåãäà âû÷èñëÿåòñÿ îäíîçíà÷íî. Ìîäà µ îïðåäåëÿåòñÿ äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé, èìåþùèõ ïëîòíîñòü âåðîÿòíîñòè, è ñîîòâåòñòâóåò òàêîìó çíà÷åíèþ ñëó÷àéíîé âåëè÷èíû, êîòîðîå ÿâëÿåòñÿ òî÷êîé ìàêñèìóìà äëÿ ôóíêöèè ïëîòíîñòè âåðîÿòíîñòåé. Îáû÷íî â ñòàòèñòèêå èìåþò äåëî ñ îäíîìîäàëüíûìè ðàñïðåäåëåíèÿìè, ò.å. ñ òàêèìè, ôóíêöèÿ ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ èìååò îäèí ìàêñèìóì1. Äëÿ ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå îæèäàíèå, ìîäà è ìåäèàíà ñîâïàäàþò. Îòìåòèì, ÷òî äëÿ áîëüøèíñòâà îäíîìîäàëüíûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå îæèäàíèå, ìåäèàíà è ìîäà ðàñïîëàãàþòñÿ íà ÷èñëîâîé îñè â òîì ïîðÿäêå, â êîòîðîì îíè çäåñü ïåðå÷èñëåíû, ëèáî â îáðàòíîì (ýòî íàçûâàåòñÿ “àëôàâèòíîå ïðàâèëî”). Òàêèì îáðàçîì, ìåäèàíà ëåæèò ìåæäó ìàòåìàòè÷åñêèì îæèäàíèåì è ìîäîé, ïðè÷åì áëèæå ê ìàòåìàòè÷åñêîìó îæèäàíèþ. Äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé îïðåäåëåíà ñïåöèàëüíàÿ ìåðà àñèììåòðèè — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà, êîòîðûé âû÷èñëÿåòñÿ ïî ôîðìóëå s = (MX – µ)/σ, ãäå µ — ìîäà, σ — êîðåíü èç äèñïåðñèè. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé êîýôôèöèåíò Ïèðñîíà ðàâåí íóëþ, îí õàðàêòåðèçóåò ñòåïåíü îòêëîíåíèÿ ìîäû îò ìàòåìàòè÷åñêîãî îæèäàíèÿ.  ìàòåìàòè÷åñêîé ñòàòèñòèêå òàêæå øèðîêî èñïîëüçóþòñÿ êâàíòèëè ñëó÷àéíûõ âåëè÷èí. Êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 1/2. Êâàíòèëè íåêîòîðûõ ïîðÿäêîâ èìåþò ñïåöèàëüíûå íàçâàíèÿ: êâàðòèëè ξ0,25, ξ0,5, ξ0,75, äåöèëè ξ0,1, ξ0,2, ..., ξ0,9, ïðîöåíòèëè ξ0,01, ξ0,02, ..., ξ0,99 äåëÿò îáëàñòü èçìåíåíèÿ ñëó÷àéíîé âåëè÷èíû Õ ñîîòâåòñòâåííî íà 4, 10 è 100 èíòåðâàëîâ, çíà÷åíèÿ èç êîòîðûõ ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò ñ ðàâíûìè âåðîÿòíîñòÿìè. Äëÿ ìíîãèõ âåðîÿòíîñòíûõ ðàñïðåäåëåíèé çíà÷åíèÿ êâàíòèëåé çàäàííîãî óðîâíÿ ïîäñ÷èòàíû, ñâåäåíû â ñïåöèàëüíûå òàáëèöû è èñïîëüçóþòñÿ ïðè ïîñòðîåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ. 1.2.4. Вероятностные неравенства  òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå áîëüøóþ ðîëü èãðàþò íåðàâåíñòâà, ñâÿçûâàþùèå âåðîÿòíîñòè ïîïàäàíèÿ ñëó÷àéíîé âåëè÷èíû Õ â îïðåäåëåííûé èíòåðâàë ñ ÷èñëîâûìè õàðàêòåðèñòèêàìè ðàñïðåäåëåíèÿ. Íàèáîëåå îáùèì íåðàâåíñòâîì òàêîãî òèïà ÿâëÿåòñÿ íåðàâåíñòâî ×åáûøåâà, êîòîðîå ñïðàâåäëèâî äëÿ ëþáîãî âåðîÿòíîñòíîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ: Ð(|ÌÕ – X| ≥ kσ) ≤ 1/k2. Çäåñü è äàëåå â ýòîì ðàçäåëå ÌÕ — ìàòåìàòè÷åñêîå îæèäàíèå, σ2 = DX — äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Õ. Ïðåäïîëàãàåòñÿ, ÷òî k > 0. Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò òîëüêî ïîëîæèòåëüíûå çíà÷åíèÿ, òî èìååò ìåñòî íåðàâåíñòâî Ìàðêîâà Ð(Õ ≥ k⋅ÌX) ≤ 1/k. Äëÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ îäíîìîäàëüíîå ðàñïðåäåëåíèå, äîêàçàíî íåñêîëüêî ïîäîáíûõ íåðàâåíñòâ, êîòîðûå â îáùåì ñëó÷àå òî÷íåå, ÷åì íåðàâåíñòâî ×åáûøåâà. 1 Äëÿ òàêèõ ðàñïðåäåëåíèé òàêæå âñòðå÷àþòñÿ íàçâàíèÿ óíèìîäàëüíîå è îäíîâåðøèííîå. Глава 1. Основные понятия теории вероятностей 27 Íåðàâåíñòâî Ãàóññà: P(| X − MX | ≥ kσ) ≤ 4 1 + s2 , k > |s|, 9 (k − | s |) 2 çäåñü s — êîýôôèöèåíò àñèììåòðèè Ïèðñîíà (ñì. ïðåäûäóùèé ðàçäåë)2. Åñëè ðàñïðåäåëåíèå ñèììåòðè÷íî (â ýòîì ñëó÷àå s = 0), òîãäà íåðàâåíñòâî Ãàóññà èìååò âèä (ñðàâíèòå åãî ñ íåðàâåíñòâîì ×åáûøåâà) P(| X − MX | ≥ kσ) ≤ 4 . 9k 2 Åñëè â êà÷åñòâå ìåðû àñèììåòðèè ðàñïðåäåëåíèÿ èñïîëüçîâàòü âåëè÷èíó δ = ν/σ, ãäå ν = M|X – µ|, òîãäà äëÿ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ñïðàâåäëèâî íåðàâåíñòâî Ïèêà P(| X − MX | ≥ kσ) ≤ 4 1 − δ2 , 9 (k − δ) 2 êîòîðîå èíîãäà òî÷íåå íåðàâåíñòâà Ãàóññà. Ïðèìåðû èñïîëüçîâàíèÿ ýòèõ íåðàâåíñòâ ïðèâåäåíû â ãëàâå 2 ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ. 1.2.5. Двумерные распределения Ðàññìîòðèì êðàòêî äâóìåðíûå ñëó÷àéíûå âåëè÷èíû Z = (X, Y). Âåðîÿòíîñòíûå ñâîéñòâà òàêèõ ñëó÷àéíûõ âåëè÷èí õàðàêòåðèçóþò ôóíêöèè ñîâìåñòíîãî ðàñïðåäåëåíèÿ F(x, y), êîòîðûå îïðåäåëÿþòñÿ òàê æå, êàê äëÿ îäíîìåðíûõ âåëè÷èí, ò.å. F(x, y) = P(X < x è Y < y). Äëÿ êàæäîé ñîñòàâëÿþùåé X è Y ñëó÷àéíîé âåëè÷èíû Z ñóùåñòâóþò ÷àñòíûå ôóíêöèè ðàñïðåäåëåíèÿ: F1(x) ≡ F(X < x) ≡ P(X < x è Y < ∞) = F(x, ∞), F2(ó) ≡ F(Y < y) ≡ P(X < ∞ è Y < y) = F(∞, y). Îòìåòèì, ÷òî ôóíêöèÿ F(x, y) ïîëíîñòüþ îïðåäåëÿåò ôóíêöèè F1(x) è F2(ó). Îäíàêî ýòè ôóíêöèè îïðåäåëÿþò ôóíêöèþ F(x, y) òîëüêî â òîì ñëó÷àå, êîãäà êîìïîíåíòû X è Y íåçàâèñèìû; òîãäà F(x, y) = F1(x)F2(ó). Ìîæíî âû÷èñëèòü ëþáûå ìîìåíòû êàæäîé ñîñòàâëÿþùåé X è Y (åñëè, êîíå÷íî, îíè ñóùåñòâóþò), íàïðèìåð ÌÕ, DX, MY, DY. Ìîæíî òàêæå âû÷èñëèòü ðàçëè÷íûå ñìåøàííûå ìîìåíòû ñëó÷àéíûõ âåëè÷èí X è Y. Ñðåäè ñìåøàííûõ ìîìåíòîâ âûäåëÿþò êîâàðèàöèþ âåëè÷èí X è Y, îïðåäåëÿåìóþ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ïðîèçâåäåíèÿ (X – MX)(Y – MY), ò.å. cov(X, Y) = M[(X – MX)(Y – MY)]. Íîðìèðîâàííóþ íà äèñïåðñèè êîâàðèàöèþ íàçûâàþò êîýôôèöèåíòîì êîððåëÿöèè ρ ñëó÷àéíûõ âåëè÷èí X è Y: ρ= cov(X, Y) DX ⋅ DY . 2 Ñóùåñòâóåò äðóãîé âàðèàíò íåðàâåíñòâà Ãàóññà, â êîòîðîì ðàññìàòðèâàåòñÿ èíòåðâàë, ñèììåòðè÷íûé îòíîñèòåëüíî ìîäû (à íå îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ). Äëÿ ñèììåòðè÷íûõ îäíîìîäàëüíûõ ðàñïðåäåëåíèé ýòè äâà âàðèàíòà íåðàâåíñòâà ñîâïàäàþò. 28 Часть I. Основные понятия теории вероятностей и математической статистики Çíà÷åíèå ýòîãî êîýôôèöèåíòà ëåæèò ìåæäó –1 è 1. Îí õàðàêòåðèçóåò ñòåïåíü ëèíåéíîé çàâèñèìîñòè ìåæäó âåëè÷èíàìè X è Y. Åñëè X è Y ñâÿçàíû ñòðîãî ëèíåéíî (íàïðèìåð, Y = –2Õ + 5), òî àáñîëþòíàÿ âåëè÷èíà ρ ðàâíà 1, åñëè X è Y íåçàâèñèìû, òî ρ = 0. Îäíàêî íóëåâàÿ êîððåëÿöèÿ íå îçíà÷àåò íåçàâèñèìîñòü X è Y (çà èñêëþ÷åíèåì ñëó÷àÿ, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò íîðìàëüíîå ðàñïðåäåëåíèå) — èç ýòîãî ñëåäóåò òîëüêî îòñóòñòâèå êàêîé-ëèáî ëèíåéíîé çàâèñèìîñòè ìåæäó X è Y. 1.3. Функции от случайных величин Ôóíêöèÿ îò ñëó÷àéíûõ âåëè÷èí òàêæå ÿâëÿåòñÿ ñëó÷àéíîé âåëè÷èíîé.  ïðèíöèïå, ëþáóþ ñëó÷àéíóþ âåëè÷èíó ìîæíî ïðåäñòàâèòü â âèäå ôóíêöèè îò íåêîòîðîé äðóãîé ñëó÷àéíîé âåëè÷èíû (íàïðèìåð, êàê ôóíêöèþ îò ðàâíîìåðíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû; ñì. ïðèâåäåííóþ íèæå òåîðåìó). Ïðåîáðàçîâàíèå ñëó÷àéíûõ âåëè÷èí øèðîêî ïðèìåíÿåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå. Ôóíêöèè îò ñëó÷àéíûõ âåëè÷èí òàêæå èñïîëüçóþòñÿ ïðè ãåíåðèðîâàíèè ñëó÷àéíûõ âåëè÷èí. Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ è Y ñâÿçàíû âçàèìíî îäíîçíà÷íûì ñîîòâåòñòâèåì Y = ϕ(Õ) è Õ = ψ(Y), ãäå ψ — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ϕ3. Îáîçíà÷èì ÷åðåç fX(x), fY(x), FX(x) è FY(x) ïëîòíîñòè âåðîÿòíîñòåé è ôóíêöèè ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî. Îíè ñâÿçàíû ìåæäó ñîáîé ñëåäóþùèìè ôîðìóëàìè: fY(x) = fX(ψ(x))⋅|ψ′(õ)|, FY(x) = FX(ψ(x)). Èìåþò ìåñòî òàêæå “îáðàòíûå” ôîðìóëû (åñëè ïîìåíÿòü ìåñòàìè Õ è Y è ôóíêöèþ ψ çàìåíèòü íà ϕ), ïîêàçûâàþùèå çàâèñèìîñòü ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ îò ðàñïðåäåëåíèÿ âåëè÷èíû Y.  îáùåì ñëó÷àå (åñëè íå òðåáîâàòü âçàèìíî îäíîçíà÷íîãî ñîîòâåòñòâèÿ ìåæäó Õ è Y) ôóíêöèÿ ðàñïðåäåëåíèÿ FY(x) ñâÿçàíà ñ ôóíêöèåé FX(x) ôîðìóëîé FY (u ) = ∫ dFX ( x) . ϕ ( x ) ≤u Îòìåòèì, ÷òî äëÿ ìîìåíòîâ ñëó÷àéíûõ âåëè÷èí Õ è Y íåò ïðîñòûõ ôîðìóë, îòîáðàæàþùèõ èõ çàâèñèìîñòü. (Ôîðìóëà ÌY = ϕ(ÌÕ), êîòîðóþ ÷àñòî ïûòàþòñÿ èñïîëüçîâàòü ñòóäåíòû, â îáùåì ñëó÷àå íåâåðíà.) Îäíàêî ìîæíî óêàçàòü ïðîñòóþ çàâèñèìîñòü ìåæäó êâàíòèëÿìè ζð è ξð ñëó÷àéíûõ âåëè÷èí Õ è Y ñîîòâåòñòâåííî: åñëè ϕ — âîçðàñòàþùàÿ ôóíêöèÿ, òî ζð = ϕ(ξð) äëÿ ëþáîãî ð (0 < p < 1); åñëè æå ϕ — óáûâàþùàÿ ôóíêöèÿ, òî â ýòîì ñëó÷àå ζð = ϕ(ξ1–ð). Äëÿ ìåäèàí ζ0,5 è ξ0,5 ñîîòíîøåíèå ζ0,5 = ϕ(ξ0,5) ñïðàâåäëèâî êàê äëÿ âîçðàñòàþùåé, òàê è äëÿ óáûâàþùåé ôóíêöèè ϕ. Ïðèâåäåì äâå òåîðåìû, êîòîðûå íàõîäÿò ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå. Òåîðåìà. Ïóñòü ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íåïðåðûâíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = F(X) ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1]. 3 Îòñóòñòâèå ñâîéñòâà âçàèìíî îäíîçíà÷íîãî îòîáðàæåíèÿ Õ ↔ Y èçìåíÿåò (óñëîæíÿåò) ïðèâåäåííûå íèæå ôîðìóëû, íî íå ÿâëÿåòñÿ ïðèíöèïèàëüíûì ïðåïÿòñòâèåì äëÿ èõ ïîñòðîåíèÿ. Глава 1. Основные понятия теории вероятностей 29 Òåîðåìà4. Ïóñòü G(x) — ôóíêöèÿ, îáðàòíàÿ ê íåïðåðûâíîé ñòðîãî ìîíîòîííîé ôóíêöèè ðàñïðåäåëåíèÿ F(x). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = G(X), ãäå ñëó÷àéíàÿ âåëè÷èíà X ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1], èìååò ôóíêöèþ ðàñïðåäåëåíèÿ F(x). Ïåðâàÿ òåîðåìà èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ òàê íàçûâàåìûõ ïðîáèòãðàôèêîâ íà ýòàïå ïðåäâàðèòåëüíîãî àíàëèçà âûáîðî÷íûõ ðàñïðåäåëåíèé (ñì. ãëàâó 9). Âòîðàÿ òåîðåìà ëåæèò â îñíîâå ìåòîäà îáðàòíûõ ôóíêöèé ãåíåðèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, àêòèâíî ïðèìåíÿåìîãî íà ïðàêòèêå (ñì. ãëàâó 7). 1.3.1. Линейное преобразование случайных величин Ýòî ïðîñòåéøàÿ çàâèñèìîñòü âèäà Y = aX + b ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ è Y.  ýòîì ñëó÷àå FY(x) = FX((x – b)/à). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ íåïðåðûâíà (ò.å. ñóùåñòâóåò åå ïëîòíîñòü âåðîÿòíîñòè fX(x)), òîãäà f Y ( x) = 1 x −b fX . |a| a Ìåæäó ìîìåíòàìè ñëó÷àéíûõ âåëè÷èí Õ è Y ñóùåñòâóþò òàêèå ñîîòíîøåíèÿ: ÌY = Ì(aX + b) = ÌX + b, DY = D(aX + b) = a2DX, M(Y)r = M(aX + b) r = a r mr + Cr1a r −1bmr −1 + ... + Crr −1ab r −1m1 + b r , çäåñü Ì(Õ)k — íà÷àëüíûå (îòíîñèòåëüíî õ = 0) ìîìåíòû ïîðÿäêà k ñëó÷àéíîé r! — áèíîìèàëüíûå êîýôôèöèåíòû. k !(r − k )! Äëÿ ñòàòèñòè÷åñêîãî àíàëèçà îñîáûé èíòåðåñ ïðåäñòàâëÿåò ëèíåéíîå ïðåîáðàçîâàíèå ê ñòàíäàðòíîìó âèäó (íîðìèðîâàíèå ñëó÷àéíîé âåëè÷èíû). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå ÌÕ è äèñïåðñèþ σ2, òîãäà ñëó÷àéíàÿ âåX − MX ëè÷èíà Y = , ó êîòîðîé ÌY = 0 è DY = 1, íàçûâàåòñÿ ñòàíäàðòèçîâàííîé σ (íîðìèðîâàííîé) ñëó÷àéíîé âåëè÷èíîé. Íîðìèðîâàíèå ñëó÷àéíûõ âåëè÷èí ÷àñòî ïðèìåíÿåòñÿ íà ïðåäâàðèòåëüíîì ýòàïå ñòàòèñòè÷åñêîãî àíàëèçà (ñì. ãëàâó 8). âåëè÷èíû Õ, Crk = 1.3.2. Суммы случайных величин Äëÿ ñëó÷àéíîé âåëè÷èíû Z = X + Y âñåãäà âåðíî (âíå çàâèñèìîñòè îò òîãî, áóäóò ëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìûìè), ÷òî MZ = M(X + Y) = MX + MY. Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Z âû÷èñëÿåòñÿ ïî ôîðìóëå DZ = D(X + Y) = DX + DY + 2cov(X, Y). Åñëè ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû, òî D(X + Y) = DX + DY. 4  ôîðìóëèðîâêàõ òåîðåì ìû íàìåðåíî íàëîæèëè æåñòêèå îãðàíè÷åíèÿ (íåïðåðûâíîñòü è ñòðîãóþ ìîíîòîííîñòü) íà ôóíêöèþ ðàñïðåäåëåíèÿ F(x), ÷òîáû èçáåæàòü ïðîáëåì ñ íåîäíîçíà÷íîñòüþ îáðàòíîé ôóíêöèè G(x) â ñëó÷àå ðàçðûâíîé èëè íåñòðîãî ìîíîòîííîé ôóíêöèè F(x). Íà ïðàêòèêå ýòè òåîðåìû èñïîëüçóþòñÿ äëÿ ëþáûõ ôóíêöèé ðàñïðåäåëåíèÿ, åñëè äîîïðåäåëèòü èõ äîëæíûì îáðàçîì. 30 Часть I. Основные понятия теории вероятностей и математической статистики  ñëó÷àå, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y èìåþò ñîâìåñòíóþ ïëîòíîñòü âåðîÿòíîñòè f(x, y), òîãäà ïëîòíîñòü âåðîÿòíîñòè g(x) ñëó÷àéíîé âåëè÷èíû Z = X + Y âûðàæàåòñÿ ôîðìóëîé g ( z) = +∞ ∫ −∞ +∞ f ( x, z − x)dx = ∫ f ( z − y, y )dy . −∞  ÷àñòíîñòè, êîãäà ñëó÷àéíûå âåëè÷èíû X è Y íåçàâèñèìû (â ýòîì ñëó÷àå f(x, y) = fX(x) fY(ó)), òîãäà g ( z) = +∞ ∫ −∞ +∞ f X ( x) f Y ( z − x )dx = ∫ f X ( z − y ) f Y ( y )dy . −∞ N Åñëè Z ÿâëÿåòñÿ ñóììîé N ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN, ò.å. Z = ∑ X i , òîi =1 N ãäà MZ = ∑ MX i . Äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí âû÷èñëÿåòñÿ ïî ôîðìóëå i =1 N N −1 N DZ = ∑ DX i + 2∑∑ cov(X i , X j ) . i =1 j =1 j > i Òàêèì îáðàçîì, äèñïåðñèÿ ñóììû ñëó÷àéíûõ âåëè÷èí ðàâíÿåòñÿ ñóììå èõ äèñïåðñèé è ñóììû êîâàðèàöèé âñåõ âîçìîæíûõ ïàð ñëó÷àéíûõ âåëè÷èí. Äëÿ N íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí X1, X2, ..., XN DZ = ∑ DX i . i=1 N Åñëè êîëè÷åñòâî ñëàãàåìûõ â ñóììå Z = ∑ X i íåîãðàíè÷åííî âîçðàñòàåò, òî i =1 ïðè äîñòàòî÷íî îáùèõ óñëîâèÿõ, íàêëàäûâàåìûõ íà ñëó÷àéíûå âåëè÷èíû Xi, ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Z ñõîäèòñÿ ê íîðìàëüíîìó ðàñïðåäåëåíèþ. Ïåðå÷èñëåíèå ýòèõ óñëîâèé ñîñòàâëÿåò ñîäåðæàíèå öåíòðàëüíûõ ïðåäåëüíûõ òåîðåì òåîðèè âåðîÿòíîñòåé. 1.3.3. Центральная предельная теорема Èñêëþ÷èòåëüíîå çíà÷åíèå öåíòðàëüíûõ ïðåäåëüíûõ òåîðåì îáúÿñíÿåòñÿ òåì, ÷òî îíè ÿâëÿþòñÿ òåîðåòè÷åñêîé îñíîâîé ïðèìåíåíèÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ïðè ðåøåíèè ìíîãèõ ïðàêòè÷åñêèõ çàäà÷. Âñåãäà, êîãäà ìîæíî ïðåäïîëîæèòü, ÷òî ðàññìàòðèâàåìàÿ âåëè÷èíà ÿâëÿåòñÿ ñóììîé áîëüøîãî ÷èñëà ñëó÷àéíûõ ôàêòîðîâ, âëèÿíèå êàæäîãî èç êîòîðûõ ïðåíåáðåæèìî ìàëî, åå ðàñïðåäåëåíèå áóäåò áëèçêî ê íîðìàëüíîìó ðàñïðåäåëåíèþ. Òàêèìè âåëè÷èíàìè ÿâëÿþòñÿ, íàïðèìåð, îøèáêè ðåãèñòðàöèè â èçìåðèòåëüíûõ ïðèáîðàõ, ðåçóëüòàòû ñëó÷àéíîãî ýêñïåðèìåíòà, çàâèñÿùåãî îò ìíîãèõ ìàëûõ ôàêòîðîâ, ðàññåèâàíèå ýëåêòðîíîâ ïðè áîìáàðäèðîâêå èìè ìèøåíåé è ò.ä. Ïðèâåäåì ïðîñòåéøèé âàðèàíò öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, îòíîñÿùèéñÿ ê ñóììàì íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëàãàåìûõ ñ êîíå÷íîé äèñïåðñèåé. Èìåííî ýòîò âàðèàíò òåîðåìû ñëóæèò îñíîâîé äëÿ ïîñòðîåíèÿ ðàçëè÷íûõ àñèìïòîòè÷åñêèõ îöåíîê âûáîðî÷íûõ ïàðàìåòðîâ ðàñïðåäåëåíèé â ñòàòèñòè÷åñêîì àíàëèçå (ñì. ðàçäåë 2.2). Глава 1. Основные понятия теории вероятностей 31 Òåîðåìà. Ïóñòü Õ1, Õ2, ..., Xn, ... — ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí ñ ìàòåìàòè÷åñêèì îæèäàíèåì ÌXk = m è êîíå÷íîé äèñïåðñèåé DXk = σ2 > 0. Îáîçíà÷èì Yn = Õ1 + Õ2 + ... + Xn. Òîãäà ïðè n → ∞ äëÿ ëþáîãî õ Y − nm < x → Φ ( x) , P n σ n ãäå Ô(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Yn íàçûâàåòñÿ àñèìïòîòè÷åñêè íîðìàëüíîé. Ñóùåñòâóþò áîëåå îáùèå âàðèàíòû öåíòðàëüíîé ïðåäåëüíîé òåîðåìû, ñïðàâåäëèâûå äëÿ ïîñëåäîâàòåëüíîñòåé Yn = Õ1 + Õ2 + ... + Xn, êîãäà Xk ìîãóò èìåòü ðàçëè÷íûå ðàñïðåäåëåíèÿ è áûòü çàâèñèìûìè. Ðàçëè÷íûå âàðèàíòû òåîðåìû ìîæíî íàéòè â [6]. 1.4. Примеры дискретных распределений Ïðèâåäåì ïðèìåðû ðàñïðåäåëåíèé, êîòîðûå ÷àñòî âñòðå÷àþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà. 1.4.1. Равномерное дискретное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå äèñêðåòíîå ðàñïðåäåëåíèå, åñëè îíà ïðèíèìàåò êîíå÷íîå ÷èñëî ðàçëè÷íûõ çíà÷åíèé ñ îäèíàêîâîé âåðîÿòíîñòüþ. Ïóñòü, äëÿ îïðåäåëåííîñòè, âåëè÷èíà Õ ìîæåò ïðèíèìàòü çíà÷åíèÿ 1, 2, ..., n. Òîãäà Ð(Õ = i) = 1/n äëÿ âñåõ öåëûõ çíà÷åíèé i èç èíòåðâàëà [1, n]. Îòìåòèì, ÷òî â ýòîì ñëó÷àå ÌÕ = (n + 1)/2, DX = (n + 1)(2n + 1)/6. Ãðàôèê ýòîãî ðàñïðåäåëåíèÿ äëÿ n = 10 ïîêàçàí íà ðèñ. 1.4. Ýòî ðàñïðåäåëåíèå ÷àñòî èñïîëüçóåòñÿ äëÿ ìîäåëèðîâàíèÿ ðàâíîâåðîÿòíûõ äèñêðåòíûõ ñîáûòèé. Ðèñ. 1.4. Äèñêðåòíîå ðàñïðåäåëåíèå ðàâíîìåðíîå 1.4.2. Распределение Бернулли Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Áåðíóëëè ñ ïàðàìåòðîì ð (0 < p < 1), åñëè Ð(Õ = 1) = ð è Ð(Õ = 0) = 1 – p. Òàêèì îáðàçîì, ñëó÷àéíàÿ âå- 32 Часть I. Основные понятия теории вероятностей и математической статистики ëè÷èíà Õ ìîæåò ïðèíèìàòü òîëüêî äâà çíà÷åíèÿ, 1 è 0, ñ âåðîÿòíîñòÿìè ð è 1 – p ñîîòâåòñòâåííî. Îòìåòèì, ÷òî ÌÕ = ð è DX = p(1 – p). Ýòî ðàñïðåäåëåíèå èãðàåò ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè, ïîñêîëüêó ÿâëÿåòñÿ ìîäåëüþ ëþáîãî ñëó÷àéíîãî ýêñïåðèìåíòà, ðåçóëüòàòîì êîòîðîãî ìîæåò áûòü îäèí èç äâóõ âîçìîæíûõ èñõîäîâ: èñõîä “1” ïðîèçîéäåò ñ âåðîÿòíîñòüþ ð è èñõîä “0” — ñ âåðîÿòíîñòüþ 1 – ð (èñõîä “1” ÷àñòî íàçûâàþò “óñïåõîì”, à èñõîä “0” — “íåóäà÷åé”). 1.4.3. Биномиальное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (0 < p < 1, n ≥ 1), åñëè P(X = k ) = Cnk p k (1 − p) n − k , k ∈ 0, n. Çäåñü Cnk = n! — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåk !(n − k )! ëè÷èíû ÌÕ = np, DX = np(1 – p). Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ n = 20 è p = 0,5 ïîêàçàíî íà ðèñ. 1.5. Ðèñ. 1.5. Áèíîìèàëüíîå ðàñïðåäåëåíèå Áèíîìèàëüíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ ñëó÷àéíûõ ýêñïåðèìåíòîâ, ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé.  ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0”. Ïðèíÿòûì íàçâàíèåì äëÿ òàêîé ìîäåëè ñëó÷àéíûõ ýêñïåðèìåíòîâ ÿâëÿåòñÿ ñõåìà Áåðíóëëè. Ñëó÷àéíàÿ âåëè÷èíà, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1” â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè äîñòàòî÷íî áîëüøèõ n è ïðè óñëîâèè, ÷òî 1/(n + 1) < p < n/(n + 1), ÷àñòî èñïîëüçóþòñÿ ïðèáëèæåííûå ôîðìóëû, îñíîâàííûå íà àïïðîêñèìàöèè ýòîãî ðàñïðåäåëåíèÿ íîðìàëüíûì.  Excel åñòü ôóíêöèÿ БИНОМРАСП (ñì. ãëàâó 4), êîòîðàÿ ïîçâîëÿåò âû÷èñëÿòü êàê çíà÷åíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè ëþáûõ n, p è k, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ F(x). (Ãðàôèêè íà ðèñ. 1.5 ïîñòðîåíû ñ ïîìîùüþ ýòîé ôóíêöèè.) Глава 1. Основные понятия теории вероятностей 33 1.4.4. Распределение Пуассона Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (λ > 0), åñëè P(X = k ) = e − λ λk , k = 0, 1, 2, ... . k! Äëÿ ýòîãî ðàñïðåäåëåíèÿ ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ñîâïàäàþò, ò.å. ÌÕ = DX = λ. Ðàñïðåäåëåíèÿ âåðîÿòíîñòåé äëÿ äâóõ çíà÷åíèé λ ïîêàçàíû íà ðèñ. 1.6. Ðèñ. 1.6. Ðàñïðåäåëåíèå Ïóàññîíà Ðàñïðåäåëåíèå Ïóàññîíà èãðàåò âàæíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå. Îíî ÿâëÿåòñÿ ìîäåëüþ äëÿ îïèñàíèÿ ñëó÷àéíîãî ÷èñëà ïîÿâëåíèé îïðåäåëåííûõ ñîáûòèé â ôèêñèðîâàííûé ïðîìåæóòîê âðåìåíè èëè â ôèêñèðîâàííîé îáëàñòè ïðîñòðàíñòâà. Òðàäèöèîííûìè ïðèìåðàìè ñëó÷àéíûõ âåëè÷èí, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà, ÿâëÿþòñÿ ÷èñëî àëüôà÷àñòèö, èñïóñêàåìûõ ðàäèîàêòèâíûì èñòî÷íèêîì çà îïðåäåëåííûé ïðîìåæóòîê âðåìåíè; êîëè÷åñòâî áàêòåðèé, âèäèìûõ ïîä ìèêðîñêîïîì; ìóòàöèè, âûçâàííûå ðàäèàöèåé; êîëè÷åñòâî çâåçä â îïðåäåëåííîé îáëàñòè çâåçäíîãî íåáà; êîëè÷åñòâî äåðåâüåâ íà ó÷àñòêå ëåñà è ò.ä.  Excel äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé Ð(Õ = k) è çíà÷åíèé ôóíêöèè ðàñïðåäåëåíèÿ F(x) åñòü ôóíêöèÿ ПУАССОН (ñì. ãëàâó 4). Îòìåòèì òàêæå ñîîòíîøåíèÿ ìåæäó ðàñïðåäåëåíèÿìè Ïóàññîíà è χ2 (ñì. ðàçäåë 1.5.5), êîòîðûå èñïîëüçóþòñÿ ïðè ïîñòðîåíèè èíòåðâàëüíûõ îöåíîê äëÿ ïàðàìåòðà λ (ñì. ðàçäåë 2.3.8): Ð(Õ ≥ k) = Ð(Y ≤ 2λ), ãäå Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2k ñòåïåíÿìè ñâîáîäû, è Ð(Õ ≤ k) = = Ð(Z ≥ 2λ), ãäå Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1) ñòåïåíÿìè ñâîáîäû. 1.4.5. Геометрическое распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì ð (0 < p < 1), åñëè Ð(Õ = k) = p(1 – p)k, k = 0, 1, 2, ... . Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (1 – p)/p, DX = (1 – p)/p2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèÿ ïàðàìåòðà p = 0,7 ïîêàçàíî íà ðèñ. 1.7. 34 Часть I. Основные понятия теории вероятностей и математической статистики Ðèñ. 1.7. Ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì îòðèöàòåëüíîãî áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ïðè ïàðàìåòðå r = 1 (ñì. ðàçäåë 1.4.7) è îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè (ðàçäåë 1.4.3), íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1” ðîâíî îäèí ðàç. 1.4.6. Гипергеометрическое распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè N, n è ð (N ≥ n ≥ 0, 0 < p < 1), åñëè P(X = k ) = k C Np C Nn −(1k− p ) C Nn , k = 0, 1, 2, ..., n . Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = np, DX = np (1 − p ) N −n . Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàN −1 ìåòðîâ N = 100, n = 10 è p = 0,4 ïîêàçàíî íà ðèñ. 1.8. Òèïè÷íàÿ ñèòóàöèÿ, â êîòîðîé ïîÿâëÿåòñÿ ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå, ñëåäóþùàÿ: ïðîâåðÿåòñÿ ïàðòèÿ ãîòîâîé ïðîäóêöèè îáúåìîì N, â êîòîðîé ëþáîå èçäåëèå ñ âåðîÿòíîñòüþ ð ÿâëÿåòñÿ ãîäíûì è, ñîîòâåòñòâåííî, ñ âåðîÿòíîñòüþ 1 – ð — áðàêîâàííûì. Ñëó÷àéíûì îáðàçîì âûáèðàþòñÿ n èçäåëèé. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî ãîäíûõ èçäåëèé ñðåäè n âûáðàííûõ èçäåëèé. Åñëè n/N < 0,1, ýòî ðàñïðåäåëåíèå õîðîøî àïðîêñèìèðóåòñÿ áèíîìèàëüíûì ðàñïðåäåëåíèåì.  Excel èìååòñÿ ôóíêöèÿ ГИПЕРГЕОМЕТ, âû÷èñëÿþùàÿ âåðîÿòíîñòè Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ N, n, ð è k (ñì. ðàçäåë 4.6.6). 1.4.7. Отрицательное биномиальное распределение (распределение Паскаля) Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ïàñêàëÿ) ñ ïàðàìåòðàìè r è ð (0 < p < 1), åñëè P(X = k ) = Crk+ k −1 p r (1 − p) r , k = 0, 1, 2, ... . Глава 1. Основные понятия теории вероятностей 35 Ðèñ. 1.8. Ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå Çäåñü Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = r(1 – p)/p, DX = r(1 – p)/p2. Ðàñïðåäåëåíèå âåðîÿòíîñòåé äëÿ çíà÷åíèé ïàðàìåòðîâ r = 10 è p = 0,8 ïîêàçàíî íà ðèñ. 1.9. Ðèñ. 1.9. Îòðèöàòåëüíîå ðàñïðåäåëåíèå áèíîìèàëüíîå Ïðè íàòóðàëüíîì r îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå îïèñûâàåò ÷èñëî èñïûòàíèé â ñõåìå Áåðíóëëè, íåîáõîäèìûõ äëÿ òîãî, ÷òîáû ïîëó÷èòü èñõîä “1” ðîâíî r ðàç. Ýòî ðàñïðåäåëåíèå ÷àñòî ïîÿâëÿåòñÿ â ïîïóëÿöèîííîé áèîëîãèè.  Excel èìååòñÿ ôóíêöèÿ ОТРБИНОМРАСП, âû÷èñëÿþùàÿ âåðîÿòíîñòè Ð(Õ = k) ïðè çàäàííûõ çíà÷åíèÿõ r, ð è k (ñì. ðàçäåë 4.6.10). 1.5. Примеры непрерывных распределений 1.5.1. Равномерное непрерывное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b], åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.10) âû÷èñëÿåòñÿ ïî ôîðìóëå 1 , если x ∈ [a, b], f ( x) = b − a 0, если x ∉ [a, b]. 36 Часть I. Основные понятия теории вероятностей и математической статистики Ðèñ. 1.10. Ïëîòíîñòü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = (a + b)/2, DX = (b – a)2/12, β1 = 0, β2 = –1,2. Ñëó÷àéíàÿ âåëè÷èíà Y = (X – a)/(b – a) ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1]. Ðàâíîìåðíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íåïðåðûâíûì àíàëîãîì äèñêðåòíîãî ðàâíîìåðíîãî ðàñïðåäåëåíèÿ, îïèñûâàþùåãî ñëó÷àéíûå ýêñïåðèìåíòû ñ ðàâíîâåðîÿòíûìè èñõîäàìè. Òåîðåìû èç ðàçäåëà 1.3, ïîêàçûâàþùèå âçàèìîñâÿçü ðàâíîìåðíîãî ðàñïðåäåëåíèÿ ñ äðóãèìè òèïàìè ðàñïðåäåëåíèé, îáúÿñíÿþò øèðîêîå èñïîëüçîâàíèå ðàâíîìåðíîãî ðàñïðåäåëåíèÿ â ñòàòèñòè÷åñêîì ìîäåëèðîâàíèè (áîëåå ïîäðîáíî îá ýòîì ðå÷ü èäåò â ãëàâå 7).  Excel ôóíêöèÿ СЛЧИС ãåíåðèðóåò ñëó÷àéíûå ÷èñëà, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] (ñì. ðàçäåë 4.13.1). 1.5.2. Треугольное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò òðåóãîëüíîå ðàñïðåäåëåíèå (íàçûâàåìîå òàêæå ðàñïðåäåëåíèåì Ñèìïñîíà) íà èíòåðâàëå [a, b], åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.11) âû÷èñëÿåòñÿ ïî ôîðìóëå 2 2 − a + b − 2 x , если x ∈ [a, b], f ( x ) = b − a (b − a ) 2 0, если x ∉ [a, b]. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû MX = 1 (4(a3 + b3 ) − (a + b)3 ) , DX = (b – 6(b − a) 2 – a)3/24. Åñëè Õ1 è Õ2 — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, ðàâíîìåðíî ðàñïðå- a b äåëåííûå íà èíòåðâàëå , , òî ñëó÷àéíàÿ âåëè÷èíà Õ = Õ1 + Õ2 èìååò òðå2 2 óãîëüíîå ðàñïðåäåëåíèå íà èíòåðâàëå [a, b]. 1.5.3. Показательное (экспоненциальное) распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.12) âû÷èñëÿåòñÿ ïî ôîðìóëå λe − λx , если x ≥ 0, f ( x) = если x < 0. 0, Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = 1/λ, DX = 1/λ2; åå ôóíêöèÿ ðàñïðåäåëåíèÿ âû÷èñëÿåòñÿ ïî ïðîñòîé ôîðìóëå F(u) = 1 – e–λu (u ≥ 0). Ýòî ðàñïðåäåëåíèå Глава 1. Основные понятия теории вероятностей 37 Ðèñ. 1.11. Ïëîòíîñòü òðåóãîëüíîãî ðàñïðåäåëåíèÿ Ðèñ. 1.12. Ïëîòíîñòü ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ ÷àñòî âñòðå÷àåòñÿ â ìîäåëèðîâàíèè ñëó÷àéíûõ ïðîöåññîâ (îíî îáëàäàåò òàê íàçûâàåìûì ñâîéñòâîì îòñóòñòâèÿ ïîñëåäåéñòâèÿ).  Excel ôóíêöèÿ ЭКСПРАСП âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.15). 1.5.4. Нормальное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.13) âû÷èñëÿåòñÿ ïî ôîðìóëå f ( x) = 1 2πσ e − ( x − m )2 2σ 2 , x ∈ (−∞, ∞). Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = m, DX = σ2, β1 = 0, β2 = 0. Íîðìàëüíîå ðàñïðåäåëåíèå íàçûâàþò òàêæå ãàóññîâñêèì ðàñïðåäåëåíèåì, çàêîíîì Ãàóññà, âòîðûì çàêîíîì Ëàïëàñà, ðàñïðåäåëåíèåì Ãàóññà–Ëàïëàñà è äð. Åñëè m = 0 è σ2 = 1, òî ðàñïðåäåëåíèå íàçûâàåòñÿ ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì. Ëèíåéíîå ïðåîáðàçîâàíèå Y = (X – m)/σ ïðèâîäèò ïðîèçâîëüíóþ íîðìàëüíî ðàñïðåäåëåííóþ âåëè÷èíó Õ ê ñòàíäàðòíîìó íîðìàëüíîìó ðàñïðåäåëåíèþ. Ôóíäàìåíòàëüíàÿ ðîëü, êîòîðóþ èãðàåò íîðìàëüíîå ðàñïðåäåëåíèå â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, îáúÿñíÿåòñÿ òåì, ÷òî ïðè äîñòà- 38 Часть I. Основные понятия теории вероятностей и математической статистики òî÷íî øèðîêèõ óñëîâèÿõ ðàñïðåäåëåíèå ñóììû ñëó÷àéíûõ âåëè÷èí ñ ðîñòîì ÷èñëà ñëàãàåìûõ àñèìïòîòè÷åñêè ñõîäèòñÿ ê íîðìàëüíîìó. Ñîîòâåòñòâóþùèå óñëîâèÿ ñõîäèìîñòè ïðèâåäåíû â öåíòðàëüíîé ïðåäåëüíîé òåîðåìå òåîðèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.3.3). Ðèñ. 1.13. Ïëîòíîñòü íîðìàëüíîãî ðàñïðåäåëåíèÿ Íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà ñ áîëüøîé âåðîÿòíîñòüþ ïðèíèìàåò çíà÷åíèÿ, áëèçêèå ê ñâîåìó ìàòåìàòè÷åñêîìó îæèäàíèþ. Ýòî ñâîéñòâî íîðìàëüíîãî ðàñïðåäåëåíèÿ ôîðìóëèðóåòñÿ êàê ïðàâèëî ñèãì: 0,3173..., k = 1, P(| X − m |≥ kσ ) = 0, 0455...., k = 2, 0, 0027...., k = 3. ×àùå âñåãî èñïîëüçóþò ïðàâèëî òðåõ ñèãì, êîòîðîå íàõîäèò øèðîêîå ïðèìåíåíèå â ìàòåìàòè÷åñêîé ñòàòèñòèêå ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ.  Excel ôóíêöèè НОРМСТРАСП è НОРМРАСП (ñì. ðàçäåëû 4.6.8 è 4.6.9) âû÷èñëÿþò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ ñîîòâåòñòâåííî ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî ðàñïðåäåëåíèé, à ôóíêöèè НОРМСТОБР è НОРМОБР — çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ ñòàíäàðòíîãî è ïðîèçâîëüíîãî íîðìàëüíîãî çàêîíîâ (ñì. ðàçäåëû 4.7.5 è 4.7.6). Ïîñëåäíèå ôóíêöèè ìîæíî èñïîëüçîâàòü äëÿ ãåíåðèðîâàíèÿ íîðìàëüíî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ãëàâó 7). 1.5.5. Распределение “хи/квадрат” Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.14) âû÷èñëÿåòñÿ ïî ôîðìóëå n x −1 − 1 2 2 , если x ≥ 0, x e n 2 n f ( x) = 2 Γ 2 0, если x < 0. Глава 1. Основные понятия теории вероятностей 39 Çäåñü è äàëåå Ã(õ) — ãàììà-ôóíêöèÿ Ýéëåðà5. Äëÿ äàííîãî ðàñïðåäåëåíèÿ ÌÕ = n, DX = 2n, β1 = 2 2 , β2 = 12/n. Ïðè n ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå õ = n – 2. n Ðèñ. 1.14. Ðàñïðåäåëåíèå χ2 Ìíîãî÷èñëåííûå ïðèìåíåíèÿ ýòîãî ðàñïðåäåëåíèÿ â òåîðèè âåðîÿòíîñòåé îñíîâàíû íà òîì ôàêòå, ÷òî åñëè Õ1, Õ2, ..., Õn — íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, òî ñëó÷àéíàÿ âåëè÷èíà Y = ∑ i =1 X i2 èìååò ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ìàòåìàòè÷åñêîé n ñòàòèñòèêå ðàñïðåäåëåíèå χ2 ïðèìåíÿåòñÿ ïðè ïîñòðîåíèè öåëîãî ðÿäà ðàçíîîáðàçíûõ êðèòåðèåâ, â òîì ÷èñëå ïðè ñîãëàñîâàíèè âûáîðî÷íûõ äàííûõ ñ âûáðàííûì çàêîíîì ðàñïðåäåëåíèÿ è â ìåòîäå íàèìåíüøèõ êâàäðàòîâ (ñì. ãëàâû 2 è 3).  Excel åñòü òðè ôóíêöèè, ХИ2РАСП, ХИ2ОБР è ХИ2ТЕСТ, ñâÿçàííûå ñ ðàñïðåäåëåíèåì χ2. Ïîäðîáíî ýòè ôóíêöèè îïèñàíû â ãëàâå 4. 1.5.6. Распределение Стьюдента Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Ñòüþäåíòà (t-ðàñïðåäåëåíèå) ñ n ñòåïåíÿìè ñâîáîäû, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.15) âû÷èñëÿåòñÿ ïî ôîðìóëå n +1 n +1 Γ − 2 x2 2 f ( x) = , x ∈ (−∞, ∞). 1 + n n nπ Γ 2 5 Çíà÷åíèÿ ãàììà-ôóíêöèè Γ ( n ) = ∫ ∞ 0 e − x x n −1 dx ìîæíî ïîëó÷èòü ñ ïîìîùüþ ôóíêöèè Excel ГАММАНЛОГ, âû÷èñëÿþùåé íàòóðàëüíûé ëîãàðèôì ãàììà-ôóíêöèè. Òàêæå îòìåòèì, ÷òî Ã(n) = (n – 1)!, åñëè n — íàòóðàëüíîå ÷èñëî. 40 Часть I. Основные понятия теории вероятностей и математической статистики Ðèñ. 1.15. Ïëîòíîñòü ðàñïðåäåëåíèÿ Ñòüþäåíòà Äëÿ ýòîãî ðàñïðåäåëåíèÿ ïðè n > 2 ÌÕ = 0, DX = n/(n – 2) (åñëè n ≤ 2, òî DX = ), β1 = 0, β2 = 6/(n – 4) (ïðè n > 4). Ïðè áîëüøèõ çíà÷åíèÿõ n ðàñïðåäåëåíèå Ñòüþäåíòà àñèìïòîòè÷åñêè ñáëèæàåòñÿ ñî ñòàíäàðòíûì íîðìàëüíûì ðàñïðåäåëåíèåì. Ðàñïðåäåëåíèå Ñòüþäåíòà èìååò ìíîãî÷èñëåííûå ïðèìåíåíèÿ â ìàòåìàòè÷åñêîé ñòàòèñòèêå. Åñëè Y — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû, òîãäà ñëó÷àéíàÿ âåëè÷èíà X = Y n èìååò t-ðàñïðåäåëåíèå òàêæå ñ n Z ñòåïåíÿìè ñâîáîäû. (Î ïðèìåíåíèè ðàñïðåäåëåíèÿ Ñòüþäåíòà ðå÷ü èäåò â ãëàâå 2.)  Excel èìåþòñÿ ôóíêöèè СТЬЮДРАСП è СТЬЮДОБР, âû÷èñëÿþùèå ñîîòâåòñòâåííî çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.12 è 4.7.7). 1.5.7. F/распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà) ñ (m, n) ñòåïåíÿìè ñâîáîäû (m, n ≥ 1), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.16) âû÷èñëÿåòñÿ ïî ôîðìóëå m+n m m+n Γ 2 m 2 m −1 m − 2 2 , если x ≥ 0, x 1 + x f ( x) = m n n n Γ Γ 2 2 если x < 0. 0, 2n 2 (m + n − 2) n (ïðè n > 2), DX = (åñëè m(n − 2) 2 (n − 4) n−2 n(m − 2) . n > 4). Ïðè m ≥ 2 ìîäà íàõîäèòñÿ â òî÷êå x = m(n + 2) Äëÿ ýòîãî ðàñïðåäåëåíèÿ MX = Глава 1. Основные понятия теории вероятностей 41 Ðèñ. 1.16. Ïëîòíîñòü F-ðàñïðåäåëåíèÿ Åñëè íåçàâèñèìûå ñëó÷àéíûå âåëè÷èíû Y1 è Y2 èìåþò ðàñïðåäåëåíèå χ2 ñ m è n ñòåïåíÿìè ñâîáîäû ñîîòâåòñòâåííî, òîãäà ñëó÷àéíàÿ âåëè÷èíà X = Y1 m áóY2 n äåò èìåòü F-ðàñïðåäåëåíèå. F-ðàñïðåäåëåíèå èãðàåò îñíîâíóþ ðîëü ïðè ñðàâíåíèè âûáîðî÷íûõ äèñïåðñèé èç íîðìàëüíî ðàñïðåäåëåííûõ ñîâîêóïíîñòåé. Îíî òàêæå øèðîêî èñïîëüçóåòñÿ â ðåãðåññèîííîì è äèñïåðñèîííîì àíàëèçå.  Excel èìåþòñÿ ôóíêöèè FРАСП è FРАСПОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.1 è 4.7.1). 1.5.8. Логарифмически нормальное распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãàðèôìè÷åñêè íîðìàëüíîå (ëîãíîðìàëüíîå) ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2, åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.17) âû÷èñëÿåòñÿ ïî ôîðìóëå 1 (ln x − m) 2 exp − , если x > 0, f ( x) = xσ 2π 2σ 2 если x ≤ 0. 0, Ðèñ. 1.17. Ïëîòíîñòü ëîãíîðìàëüíîãî ðàñïðåäåëåíèÿ 42 Часть I. Основные понятия теории вероятностей и математической статистики Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = exp(m + σ2/2), DX = (exp(σ2) – 1)exp(2m + σ2). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãíîðìàëüíîå ðàñïðåäåëåíèå, òî åå ëîãàðèôì Y = lnX ðàñïðåäåëåí ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2. Ýòî ðàñïðåäåëåíèå íàõîäèò ïðèìåíåíèå â òåîðèè íàäåæíîñòè, ñòàòèñòè÷åñêîé ôèçèêå, ýêîíîìè÷åñêîé ñòàòèñòèêå, áèîëîãèè è ò.ä.  Excel èìåþòñÿ ôóíêöèè ЛОГНОРМРАСП è ЛОГНОРМОБР, êîòîðûå âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.7 è 4.7.4). 1.5.9. Бета/распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò áåòà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è β (α > 0, β > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.18) âû÷èñëÿåòñÿ ïî ôîðìóëå Γ (α + β) α −1 x (1 − x)β −1 , если x ∈ [0,1], f ( x) = Γ(α)Γ(β) 0, если x ∉ [0,1]. Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/(α + β), DX = αβ/(α + β)2(α + β + 1). Åñëè α > 1 è β > 1, òî ðàñïðåäåëåíèå îäíîìîäàëüíî ñ ìîäîé â òî÷êå õ = (α – – 1)/(α + β – 1). Ïðè α = β = 1 áåòà-ðàñïðåäåëåíèå ÿâëÿåòñÿ ðàâíîìåðíûì íà èíòåðâàëå [0, 1] ðàñïðåäåëåíèåì, ïðè α = β = 2 — òðåóãîëüíûì, â ñëó÷àå α = β = 1/2 îíî íàçûâàåòñÿ ðàñïðåäåëåíèåì àðêñèíóñà, à ïðè β = α + 1 — îáîáùåííûì ðàñïðåäåëåíèåì àðêñèíóñà.  ìàòåìàòè÷åñêîé ñòàòèñòèêå áåòà-ðàñïðåäåëåíèå íàèáîëåå ÷àñòî âñòðå÷àåòñÿ â êà÷åñòâå ðàñïðåäåëåíèÿ ïîðÿäêîâûõ ñòàòèñòèê (ñì. ãëàâó 2).  Excel ôóíêöèè БЕТАРАСП è БЕТАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.2 è 4.7.2). Ðèñ. 1.18. Ïëîòíîñòü áåòà-ðàñïðåäåëåíèÿ Глава 1. Основные понятия теории вероятностей 43 1.5.10. Гамма/распределение Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ (α > 0, λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.19) âû÷èñëÿåòñÿ ïî ôîðìóëå λ α α −1 − λx x e , если x > 0, f ( x) = Γ(α) 0, если x ≤ 0. Ðèñ. 1.19. Ïëîòíîñòü ãàììà-ðàñïðåäåëåíèÿ ïðè α = 1 è λ = 0,5 Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû ÌÕ = α/λ, DX = α/λ2. Ïðè α ≤ 1 ìîäà ðàñïðåäåëåíèÿ íàõîäèòñÿ â íóëå, à ïðè α ≥ 1 — â òî÷êå õ = (α – 1)/λ. Åñëè α = 1, òî ãàììà-ðàñïðåäåëåíèå ñîâïàäàåò ñ ïîêàçàòåëüíûì ðàñïðåäåëåíèåì, à ïðè α = n/2, λ = 1/2 — ñ ðàñïðåäåëåíèåì χ2 ñ n ñòåïåíÿìè ñâîáîäû.  ñëó÷àå λ = nµ è α = n (n — íàòóðàëüíîå ÷èñëî) ýòî ðàñïðåäåëåíèå íàçûâàþò ðàñïðåäåëåíèåì Ýðëàíãà ñ ïàðàìåòðàìè n è µ. Ïðè íàòóðàëüíîì α è λ = 1 ãàììà-ðàñïðåäåëåíèå íàçûâàåòñÿ ïîêàçàòåëüíî-ñòåïåííûì. Äàííîå ðàñïðåäåëåíèå è åãî ÷àñòíûå ñëó÷àè øèðîêî èñïîëüçóþòñÿ â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå.  Excel ôóíêöèè ГАММАРАСП è ГАММАОБР âû÷èñëÿþò çíà÷åíèÿ ñîîòâåòñòâåííî ôóíêöèè ðàñïðåäåëåíèÿ è îáðàòíîé ê íåé ôóíêöèè (ñì. ðàçäåëû 4.6.5 è 4.7.3). 1.5.11. Распределение Вейбулла–Гнеденко Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ñ ïàðàìåòðàìè α è λ (λ > 0), åñëè åå ïëîòíîñòü âåðîÿòíîñòè (ðèñ. 1.20) âû÷èñëÿåòñÿ ïî ôîðìóëå | α | λx α −1e− λx , если x > 0, f ( x) = если x ≤ 0. 0, α Äëÿ ýòîé ñëó÷àéíîé âåëè÷èíû 2 2 1 λ −1/ α 1 MX = Γ è DX = λ −2 / α Γ − 2 α α α α α 44 2 1 Γ α . Часть I. Основные понятия теории вероятностей и математической статистики Ðèñ. 1.20. Ïëîòíîñòü ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî ïðè α = 1 è α = 3 è λ = 2 Ðàñïðåäåëåíèå Âåéáóëëà–Ãíåäåíêî ÷àñòî èñïîëüçóåòñÿ â òåîðèè íàäåæíîñòè, â ÷àñòíîñòè äëÿ îïèñàíèÿ âðåìåíè áåçîòêàçíîé ðàáîòû ïðèáîðîâ.  Excel ôóíêöèÿ ВЕЙБУЛЛ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ (ñì. ðàçäåë 4.6.4). 1.5.12. Распределения Пирсона Ñèñòåìà ðàñïðåäåëåíèé Ïèðñîíà îñíîâàíà íà òîì, ÷òî ïëîòíîñòè âåðîÿòíîñòè ìíîãèõ èçâåñòíûõ ðàñïðåäåëåíèé ïîä÷èíÿþòñÿ äèôôåðåíöèàëüíîìó óðàâíåíèþ îäíîãî îïðåäåëåííîãî òèïà, êîòîðîå çàâèñèò îò ÷åòûðåõ ïàðàìåòðîâ.  çàâèñèìîñòè îò çíà÷åíèé ýòèõ ïàðàìåòðîâ ðàçëè÷àþò 12 òèïîâ ðàñïðåäåëåíèé, ñðåäè êîòîðûõ òàêèå ðàñïðåäåëåíèÿ, êàê íîðìàëüíîå, ãàììà-ðàñïðåäåëåíèå, áåòà-ðàñïðåäåëåíèå, ðàñïðåäåëåíèå Ñòüþäåíòà è äðóãèå. Óæå ýòî ïåðå÷èñëåíèå ðàñïðåäåëåíèé, èãðàþùèõ ôóíäàìåíòàëüíóþ ðîëü â òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå, ïîêàçûâàåò âàæíîñòü ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà. Ïîñêîëüêó â ìàòåìàòè÷åñêîé ëèòåðàòóðå ïîëíîå îïèñàíèå ðàñïðåäåëåíèé Ïèðñîíà âñòðå÷àåòñÿ ðåäêî (îáû÷íî óêàçûâàþòñÿ òîëüêî íåêîòîðûå òèïû ðàñïðåäåëåíèé), ïðèâåäåì èõ ïîäðîáíóþ êëàññèôèêàöèþ. (Ïðèâåäåííûé íèæå ìàòåðèàë, ñ íåáîëüøèìè äîïîëíåíèÿìè àâòîðà, âçÿò èç [8]. Äðóãóþ êëàññèôèêàöèþ êðèâûõ Ïèðñîíà ìîæíî íàéòè â [4].) Ðàñïðåäåëåíèÿìè Ïèðñîíà íàçûâàþòñÿ íåïðåðûâíûå ðàñïðåäåëåíèÿ, ïëîòíîñòè âåðîÿòíîñòè êîòîðûõ ÿâëÿþòñÿ ðåøåíèÿìè äèôôåðåíöèàëüíîãî óðàâíåíèÿ df ( x) x+a = f ( x), dx b0 + 2b1 x + b2 x 2 ãäå a, b0, b1, b2 — ïàðàìåòðû ðàñïðåäåëåíèÿ. Ýòè ïàðàìåòðû ïîëíîñòüþ îïðåäåëÿþòñÿ ïåðâûìè ÷åòûðüìÿ öåíòðàëüíûìè ìîìåíòàìè ðàñïðåäåëåíèÿ. Ïóñòü µk — k-é öåíòðàëüíûé ìîìåíò, òîãäà a= b1 = − µ 3 (µ 4 + 3µ 22 ) µ (4µ 2 µ 4 − 3µ 32 ) , b0 = − 2 , A A µ 3 (µ 4 + 3µ 22 ) 2µ µ − 3µ 32 − 6µ 32 , b2 = − 2 4 , 2A A ãäå A = 10µ 2 µ 4 − 18µ 32 − 12µ 32 . Глава 1. Основные понятия теории вероятностей 45 Òèïû ðàñïðåäåëåíèé Ïèðñîíà ðàçëè÷àþò â ñîîòâåòñòâèè ñî çíà÷åíèÿìè êîðíåé êâàäðàòíîãî óðàâíåíèÿ b0 + 2b1õ + b2õ2 = 0. Ââåäåì îáîçíà÷åíèÿ: D = b0b2 – b12, λ = b12/b0b2 = 1 – D. Îòìåòèì, ÷òî áîëüøèíñòâî ïðèâåäåííûõ íèæå ôîðìóë äëÿ ïëîòíîñòåé âåðîÿòíîñòè óïðîùàåòñÿ, åñëè çà íà÷àëî îòñ÷åòà âçÿòü ìîäó ðàñïðåäåëåíèÿ èëè ìàòåìàòè÷åñêîå îæèäàíèå. Òèï I. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β), α, β > 0. Îáîçíà÷èì êàê m = (α – à)/b2(α + β), n = (β – à)/b2(α + β). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé Ïèðñîíà îïðåäåëÿåòñÿ ôîðìóëîé α 2mβ2 n (α + x) m (β − x) n , если x ∈ [−α,β], m + n +1 f ( x) = (α + β) B(m + 1, n + 1) 0, если x ∉ [−α,β]. Çäåñü è äàëåå B(m, n) = Γ ( m) Γ ( n ) (m > 0, n > 0) — áåòà-ôóíêöèÿ. Γ ( m + n) Ðàñïðåäåëåíèÿìè ýòîãî òèïà ÿâëÿþòñÿ áåòà-ðàñïðåäåëåíèÿ. Òèï II. D < 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 – α2), α = −b0 b2 > 0. Îáîçíà÷èì êàê m = 1/2b2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé 1 (α 2 − x 2 )m , если x ∈ [−α, α], 2 m +1 f ( x) = α B (m + 1,1/ 2) 0, если x ∉ [−α,α]. Ýòî ðàñïðåäåëåíèå ñèììåòðè÷íî îòíîñèòåëüíî òî÷êè õ = 0. Òèï III. D < 0, λ = ∞ è b0 + 2b1õ + b2õ2 = 2b1(õ + α), α = b0/2b1. Îáîçíà÷èì êàê m = (à – α)/2b1, k = –1/2b1 (k > 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé k m +1 ( x + α) m e − k ( x + α ) , если x > −α, f ( x) = Γ(m + 1) 0, если x ≤ −α. Ýòîò òèï ðàñïðåäåëåíèÿ ÿâëÿåòñÿ ãàììà-ðàñïðåäåëåíèåì. Òèï IV. D > 0, 0 < λ < 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α2 = D/(b2)2. Îáîçíà÷èì êàê m = –1/2b2 ≥ 1/2, k = –b1(2b2 + 1)/(b2)2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé f ( x) = c(α 2 + x 2 ) − m e − k arctg(x / α ) , x ∈ (−∞, ∞), ∞ ãäå c −1 = ∫ (α 2 + x 2 )− m e− k arctg(x / α) dx. −∞ Òèï V. D = 0, λ = 1 è b0 + 2b1õ + b2õ2 = b2(õ12 + α2), α = b1/b2. Îáîçíà÷èì êàê m = –1/b2 ≥ 1, k = –b1(2b2 + 1)/b2 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé 46 Часть I. Основные понятия теории вероятностей и математической статистики k − k m −1 x − m e x , если x > 0, f ( x) = Γ(m − 1) 0, если x ≤ 0. Òèï VI. D < 0, λ > 1 è b0 + 2b1õ + b2õ2 = b2(õ + α)(õ – β). Îáîçíà÷èì êàê m = (α – à)/b2(α + β) > 1, n = (β – à)/b2(α + β) > –1. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé (α + β) − ( m + n +1) ( x + α) m ( x − β) n , если x > β, f ( x) = B(−m − n − 1, n + 1) 0, если x ≤ β. Òèï VII. D > 0, λ = 0 è b0 + 2b1õ + b2õ2 = b2(õ2 + α2), α2 = b0/b2. Îáîçíà÷èì êàê m = 1/2b2 ≥ 1/2. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé f ( x) = α (α 2 + x 2 ) − m , если x ∈ (−∞, ∞). 1 1 B m − , 2 2 Ðàñïðåäåëåíèå ýòîãî òèïà ÿâëÿåòñÿ ðàñïðåäåëåíèåì Ñòüþäåíòà. Òèï VIII. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì êàê m = 1/b2 (–1 < m < 0). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé m +1 ( x + α)m , если x ∈ [−α,0], f ( x) = α m +1 0, если x ∉ [−α, 0]. Òèï IX. D < 0, λ < 0 è b0 + 2b1õ + b2õ2 = b2(õ + α)x, α = 2b1/b2. Îáîçíà÷èì êàê m = 1/b2 (m < –1). Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé m +1 ( x + α)m , если x ∈ [−α,0], f ( x) = α m +1 0, если x ∉ [−α, 0]. Òèï X. D = 0, λ = 0 è b0 + 2b1õ + b2õ2 = b0, ÷èñëèòåëü äðîáè â äèôôåðåíöèàëüíîì óðàâíåíèè Ïèðñîíà ðàâåí à. Îáîçíà÷èì êàê m = à/b0 > 0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé me − mx , если x > 0, f ( x) = если x ≤ 0. 0, Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ïîêàçàòåëüíûì. Òèï XI. D = 0, λ íå îïðåäåëåíî, b0 + 2b1õ + b2õ2 = b0. Îáîçíà÷èì êàê σ2 = b0. Ïëîòíîñòü âåðîÿòíîñòè ýòîãî òèïà ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ôîðìóëîé f ( x) = 1 2πσ e − x2 2 σ2 , x ∈ (−∞, ∞). Глава 1. Основные понятия теории вероятностей 47 Äàííîå ðàñïðåäåëåíèå ÿâëÿåòñÿ íîðìàëüíûì. Òèï ÕII. Ðàñïðåäåëåíèå ýòîãî òèïà ñîâïàäàåò ñ ðàñïðåäåëåíèåì òèïà I, åñëè â ïîñëåäíåì ðàñïðåäåëåíèè ïîëîæèòü m = –n. Ðàñïðåäåëåíèÿ Ïèðñîíà èñïîëüçóþòñÿ äëÿ ñãëàæèâàíèÿ ðàñïðåäåëåíèé âûáîðî÷íûõ çíà÷åíèé. Ýòà ñèñòåìà ðàñïðåäåëåíèé ïðèìåíÿåòñÿ òàêæå äëÿ ïîäáîðà ðàñïðåäåëåíèÿ ê ýìïèðè÷åñêèì äàííûì òîãäà, êîãäà ïî êàêèì-ëèáî ïðè÷èíàì òðóäíî èëè íåâîçìîæíî îáîñíîâàòü òèï ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè.  ýòîì ñëó÷àå ïî âûáîðêå âû÷èñëÿþòñÿ ïåðâûå ÷åòûðå ìîìåíòà, çàòåì îïðåäåëÿåòñÿ òèï ðàñïðåäåëåíèÿ Ïèðñîíà, çàòåì ìîæíî ïðîâåðèòü ñòåïåíü ñîãëàñîâàííîñòè ýìïèðè÷åñêèõ äàííûõ è ïîëó÷åííîãî ðàñïðåäåëåíèÿ Ïèðñîíà ñ ïîìîùüþ êðèòåðèÿ Êîëìîãîðîâà–Ñìèðíîâà èëè êðèòåðèÿ χ2. 48 Часть I. Основные понятия теории вероятностей и математической статистики Глава 2 Основные статистические методы Ï ðè âûïîëíåíèè ñòàòèñòè÷åñêîãî àíàëèçà íàèáîëåå ÷àñòî â êà÷åñòâå èñõîäíîãî ìàòåðèàëà èñïîëüçóåòñÿ ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ íàáëþäåíèé ñëó÷àéíîé âåëè÷èíû Õ. Äðóãèìè ñëîâàìè, ïðåäïîëàãàåòñÿ, ÷òî èìååòñÿ âåðîÿòíîñòíûé ýêñïåðèìåíò, â êîòîðîì íàáëþäàåòñÿ ñëó÷àéíàÿ âåëè÷èíà Õ, è âûïîëíÿåòñÿ n íåçàâèñèìûõ ðåàëèçàöèé ýòîãî ýêñïåðèìåíòà. Íàáëþäàåìûå çíà÷åíèÿ õ1, õ2, ..., õn íàçûâàþòñÿ ñëó÷àéíîé âûáîðêîé, êîëè÷åñòâî íàáëþäåíèé n — îáúåìîì âûáîðêè. Êàê ñëó÷àéíàÿ âåëè÷èíà Õ, òàê è åå çíà÷åíèÿ ìîãóò áûòü âåêòîðàìè. Ìíîæåñòâî âîçìîæíûõ çíà÷åíèé, êîòîðûå ìîãóò íàáëþäàòüñÿ ïðè ðåàëèçàöèè ýêñïåðèìåíòà, îáðàçóþò âûáîðî÷íîå ïðîñòðàíñòâî, èëè, â äðóãèõ òåðìèíàõ, ãåíåðàëüíóþ ñîâîêóïíîñòü. Ñ òî÷êè çðåíèÿ òåîðèè âåðîÿòíîñòåé âûáîðêà õ1, õ2, ..., õn ÿâëÿåòñÿ ðåàëèçàöèåé íåêîòîðîé ñëó÷àéíîé âåëè÷èíû Õ. Çàäà÷è ìàòåìàòè÷åñêîé ñòàòèñòèêè âîçíèêàþò, êîãäà ôóíêöèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ íåèçâåñòíà, ïðè ýòîì ìåòîäû ñòàòèñòè÷åñêîãî àíàëèçà ïîçâîëÿþò ïîëó÷èòü èíôîðìàöèþ î ðàçëè÷íûõ çàêîíîìåðíîñòÿõ â ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðåæäå ÷åì îïèñûâàòü çàäà÷è ñòàòèñòè÷åñêîãî àíàëèçà, îòìåòèì, ÷òî ïåðåä íåïîñðåäñòâåííûì ïðîâåäåíèåì àíàëèçà äàííûõ, êàê ïðàâèëî, âûïîëíÿåòñÿ ýòàï ïðåäâàðèòåëüíîãî àíàëèçà è îáðàáîòêè ñòàòèñòè÷åñêèõ äàííûõ. Íà ýòîì ýòàïå íåîáõîäèìî ÷åòêî îïðåäåëèòü öåëè àíàëèçà, ïîëó÷èòü è ïåðâè÷íî îáðàáîòàòü äàííûå, îïðåäåëèòü èõ òèï è ñòðóêòóðó, ïîäîáðàòü è îáîñíîâàòü ñòàòèñòè÷åñêèå ìåòîäû, ñ ïîìîùüþ êîòîðûõ ìîæíî äîñòè÷ü öåëåé àíàëèçà, ïîäãîòîâèòü äàííûå äëÿ ïðèìåíåíèÿ âûáðàííûõ ñòàòèñòè÷åñêèõ ìåòîäîâ è òîëüêî ïîñëå ýòîãî âûïîëíèòü íåïîñðåäñòâåííî ñòàòèñòè÷åñêèé àíàëèç äàííûõ. Ýòîò ýòàï, êðîìå ôîðìàëüíûõ ìåòîäîâ àíàëèçà äàííûõ, ÷àñòî âêëþ÷àåò â ñåáÿ íåôîðìàëüíûå ñïîñîáû îöåíêè ýòèõ äàííûõ. Èç ñêàçàííîãî ÿñíî, ÷òî ïðåäâàðèòåëüíûé ýòàï ñòàòèñòè÷åñêîãî àíàëèçà òðåáóåò îòäåëüíîãî ðàññìîòðåíèÿ. Êðîìå òîãî, íà ýòîì ýòàïå òàêæå ïðèìåíÿþòñÿ ñòàòèñòè÷åñêèå ìåòîäû. Ïðåäâàðèòåëüíîìó àíàëèçó ïîñâÿùåíà ãëàâà 8. Çäåñü æå ìû ðàññìîòðèì îáùèå ïîíÿòèÿ è ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè.  çàâèñèìîñòè îò òîãî, êàêîâ êëàññ âîçìîæíûõ ðàñïðåäåëåíèé ãåíåðàëüíîé ñîâîêóïíîñòè è ÷òî íóæíî çíàòü î ôóíêöèè ðàñïðåäåëåíèÿ, âîçíèêàþò ðàçëè÷íûå ñòàòèñòè÷åñêèå çàäà÷è. Ðàññìîòðèì îñíîâíûå èç íèõ. 2.1. Точечное оценивание параметров распределения Ïðåäïîëàãàåòñÿ, ÷òî íåèçâåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ïðèíàäëåæèò íåêîòîðîìó ñåìåéñòâó ðàñïðåäåëåíèé F(u, θ), çàâèñÿùåìó îò íåêîòîðîãî ïàðàìåòðà θ (ïàðàìåòð θ, âîçìîæíî, âåêòîðíûé, ò.å. θ = (θ1, θ2, ..., θk)); òàê, íàïðèìåð, ñåìåéñòâî íîðìàëüíûõ ðàñïðåäåëåíèé çàâèñèò îò äâóõ ïàðàìåòðîâ — ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè. Íóæíî ïî íàáëþäåíèÿì (çíà÷åíèÿì âûáîðêè) îöåíèòü ïàðàìåòð (èëè íåñêîëüêî ïàðàìåòðîâ). Äëÿ ïîñòðîåíèÿ îöåíîê èñïîëüçóþòñÿ ñòàòèñòèêè — ôóíêöèè îò âûáîðî÷íûõ çíà÷åíèé. Ðàñïðîñòðàíåííûìè ïðèìåðàìè ñòàòèñòèê ÿâëÿþòñÿ: âûáîðî÷íîå ñðåäíåå x = 1 n ∑ xi , n i =1 âûáîðî÷íàÿ äèñïåðñèÿ Sn2 = 1 n ∑ ( xi − x )2 , n i =1 âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk = 1 n k ∑ xi , n i =1 âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k = 1 n ∑ ( xi − x )k . n i =1 Íèæå áóäóò ïðèâåäåíû ïðèìåðû äðóãèõ ñòàòèñòèê. ßñíî, ÷òî íå âñÿêàÿ ñòàòèñòèêà ìîæåò ñëóæèòü îöåíêîé íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ. Ïîñêîëüêó ðåçóëüòàòû îïûòîâ ñëó÷àéíû, ëþáàÿ ñòàòèñòèêà ïðåäñòàâëÿåò ñîáîé ñëó÷àéíóþ âåëè÷èíó. ×òîáû ñòàòèñòèêà ìîãëà ñëóæèòü îöåíêîé äàííîãî ïàðàìåòðà θ, íåîáõîäèìî, ÷òîáû ðàñïðåäåëåíèå ýòîé ñòàòèñòèêè áûëî ñîñðåäîòî÷åíî â äîñòàòî÷íîé áëèçîñòè îò íåèçâåñòíîãî çíà÷åíèÿ ïàðàìåòðà θ, ò.å. òàê, ÷òîáû âåðîÿòíîñòü áîëüøèõ îòêëîíåíèé ýòîé ñòàòèñòèêè îò θ áûëà äîñòàòî÷íî ìàëà. Æåëàòåëüíî òàêæå, ÷òîáû òî÷íîñòü îöåíèâàíèÿ óâåëè÷èâàëàñü ïðè óâåëè÷åíèè îáúåìà âûáîðêè.  ñâÿçè ñ ýòèì ââîäÿò ñëåäóþùèå îïðåäåëåíèÿ, õàðàêòåðèçóþùèå îöåíêè. Ïóñòü θ̂ n — íåêîòîðàÿ ñòàòèñòè÷åñêàÿ îöåíêà, ïîëó÷åííàÿ ïî âûáîðêå õ1, õ2, ..., xn è îöåíèâàþùàÿ íåèçâåñòíûé ïàðàìåòð θ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Åñëè îöåíêà îïðåäåëÿåòñÿ îäíèì ÷èñëîì θ̂ n , òî åå íàçûâàþò òî÷å÷íîé; åñëè âû÷èñëÿþòñÿ äâå âåëè÷èíû, θ1n è θ2n, òàêèå, ÷òî θ1n ≤ θ ≤ θ2n, òî òàêóþ îöåíêó äëÿ θ íàçûâàþò èíòåðâàëüíîé (èíòåðâàëüíûå îöåíêè ðàññìîòðåíû â ñëåäóþùåì ðàçäåëå). 2.1.1. Несмещенность оценки Îöåíêà θ̂ n íàçûâàåòñÿ íåñìåùåííîé, åñëè ïðè ëþáîì îáúåìå âûáîðêè åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî îöåíèâàåìîìó ïàðàìåòðó θ: Ì θ̂ n = θ. Ýòî ñâîéñòâî îçíà÷àåò, ÷òî îöåíêà θ̂ n â ñðåäíåì ïðàâèëüíî îöåíèâàåò íåèçâåñòíûé ïàðàìåòð θ; ò.å. åñëè åñòü íåêîòîðîå ìíîæåñòâî îöåíîê äàííîãî ïàðàìåòðà (çíà÷åíèÿ îäíîé è òîé æå ñòàòèñòèêè), òî ñðåäíåå ýòèõ îöåíîê áóäåò ñîâïàäàòü ñ èñòèííûì çíà÷åíèåì ïàðàìåòðà èëè áóäåò ê íåìó áëèçêî. Îòìåòèì, ÷òî âñå âûáîðî÷íûå íà÷àëüíûå ìîìåíòû, âêëþ÷àÿ âûáîðî÷íîå ñðåäíåå, ÿâëÿþòñÿ íåñìåùåííûìè îöåíêàìè ñîîòâåòñòâóþùèõ ìîìåíòîâ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îäíàêî âûáîðî÷íàÿ äèñïåðñèÿ Sn2 ÿâëÿåòñÿ 50 Часть I. Основные понятия теории вероятностей и математической статистики ñìåùåííîé (êàê è äðóãèå öåíòðàëüíûå âûáîðî÷íûå ìîìåíòû): íåòðóäíî ïîêàçàòü, ÷òî MS n2 = n −1 DX . Íî ïîñêîëüêó ïðè n → ∞ ÌSn2 → DX, îöåíêó Sn2 íàçûn âàþò àñèìïòîòè÷åñêè íåñìåùåííîé. Åñëè íåìíîãî èçìåíèòü ñòàòèñòèêó Sn2, òî íîâàÿ îöåíêà äèñïåðñèè áóäåò íåñìåùåííîé: sn2 = n 2 1 n Sn = ∑ ( xi − x )2 . n −1 n − 1 i =1 Îòìåòèì òàêæå, ÷òî äëÿ íåñìåùåííûõ îöåíîê âåëè÷èíà Ì( θ̂ n – θ)2 ñîâïàäàåò ñ äèñïåðñèåé ñòàòèñòèêè θ̂ n . 2.1.2. Эффективность оценки Îöåíêà θ̂ n íàçûâàåòñÿ ýôôåêòèâíîé, åñëè èìååò íàèìåíüøóþ äèñïåðñèþ ñðåäè âñåõ âîçìîæíûõ îöåíîê ïàðàìåòðà θ ïðè ôèêñèðîâàííîì îáúåìå âûáîðêè n. Ýôôåêòèâíîñòü îöåíêè îáåñïå÷èâàåò íàèìåíüøèé ðàçáðîñ âîçìîæíûõ çíà÷åíèé îöåíêè θ̂ n âîêðóã èñòèííîãî çíà÷åíèÿ ïàðàìåòðà θ. Ýôôåêòèâíîñòü îöåíîê ñèëüíî çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè1. Òàê, åñëè ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå, òî âûáîðî÷íûå ñðåäíåå è äèñïåðñèÿ áóäóò ýôôåêòèâíûìè îöåíêàìè. 2.1.3. Состоятельность оценки Îöåíêà θ̂ n íàçûâàåòñÿ ñîñòîÿòåëüíîé, åñëè ïðè íåîãðàíè÷åííîì ðîñòå îáúåìà âûáîðêè äëÿ ïðîèçâîëüíîãî ε > 0 P(| θ̂ n – θ| > ε) → 0 ïðè n → ∞, èëè, êàê ãîâîðÿò, θ̂ n ñòðåìèòñÿ ê θ ïî âåðîÿòíîñòè ïðè n → ∞. Ïîíÿòèÿ ñîñòîÿòåëüíîñòè îöåíêè è íåñìåùåííîñòè (òî÷íåå, àñèìïòîòè÷åñêîé íåñìåùåííîñòè) òåñíî ñâÿçàíû: åñëè îöåíêà θ̂ n ÿâëÿåòñÿ ñîñòîÿòåëüíîé, òî îíà àñèìïòîòè÷åñêè íåñìåùåííàÿ. Îáðàòíîå óòâåðæäåíèå íå âåðíî, ò.å. ñâîéñòâî ñîñòîÿòåëüíîñòè ÿâëÿåòñÿ áîëåå ñèëüíûì, ÷åì óñëîâèå íåñìåùåííîñòè. Îòìåòèì, ÷òî âûáîðî÷íîå ñðåäíåå è âûáîðî÷íàÿ äèñïåðñèÿ ÿâëÿþòñÿ ñîñòîÿòåëüíûìè îöåíêàìè. Íèæå áóäóò ïðèâåäåíû ïðèìåðû âûáîðî÷íûõ ñòàòèñòèê, êîòîðûå ÷àñòî èñïîëüçóþòñÿ â ñòàòèñòè÷åñêîì àíàëèçå, âìåñòå ñ èíòåðâàëüíûìè îöåíêàìè ïàðàìåòðîâ ðàñïðåäåëåíèé, êîòîðûå ñåé÷àñ ðàññìîòðèì. 1 Òî÷íåå, ýôôåêòèâíîñòü îöåíîê îáû÷íî äîêàçûâàåòñÿ (èëè, èíà÷å ãîâîðÿ, ñòðîÿòñÿ ýôôåêòèâíûå îöåíêè) íà îñíîâå ìåòîäà ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ, â êîòîðîì ôóíêöèÿ ïðàâäîïîäîáèÿ îïðåäåëÿåòñÿ èñõîäÿ èç ïðåäïîëîæåíèÿ, ÷òî èçâåñòåí êëàññ ðàñïðåäåëåíèé, êîòîðîìó ïðèíàäëåæèò ðàñïðåäåëåíèå äàííîé ãåíåðàëüíîé ñîâîêóïíîñòè. Глава 2. Основные статистические методы 51 2.2. Интервальное оценивание параметров распределения Òî÷å÷íûå îöåíêè èìåþò òîò íåäîñòàòîê, ÷òî ïî íèì íåëüçÿ ñóäèòü î òî÷íîñòè ïîëó÷åííûõ îöåíîê. Ïîýòîìó âîçíèêàåò çàäà÷à îïðåäåëåíèÿ íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé òàêîãî èíòåðâàëà (θ1, θ2), êîòîðûé ïîêðûâàë áû íåèçâåñòíîå çíà÷åíèå ïàðàìåòðà θ ñ çàäàííîé âåðîÿòíîñòüþ. Ïóñòü Ð(θ1 ≤ θ ≤ θ2) = α, ãäå ñëó÷àéíûé èíòåðâàë (θ1, θ2), êîòîðûé íàçûâàåòñÿ äîâåðèòåëüíûì èíòåðâàëîì, ñ çàäàííîé âåðîÿòíîñòüþ α ñîäåðæèò îöåíèâàåìûé ïàðàìåòð θ. Âåëè÷èíó α íàçûâàþò äîâåðèòåëüíûì óðîâíåì èëè íàäåæíîñòüþ. Âåëè÷èíà δ = (θ1 – θ2)/2 õàðàêòåðèçóåò òî÷íîñòü èíòåðâàëüíîé îöåíêè. Îáû÷íî âåëè÷èíó α áåðóò ðàâíîé 0,95, 0,99 èëè 0,999. Âåëè÷èíó 1 – α íàçûâàþò óðîâíåì çíà÷èìîñòè îòêëîíåíèÿ îöåíêè. Êîíöû äîâåðèòåëüíîãî èíòåðâàëà θ1 è θ2 íàçûâàþò äîâåðèòåëüíûìè ãðàíèöàìè. Îäèí èç ðàñïðîñòðàíåííûõ ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ çàêëþ÷àåòñÿ â ñëåäóþùåì. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåòñÿ íåñìåùåííàÿ òî÷å÷íàÿ îöåíêà θ̂ n ïàðàìåòðà θ. Íàïîìíèì, ÷òî îöåíêà (ñòàòèñòèêà) θ̂ n ÿâëÿåòñÿ ñëó÷àéíîé âåëè÷èíîé. Êàêèì-ëèáî ñïîñîáîì âû÷èñëÿåòñÿ äèñïåðñèÿ ñòàòèñòèêè θ̂ n èëè åå îöåíêà σ̂ 2n . Çàòåì ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà ( θ̂ n – k1 σ̂ n , θ̂ n + k2 σ̂ n ), ãäå k1 è k2 — êîýôôèöèåíòû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþò âûáðàííûé äîâåðèòåëüíûé óðîâåíü è àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè (íàïðèìåð, íîðìàëüíîñòü èëè ñèììåòðè÷íîñòü ðàñïðåäåëåíèÿ). Íî ïîñêîëüêó òàêîé èíòåðâàë îïðåäåëÿåòñÿ íå îäíîçíà÷íî, íàêëàäûâàåòñÿ äîïîëíèòåëüíîå óñëîâèå, ÷òîáû äàííûé èíòåðâàë èìåë ìèíèìàëüíóþ äëèíó. Åñëè ðàñïðåäåëåíèå ñòàòèñòèêè θ̂ n ñèììåòðè÷íî (èëè áëèçêî ê ñèììåòðè÷íîìó), òî â ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë ìèíèìàëüíîé äëèíû ïîëó÷àåòñÿ ïðè k1 = k2. Íà òàêîé îñíîâå ñòðîèòñÿ, â ÷àñòíîñòè, èçâåñòíûé êðèòåðèé Ñòüþäåíòà (ñì. íèæå) äëÿ íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé.  ñàìîì îáùåì ñëó÷àå (ïðè ìèíèìàëüíûõ ïðåäïîëîæåíèÿõ îòíîñèòåëüíî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè) äîâåðèòåëüíûå èíòåðâàëû ìîæíî ïîñòðîèòü íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà èëè äðóãèõ ïîäîáíûõ íåðàâåíñòâ (ñì. ðàçäåë 1.2.4). Îäíàêî òàêèå èíòåðâàëüíûå îöåíêè èìåþò íåáîëüøóþ òî÷íîñòü. Âàæíóþ ðîëü ïðè ïîñòðîåíèè òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê èãðàþò èõ àñèìïòîòè÷åñêèå ñâîéñòâà. ×àñòî ÿâíî èëè íå ÿâíî èñïîëüçóåòñÿ ñëåäóþùàÿ äîñòàòî÷íî îáùàÿ ñõåìà ðàññóæäåíèé [6, ñ. 371]. Ïóñòü èìåþòñÿ íåçàâèñèìûå îäèíàêîâî ðàñïðåäåëåííûå âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn, êîòîðûå ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u). Òðåáóåòñÿ ïî âûáîðêå îöåíèòü ìàòåìàòè÷åñêîå îæèäàíèå G = MY = ∫ g (u )dF (u ) ñëó÷àéíîé âåëè÷èíû Y = g(X). (Åñòåñòâåííî ïðåäïîëîæåíèå î òîì, ÷òî ôóíêöèÿ g òàêîâà, ÷òî ñëó÷àéíàÿ âåëè÷èíà Y èìååò êîíå÷íûé ïåðâûé ìîìåíò.) Ñòàòèñòèêà Gˆ n , îöåíèâàþùàÿ çíà÷åíèå âåëè÷èíû G, âû÷èñëÿåòñÿ ïî ôîðìóëå Gˆ n = 52 1 n ∑ g ( xi ) . Ýòà îöåíêà íåñìåùåíà: n i =1 Часть I. Основные понятия теории вероятностей и математической статистики 1 n 1 n 1 n MGˆ n = ∑ Mg ( xi ) = ∑ Mg (X) = ∑ MY = G. n i =1 n i =1 n i =1 Ïî óñèëåííîìó çàêîíó áîëüøèõ ÷èñåë îíà òàêæå ñîñòîÿòåëüíà2, ò.å. ñ âåðîÿòíîñòüþ 1 ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ âåëè÷èí Gˆ ñõîäèòñÿ ê çíà÷åíèþ G. Åñn ëè åùå ïîòðåáîâàòü, ÷òîáû ñóùåñòâîâàëà äèñïåðñèÿ DY = σ2, òî èç öåíòðàëüíîé ïðåäåëüíîé òåîðåìû äëÿ ñóììû îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ ñëàãàåìûõ ñëåäóåò, ÷òî ñëó÷àéíàÿ âåëè÷èíà Zn = n ˆ 1 n g ( xi ) − G (Gn − G ) = ∑ σ σ n i =1 àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1). Îòñþäà âûòåêàåò, ÷òî ïðè áîëüøèõ n íåðàâåíñòâî σ σ Gˆ n − α < G < Gˆ n + α n n âûïîëíÿåòñÿ ñ âåðîÿòíîñòüþ pα = 2 2π ∫ α 0 − e u2 2 du = 2Ô(α) – 1, ãäå Ô(u) — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ïðè çàäàííîì çíà÷åíèè âåðîÿòíîñòè ðα èç ïîñëåäíåãî ðàâåíñòâà îïðåäåëÿåòñÿ çíà÷åíèå α, â ðåçóëüòàòå ïîëó÷àåì äîâåðèòåëüíûé èíòåðâàë ˆ σ ˆ σ , Gn + α Gn − α , n n êîòîðûé ñîäåðæèò îöåíèâàåìîå çíà÷åíèå G ñ âåðîÿòíîñòüþ ðα. Ïîñòðîåííàÿ èíòåðâàëüíàÿ îöåíêà íå âñåãäà ïðèìåíèìà íà ïðàêòèêå, ïîñêîëüêó çíà÷åíèå äèñïåðñèè σ2 ìîæåò áûòü íåèçâåñòíûì. Îäíàêî ïðè áîëüøèõ n, èñõîäÿ èç òåõ æå ñîîáðàæåíèé, êîòîðûå èçëîæåíû âûøå, èìååì DY = σ 2 ≈ 1 n ∑ ( g ( xi ) − Gˆ n )2 = Sn2 . n i =1 Îøèáêà, âîçíèêàþùàÿ ïðè çàìåíå â ïðèâåäåííûõ âûøå ôîðìóëàõ âåëè÷èíû σ åå îöåíêîé Sn, èìååò áîëåå âûñîêèé ïîðÿäîê ìàëîñòè (ïðè n → ), ÷åì îøèáêà, âîçíèêàþùàÿ ïðè çàìåíå òî÷íîãî ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Zn íîðìàëüíûì ðàñïðåäåëåíèåì. Ïîýòîìó “áåç çàçðåíèÿ ñîâåñòè” â êà÷åñòâå äîâåðèòåëüíîãî èíòåðâàëà äëÿ èñòèííîãî çíà÷åíèÿ G ìîæíî èñïîëüçîâàòü èíòåðâàë Sn ˆ S ˆ , Gn + α n . Gn − α n n Åñëè îäíîâðåìåííî îöåíèâàþòñÿ íåñêîëüêî ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, òî èíîãäà âîçìîæíî ïîñòðîåíèå ìíîãîìåðíûõ (ðàçìåðíîñòü ïî ÷èñëó îöåíèâàåìûõ ïàðàìåòðîâ) äîâåðèòåëüíûõ îáëàñòåé, êîòîðûå ñîäåðæàò íåèçâåñòíûå çíà÷åíèÿ ïàðàìåòðîâ. Îäíàêî ïîñòðîåíèå òàêèõ îáëàñòåé âûçûâàåò îïðåäåëåííûå çàòðóäíåíèÿ, ïîñêîëüêó ñòàòèñòèêè, îöåíèâàþùèå ïàðàìåòðû, íå ÿâëÿþòñÿ íåçàâèñèìûìè ñëó÷àéíûìè âåëè÷èíàìè (ïîýòîìó íåëüçÿ ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü ïðîñòî êàê ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ îòäåëüíûõ ïàðàìåòðîâ). 2 Òî÷íåå, îíà ñèëüíî ñîñòîÿòåëüíà. Глава 2. Основные статистические методы 53 Âìåñòå ñ òåì, åñëè óäàåòñÿ ïîñòðîèòü òàêóþ äîâåðèòåëüíóþ îáëàñòü, êàê ïðàâèëî, îíà çíà÷èòåëüíî áîëåå òî÷íî ëîêàëèçóåò çíà÷åíèÿ íåèçâåñòíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, ÷åì ïðîñòîå ïåðåñå÷åíèå äîâåðèòåëüíûõ èíòåðâàëîâ.  ýòîé êíèãå ìû íå áóäåì ðàññìàòðèâàòü ìíîãîìåðíûå äîâåðèòåëüíûå îáëàñòè. 2.3. Выборочные статистики и интервальные оценки Ïðèâåäåì ïðèìåðû ñòàòèñòèê è äîâåðèòåëüíûå èíòåðâàëû äëÿ íèõ, êîòîðûå íàõîäÿò íàèáîëüøåå ïðèìåíåíèå â ñòàòèñòè÷åñêîì àíàëèçå.  ïîñëåäóþùèõ ÷àñòÿõ êíèãè áóäåò ïîêàçàíà èõ ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ñ èñïîëüçîâàíèåì ñòàòèñòè÷åñêèõ ôóíêöèé èëè ñðåäñòâ Excel. Ïîñêîëüêó ñâîéñòâà ýòèõ ñòàòèñòèê, è îñîáåííî ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ, çàâèñÿò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ïðè èõ îïèñàíèè íåîáõîäèìî óêàçûâàòü ñòàòèñòè÷åñêóþ ìîäåëü, â ðàìêàõ êîòîðîé ïðèìåíèìû äàííûå ñòàòèñòèêè è äîâåðèòåëüíûå èíòåðâàëû. Ñòàòèñòè÷åñêàÿ ìîäåëü îïèñûâàåò àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, òðåáîâàíèÿ ê âûáîðî÷íûì çíà÷åíèÿì (íàïðèìåð, èõ íåçàâèñèìîñòü èëè ìèíèìàëüíûé îáúåì âûáîðêè) è, âîçìîæíî, ñïîñîá ïðåäñòàâëåíèÿ äàííûõ. Ñòàòèñòè÷åñêèå ìîäåëè ìîãóò áûòü ðàçëè÷íûìè äëÿ òî÷å÷íûõ è èíòåðâàëüíûõ îöåíîê. Äàëåå â ýòîì ðàçäåëå ïðåäïîëàãàåòñÿ, ÷òî, åñëè íå óêàçàíî äðóãîå, âñå âûáîðî÷íûå çíà÷åíèÿ íåçàâèñèìû è èìåþò îäèíàêîâîå ðàñïðåäåëåíèå, ò.å. òðåáîâàíèå íåçàâèñèìîñòè âûáîðî÷íûõ çíà÷åíèé âêëþ÷àåòñÿ â ñòàòèñòè÷åñêóþ ìîäåëü îáÿçàòåëüíî. Åñëè êîíêðåòíàÿ âûáîðêà íå ñîîòâåòñòâóåò îïðåäåëåííîé ñòàòèñòè÷åñêîé ìîäåëè, íî âñå ðàâíî íà îñíîâå äàííîé âûáîðêè âû÷èñëÿþòñÿ êàêèå-ëèáî îöåíêè, îïðåäåëÿåìûå â ðàìêàõ òîëüêî ýòîé ñòàòèñòè÷åñêîé ìîäåëè, òî âåñüìà âåðîÿòíî, ÷òî òå âûâîäû, êîòîðûå ìîæíî ñäåëàòü íà îñíîâå ïîëó÷åííûõ îöåíîê, îêàæóòñÿ îøèáî÷íûìè. Çàìåòèì, ÷òî ñòàòèñòè÷åñêèé àíàëèç âûïîëíÿåòñÿ íå ïðîñòî èç-çà ëþáâè ê âû÷èñëåíèÿì, à äëÿ îïðåäåëåííûõ öåëåé, ñðåäñòâîì äîñòèæåíèÿ êîòîðûõ ñëóæèò ñòàòèñòè÷åñêèé àíàëèç. Ïðè÷èíîé áîëüøèíñòâà íåâåðíûõ ñòàòèñòè÷åñêèõ âûâîäîâ, êîòîðûå âåñüìà ÷àñòî ìîæíî âñòðåòèòü íà ïðàêòèêå, ÿâëÿåòñÿ íåïðàâîìåðíîå ïðèìåíåíèå îöåíîê (è ñòàòèñòè÷åñêèõ êðèòåðèåâ, î êîòîðûõ ñêàçàíî íèæå) â ñèòóàöèè, êîãäà âûáîðêà íå óäîâëåòâîðÿåò óñëîâèÿì ñòàòèñòè÷åñêîé ìîäåëè. Ñ äðóãîé ñòîðîíû, ÷àñòî ìîæíî ïðåíåáðå÷ü óìåðåííûìè îòêëîíåíèÿìè îò óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è ïîïûòàòüñÿ ïðèìåíèòü îöåíêè äàííîé ìîäåëè. Ïîýòîìó ïðè îïèñàíèè îöåíîê áóäåì ïîêàçûâàòü âîçìîæíîñòü îñëàáëåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè è óêàçûâàòü ñòåïåíü îòêëîíåíèÿ îò ìîäåëè, ïðè êîòîðîé ñòàòèñòèêè ñîõðàíÿþò ñâîè ñâîéñòâà. Ñäåëàåì åùå îäíî çàìå÷àíèå. Çäåñü ìû íå ðàññìàòðèâàåì ìåòîäû ïîñòðîåíèÿ îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ. Ìû ïðèâîäèì òîëüêî ãîòîâûå ôîðìóëû è ðåêîìåíäàöèè ïî èõ ïðèìåíåíèþ. ×èòàòåëü, êîòîðûé õî÷åò ïîáëèæå ïîçíàêîìèòüñÿ ñ ìåòîäàìè ïîñòðîåíèÿ îöåíîê è äîâåðèòåëüíûõ èíòåðâàëîâ, ìîæåò îáðàòèòüñÿ ê ìíîãî÷èñëåííûì èçäàíèÿì ïî äàííîìó âîïðîñó, ñðåäè êîòîðûõ âûäåëèì [5, 6, 17]. 2.3.1. Статистика для оценивания математического ожидания Точечная оценка Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íîå ìàòåìàòè÷åñêîå îæèäàíèå. Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè 54 Часть I. Основные понятия теории вероятностей и математической статистики êîíå÷íîãî âòîðîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Çäåñü è äàëåå, åñëè íå óêàçàíî äðóãîå, n — îáúåì âûáîðêè. Ñòàòèñòèêà äëÿ îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ: x= 1 n ∑ xi . n i =1 Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå äèñïåðñèÿ: Dx = DX , n ãäå DX — äèñïåðñèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Îòìåòèì òàêæå, ÷òî êîýôôèöèåíò àñèììåòðèè β1 ( x ) ðàñïðåäåëåíèÿ ñòàòèñòèêè x ñâÿçàí ñ êîýôôèöèåíòîì àñèììåòðèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè β1 (X) (ñì. ðàçäåë 1.2.3) çàâèñèìîñòüþ β1 ( x ) = β1 (X) n . Интервальные оценки Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íîé èçâåñòíîé äèñïåðñèåé σ2. Ýòî íàèáîëåå îáùàÿ ñòàòèñòè÷åñêàÿ ìîäåëü.  ðàìêàõ òàêîé ìîäåëè äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ìîæíî ïîñòðîèòü òîëüêî íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà (ñì. ðàçäåë 1.2.4), êîòîðîå â äàííîì ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k σ n ) ≤ 1− 1 . Êîýôôèöèåíò k íàõîäèòñÿ k2 â ñîîòâåòñòâèè ñ çàäàííûì äîâåðèòåëüíûì óðîâíåì α èç ðàâåíñòâà α = 1 – 1/k2: σ σ ,x +k k = 1/ 1 − α . Äîâåðèòåëüíûé èíòåðâàë áóäåò èìåòü âèä x − k . n n Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñèììåòðè÷íîå îäíîìîäàëüíîå ðàñïðåäåëåíèå ñ èçâåñòíîé êîíå÷íîé äèñïåðñèåé σ2.  ýòîé ñòàòèñòè÷åñêîé ìîäåëè ðàñïðåäåëåíèå ñòàòèñòèêè x òàêæå áóäåò ñèììåòðè÷íûì è îäíîìîäàëüíûì3. Ïîýòîìó äëÿ ïîñòðîåíèÿ èíòåðâàëüíûõ îöåíîê ìîæíî âîñïîëüçîâàòüñÿ íåðàâåíñòâîì Ãàóññà, êîòîðîå â äàííîì ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k k= 3 2 1− α σ n ) ≤ 1− 4 . Çíà÷åíèå k çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå 9k 2 , ãäå α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, à äîâåðèòåëüíûé èíòåð- σ n âàë èìååò âèä x − k ,x +k σ . n Ñòàòèñòè÷åñêàÿ ìîäåëü 3. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì è íåèçâåñòíîé äèñïåðñèåé. Îáúåì âûáîðêè n áîëüøå 30. 3 Ê ñîæàëåíèþ, â ýòîé ìîäåëè íåëüçÿ îñâîáîäèòüñÿ îò óñëîâèÿ ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ, ïîñêîëüêó, êàê èçâåñòíî, ñâåðòêà îäíîìîäàëüíûõ ðàñïðåäåëåíèé íå îáÿçàíà áûòü îäíîìîäàëüíûì ðàñïðåäåëåíèåì. Äðóãèìè ñëîâàìè, åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè îäíîìîäàëüíî, òî ðàñïðåäåëåíèå x íå âñåãäà áóäåò îäíîìîäàëüíûì. Глава 2. Основные статистические методы 55  äàííîé ìîäåëè ìîæíî ïîñòðîèòü èíòåðâàëüíûå îöåíêè, îñíîâûâàÿñü íà àñèìïòîòè÷åñêèõ ñâîéñòâàõ ñòàòèñòèêè x (ñì. ðàçäåë 2.2). Ñäåëàåì îáùåå çàìå÷àíèå î òîì, êàêîé îáúåì âûáîðêè ñ÷èòàòü äîñòàòî÷íûì, ÷òîáû ïðèìåíÿòü àñèìïòîòè÷åñêèå îöåíêè.  ëèòåðàòóðå ïî ïðèêëàäíîé ñòàòèñòèêå îáû÷íî óêàçûâàåòñÿ, ÷òî äëÿ ýòîãî äîñòàòî÷íî, ÷òîáû n áûëî áîëüøå 20, 25 èëè 30. Òî÷íóþ íèæíþþ ãðàíèöó äëÿ n îïðåäåëèòü ñëîæíî, ïîñêîëüêó îíà çàâèñèò îò ìíîãèõ ôàêòîðîâ, ïðåæäå âñåãî îò òèïà ðàñïðåäåëåíèÿ.  òåîðèè âåðîÿòíîñòåé ïîêàçàíî (íåðàâåíñòâî ÁåððèÝññååíà è ïîäîáíûå), ÷òî ñêîðîñòü ñõîäèìîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè x ê íîðìàëüíîìó â ðàâíîìåðíîé ìåòðèêå (è äàæå â èíòåãðàëüíûõ ìåòðèêàõ) èìååò ïîðÿ- 1 è ýòîò ïîðÿäîê íåëüçÿ óëó÷øèòü, íå ââîäÿ äîïîëíèòåëüíûõ ïðåäïî n äîê O ëîæåíèé. Îòñþäà ñëåäóåò, ÷òî çíà÷åíèå n äîëæíî áûòü äîñòàòî÷íî áîëüøèì (õîòÿ áû áîëüøå 100). Îäíàêî íà ïðàêòèêå óæå ïðè n ≥ 20 ïîëó÷àþòñÿ äîñòàòî÷íî òî÷íûå îöåíêè.  äàëüíåéøåì, åñëè íå îãîâîðåíî äðóãîå, áóäåì ïðèìåíÿòü àñèìïòîòè÷åñêèå ìåòîäû, êîãäà n ≥ 30. Îäíàêî ñëåäóåò ïîìíèòü, ÷òî êàêîé áû íå áûë îáúåì âûáîðêè, àñèìïòîòè÷åñêèå îöåíêè — ýòî âñåãäà òîëüêî ïðèáëèæåííûå îöåíêè. Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè îöåíîê, êàê ïîêàçàíî â ðàçäåëå 2.2. Äîâåðèòåëü- Sn n íûé èíòåðâàë èìååò âèä x − k ,x +k Sn , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç n óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Îòìåòèì, ÷òî ïðèìåíåíèå âìåñòî íîðìàëüíîãî ðàñïðåäåëåíèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ðàñøèðÿåò äîâåðèòåëüíûé èíòåðâàë, òåì ñàìûì ïîâûøàÿ åãî íàäåæíîñòü. Ïîýòîìó íà ïðàêòèêå îáû÷íî ïðèìåíÿþò äîâåðèòåëüíûé èíòåðâàë, ïîñòðîåííûé ñ ïîìîùüþ ðàñïðåäåëåíèÿ Ñòüþäåíòà, êàê ïîêàçàíî â ðàçäåëå 2.3.6. Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò ïîêàçàíû íèæå. 2.3.2. Статистика для оценивания дисперсии Точечная оценка Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðèâåäåííàÿ íèæå ñòàòèñòèêà ïðèìåíèìà äëÿ ëþáîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåãî êîíå÷íóþ äèñïåðñèþ. Ôîðìóëà äëÿ äèñïåðñèè ñòàòèñòèêè ïðàâîìåðíà ïðè íàëè÷èè êîíå÷íîãî ÷åòâåðòîãî ìîìåíòà ó ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ñòàòèñòèêà äëÿ îöåíêè äèñïåðñèè DX: âûáîðî÷íàÿ äèñïåðñèÿ Sn2 = 1 n ∑ ( xi − x )2 , n i =1 ãäå n — îáúåì âûáîðêè. Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Åå ìàòåìàòè÷åñêîå îæèäàíèå ðàâíî MSn2 = 56 n −1 DX , äèñïåðñèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå n Часть I. Основные понятия теории вероятностей и математической статистики DS n2 = µ 4 − µ 22 2(µ 4 − 2µ 22 ) µ 4 − 3µ 22 µ 4 − µ 22 1 − + = + O 2 n n2 n3 n n , ãäå µr — r-é öåíòðàëüíûé ìîìåíò ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðèâåäåì òàêæå ôîðìóëû äëÿ òðåòüåãî öåíòðàëüíîãî ìîìåíòà ñòàòèñòèêè S n2 è åå êîýôôèöèåíòà àñèììåòðèè β1 ( S n2 ) (ñì. ðàçäåë 1.2.3): M(Sn2 − MS n2 )3 = β1 (Sn2 ) = Íåñìåùåííîé îöåíêîé µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32 1 + O 3 , 2 n n µ 6 − 3µ 2 µ 4 − 6µ 32 + 2µ 32 (µ 4 − µ )n 2 2 äëÿ 1 + O 3/ 2 n äèñïåðñèè . DX áóäåò ñòàòèñòèêà µ −µ 1 1 + O 2 . ( xi − x ) 2 , äèñïåðñèÿ êîòîðîé èìååò ïîðÿäîê Dsn2 = 4 ∑ n − 1 i =1 n n 2 2 Ðàçëè÷èå ìåæäó îöåíêàìè S n è sn èìååò çíà÷åíèå òîëüêî ïðè î÷åíü ìàëûõ sn2 = 2 2 n çíà÷åíèÿõ n. Ïðè n > 10 ðàçíîñòü ìåæäó íèìè ìåíüøå 10%. Ïðèâåäåì åùå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè îöåíêè ñðåäíåêâàäðàòè÷íîãî îòêëîíåíèÿ Sn: µ − µ 22 1 1 + O 2 . MSn = σ + O è DS n = 4 4µ 2 n n n Интервальные оценки Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì. Îáúåì âûáîðêè — íå ìåíåå 50. Åñëè íåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîé äèñïåðñèè ÿâëÿåòñÿ èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèê äëÿ âû÷èñëåíèÿ ìîìåíòîâ ãåíåðàëüíîé ñîâîêóïíîñòè.  ýòîì ñëó÷àå äîâåðèòåëüíûé èíòåðâàë èìååò âèä (S 2 n − kσ( S n2 ), Sn2 + kσ( Sn2 ) ) , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Ô(k) – 1, α — çàäàííûé äîâåðèòåëüíûé óðîâåíü, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå σ(S n2 ) ñòàòèñòèêè S n2 âû÷èñëÿåòñÿ ïî ôîð- µ 4 − S 22 1 n , ãäå µ 4 = ∑ ( xi − x )4 4. n i =1 n Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ äèñïåðñèè êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò ïîêàçàíû íèæå. ìóëå σ(S n2 ) = 4 Ïî ýòîé ôîðìóëå âû÷èñëÿåòñÿ ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå ñòàòèñòèêè Sn2 ñ òî÷íîñòüþ O (1/ n ) . Ìîæíî èñïîëüçîâàòü áîëåå òî÷íóþ ôîðìóëó, íî, êàê ïðàâèëî, ýòîãî íå òðåáóåòñÿ. Глава 2. Основные статистические методы 57 2.3.3. Статистики для оценивания моментов Точечные оценки для начальных моментов Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà. Ñòàòèñòèêà äëÿ îöåíêè íà÷àëüíîãî ìîìåíòà mk ïîðÿäêà k: âûáîðî÷íûé k-é íà÷àëüíûé ìîìåíò mk = 1 n k ∑ xi . n i =1 Ýòà îöåíêà íåñìåùåííàÿ, ýôôåêòèâíàÿ è ñîñòîÿòåëüíàÿ. Ðàñïðåäåëåíèå ñòàòèñòèêè mk àñèìïòîòè÷åñêè íîðìàëüíî. Åå äèñïåðñèÿ: Dmk = m2 k − mk2 . n Точечные оценки для центральных моментов Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ñîîòâåòñòâóþùåãî ïîðÿäêà. Ñòàòèñòèêà äëÿ îöåíêè öåíòðàëüíîãî ìîìåíòà µk ïîðÿäêà k: âûáîðî÷íûé k-é öåíòðàëüíûé ìîìåíò µ k = 1 n ( xi − x ) k . ∑ n i =1 Ýòà îöåíêà àñèìïòîòè÷åñêè íåñìåùåííàÿ: Ì µ k = µk + Î(n–1). Åå äèñïåðñèÿ: µ 2 k − 2kµ k −1µ k +1 − µ k2 + k 2 µ 2 µ 2k −1 1 + O 2 . n n Èíòåðâàëüíûå îöåíêè äëÿ ìîìåíòîâ âûøå âòîðîãî ïîðÿäêà ñòðîÿòñÿ ðåäêî. Åñëè íå äåëàòü ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíûõ ìîìåíòîâ ìîæíî ïîñòðîèòü òîëüêî íà îñíîâå èõ àñèìïòîòè÷åñêîé íîðìàëüíîñòè ïðè äîñòàòî÷íî áîëüøèõ çíà÷åíèÿõ n. Dµ k = 2.3.4. Статистики для оценивания коэффициентов асимметрии и эксцесса Точечные оценки Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûìè ìîìåíòàìè ÷åòâåðòîãî ïîðÿäêà. Íàïîìíèì, ÷òî êîýôôèöèåíò àñèììåòðèè âû÷èñëÿåòñÿ ïî ôîðìóëå β1 = µ3/µ23/2, à êîýôôèöèåíò ýêñöåññà — ïî ôîðìóëå β2 = µ4/µ22 – 3, ãäå µk — öåíòðàëüíûå ìîìåíòû ïîðÿäêà k (ñì. ðàçäåë 1.2.3). Äëÿ ïîëó÷åíèÿ îöåíîê ýòèõ êîýôôèöèåíòîâ âû÷èñëÿþòñÿ âûáîðî÷íûå öåíòðàëüíûå ìîìåíòû µ k = 1 n ∑ ( xi − x )k , êîòîðûå çàòåì n i =1 ïîäñòàâëÿþòñÿ â ïðèâåäåííûå ôîðìóëû âìåñòî µk. Ïîëó÷àåì îöåíêè: β1 = 58 µ3 µ 3 2 , β2 = µ4 −3. µ 22 Часть I. Основные понятия теории вероятностей и математической статистики Ýòè îöåíêè ñîñòîÿòåëüíûå è àñèìïòîòè÷åñêè íåñìåùåííûå: M β1 = β1 + O(n −1 ) , M β2 = β 2 + O (n −1 ) . Îòìåòèì òàêæå, ÷òî D β1 = d= d 1 + O 3/ 2 n n , ãäå 4µ 22 µ 6 − 12µ 2 µ 3µ 5 − 24µ 32 µ 4 + 9µ 32 µ 4 + 35µ 32 µ 32 + 36µ 52 . 4µ 52 Åñëè ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñèììåòðè÷íî, òî d= 4µ 22 µ 6 − 24µ 32 µ 4 + 36µ 52 . 4µ 52 Îòìåòèì òàêæå, ÷òî íà ïðàêòèêå, åñëè âûáîðî÷íîå ðàñïðåäåëåíèå áëèçêî ê íîðìàëüíîìó, äëÿ îöåíêè ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé s1 è s2 êîýôôèöèåíòîâ β1 è β2 èñïîëüçóþò ôîðìóëû s1 = 6(n − 2) 24n(n − 2)(n − 3) , s2 = . (n + 1)(n + 3) (n + 1)2 (n + 3)(n + 5)  ðàçäåëå 9.2 ïîêàçàíî ïðàêòè÷åñêîå ïðèìåíåíèå êîýôôèöèåíòîâ β1 è β2 äëÿ ïîäáîðà ôóíêöèé ðàñïðåäåëåíèé. 2.3.5. Статистика для оценивания медианы Точечная оценка Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè. Íàïîìíèì, ÷òî ìåäèàíîé íàçûâàþò òàêîå çíà÷åíèå m, êîòîðîå äåëèò ðàñïðåäåëåíèå íà äâå ðàâíîâåðîÿòíûå ïîëîâèíû, ò.å. Ð(Õ < m) = P(X ≥ m) = 1/2. Òî÷å÷íàÿ îöåíêà äëÿ ìåäèàíû ñòðîèòñÿ ñëåäóþùèì îáðàçîì. Íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé ñòðîèòñÿ âàðèàöèîííûé ðÿä, ò.å. çíà÷åíèÿ õ1, õ2, ..., õn ðàñïîëàãàþòñÿ â ïîðÿäêå âîçðàñòàíèÿ. Ïîëó÷àåì ïîñëåäîâàòåëüíîñòü õ(1) ≤ õ(2) ≤ ... ≤ õ(n), êîòîðàÿ íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì (î âàðèàöèîííîì ðÿäå ðå÷ü èäåò íèæå, â ðàçäåëå 2.3.9). Åñëè îáúåì âûáîðêè n — íå÷åòíîå ÷èñëî, ò.å. n = 2k + 1, òî â êà÷åñòâå îöåíêè ìåäèàíû âûáèðàåòñÿ çíà÷åíèå õ(k) èç âàðèàöèîííîãî ðÿäà. Åñëè n ÷åòíîå, ò.å. n = 2k , òî â êà÷åñòâå îöåíêè ìåäèàíû âûáèðàåòñÿ ïîëóñóììà çíà÷åíèé õ(k) è õ(k+1) âàðèàöèîííîãî ðÿäà5. Áîëåå ïîäðîáíî ïîëó÷åíèå îöåíêè ìåäèàíû îïèñàíî â ðàçäåëå 8.4. Äàëåå ïðèâåäåì ìåòîäû îöåíèâàíèÿ ïàðàìåòðîâ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé, äëÿ ðåàëèçàöèè êîòîðûõ â Excel ïðåäóñìîòðåíû ñïåöèàëüíûå ôóíêöèè èëè ñðåäñòâà (ñì. ãëàâû 4 è 5). 2.3.6. Оценки параметров нормального распределения Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2. 5  ïðèíöèïå, â ïîñëåäíåì ñëó÷àå â êà÷åñòâå îöåíêè ìåäèàíû ìîæíî âçÿòü ëþáîå çíà÷åíèå èç èíòåðâàëà (õ(k), õ(k+1)). Глава 2. Основные статистические методы 59 Точечные оценки Äëÿ òî÷å÷íîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ m è äèñïåðñèè σ2 èñïîëüçóþòñÿ ñòàòèñòèêè x = 1 n 1 n xi è Sn2 = ∑ ( xi − x )2 , êîòîðûå ÿâëÿþòñÿ íåñìå∑ n i =1 n i =1 ùåííûìè ( S n2 àñèìïòîòè÷åñêè íåñìåùåííàÿ), ýôôåêòèâíûìè è ñîñòîÿòåëüíûìè îöåíêàìè íåèçâåñòíûõ m è σ2. Ôîðìóëû äëÿ äèñïåðñèé ýòèõ ñòàòèñòèê ïðèâåäåíû â ðàçäåëàõ 2.3.1 è 2.3.2. Ñòàòèñòèêà x ðàñïðåäåëåíà ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíè- n ( x − m) / σ èìååò ñòàíäàðòíîå íîð- åì m è äèñïåðñèåé σ2/n, à ñëó÷àéíàÿ âåëè÷èíà ìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà n S /σ2 èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) 2 n ñòåïåíüþ ñâîáîäû (ñì. ðàçäåë 1.5.5). Ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû (ñì. ðàçäåë 1.5.6) èìååò ñëó÷àéíàÿ âåëè÷èíà n − 1( x − m) / S n . Ýòè ñâîéñò- 2 n âà ñòàòèñòèê x è S èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ. Интервальные оценки для математического ожидания Ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ çàâèñèò îò òîãî, èçâåñòíî ëè çíà÷åíèå äèñïåðñèè σ2. Åñëè çíà÷åíèå äèñïåðñèè èçâåñòíî, òî äîâåðèòåëüíûé èíòåðâàë, ñîîòâåòñòâóþùèé äîâåðèòåëüíîìó óðîâíþ σ , ãäå êîýôôèöèåíò k îïðåäåëÿåòñÿ èç óðàâíåíèÿ n n α = 2Ô(k) – 1, Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. ( Excel, êðîìå äðóãèõ ñðåäñòâ, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé Excel ДОВЕРИТ, êîòîðàÿ ïî çàäàííûì çíà÷åíèÿì σ α, σ è n âû÷èñëÿåò âåëè÷èíó k (ñì. ðàçäåë 4.11.2).) n  ñëó÷àå, êîãäà çíà÷åíèå äèñïåðñèè σ2 íåèçâåñòíî, âìåñòî ýòîãî çíà÷åíèÿ èñ1 n ïîëüçóþò âûáîðî÷íóþ äèñïåðñèþ Sn2 = ∑ ( xi − x ) 2 , à çíà÷åíèå êîýôôèöèåíòà k n i =1 îïðåäåëÿåòñÿ èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà α, èìååò âèä x − k σ ,x +k n − 1( x − m) / S n èìååò èìåííî òàêîå ðàñïðåäåëåíèå. Äîâåðèòåëüíûé èíòåðâàë Sn n −1 èìååò âèä x − k ,x +k . n −1 Sn  ãëàâå 10 ïîêàçàíà ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ. Интервальные оценки для дисперсии Ïðåäïîëîæèì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû (ñëó÷àé, êîãäà èçâåñòíî ìàòåìàòè÷åñêîå îæèäàíèå, ðàññìîòðåí â ãëàâå 10). Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà n S n2 /σ2 èìååò 60 Часть I. Основные понятия теории вероятностей и математической статистики ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû, äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì îáðàçîì. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x = 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 è îïðåäåëÿþòñÿ êîýôôèöèåíòû ∑ n i =1 n i =1 tн = Fn−−11 ( β н ) è tв = Fn−−11 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Äîâåðèòåëü- n 2 n 2 S n , Sn . tн tв íûé èíòåðâàë èìååò âèä Òàêæå ìîæíî ïîñòðîèòü äîâåðèòåëüíóþ îáëàñòü äëÿ ñîâìåñòíîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè [7, ñ. 94, 18, ñ. 181]. 2.3.7. Оценка параметра р распределения Бернулли Íàïîìíèì, ÷òî ðàñïðåäåëåíèå Áåðíóëëè îáû÷íî ðàññìàòðèâàåòñÿ êàê ìîäåëü ñëó÷àéíîãî ýêñïåðèìåíòà, â ðåçóëüòàòå êîòîðîãî ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ 1 – p — èñõîä “0” (ñì. ðàçäåë 1.4.2). Öåëüþ ñòàòèñòè÷åñêîãî àíàëèçà îáû÷íî ÿâëÿåòñÿ îïðåäåëåíèå çíà÷åíèÿ âåðîÿòíîñòè ð (âåðîÿòíîñòü ð ÷àñòî íàçûâàþò áèíîìèàëüíîé âåðîÿòíîñòüþ). Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä “1”, è 0 — â ïðîòèâíîì ñëó÷àå. Точечная оценка Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Äèñïåðñèÿ ñòàòèñòèêè p̂ : pˆ = r / n , Dpˆ = p (1 − p) / n , åå âûáîðî÷íàÿ îöåíêà: Sn2 ( pˆ ) = r (n − r ) / n 2 (n − 1) . Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (ñì. ðàçäåë 1.4.3). Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n. Интервальные оценки Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîÿòñÿ èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ . Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α ñòðîèòñÿ ñëåäóþùèì îáðàçîì6. Ñíà÷àëà ïîäñ÷èòûâàåòñÿ âåëè÷èíà r — êîëè÷åñòâî èñõîäîâ “1”, çàòåì îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1,1k 2 ( β н ) è tв = Fk−3,1k 4 ( β в ) , ãäå βí = (1 – α)/2, β â = (1 + α)/2, Fm−1,1 m 2 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè áåòà-ðàñïðåäåëåíèÿ 6 Ïîñêîëüêó ñóùåñòâóåò íåñêîëüêî ðàçëè÷íûõ âàðèàíòîâ ïîñòðîåíèÿ äàííîãî äîâåðèòåëüíîãî èíòåðâàëà, óêàæåì, ÷òî ïðèâåäåííûå íèæå ôîðìóëû âçÿòû èç [4, ñ. 69]. Глава 2. Основные статистические методы 61 ñ ïàðàìåòðàìè m1 è m2 (ñì. ðàçäåë 1.5.9), k1 = r, k2 = n – r + 1, k3 = r + 1, k4 = n – r. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä ( tн , tв ) . Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó áèíîìèàëüíûì ðàñïðåäåëåíèåì è áåòàðàñïðåäåëåíèåì: åñëè Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p, òîãäà Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Fn–k,k+1 — ôóíêöèÿ áåòà-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè. Äîâåðèòåëüíûé èíòåðâàë íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Êàê óêàçûâàëîñü, ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) òî÷å÷íàÿ îöåíêà pˆ = r / n ðàñïðåäåëåíà ïðèáëèæåííî ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì p è äèñïåðñèåé p(1 – p)/n. Ïîýòîìó ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ìîæíî ïîñòðîèòü ñëåäóþùèì îáðàçîì. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n . Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Äàëåå ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë 1 1 1 1 ˆ + k 2 − k pˆ (1 − pˆ )n + k 2 pn ˆ + k 2 + k pˆ (1 − pˆ )n + k 2 pn 2 4 2 4 , n + k2 n + k2 è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + k pˆ − k . n n Çäåñü ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ = p (1 − p) / n çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n . Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Âûáîðêà õ1, õ2, ..., xn ñîñòîèò èç ðåçóëüòàòîâ n ýêñïåðèìåíòîâ, â êàæäîì èç êîòîðûõ ïðîâîäèëîñü N èñïûòàíèé, â êàæäîì èñïûòàíèè ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî ÷èñëó èñõîäîâ “1” â i-ì ýêñïåðèìåíòå. Точечная оценка Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà pˆ = 1 nN n ∑x i . Äèñïåðñèÿ ñòàòèñòèêè p̂ : Dpˆ = p (1 − p) / nN . Ðàñïðåäåëåíèå ñòàòè- i =1 ñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/nN. Интервальные оценки Ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, áîëüøå 30, òî íàèáîëåå ïðîñòîé äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ , êîòîðàÿ çäåñü âû÷èñëÿåòñÿ ïî ôîðìóëå pˆ = 62 1 nN n ∑x i . Ïî çàäàííîìó çíà÷åíèþ äîâåðèòåëüíîãî i =1 Часть I. Основные понятия теории вероятностей и математической статистики óðîâíÿ α èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå êîýôôèöèåíòà k. Äîâåðèòåëüíûé èíòåðâàë èìååò âèä pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + k pˆ − k . nN nN Çäåñü, êàê è â àñèìïòîòè÷åñêèõ îöåíêàõ ïðåäûäóùåé ìîäåëè, ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì è çàìåíà íåèçâåñòíîãî çíà÷åíèÿ äèñïåðñèè Dpˆ = p (1 − p) / nN âåëè÷èíîé pˆ (1 − pˆ ) / nN . Преобразование арксинуса Íåäîñòàòêîì àñèìïòîòè÷åñêèõ äîâåðèòåëüíûõ èíòåðâàëîâ ÿâëÿåòñÿ òî, ÷òî ïðè èõ ïîñòðîåíèè íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n (â ìîäåëè 1) èëè âåëè÷èíîé pˆ (1 − pˆ ) / nN (â ìîäåëè 2). Ñóùåñòâóåò ïðåîáðàçîâàíèå ñòàòèñòèêè p̂ , ðàñïðåäåëåíèå êîòîðîãî ïî÷òè íå çàâèñèò îò íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð. Òàêîå ïðåîáðàçîâàíèå íàçûâàåòñÿ ïðåîáðàçîâàíèåì àðêñèíóñà è èìååò âèä z = arcsin pˆ . Ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû z ïðè- áëèæåííî ðàâíî arcsin p , à äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1/4n. Êðîìå òîãî, ðàñ- ïðåäåëåíèå âåëè÷èíû z áëèæå ê íîðìàëüíîìó, ÷åì ðàñïðåäåëåíèå ñòàòèñòèêè p̂ . Èíîãäà èñïîëüçóþò äðóãîé âàðèàíò ïðåîáðàçîâàíèÿ àðêñèíóñà: y = 2 n arcsin pˆ . Çäåñü äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû ó ïðàêòè÷åñêè íå çàâèñèò îò n è ð è ïðèáëèæåííî ðàâíà 1. Åå ìàòåìàòè÷åñêîå îæèäàíèå ïðèáëèæåííî ðàâíî 2 n arcsin p. Ïðèâåäåííûå ïðåîáðàçîâàíèÿ íå ïðèìåíèìû â ñëó÷àå, êîãäà çíà÷åíèå ð áëèçêî ê 0 èëè 1. Ïðåîáðàçîâàíèå Ýíñêîìáà w = arcsin r + 3/8 (r — êîëè÷åñòâî èñõîn + 1/ 4 äîâ “1”) ëèøåíî ýòîãî íåäîñòàòêà. Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû w ïðèáëèæåííî ðàâíà 1/(4n + 2). Ïðàêòè÷åñêîå ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ íà îñíîâå ïðåîáðàçîâàíèÿ àðêñèíóñà ïîêàçàíî â ãëàâå 10, ðàçäåë 10.8.3. 2.3.8. Оценка параметра λ распределения Пуассона Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (ñì. ðàçäåë 1.4.4). Точечная оценка 1 n ∑ xi áóäåò íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé n i =1 äëÿ íåèçâåñòíîãî ïàðàìåòðà λ. Äèñïåðñèÿ ýòîé îöåíêè: D x = λ/n. Ñëó÷àéíàÿ Âûáîðî÷íîå ñðåäíåå x = Глава 2. Основные статистические методы 63 n âåëè÷èíà ∑x i èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì nλ, à ñëó÷àéíàÿ âå- i =1 ëè÷èíà n / λ ( x − λ ) àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1). Интервальные оценки Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè λ ñòðîÿòñÿ n èëè íà îñíîâå ðàñïðåäåëåíèÿ Ïóàññîíà, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà ∑x i , i =1 èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷è- n / λ ( x − λ) . íû Èñïîëüçîâàíèå ðàñïðåäåëåíèÿ Ïóàññîíà. Åñëè çàäàí äîâåðèòåëüíûé óðîâåíü α è âû÷èñëåíà òî÷å÷íàÿ îöåíêà x = 1 n ∑ xi , òî äàëåå äëÿ ïîñòðîåíèÿ äîâåðèòåëün i =1 íîãî èíòåðâàëà ñ èñïîëüçîâàíèåì ðàñïðåäåëåíèÿ Ïóàññîíà îïðåäåëÿþòñÿ êîýôôèöèåíòû tн = Fk−1 ( β н ) è tв = Fk−1 ( β в ) , ãäå βí = (1 – α)/2, βâ = (1 + α)/2, Fk−1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè χ2-ðàñïðåäåëåíèÿ ñ k = 2(n x + 1) ñòåïåíÿìè ñâî- tн tв , . 2n 2n áîäû (ñì. ðàçäåë 1.5.5). Äîâåðèòåëüíûé èíòåðâàë èìååò âèä Çäåñü èñïîëüçîâàíî ñîîòíîøåíèå ìåæäó ðàñïðåäåëåíèåì Ïóàññîíà è ðàñïðåäåëåíèåì χ2 (ñì. ðàçäåë 1.4.4): Ð(Õ ≤ k) = Ð(Z ≥ 2λ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî çàêîíó Ïóàññîíà ñ ïàðàìåòðîì λ, Z — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ χ2-ðàñïðåäåëåíèå ñ 2(k + 1) ñòåïåíüþ ñâîáîäû. Èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè. Ïðè äîñòàòî÷íî áîëüøîì n ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ λ ñòðîèòñÿ òàêèì îáðàçîì. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α è âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x= 1 n ∑ xi . Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàín i =1 äàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k. Ìîæíî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äâóõ òèïîâ: áîëåå òî÷íûé èíòåðâàë k2 k k2 k − k 2 + 4nx , x + + k 2 + 4nx x + 2 n 2 n 2 n 2 n è áîëåå ïðîñòîé, íî ìåíåå òî÷íûé, èíòåðâàë âèäà x x x −k , x +k . n n Ïðè ïîñòðîåíèè ïåðâîãî äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì, ïðè ïîñòðîåíèè âòîðîãî íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dx = λ / n çàìåíÿåòñÿ âåëè÷èíîé x / n . 64 Часть I. Основные понятия теории вероятностей и математической статистики 2.3.9. Порядковые статистики Ïîðÿäêîâûå (ðàíãîâûå) ñòàòèñòèêè èãðàþò áîëüøóþ ðîëü â ìàòåìàòè÷åñêîé ñòàòèñòèêå. Íà èõ îñíîâå ñòðîÿòñÿ òàê íàçûâàåìûå íåïàðàìåòðè÷åñêèå èëè ñâîáîäíûå îò ðàñïðåäåëåíèÿ ìåòîäû, ò.å. ìåòîäû, êîòîðûå íå çàâèñÿò îò íåèçâåñòíîãî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Íåêîòîðûå òàêèå ìåòîäû áóäóò îïèñàíû íèæå, â ðàçäåëå 2.4. Êðîìå òîãî, ïîðÿäêîâûå ñòàòèñòèêè èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ, àïïðîêñèìèðóþùåé ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè (ñì. ðàçäåë 8.3), äëÿ îöåíèâàíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, êàê ïîêàçàíî íèæå â ýòîì ðàçäåëå, è âî ìíîãèõ äðóãèõ ñòàòèñòè÷åñêèõ ìåòîäàõ. Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ êîíå÷íàÿ âûáîðêà õ1, õ2, ..., xn îáúåìîì n, êîòîðàÿ ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u). Óïîðÿäî÷åííàÿ ïî âîçðàñòàíèþ ïîñëåäîâàòåëüíîñòü âûáîðî÷íûõ çíà÷åíèé õ(1) ≤ õ(2) ≤ ... ≤ õ(n) íàçûâàåòñÿ âàðèàöèîííûì ðÿäîì. Ðàâíûå ìåæäó ñîáîé ÷ëåíû âûáîðêè íóìåðóþòñÿ â ïðîèçâîëüíîì ïîðÿäêå. ×ëåíû âàðèàöèîííîãî ðÿäà õ(i) (i = 1, 2, ..., n) íàçûâàþòñÿ ïîðÿäêîâûìè (ðàíãîâûìè) ñòàòèñòèêàìè. ×èñëî ri = i íàçûâàåòñÿ ðàíãîì ÷ëåíà õ(i). ( ëèòåðàòóðå òàêæå ìîæíî âñòðåòèòü îïðåäåëåíèå ðàíãà êàê ri = i/n.)  ñòàòèñòè÷åñêîì àíàëèçå ÷àñòî èñïîëüçóåòñÿ ñòàòèñòèêà Rn = x(n) – x(1), êîòîðàÿ íàçûâàåòñÿ ðàçìàõîì èëè øèðîòîé âûáîðêè. Ðàñïðåäåëåíèå ïîðÿäêîâûõ ñòàòèñòèê çàâèñèò îò ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, íî âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå èç èíòåðâàëà (õ(i–1), õ(i)), íå çàâèñèò îò ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1).  ÷àñòíîñòè, âåðîÿòíîñòè Ð(Õ < õ(0)) è Ð(Õ > õ(n)) òàêæå ðàâíû 1/(n + 1) [6, ñ. 367]. Оценки квантилей Íàïîìíèì, ÷òî êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð. (Ìåäèàíà ÿâëÿåòñÿ êâàíòèëüþ ïîðÿäêà 0,5). Îöåíêîé íåèçâåñòíîé êâàíòèëè ïîðÿäêà ð ξð ïðèíèìàåòñÿ âûáîðî÷íàÿ ðêâàíòèëü ξ p = õ(k(p)), ãäå k(p) = np, åñëè np — öåëîå ÷èñëî è k(p) = [np] + 1 â ïðîòèâíîì ñëó÷àå7. 2.4. Проверка статистических гипотез Ñòàòèñòè÷åñêîé ãèïîòåçîé íàçûâàåòñÿ óòâåðæäåíèå, âûñêàçàííîå îòíîñèòåëüíî ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èëè íåêîòîðûõ åãî ïàðàìåòðîâ. Îáû÷íî òàêóþ ãèïîòåçó îáîçíà÷àþò êàê Í0 — ýòî íóëåâàÿ (ïðåäëîæåííàÿ) ãèïîòåçà. Ïðîòèâîïîëîæíîå óòâåðæäåíèå — îòðèöàíèå ãèïîòåçû Í0 — íàçûâàåòñÿ êîíêóðèðóþùåé (èëè àëüòåðíàòèâíîé) ãèïîòåçîé è îáîçíà÷àåòñÿ êàê Í1. Ïðèâåäåì íåñêîëüêî ïðèìåðîâ ñòàòèñòè÷åñêèõ ãèïîòåç. Ãèïîòåçà Í0: âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ðàâíîìåðíî ðàñïðåäåëåííîé íà èíòåðâàëå [à, b]. Ãèïîòåçà Í0: âûáîðî÷íûå çíà÷åíèÿ èçâëå÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè, ìàòåìàòè÷åñêîå îæèäàíèå êîòîðîé ëåæèò â ïðåäåëàõ îò à äî b (à è b — àïðèîðíî çàäàííûå ÷èñëà). 7 [m] îáîçíà÷àåò öåëóþ ÷àñòü ÷èñëà m. Глава 2. Основные статистические методы 65 Èìååì ïàðíûå íàáëþäåíèÿ (õ1, ó1), (õ2, ó2), ..., (õn, ón), ÿâëÿþùèåñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (Õ, Y). Ãèïîòåçà Í0: êîìïîíåíòû Õ è Y íåçàâèñèìû. Åñòü äâå âûáîðêè, õ1, õ2, ..., õn è y1, y2, ..., yk, èçâëå÷åííûå èç äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè m1 è m2 ñîîòâåòñòâåííî. Ãèïîòåçà Í0: m1 ≥ m2. Î÷åâèäíî, â êàæäîé êîíêðåòíîé ñèòóàöèè ìîæíî ñôîðìóëèðîâàòü öåëîå ñåìåéñòâî ðàçëè÷íûõ ãèïîòåç. Ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà èç ýòîãî ìíîæåñòâà ãèïîòåç ñëåäóåò âûáðàòü òå ãèïîòåçû, êîòîðûå ñôîðìóëèðîâàíû íàèáîëåå ÷åòêî, íå îñòàâëÿÿ ìåñòà äâîéñòâåííîñòè â óòâåðæäåíèÿõ, è ìàêñèìàëüíî ñîîòâåòñòâóþò öåëè êîíêðåòíîãî èññëåäîâàíèÿ. Ðåêîìåíäóåòñÿ òàêæå âûáèðàòü ïðîñòûå ãèïîòåçû, ñôîðìóëèðîâàííûå îòíîñèòåëüíî îäíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, òàê êàê ñëîæíûå ãèïîòåçû òðåáóþò è ñëîæíûõ êðèòåðèåâ äëÿ ïðîâåðêè èõ èñòèííîñòè. Êðèòåðèé ïðîâåðêè ñòàòèñòè÷åñêîé ãèïîòåçû — ýòî ïðîöåäóðà âûðàáîòêè ðåøåíèÿ î òîì, ïðèíÿòü èëè îòâåðãíóòü äàííóþ ãèïîòåçó. Êðèòè÷åñêîé îáëàñòüþ êðèòåðèÿ (èëè îáëàñòüþ íåïðèíÿòèÿ ãèïîòåçû) ÿâëÿåòñÿ òà ÷àñòü âûáîðî÷íîãî ïðîñòðàíñòâà, êîòîðàÿ ïðèâîäèò ê îòêëîíåíèÿì ãèïîòåçû. Óðîâíåì çíà÷èìîñòè α êðèòåðèÿ ÿâëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ýòîò êðèòåðèé ïðèâåäåò ê îòêëîíåíèþ íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè, ò.å. âåðîÿòíîñòü òîãî, ÷òî ïðè âûïîëíåíèè íóëåâîé ãèïîòåçû ðåçóëüòàòû ïðîâåðîê ïîïàäóò â êðèòè÷åñêóþ îáëàñòü. Åñëè ðåçóëüòàòû ïðîâåðêè íàõîäÿòñÿ â êðèòè÷åñêîé îáëàñòè, òî ãèïîòåçà Í0 îòêëîíÿåòñÿ è ïðèíèìàåòñÿ àëüòåðíàòèâíàÿ ãèïîòåçà Í1. Ïîýòîìó êðèòè÷åñêàÿ îáëàñòü äîëæíà áûòü ðàñïîëîæåíà òàì, ãäå îíà ñîîòâåòñòâóåò êîíêóðèðóþùåé ãèïîòåçå. Ïðè âûáîðå ãèïîòåç íóëåâîé ãèïîòåçîé (ïî ñðàâíåíèþ ñ àëüòåðíàòèâíîé) äîëæíà áûòü òà ãèïîòåçà, êîòîðóþ áîëåå îïàñíî îøèáî÷íî îòâåðãíóòü. Îòêëîíåíèå íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè íàçûâàåòñÿ îøèáêîé ïåðâîãî ðîäà. Ïîýòîìó óðîâåíü çíà÷èìîñòè α åñòü âåðîÿòíîñòü ñîâåðøåíèÿ îøèáêè ïåðâîãî ðîäà. Ïðèíÿòèå ãèïîòåçû Í0, êîãäà îíà íåâåðíà, íàçûâàåòñÿ îøèáêîé âòîðîãî ðîäà. Âåðîÿòíîñòü îøèáêè âòîðîãî ðîäà îáû÷íî îáîçíà÷àþò êàê β. Åñòåñòâåííî ñòðåìëåíèå ìèíèìèçèðîâàòü âåðîÿòíîñòè îøèáîê ïåðâîãî è âòîðîãî ðîäà. Ñíèæàÿ óðîâåíü çíà÷èìîñòè α, òåì ñàìûì ñíèæàåì âåðîÿòíîñòü âîçíèêíîâåíèÿ îøèáêè ïåðâîãî ðîäà, íî â ýòîì ñëó÷àå âîçðàñòàåò âåðîÿòíîñòü β âîçíèêíîâåíèÿ îøèáîê âòîðîãî ðîäà.  ñâÿçè ñ ýòèì ââîäÿò ïîíÿòèå ìîùíîñòè êðèòåðèÿ, êîòîðîå îïðåäåëÿþò êàê âåðîÿòíîñòü îòêëîíåíèÿ íóëåâîé ãèïîòåçû, êîãäà îíà íåâåðíà, ò.å. ìîùíîñòü êðèòåðèÿ ìîæíî îïðåäåëèòü êàê 1 – β. Ýòà âåðîÿòíîñòü çàâèñèò îò ðåàëüíîãî çíà÷åíèÿ ðàññìàòðèâàåìîãî ïàðàìåòðà ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîñêîëüêó ðåàëüíîå çíà÷åíèå ïàðàìåòðà çàðàíåå íå èçâåñòíî, ðàññìàòðèâàþò ôóíêöèþ ìîùíîñòè, êîòîðàÿ ïîêàçûâàåò ñîîòâåòñòâóþùåå çíà÷åíèå ìîùíîñòè êðèòåðèÿ äëÿ êàæäîãî âîçìîæíîãî çíà÷åíèÿ ïàðàìåòðà. Ôóíêöèÿ ìîùíîñòè èãðàåò â òåîðèè ïðîâåðêè ãèïîòåç ôóíäàìåíòàëüíóþ ðîëü. Îíà ïîëíîñòüþ õàðàêòåðèçóåò êðèòåðèé, òàê êàê ïîêàçûâàåò, íàñêîëüêî õîðîøî îí ñîîòâåòñòâóåò ñâîåìó îñíîâíîìó íàçíà÷åíèþ — “óëàâëèâàòü” âîçìîæíûå îòêëîíåíèÿ îò íóëåâîé ãèïîòåçû. ×àñòî âîçìîæíûå çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè, íà îñíîâå êîòîðîé ñòðîèòñÿ êðèòåðèé, ïðèíàäëåæàò íåêîòîðîìó èíòåðâàëó. Òîãäà êðèòè÷åñêàÿ îáëàñòü òàêæå ÿâëÿåòñÿ èíòåðâàëîì. Ãðàíè÷íûå òî÷êè êðèòè÷åñêîé îáëàñòè íàçûâàþòñÿ êðèòè÷åñêèìè çíà÷åíèÿìè. Êðèòè÷åñêèå çíà÷åíèÿ âûáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû ïðè âûáðàííîì óðîâíå çíà÷èìîñòè α ìîùíîñòü êðèòåðèÿ 1 – β áûëà íàèáîëüøåé. 66 Часть I. Основные понятия теории вероятностей и математической статистики Âîçìîæíû òðè âàðèàíòà ðàñïîëîæåíèÿ êðèòè÷åñêîé îáëàñòè, îïðåäåëÿåìûõ âèäîì íóëåâîé è àëüòåðíàòèâíîé ãèïîòåç, à òàêæå ðàñïðåäåëåíèåì êðèòåðèàëüíîé ñòàòèñòèêè θ. 1. Ïðàâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (têð, +∞), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ > têð) = α. Çíà÷åíèå têð íàçûâàåòñÿ ïðàâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ çíà÷èìîñòè α. 2. Ëåâîñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü â âèäå èíòåðâàëà (–∞, têð), ãäå êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ èç ðàâåíñòâà Ð(θ < têð) = α. Çíà÷åíèå têð íàçûâàåòñÿ ëåâîñòîðîííåé êðèòè÷åñêîé òî÷êîé, îòâå÷àþùåé óðîâíþ çíà÷èìîñòè α. 3. Äâóõñòîðîííÿÿ êðèòè÷åñêàÿ îáëàñòü, ñîñòîÿùàÿ èç äâóõ èíòåðâàëîâ (–∞, têð1) è (têð2, +∞), ãäå êðèòè÷åñêèå çíà÷åíèÿ têð1 è têð2 îïðåäåëÿåòñÿ èç ðàâåíñòâ Ð(θ < têð1) = α/2 è Ð(θ > têð2) = α/2. Ýòè çíà÷åíèÿ íàçûâàþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè, îòâå÷àþùèìè óðîâíþ çíà÷èìîñòè α. Íåîáõîäèìî ïîä÷åðêíóòü, ÷òî ñòàòèñòè÷åñêèå êðèòåðèè íà îñíîâàíèè âûáîðî÷íûõ íàáëþäåíèé íå äîêàçûâàþò òó èëè èíóþ ãèïîòåçó. Îíè ïîçâîëÿþò óòâåðæäàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò ïðèíÿòîé ãèïîòåçå. Òàêèì îáðàçîì, âûâîäû, ïðèíèìàåìûå íà îñíîâå ñòàòèñòè÷åñêèõ äàííûõ, ôîðìóëèðóþòñÿ â ñëåäóþùåì âèäå: “ýêñïåðèìåíòàëüíûå äàííûå ñîãëàñóþòñÿ ñ äàííîé ãèïîòåçîé (èëè ïðîòèâîðå÷àò åé)”. Ñëåäóåò ïðåäóïðåäèòü îá îïàñíîñòè, ñâÿçàííîé ñ ïðèìåíåíèåì íåñêîëüêèõ ñòàòèñòè÷åñêèõ êðèòåðèåâ ïðè àíàëèçå îäíèõ è òåõ æå äàííûõ. Åñëè ê îäíèì è òåì æå äàííûì ïðèìåíÿþò äâà ðàçëè÷íûõ êðèòåðèÿ äëÿ ïðîâåðêè îäíîé è òîé æå íóëåâîé ãèïîòåçû (èëè äâóõ ñõîäíûõ ãèïîòåç) è â êàæäîì ñëó÷àå ïðèíèìàåòñÿ óðîâåíü çíà÷èìîñòè, íàïðèìåð, 0,05, òî âåðîÿòíîñòü òîãî, ÷òî õîòÿ áû ïî îäíîìó èç êðèòåðèåâ íóëåâàÿ ãèïîòåçà áóäåò îøèáî÷íî îòêëîíåíà, ïðåâîñõîäèò 0,05. Ñëåäóåò âîñïîëüçîâàòüñÿ ëèøü îäíèì êðèòåðèåì, æåëàòåëüíî áîëåå ìîùíûì. Ñäåëàåì åùå íåêîòîðûå çàìå÷àíèÿ î ïðèìåíåíèè ñòàòèñòè÷åñêèõ êðèòåðèåâ. Âñå ñòàòèñòè÷åñêèå êðèòåðèè äëÿ êîððåêòíîãî ñâîåãî èñïîëüçîâàíèÿ ïðåäïîëàãàþò âûïîëíåíèå íåêîòîðîãî êîìïëåêñà óñëîâèé (íàïðèìåð, óñëîâèÿ íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè), èëè, êàê ãîâîðÿò, êðèòåðèé “ðàáîòàåò” â ðàìêàõ êîíêðåòíîé ñòàòèñòè÷åñêîé ìîäåëè. Íà ïðàêòèêå óñëîâèÿ, íàëàãàåìûå ñòàòèñòè÷åñêîé ìîäåëüþ, ìîãóò è íå âûïîëíÿòüñÿ, ÷òî ïðèâîäèò ê âîçðàñòàíèþ âåðîÿòíîñòè íåïðàâèëüíûõ âûâîäîâ, êîòîðûå äåëàþòñÿ íà îñíîâå òîãî èëè èíîãî êðèòåðèÿ. Äëÿ îäíèõ êðèòåðèåâ ïîäîáíîå ñíèæåíèå íàäåæíîñòè âûâîäîâ ïðîèñõîäèò â áîëüøåé ñòåïåíè, äëÿ äðóãèõ â ìåíüøåé. Óñòîé÷èâûìè (ðîáàñòíûìè) íàçûâàþòñÿ òàêèå êðèòåðèè, äëÿ êîòîðûõ óìåðåííûå îòêëîíåíèÿ îò ïðåäïîëàãàåìîé ñòàòèñòè÷åñêîé ìîäåëè íåçíà÷èòåëüíî âëèÿþò íà íàäåæíîñòü âûâîäîâ. Ìíîãèå êðèòåðèè, îïèñàííûå â ïîñëåäíèõ äâóõ ÷àñòÿõ êíèãè, îñíîâàíû íà ïðåäïîëîæåíèè î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè ýòîì êðèòåðèè ïðîâåðêè ãèïîòåç î ñðåäíèõ çíà÷åíèÿõ â áîëüøèíñòâå ñâîåì óñòîé÷èâû ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè, à êðèòåðèè äëÿ ãèïîòåç î çíà÷åíèÿõ äèñïåðñèè — íåò. Íåêîòîðûå èç êðèòåðèåâ ÿâëÿþòñÿ íåïàðàìåòðè÷åñêèìè èëè ñâîáîäíûìè îò ðàñïðåäåëåíèé. Ïðèìåíåíèå òàêèõ êðèòåðèåâ íå îñíîâûâàåòñÿ íà ïðåäïîëîæåíèÿõ Глава 2. Основные статистические методы 67 î êàêîì-ëèáî êîíêðåòíîì âèäå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðè èññëåäîâàíèè âûáîðêè èç íîðìàëüíî ðàñïðåäåëåííîé ãåíåðàëüíîé ñîâîêóïíîñòè êðèòåðèè ýòîãî òèïà íåñêîëüêî óñòóïàþò ïî ìîùíîñòè ñîîòâåòñòâóþùèì êðèòåðèÿì, ïîñòðîåííûì íà ïðåäïîëîæåíèè î íîðìàëüíîñòè. Îíè îáëàäàþò, îäíàêî, òåì ïðåèìóùåñòâîì, ÷òî ñâîáîäíû îò ïîäîáíîãî ïðåäïîëîæåíèÿ î íîðìàëüíîñòè, ïîýòîìó èõ ìîæíî èñïîëüçîâàòü â ñèòóàöèÿõ, êîãäà âèä ðàñïðåäåëåíèÿ çàðàíåå íå èçâåñòåí. ×òîáû ïîêàçàòü, êàê ñòðîÿòñÿ è êàê “ðàáîòàþò” êðèòåðèè ïðîâåðêè ãèïîòåç, ðàññìîòðèì òðè òèïà êðèòåðèåâ: êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ïàðàìåòðîâ ãåíåðàëüíîé ñîâîêóïíîñòè, êðèòåðèè ïðîâåðêè ãèïîòåç î ðàçëè÷èè (èëè ðàâåíñòâå) ïàðàìåòðîâ íåñêîëüêèõ ãåíåðàëüíûõ ñîâîêóïíîñòåé è êðèòåðèè ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé. Ìíîãî÷èñëåííûå ïðèìåðû äðóãèõ êðèòåðèåâ ïðèâåäåíû â ÷àñòÿõ III è IV êíèãè. 2.4.1. Критерии проверки гипотез о значениях параметров генеральной совокупности Ìíîãèå ïîäîáíûå êðèòåðèè ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ (ñì. ðàçäåë 2.3). Íàïðèìåð, íåîáõîäèìî ïðîâåðèòü ãèïîòåçó, ÷òî íåèçâåñòíîå ìàòåìàòè÷åñêîå îæèäàíèå m ãåíåðàëüíîé ñîâîêóïíîñòè ðàâíî íåêîòîðîìó êîíêðåòíîìó çíà÷åíèþ m0. Ïóñòü íà îñíîâå âûáîðêè ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë (t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α (ò.å. ñ âåðîÿòíîñòüþ α ýòîò èíòåðâàë ñîäåðæèò íåèçâåñòíîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ m). Òîãäà, åñëè èíòåðâàë (t1, t2) ïîêðûâàåò çíà÷åíèå m0 (ò.å. âûïîëíÿþòñÿ íåðàâåíñòâà t1 ≤ m0 ≤ t2), ïðèíèìàåòñÿ âûäâèíóòàÿ ãèïîòåçà ñ óðîâíåì çíà÷èìîñòè 1 – α. Êðèòè÷åñêàÿ îáëàñòü çäåñü ñîñòîèò èç îáúåäèíåíèÿ äâóõ îáëàñòåé: (–∞, t1) è (t2, +∞), t1 è t2 ÿâëÿþòñÿ äâóõñòîðîííèìè êðèòè÷åñêèìè òî÷êàìè. Òàêèì îáðàçîì, ÷òîáû ïðîâåðèòü ãèïîòåçó Í0: m = m0 ñ óðîâíåì çíà÷èìîñòè 1 – α, íåîáõîäèìî ïîñòðîèòü äëÿ çíà÷åíèÿ m äîâåðèòåëüíûé èíòåðâàë (t1, t2) ñ äîâåðèòåëüíûì óðîâíåì α è ïðîâåðèòü âûïîëíåíèå íåðàâåíñòâ t1 ≤ m0 ≤ t2. Åñëè ýòè íåðàâåíñòâà âûïîëíÿþòñÿ, òî ñ âåðîÿòíîñòüþ α ãèïîòåçà Í0 ïðèíèìàåòñÿ. Åñëè õîòÿ áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, òî ãèïîòåçà îòêëîíÿåòñÿ. Àíàëîãè÷íî ñòðîÿòñÿ êðèòåðèè î ïðîâåðêå ãèïîòåç â âèäå íåðàâåíñòâ. Íàïðèìåð, ãèïîòåçà Í0: m ≥ m0.  ýòîì ñëó÷àå íåîáõîäèìî ïîñòðîèòü ïðàâîñòîðîííèé äîâåðèòåëüíûé èíòåðâàë âèäà (t, +∞), êîòîðûé ñîäåðæàë áû çíà÷åíèå m ñ âåðîÿòíîñòüþ α, è ïðîâåðèòü íåðàâåíñòâî t ≥ m0 (t — êðèòè÷åñêîå çíà÷åíèå). Åñëè ýòî íåðàâåíñòâî âûïîëíÿåòñÿ, òî ãèïîòåçà Í0 ïðèíèìàåòñÿ ñ óðîâíåì çíà÷èìîñòè 1 – α.  ïðîòèâíîì ñëó÷àå îíà îòâåðãàåòñÿ. Îáû÷íî â ïîäîáíûõ êðèòåðèÿõ äëÿ óïðîùåíèÿ âû÷èñëåíèé äîâåðèòåëüíûå èíòåðâàëû ñòðîÿòñÿ íå äëÿ íåèçâåñòíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ, à äëÿ óíèôèöèðîâàííîé ñòàòèñòèêè, êîòîðàÿ ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 èìååò èçâåñòíîå ðàñïðåäåëåíèå. Òàêàÿ ñòàòèñòèêà íàçûâàåòñÿ êðèòåðèàëüíîé ñòàòèñòèêîé. Íàïðèìåð, äëÿ êðèòåðèÿ ïðîâåðêè ãèïîòåçû î çíà÷åíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ, ñôîðìóëèðîâàííîé âûøå, âû÷èñëÿåòñÿ ñòàòèñòèêà T = (çäåñü x = 68 n ( x − m0 ) Sn 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 ), êîòîðàÿ â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëå∑ n i =1 n i =1 Часть I. Основные понятия теории вероятностей и математической статистики íèÿ ãåíåðàëüíîé ñîâîêóïíîñòè è ïðè âûïîëíåíèè óñëîâèÿ m = m0 ïîä÷èíÿåòñÿ ðàñïðåäåëåíèþ Ñòüþäåíòà. Òîãäà ãðàíèöàìè êðèòè÷åñêîé îáëàñòè äëÿ êðèòåðèÿ áóäóò ïðîñòî êâàíòèëè ýòîãî ðàñïðåäåëåíèÿ, ïîðÿäîê êîòîðûõ îïðåäåëÿåòñÿ çàäàííûì óðîâíåì çíà÷èìîñòè. Íà òàêîì ïðèíöèïå ïîñòðîåíû ïðèâåäåííûå íèæå êðèòåðèè. Áîëüøóþ ðîëü â òàêèõ êðèòåðèÿõ èãðàþò àïðèîðíûå ïðåäïîëîæåíèÿ î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîýòîìó èñïîëüçîâàíèå êîíêðåòíûõ êðèòåðèåâ ïðîâåðêè ãèïîòåç òðåáóåò îáÿçàòåëüíîãî ñîáëþäåíèÿ óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè, â ðàìêàõ êîòîðîé ïðèìåíèì äàííûé êðèòåðèé. Âî ìíîãèõ ñëó÷àÿõ, ÷òîáû óìåíüøèòü çàâèñèìîñòü êðèòåðèàëüíûõ ñòàòèñòèê îò àïðèîðíûõ ïðåäïîëîæåíèé î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè (à òàêæå â ñëó÷àÿõ, êîãäà ñ òî÷íûìè ðàñïðåäåëåíèÿìè êðèòåðèàëüíûõ ñòàòèñòèê ïî êàêèì-ëèáî ïðè÷èíàì òðóäíî ðàáîòàòü (ñëîæíûå âû÷èñëåíèÿ è ò.ï.)), êðèòåðèè ñòðîÿò íà îñíîâå àñèìïòîòè÷åñêèõ ðàñïðåäåëåíèé ýòèõ ñòàòèñòèê. Ïðè èñïîëüçîâàíèè òàêèõ êðèòåðèåâ ñëåäóåò ïîìíèòü, ÷òî, âî-ïåðâûõ, îíè ðàáîòàþò òîëüêî ïðè äîñòàòî÷íî áîëüøîì îáúåìå âûáîðêè, âî-âòîðûõ, ýòè êðèòåðèè ïðèáëèæåííûå, ñòåïåíü òî÷íîñòè êîòîðûõ óäàåòñÿ îïðåäåëèòü òîëüêî â ðåäêèõ ñëó÷àÿõ. Ïðèâåäåì íåñêîëüêî êðèòåðèåâ ïðîâåðêè çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðûå ñòðîÿòñÿ íà îñíîâå äîâåðèòåëüíûõ èíòåðâàëîâ. Ðàññìîòðèì êðèòåðèè äëÿ ñëó÷àÿ ðàâåíñòâà è íåðàâåíñòâ. Ôîðìû îïèñàíèÿ êðèòåðèåâ, èñïîëüçóåìîé â ýòèõ ïðèìåðàõ, áóäåì ïðèäåðæèâàòüñÿ è äàëåå ïðè îïèñàíèè êðèòåðèåâ â ïîñëåäóþùèõ ãëàâàõ. Критерий проверки значения математического ожидания нормальной совокупности Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ïîä÷èíÿþùåéñÿ íîðìàëüíîìó çàêîíó ðàñïðåäåëåíèÿ ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: µ = m0 Í0: µ ≤ m0 Í0: µ ≥ m0 Í1: µ ≠ m0 Í1: µ > m0 Í1: µ < m0 Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.  êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåì ñòàòèñòèêó T = n ( x − m0 ) , Sn 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòè∑ n i =1 n i =1 ñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Îïðåäåëÿþòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ ïðàâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ. ãäå x = Глава 2. Основные статистические методы 69 Ñëó÷àé â). Îïðåäåëÿåòñÿ ëåâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò. Ýòîò êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. Ïðè ïðîâåðêå ðàâåíñòâà â ñèëó ñèììåòðèè ðàñïðåäåëåíèÿ Ñòüþäåíòà äîñòàòî÷íî ñðàâíèòü |Ò| ñ êâàíòèëåì tâ ïîðÿäêà 1 – α/2. Критерий проверки значения дисперсии нормальной совокупности Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ è ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è íåèçâåñòíîé äèñïåðñèåé σ2. Ãèïîòåçû à) Ðàâåíñòâî 2 2 á) Íåðàâåíñòâî 2 â) Íåðàâåíñòâî Í0: σ = σ0 Í0: σ ≤ σ0 2 Í0: σ2 ≥ σ02 Í1: σ2 ≠ σ02 Í1: σ2 > σ02 Í1: σ2 < σ02 Çäåñü σ02 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå T= (n − 1) S n2 , σ 20 ãäå 1 n ∑ ( xi − x )2 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñn i =1 ïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Îïðåäåëÿþòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ ïðàâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ. Ñëó÷àé â). Îïðåäåëÿåòñÿ ëåâîñòîðîííåå êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò. Êðèòåðèé íå óñòîé÷èâ, åñëè íå âûïîëíÿåòñÿ óñëîâèå íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Sn2 = 2.4.2. Критерии сравнения значений параметров генеральных совокупностей Ïðè ïîñòðîåíèè êðèòåðèåâ ïðîâåðêè ãèïîòåç î ñðàâíåíèè çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèé äâóõ è áîëåå íåçàâèñèìûõ âûáîðîê ïðèìåíÿþòñÿ äâà îñíîâíûõ ïîäõîäà. Ïåðâûé ïîäõîä ïðåäïîëàãàåò, ÷òî ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ñðàâíèâàåìûõ ïàðàìåòðîâ ðàñïðåäåëåíèé è çàòåì íà îñíîâå òî÷å÷íûõ îöåíîê ñòðîèòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà, ðàñïðåäåëåíèå êîòîðîé, êîíå÷íî æå, çàâèñèò îò ðàñïðåäåëåíèé òî÷å÷íûõ îöåíîê. Ãðàíèöû êðèòè÷åñêîé îáëàñòè êðèòåðèÿ ñîñòàâëÿþò êâàíòèëè ðàñïðåäåëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè 70 Часть I. Основные понятия теории вероятностей и математической статистики (ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû), ïîðÿäîê êîòîðûõ îïðåäåëÿåòñÿ çàäàííûì óðîâíåì çíà÷èìîñòè êðèòåðèÿ. Íà òàêîé îñíîâå ïîñòðîåíû ïðèâåäåííûå íèæå íåñêîëüêî êðèòåðèåâ ïðîâåðêè ãèïîòåç î ðàçëè÷èè ìåæäó ìàòåìàòè÷åñêèìè îæèäàíèÿìè äâóõ íîðìàëüíûõ ðàñïðåäåëåíèé (ïðèâåäåíû òàêèå êðèòåðèè, äëÿ êîòîðûõ â Excel ïðåäóñìîòðåíû ñïåöèàëüíûå ñðåäñòâà, îïèñàííûå â ãëàâå 5). Ïðè âòîðîì ïîäõîäå èç èìåþùèõñÿ íåñêîëüêèõ íåçàâèñèìûõ âûáîðîê îáðàçóåòñÿ åäèíàÿ îáùàÿ âûáîðêà è êðèòåðèàëüíàÿ ñòàòèñòèêà ñòðîèòñÿ íà îñíîâå îáùåé âûáîðêè. ×àñòî òàêîé ïîäõîä èñïîëüçóåòñÿ ïðè ïîñòðîåíèè íåïàðàìåòðè÷åñêèõ êðèòåðèåâ. Íèæå äëÿ èëëþñòðàöèè ýòîãî ïîäõîäà ïðèâåäåí íåïàðàìåòðè÷åñêèé êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè äëÿ ñðàâíåíèÿ ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ âûáîðîê. Äðóãèå êðèòåðèè ýòîãî òèïà îïèñàíû â ÷àñòè III. Критерий проверки гипотезы о равенстве математических ожиданий для нормальных совокупностей (случай известных дисперсий) Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Í1: µ1 > µ2 Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x = è çàòåì êðèòåðèàëüíàÿ ñòàòèñòèêà z = (x − y) σ / n + σ 22 / m 2 1 1 n 1 m xi , y = ∑ yi ∑ n i =1 m i =1 . Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |z| ≤ zêð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный z-тест для средних èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.6). Критерий Стьюдента проверки гипотезы о равенстве математических ожиданий для нормальных совокупностей (случай равных дисперсий) Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè, íî ðàâíûìè äèñïåðñèÿìè σ12 = σ22 = σ2 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2. Глава 2. Основные статистические методы 71 Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Í1: µ1 > µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x = 1 n 1 n 1 m 1 m xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 . Ïîñêîëüêó ïðè ∑ n i =1 n i =1 m i =1 m i =1 óñëîâèè ðàâåíñòâà äèñïåðñèé èìåþòñÿ äâå îöåíêè îäíîé è òîé æå âåëè÷èíû σ2, ýòè îöåíêè îáúåäèíÿþò â îäíó îöåíêó S 2 = ñòè ãèïîòåçû Í0 âåëè÷èíà T = x−y 1 1 + S n m (n − 1) S x2 + (m − 1) S y2 (n − 1) + (m − 1) . Ïðè óñëîâèè èñòèííî- èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ýòà âåëè÷èíà Ò ïðèíèìàåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè; îáû÷íî åå âû÷èñëÿþò ïî ôîðìóëå T = n + m − 2( x − y ) n+m (n − 1) S x2 + (m − 1) S y2 nm , îáúå- äèíÿþùåé äâå âûøåïðèâåäåííûå ôîðìóëû âû÷èñëåíèÿ S2 è T. Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. Êðèòåðèé òàêæå óñòîé÷èâ, åñëè äèñïåðñèè ãåíåðàëüíûõ ñîâîêóïíîñòåé íåçíà÷èòåëüíî îòëè÷àþòñÿ, à çíà÷åíèÿ n è m ïðèáëèçèòåëüíî ðàâíû.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с одинаковыми дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.7). Критерий Стьюдента проверки гипотезы о равенстве математических ожиданий для нормальных совокупностей (случай неравных дисперсий) Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Í1: µ1 > µ2 72 Часть I. Основные понятия теории вероятностей и математической статистики Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x = 1 n 1 n xi , S x2 = ∑ ( xi − x ) 2 , ∑ n i =1 n i =1 y= 1 m 1 m yi , S y2 = ∑ ( yi − y ) 2 .  êà÷åñòâå ∑ m i =1 m i =1 êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ àíàëîã z-ñòàòèñòèêè èç êðèòåðèÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ñðåäíèõ äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé ïðè èçâåñòíûõ äèñïåðñèÿõ: T = x−y . Òî÷íîå ðàñïðåäåëåíèå ýòîé ñòàòèñòèêè äîñòàòî÷- S / n + S y2 / m 2 x íî ñëîæíî, íî äîêàçàíî, ÷òî åãî ìîæíî àïïðîêñèìèðîâàòü ðàñïðåäåëåíèåì Ñòüþäåíòà, åñëè âçÿòü ÷èñëî ñòåïåíåé ñâîáîäû ðàâíûì k= ( S x2 / n + S y2 / m)2 2 2 ( S x2 / n) 2 ( S y / m) + n −1 m −1 . Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð. Ýòîò êðèòåðèé, åñëè ñòåïåíü ñâîáîäû ðàñïðåäåëåíèÿ Ñòüþäåíòà âû÷èñëÿåòñÿ ïî ïðèâåäåííîé âûøå ôîðìóëå, ÷àñòî íàçûâàþò êðèòåðèåì Áåðåíñà–Ôèøåðà. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé ïðåäïîëàãàòü, ÷òî äèñïåðñèè íå ðàâíû (êðèòåðèé ïðîâåðêè ðàâåíñòâà äèñïåðñèé îïèñàí íèæå), ñëåäóåò ïðèìåíèòü òî÷íûé êðèòåðèé ïðîâåðêè ñðåäíèõ ïðè ðàâíûõ äèñïåðñèÿõ. Åñëè ñóììà îáúåìîâ âûáîðîê áîëüøå 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî èñïîëüçîâàòü íîðìàëüíîå ðàñïðåäåëåíèå.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с различными дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.8). Критерий Стьюдента проверки гипотезы о равенстве математических ожиданий для зависимых нормальных совокупностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Äâóìåðíàÿ âûáîðêà (õ1, y1), (õ2, y2), ..., (õn, ón) îáúåìîì n èçâëå÷åíà èç äâóìåðíîé íîðìàëüíîé ñîâîêóïíîñòè ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2 êîìïîíåíòîâ âûáîðêè. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Í1: µ1 > µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëÿþòñÿ n ðàçíîñòåé d1 = x1 – y1, d2 = x2 – y2, ..., dn = xn – yn, è ïî íèì îïðåäåëÿþòñÿ Sn2 = ñðåäíåå d = 1 n ∑ di n i =1 è âûáîðî÷íàÿ äèñïåðñèÿ ðàçíîñòåé 1 n d ïðè óñëîâèè èñòèííîñòè (di − d )2 . Êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ n i =1 Sn / n íóëåâîé ãèïîòåçû èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Глава 2. Основные статистические методы 73 Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Парный двухвыборочный t-тест для средних èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.9). Непараметрический критерий Уилкоксона–Манна–Уитни для двух не: зависимых выборок Ýòîò êðèòåðèé ïðèìåíÿåòñÿ òîãäà, êîãäà íåëüçÿ ñäåëàòü îáîñíîâàííûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèé âûáîðîê, ïîñêîëüêó îí ìåíåå ìîùíûé, ÷åì àíàëîãè÷íûå êðèòåðèè, îñíîâàííûå íà ïðåäïîëîæåíèÿõ î êîíêðåòíûõ òèïàõ ðàñïðåäåëåíèé ãåíåðàëüíûõ ñîâîêóïíîñòåé. Êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè ìîæíî ïðèìåíèòü äëÿ ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé. Îäíàêî çàìåòèì, ÷òî ðàññìàòðèâàåìàÿ íóëåâàÿ ãèïîòåçà, ïðîâåðÿåìàÿ ñ ïîìîùüþ äàííîãî êðèòåðèÿ, ñîñòîèò â òîì, ÷òî ãåíåðàëüíûå ñîâîêóïíîñòè îäèíàêîâî ðàñïðåäåëåíû. Åñëè êðèòåðèé îòêëîíÿåò íóëåâóþ ãèïîòåçó, òî ýòî åùå íå ïîçâîëÿåò çàêëþ÷èòü, ÷òî ìàòåìàòè÷åñêèå îæèäàíèÿ îáåèõ âûáîðîê íå ðàâíû. Äëÿ òàêîãî âûâîäà íåîáõîäèìî ïðåäïîëîæèòü, ÷òî ðàññìàòðèâàåìûå ðàñïðåäåëåíèÿ èäåíòè÷íû âî âñåõ îñòàëüíûõ àñïåêòàõ, íàïðèìåð, ÷òî èõ äèñïåðñèè ðàâíû. Íà ïðàêòèêå äîïóñòèìû óìåðåííûå ðàçëè÷èÿ â çíà÷åíèÿõ äèñïåðñèé, òàê êàê êðèòåðèé íåçíà÷èòåëüíî ÷óâñòâèòåëåí ê íèì. Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîâ ñîîòâåòñòâåííî n è m. Ïðåäïîëàãàåòñÿ, ÷òî n, m ≥ 30. Ãèïîòåçû Í0: ãåíåðàëüíûå ñîâîêóïíîñòè îáåèõ âûáîðîê îäèíàêîâî ðàñïðåäåëåíû; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Äëÿ ðåàëèçàöèè ýòîãî êðèòåðèÿ âûïîëíÿþòñÿ ñëåäóþùèå âû÷èñëåíèÿ. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåäèíÿþòñÿ â îäíó îáùóþ âûáîðêó z1, z2, ..., zN, N = n + m. Çíà÷åíèÿ z1, z2, ..., zN ðàññòàâëÿþòñÿ â ïîðÿäêå âîçðàñòàíèÿ. Ïîëó÷àåì âàðèàöèîííûé ðÿä z(1) ≤ z(2) ≤ ... ≤ z(N). Íîìåð i ìåñòîïîëîæåíèÿ z(i) â ýòîì ðÿäó ÿâëÿåòñÿ ðàíãîì äàííîãî çíà÷åíèÿ. Ðàíãè ïðèíèìàþò çíà÷åíèÿ îò 1 äî N. Ñóììèðóþòñÿ ðàíãè òåõ çíà÷åíèé, êîòîðûå ïðèíàäëåæàò ïåðâîé âûáîðêå, è ïîëó÷àåòñÿ ÷èñëî R1. Àíàëîãè÷íî îïðåäåëÿåòñÿ R2 — ñóììà ðàíãîâ âòîðîé âûáîðêè. Åñëè äâà (èëè áîëåå) âûáîðî÷íûõ çíà÷åíèÿ èìåþò îäèíàêîâûå çíà÷åíèÿ, òî êàæäîìó èç íèõ ïðèïèñûâàåòñÿ çíà÷åíèå ðàíãà, ðàâíîå ñðåäíåìó èç ðàíãîâ, êîòîðûå áûëè áû èì ïðèïèñàíû ïðè îòñóòñòâèè ñîâïàäåíèé. Âû÷èñëÿþòñÿ âåëè÷èíû U1 = nm + n(n + 1) m(m + 1) − R1 è U 2 = nm + − R2 , èç êî2 2 òîðûõ âûáèðàåòñÿ íàèáîëüøàÿ, ò.å. U = max(U1, U2). Âû÷èñëÿåòñÿ êðèòåðèàëü- 74 Часть I. Основные понятия теории вероятностей и математической статистики 1 U − nm 2 íàÿ ñòàòèñòèêà T = . Ïðè óñëîâèÿ èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà nm( N + 1) 12 Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ïðèâåäåííàÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Ò ïðèìåíÿåòñÿ ïðè áîëüøèõ âûáîðêàõ. Ïðè ìàëûõ âûáîðêàõ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ âåëè÷èíà U, à êðèòè÷åñêàÿ îáëàñòü îïðåäåëÿåòñÿ ïî ñïåöèàëüíîìó ðàñïðåäåëåíèþ Ìàííà–Óèòíè. Критерий Фишера проверки равенства дисперсий двух независимых выборок из нормально распределенных генеральных совокупностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: σ12 = σ22 Í0: σ12 ≤ σ22 Í1: σ12 ≠ σ22 Çàäàí óðîâåíü çíà÷èìîñòè α. Í1: σ12 > σ22 Äëÿ êàæäîé âûáîðêè âû÷èñëÿþòñÿ âûáîðî÷íûå äèñïåðñèè S x2 = S y2 = 1 n ∑ ( xi − x )2 , n i =1 S2 1 m ( yi − y ) 2 è èõ îòíîøåíèå F = x2 . Ýòî îòíîøåíèå, íàçûâàåìîå äèñïåðñè∑ m i =1 Sy îííûì îòíîøåíèåì Ôèøåðà, âûáèðàåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè è â ñëó÷àå èñòèííîñòè íóëåâîé ãèïîòåçû èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1 (î F-ðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7). Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè F ≤ têð.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный F-тест для дисперсий èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.10). 2.4.3. Критерии проверки гипотез о принадлежности распределения выборки классу распределений Êðèòåðèè ýòîãî òèïà ÿâëÿþòñÿ, âåðîÿòíî, íàèáîëåå ÷àñòî èñïîëüçóåìûìè, ïîñêîëüêó áåç ïðîâåðêè ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè Глава 2. Основные статистические методы 75 êîíêðåòíîìó êëàññó ðàñïðåäåëåíèé ñëîæíî ïîñòðîèòü äîñòàòî÷íî òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ îöåíèâàåìûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ èëè ïîäîáðàòü íàèáîëåå ìîùíûé êðèòåðèé ïðîâåðêè ñôîðìóëèðîâàííûõ ãèïîòåç. Ðàññìîòðèì äâà êðèòåðèÿ äàííîãî òèïà: êðèòåðèé χ2 (òàêæå íàçûâàåìûé êðèòåðèåì ñîãëàñèÿ, êðèòåðèåì ñîãëàñèÿ χ2 èëè êðèòåðèåì Ïèðñîíà) è êðèòåðèé Êîëìîãîðîâà. Ïåðâûé èç íèõ ÿâëÿåòñÿ áîëåå îáùèì, íî, êàê ïðàâèëî, ìåíåå òî÷íûì, ÷åì âòîðîé. Ñ äðóãîé ñòîðîíû, êðèòåðèé Êîëìîãîðîâà ïðèìåíÿåòñÿ òîëüêî äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé. Критерий χ2 Ðàññìîòðèì ïîñëåäîâàòåëüíîñòü íåçàâèñèìûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ìîæåò îñóùåñòâèòüñÿ îäèí èç èñõîäîâ À1, À2, ..., Am ñ âåðîÿòíîñòÿìè ð1, ð2, ..., pm ñîîòâåòñòâåííî ( ∑ i =1 pi = 1 ). Ïóñòü ïðîâåäåíî n èñïûòàíèé, ïðè ýòîì ñîáûm òèå À1 íàáëþäàëîñü ν1 ðàç, ñîáûòèå À2 íàáëþäàëîñü ν2 ðàç è ò.ä., ñîáûòèå Am íàáëþäàëîñü νm ðàç ( ∑ i =1 ν i = n ). Ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû m m η=∑ i =1 m (ν i − npi ) 2 ν2 = ∑ i −n npi i =1 npi ïðè n → ∞ ñòðåìèòñÿ ê ðàñïðåäåëåíèþ χ2 ñ (m – 1) ñòåïåíüþ ñâîáîäû (òåîðåìà Ê. Ïèðñîíà). Ýòî ñâîéñòâî ñëó÷àéíîé âåëè÷èíû η ïîçâîëÿåò âçÿòü åå â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè äëÿ êðèòåðèÿ ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè êëàññó ðàñïðåäåëåíèé. Ðàññìîòðèì ýòîò êðèòåðèé äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé (âñå âàðèàíòû êðèòåðèÿ è èõ ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïðèâåäåíû â ãëàâå 9, ðàçäåë 9.2). Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò k ïàðàìåòðîâ, èç êîòîðûõ k1 ïàðàìåòðîâ íåèçâåñòíî. Ãèïîòåçû Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò k ïàðàìåòðîâ, èç êîòîðûõ k1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. ×òîáû ïîñòðîèòü êðèòåðèàëüíóþ ñòàòèñòèêó, îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé ðàçáèâàåòñÿ íà m íåïåðåñåêàþùèõñÿ èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 = (õ(2), õ(3)), ..., ∆m = (õ(m), õ(m+1)). Ïîäñ÷èòûâàåòñÿ, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé ïîïàëî â êàæäûé èíòåðâàë ∆i. Ïîëó÷àåòñÿ ðÿä ÷àñòîò ν1, ν2, ..., νm (ïðè ýòîì, êîíå÷íî, äîëæíî âûïîëíÿòüñÿ ðàâåíñòâî ν1 + ν2 +...+ νm = n, ãäå n — îáúåì âûáîðêè).  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå ni = npi = n[F(x(i+1)) – F(x(i))] âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò, ò.å. êîëè÷åñòâî ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i) è x(i+1) — ãðàíèöû èíòåðâàëà ∆i. Òåïåðü ìîæíî âû÷èñëèòü êðèòåðèàëüíóþ ñòàòèñòèêó 76 Часть I. Основные понятия теории вероятностей и математической статистики m T =∑ i =1 (ν i − npi ) 2 . Îòìåòèì, ÷òî, ïîñêîëüêó k1 ïàðàìåòðîâ ðàñïðåäåëåíèÿ îïðåäånpi ëÿåòñÿ íà îñíîâå âûáîðî÷íûõ çíà÷åíèé, ðàñïðåäåëåíèå χ2, êîòîðîå àñèìïòîòè÷åñêè èìååò ñòàòèñòèêà Ò, èìååò (m – k1 – 1) ñòåïåíåé ñâîáîäû. Êðèòè÷åñêîå çíà÷åíèå êðèòåðèÿ têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (m – k1 – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ïðîáëåìà âûáîðà êîëè÷åñòâà è ïîñòðîåíèå èíòåðâàëîâ ∆i = (õ(i), õ(i+1)) ðàññìîòðåíû â ðàçäåëå 9.2. Критерий Колмогорова Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåíèå êîòîðîé ïðåäïîëàãàåòñÿ íåïðåðûâíûì. Ãèïîòåçû Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u); Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Êðèòåðèàëüíàÿ ñòàòèñòèêà çäåñü îïðåäåëÿåòñÿ êàê ìàêñèìóì îòêëîíåíèÿ âûáîðî÷íîãî ðàñïðåäåëåíèÿ Fn(u) (ñòðîèòñÿ ïî âûáîðêå) îò ãèïîòåòè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ F(u). Äëÿ âû÷èñëåíèÿ òàêîé ñòàòèñòèêè âûïîëíÿþòñÿ ñëåäóþùèå äåéñòâèÿ. Ïî âûáîðêå õ1, õ2, ..., õn ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Çàòåì âû÷èñëÿþòñÿ òàê íàçûâàåìûå êóìóëÿòèâíûå ðàçíîñòè: è Dm− = F ( x( m ) ) − Dm+ = m − F ( x( m ) ) n m −1 , m = 1, 2, ..., n. Ïîñëå âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèn ñòèêà Dn = max( Dm+ , Dm− ) . Ïðè óñëîâèÿ èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn 1≤ m ≤ n èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Êîëìîãîðîâà–Ñìèðíîâà. Êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî êðèòåðèÿ ïîêàçàíà â ãëàâå 9 (ðàçäåë 9.3). Глава 2. Основные статистические методы 77 Глава 3 Анализ статистических зависимостей  ýòîé ãëàâå ðàññìîòðåíû çàäà÷è è ìåòîäû àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, êîòîðûå âêëþ÷àþò â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ. Íî ïðåæäå ÷åì ïåðåéòè ê ôîðìóëèðîâêå îáùåé è ÷àñòíûõ çàäà÷ ñòàòèñòè÷åñêîãî àíàëèçà çàâèñèìîñòåé, ïðåäñòàâèì âåñüìà îáùóþ ìîäåëü, â ðàìêàõ êîòîðîé ëåã÷å ïîíÿòü è ñôîðìóëèðîâàòü ýòè çàäà÷è. 3.1. Общая модель статистических зависимостей Áîëüøîå êîëè÷åñòâî ïðèðîäíûõ ÿâëåíèé, ÿâëåíèé îáùåñòâåííîé æèçíè, ìîäåëèðîâàíèå òåõíè÷åñêèõ óñòðîéñòâ, òåõíîëîãè÷åñêèõ ïðîöåññîâ è ò.ï. ìîæíî ïðåäñòàâèòü â âèäå ñëåäóþùåé ìàòåìàòè÷åñêîé ìîäåëè, êîòîðàÿ áóäåò îïèñûâàòü âñå ýòè ðàçíîðîäíûå ÿâëåíèÿ è ïðîöåññû. Åñòü íåêîòîðûé îáúåêò (ñèñòåìà, ïðîöåññ, ÿâëåíèå è ò.ä.), íà âõîäå êîòîðîãî íàáëþäàåòñÿ “âõîäíîå” âîçäåéñòâèå Õ, à íà âûõîäå — ðåçóëüòèðóþùàÿ ïåðåìåííàÿ Y. Ñóùåñòâóåò òàêæå ñëó÷àéíîå âîçäåéñòâèå ε íà îáúåêò, íå ïîääàþùååñÿ íåïîñðåäñòâåííîìó èçìåðåíèþ è êîíòðîëþ.  îáùåì âèäå òàêàÿ ñõåìà ïðåäñòàâëåíà íà ðèñ. 3.1. Ïåðåìåííûå Õ, Y, ε â îáùåì ñëó÷àå ÿâëÿþòñÿ âåêòîðíûìè ïåðåìåííûìè ðàçëè÷íûõ ðàçìåðíîñòåé, ò.å. Õ = (õ(1), õ(2), ..., õ(ð)), Y = (y(1), y(2), ..., y(m)), ε = (ε(1), ε(2), ..., ε(k)), ïðè ýòîì âñå èëè íåêîòîðûå êîìïîíåíòû âåêòîðîâ Õ, Y è ε ìîãóò áûòü ôóíêöèÿìè îò âðåìåíè (âðåìåííûìè ïðîöåññàìè). Ðèñ. 3.1. Îáùåå ïðåäñòàâëåíèå îáúåêòà ñî ñëó÷àéíûì âîçäåéñòâèåì Âõîäíàÿ ïåðåìåííàÿ Õ îïèñûâàåò óñëîâèÿ ôóíêöèîíèðîâàíèÿ îáúåêòà (÷àñòü êîìïîíåíòîâ âåêòîðà Õ, êàê ïðàâèëî, ïîääàåòñÿ ðåãóëèðîâàíèþ èëè ÷àñòè÷íîìó óïðàâëåíèþ); â ðàçëè÷íûõ ñòàòèñòè÷åñêèõ ìîäåëÿõ êîìïîíåíòû âåêòîðà Õ íàçûâàþò íåçàâèñèìûìè ïåðåìåííûìè, ôàêòîð-àðãóìåíòàìè, ýêçîãåííûìè, ïðåäèêòîðíûìè (èëè ïðîñòî ïðåäèêòîðàìè, ò.å. ïðåäñêàçûâàòåëÿìè), îáúÿñíÿþùèìè è ò.ä. Êîìïîíåíòû y(1), y(2), ..., y(m) âåêòîðà Y — ýòî âûõîäíûå ïåðåìåííûå, õàðàêòåðèçóþùèå ïîâåäåíèå èëè ðåçóëüòàò ôóíêöèîíèðîâàíèÿ îáúåêòà; â ñòàòèñòè÷åñêèõ ìîäåëÿõ èõ íàçûâàþò çàâèñèìûìè, îòêëèêàìè, ýíäîãåííûìè, ðåçóëüòèðóþùèìè èëè îáúÿñíÿåìûìè ïåðåìåííûìè. Êîìïîíåíòû ε(1), ε(2), ..., ε(k) ñëó÷àéíîãî âåêòîðà ε — ýòî ëàòåíòíûå (ò.å. ñêðûòûå) ñëó÷àéíûå “îñòàòî÷íûå” êîìïîíåíòû, îòðàæàþùèå âëèÿíèå íà Y íåó÷òåííûõ “íà âõîäå” ôàêòîðîâ, à òàêæå ñëó÷àéíûå îøèáêè â èçìåðåíèè àíàëèçèðóåìûõ ïîêàçàòåëåé. Ñðåäè êîìïîíåíòîâ âåêòîðîâ Õ è Y ìîãóò áûòü ïåðåìåííûå ñëåäóþùèõ òèïîâ. • Êîëè÷åñòâåííûå, ò.å. ïðèíèìàþùèå ÷èñëîâûå çíà÷åíèÿ, èçìåðåííûå â îïðåäåëåííîé øêàëå (íàïðèìåð, äåíåæíûé äîõîä è ñáåðåæåíèÿ ñåìüè â ñîöèîëîãèè, ÷èñëåííîñòü ïîïóëÿöèè è ëèíåéíûå ðàçìåðû îñîáè â áèîëîãèè, ïîòðåáëÿåìàÿ ýíåðãèÿ è âûõîäíàÿ ìîùíîñòü â òåõíèêå è ò.ï.). • Ïîðÿäêîâûå (èëè îðäèíàëüíûå), ò.å. ïîçâîëÿþùèå óïîðÿäî÷èâàòü àíàëèçèðóåìûå îáúåêòû ïî ñòåïåíè ïðîÿâëåíèÿ â íèõ èçó÷àåìîãî ñâîéñòâà (óðîâåíü îáðàçîâàíèÿ ðàáîòíèêîâ èëè óðîâåíü æèëèùíûõ óñëîâèé â ñîöèîëîãèè, ñòåïåíü êàêîãî-ëèáî çàáîëåâàíèÿ â ìåäèöèíå è ò.ï.). • Êëàññèôèêàöèîííûå (èëè íîìèíàëüíûå), ïîçâîëÿþùèå ðàçáèâàòü ñîâîêóïíîñòü îáúåêòîâ íà íå ïîääàþùèåñÿ óïîðÿäî÷åíèþ îäíîðîäíûå ïî àíàëèçèðóåìîìó ñâîéñòâó êëàññû (ïðîôåññèÿ ðàáîòíèêà, ìîòèâû ìèãðàöèè â ñîöèîëîãèè, ïîë îñîáè, âèä è ðîä â áèîëîãèè è ò.ä.). Îòìåòèì, ÷òî òèï ïåðåìåííûõ ñóùåñòâåííî âëèÿåò íà âûáîð ïðèìåíÿåìûõ ñòàòèñòè÷åñêèõ ìåòîäîâ. 3.2. Задачи статистического анализа зависимостей Îáùàÿ çàäà÷à ñòàòèñòè÷åñêîãî àíàëèçà çàâèñèìîñòåé ìîæåò áûòü ñôîðìóëèðîâàíà ñëåäóþùèì îáðàçîì: ïî ðåçóëüòàòàì n èçìåðåíèé (Õ1, Y1), (Õ2, Y2), ..., (Õn, Yn) èññëåäóåìûõ ïåðåìåííûõ Õ è Y ïîñòðîèòü òàêóþ ôóíêöèþ f(Õ) (â îáùåì ñëó÷àå Õ è Y ÿâëÿþòñÿ âåêòîðàìè, ôóíêöèÿ f(Õ) — âåêòîðîçíà÷íàÿ), êîòîðàÿ ïîçâîëèëà áû íàèëó÷øèì îáðàçîì, â îïðåäåëåííîì ñìûñëå, âîññòàíàâëèâàòü çíà÷åíèÿ ðåçóëüòèðóþùèõ ïåðåìåííûõ Y = (y(1), y(2), ..., y(m)) ïî çàäàííûì çíà÷åíèÿì âõîäíûõ ïåðåìåííûõ Õ = (õ(1), õ(2), ..., õ(ð)). Äàííàÿ ôîðìóëèðîâêà çàäà÷è íóæäàåòñÿ â óòî÷íåíèÿõ.  ÷àñòíîñòè, ïðåæäå âñåãî íåîáõîäèìî îòâåòèòü íà ñëåäóþùèå âîïðîñû. • Êàêîâî ìàòåìàòè÷åñêîå âûðàæåíèå èñêîìîé çàâèñèìîñòè ìåæäó Õ è Y, çàïèñàííîé â òåðìèíàõ Y, Õ, f(Õ) è ε? •  ñîîòâåòñòâèè ñ êàêèì êðèòåðèåì êà÷åñòâà àïïðîêñèìàöèè áóäåò îïðåäåëÿòüñÿ íàèëó÷øèé ñïîñîá âîññòàíîâëåíèÿ çíà÷åíèé Y? Глава 3. Анализ статистических зависимостей 79 • Ñ êàêîé ïðèêëàäíîé öåëüþ ïðîâîäèòñÿ ñòàòèñòè÷åñêèé àíàëèç, ò.å. äëÿ ðåøåíèÿ êàêèõ êîíêðåòíûõ çàäà÷ áóäåò èñïîëüçîâàíà ïîñòðîåííàÿ â ðåçóëüòàòå àíàëèçà ôóíêöèÿ f(Õ)? Ñ ïîñëåäíåãî âîïðîñà äîëæåí íà÷èíàòüñÿ ëþáîé ñòàòèñòè÷åñêèé àíàëèç çàâèñèìîñòåé — îò îòâåòà íà ýòîò âîïðîñ ñóùåñòâåííî çàâèñÿò ïîñëåäîâàòåëüíîñòü âûïîëíåíèÿ ðàçëè÷íûõ ýòàïîâ àíàëèçà, âûáîð îáùåé ñòðóêòóðû ôóíêöèè f, èíòåðïðåòàöèÿ ïîëó÷åííûõ ñòàòèñòè÷åñêèõ ðåçóëüòàòîâ è ò.ä. Âûäåëèì òðè îñíîâíûõ òèïà êîíå÷íûõ ïðèêëàäíûõ öåëåé (çàäà÷) àíàëèçà çàâèñèìîñòåé, ðàñïîëîæèâ èõ êàê áû ïî íàðàñòàíèþ ñòåïåíè ïðîíèêíîâåíèÿ â ñîäåðæàòåëüíóþ ñóùíîñòü àíàëèçèðóåìîé êîíêðåòíîé çàäà÷è. Òèï 1. Óñòàíîâëåíèå ñàìîãî ôàêòà íàëè÷èÿ (èëè îòñóòñòâèÿ) ñòàòèñòè÷åñêè çíà÷èìîé ñâÿçè ìåæäó Y è Õ. Âûáîð âèäà ôóíêöèè f èãðàåò ïîä÷èíåííóþ ðîëü, è ÷àñòî äàæå íå ñòîèò âîïðîñ î ïîñòðîåíèè ôóíêöèè f. Çàäà÷è ýòîãî òèïà ðåøàþòñÿ ìåòîäàìè êîððåëÿöèîííîãî àíàëèçà, ðàíãîâûõ êîððåëÿöèé è ñ ïîìîùüþ àíàëèçà òàáëèö ñîïðÿæåíèÿ. Òèï 2. Ïðîãíîç (âîññòàíîâëåíèå) çíà÷åíèé ðåçóëüòèðóþùèõ ïåðåìåííûõ Y ïî çàäàííûì çíà÷åíèÿì âûõîäíûõ ïåðåìåííûõ Õ. Çäåñü òàêæå âûáîð ôóíêöèè f èãðàåò ïîä÷èíåííóþ ðîëü, ïîñêîëüêó â äàííîì ñëó÷àå èíòåðåñóþòñÿ ëèøü çíà÷åíèÿìè ôóíêöèè f(Õ), íî íå åå ñòðóêòóðîé, ò.å. ôóíêöèÿ f äîëæíà õîðîøî àïïðîêñèìèðîâàòü “÷èñëîâóþ” çàâèñèìîñòü ìåæäó Y è Õ, íî ñîâñåì íå îáÿçàíà îòðàæàòü “ôèçè÷åñêóþ” ñâÿçü ìåæäó Õ è Y. Òèï 3. Âûÿâëåíèå ïðè÷èííûõ ñâÿçåé ìåæäó âõîäíûìè ïåðåìåííûìè Õ è ðåçóëüòèðóþùèìè ïåðåìåííûìè Y. Òàêàÿ ïîñòàíîâêà çàäà÷è ïðåòåíäóåò íà ïðîíèêíîâåíèå â “ôèçè÷åñêèé ìåõàíèçì” èçó÷àåìûõ ñòàòèñòè÷åñêèõ ñâÿçåé, ò.å. â òîò ñàìûé ìåõàíèçì ïðåîáðàçîâàíèÿ âõîäíûõ ïåðåìåííûõ Õ è ε â ðåçóëüòèðóþùèå ïîêàçàòåëè Y. Çäåñü íà ïåðâûé ïëàí âûõîäèò çàäà÷à ïðàâèëüíîãî îïðåäåëåíèÿ ñòðóêòóðû ôóíêöèè f(Õ), ïðè ýòîì ÷àñòî ïàðàìåòðû, îò êîòîðûõ ìîæåò çàâèñåòü ôóíêöèÿ f, èìåþò îïðåäåëåííóþ “ôèçè÷åñêóþ” èíòåðïðåòàöèþ. Çàäà÷è òèïîâ 2 è 3 ðåøàþòñÿ ìåòîäàìè ðåãðåññèîííîãî è äèñïåðñèîííîãî àíàëèçà, äèñêðèìèíàíòíîãî àíàëèçà è äð. Ïðèâåäåì òàáëèöó ñòàòèñòè÷åñêèõ ìåòîäîâ, êîòîðûå “îáñëóæèâàþò” òîò èëè èíîé òèï çàäà÷ â çàâèñèìîñòè îò ïðèðîäû èçó÷àåìûõ ïåðåìåííûõ. Âèä ðåçóëüòèðóþùèõ ïåðåìåííûõ Y Âèä âõîäíûõ ïåðåìåííûõ Õ Ðàçäåëû ñòàòèñòè÷åñêîãî àíàëèçà Êîëè÷åñòâåííûå Êîëè÷åñòâåííûå Ðåãðåññèîííûé è êîððåëÿöèîííûé àíàëèç Êîëè÷åñòâåííûå Åäèíñòâåííàÿ êîëè÷åñòâåííàÿ ïåðåìåííàÿ, èíòåðïðåòèðóåìàÿ êàê “âðåìÿ” Àíàëèç âðåìåííûõ ðÿäîâ Êîëè÷åñòâåííûå Íåêîëè÷åñòâåííûå (ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå) Äèñïåðñèîííûé àíàëèç Êîëè÷åñòâåííûå Ñìåøàííûå (êîëè÷åñòâåííûå è íåêîëè÷åñòâåííûå) Êîâàðèàöèîííûé àíàëèç, ìîäåëè òèïîëîãè÷åñêîé ðåãðåññèè 80 Часть I. Основные понятия теории вероятностей и математической статистики Îêîí÷àíèå òàáë. Âèä ðåçóëüòèðóþùèõ ïåðåìåííûõ Y Âèä âõîäíûõ ïåðåìåííûõ Õ Ðàçäåëû ñòàòèñòè÷åñêîãî àíàëèçà Íåêîëè÷åñòâåííûå (ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå) Íåêîëè÷åñòâåííûå (ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå) Àíàëèç ðàíãîâûõ êîððåëÿöèé è òàáëèö ñîïðÿæåíèÿ Íåêîëè÷åñòâåííûå (ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå) Êîëè÷åñòâåííûå Äèñêðèìèíàíòíûé àíàëèç, êëàñòåð-àíàëèç, òàêñîíîìèÿ, ðàñùåïëåíèå ñìåñåé ðàñïðåäåëåíèé Ñìåøàííûå (êîëè÷åñòâåííûå è íåêîëè÷åñòâåííûå) Ñìåøàííûå (êîëè÷åñòâåííûå è íåêîëè÷åñòâåííûå) Àïïàðàò ëîãè÷åñêèõ ðåøàþùèõ ôóíêöèé Îïèøåì áîëåå ïîäðîáíî îñíîâíûå çàäà÷è àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé è ìåòîäû èõ ðåøåíèÿ. 3.3. Корреляционный анализ  ýòîì ðàçäåëå ðàññìîòðèì çàäà÷ó óñòàíîâëåíèÿ ñàìîãî ôàêòà íàëè÷èÿ ñòàòèñòè÷åñêè çíà÷èìîé ñâÿçè ìåæäó ïåðåìåííûìè. Ýòî çàäà÷à òèïà I èç ïðåäûäóùåãî ðàçäåëà. Ìåòîäû, ïðèìåíÿåìûå äëÿ åå ðåøåíèÿ, çàâèñÿò îò ïðèðîäû èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ (êîëè÷åñòâåííûå, ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå), îò âûáðàííîãî ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (èíäåêñ èëè êîýôôèöèåíò êîððåëÿöèè, ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè è ò.ï.) è îò êîíêðåòíîé ðåøàåìîé çàäà÷è: òî÷å÷íîå è/èëè èíòåðâàëüíîå îöåíèâàíèå ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè, ïðîâåðêà ãèïîòåçû î çíà÷åíèè ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (êàê ïðàâèëî, ïðîâåðÿåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêè çíà÷èìîì îòëè÷èè ýòîãî ïîêàçàòåëÿ îò íóëÿ). Êîíå÷íî, ìîãóò áûòü ïîñòàâëåíû è äðóãèå êîíêðåòíûå çàäà÷è, íàïðèìåð óñòàíîâëåíèå ñòðóêòóðû ñâÿçåé ìåæäó êîìïîíåíòàìè âõîäíîé ïåðåìåííîé Õ è âûõîäíîé ïåðåìåííîé Y. Îïèøåì âîçìîæíûå ìåòîäû ðåøåíèÿ ïåðå÷èñëåííûõ çàäà÷ â çàâèñèìîñòè îò âèäà èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ. 3.3.1. Анализ зависимостей между количественными переменными Ïðåäñòàâèì äâà ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (êîýôôèöèåíò êîððåëÿöèè è èíäåêñ êîððåëÿöèè), èñïîëüçóåìûõ äëÿ àíàëèçà ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó êîëè÷åñòâåííûìè ïåðåìåííûìè. Коэффициент корреляции Ïóñòü àíàëèçèðóåòñÿ ïàðíàÿ çàâèñèìîñòü ìåæäó ñëó÷àéíûìè ïåðåìåííûìè Õ è Y. Íàïîìíèì (ñì. ðàçäåë 1.2.5), ÷òî êîýôôèöèåíò êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ è Y îïðåäåëÿåòñÿ êàê ρ = cov(X, Y) DX ⋅ DY , ãäå êîâàðèàöèÿ cov(X, Y) âû÷èñëÿåòñÿ ïî ôîðìóëå cov(X, Y) = M[(X – MX)(Y – MY)]. Çíà÷åíèå Глава 3. Анализ статистических зависимостей 81 êîýôôèöèåíòà êîððåëÿöèè ëåæèò ìåæäó –1 è 1. Îí õàðàêòåðèçóåò ñòåïåíü ëèíåéíîé çàâèñèìîñòè ìåæäó âåëè÷èíàìè X è Y. Ïðèâåäåì òî÷å÷íûå è èíòåðâàëüíûå îöåíêè âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè. Точечные оценки Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà. Íèæå ïðèâåäåíà ñòàòèñòèêà äëÿ îöåíêè êîýôôèöèåíòà êîððåëÿöèè: n ∑ ( x − x )( y i r= i − y) i =1 n , n ∑ (x − x) ⋅ ∑ ( y 2 i i =1 ãäå x = i − y) 2 i =1 1 n 1 n xi , y = ∑ yi . ∑ n i =1 n i =1 Ðàñïðåäåëåíèå ýòîé ñòàòèñòèêè â îáùåì ñëó÷àå äîñòàòî÷íî ñëîæíî è çàâèñèò îò íåèçâåñòíîãî çíà÷åíèÿ êîýôôèöèåíòà êîððåëÿöèè ρ. Äëÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè èçâåñòíî íîðìàëèçóþùåå z-ïðåîáðàçîâàíèå Ôèøåðà z= 1 1+ r ln , çàìå÷àòåëüíîå òåì, ÷òî ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû z íå çà2 1− r âèñèò îò íåèçâåñòíîãî êîýôôèöèåíòà êîððåëÿöèè. Êðîìå òîãî, óæå ïðè n ≥ 20 ýòî ðàñïðåäåëåíèå áëèçêî ê íîðìàëüíîìó, ïðè÷åì Mz = 1 1+ r r 3 − r2 + + ... , ln 1 − 2 1 − r 2(n − 3) 4(n − 3) Dz = 1 r2 2 − 6r 2 + 3r 4 − − + ... , 1 2 6(n − 3) n − 3 2(n − 3) β1 ( z ) = r6 [M( z − Mz )3 ]2 = + ... , (Dz )3 (n − 3) 2 β 2 ( z) = M( z − Mz )4 2 2r 2 − 3r 4 = + + + ... . 3 n − 3 (n − 3)2 (Dz ) 2 Çäåñü β1(z) — êîýôôèöèåíò àñèììåòðèè, β2(z) — êîýôôèöèåíò ýêñöåññà ñëó÷àéíîé âåëè÷èíû z. Îòìåòèì, ÷òî ïðè âû÷èñëåíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè ñëó÷àéíîé âåëè÷èíû z â ïðèâåäåííûõ âûøå ôîðìóëàõ îáû÷íî îãðàíè÷èâàþòñÿ ëèøü ïåðâûìè ñëàãàåìûìè, ò.å. ïîëàãàþò, ÷òî Mz = 1 1+ r 1 ln è Dz = . 2 1− r n−3 Интервальные оценки для коэффициента корреляции Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà ( z − Mz ) / Dz ðàñïðåäåëåíà ïðèáëèæåííî ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, ýòî ñâîéñòâî èñïîëüçóåòñÿ ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà êîððåëÿöèè. Åñëè 82 Часть I. Основные понятия теории вероятностей и математической статистики çàäàí äîâåðèòåëüíûé óðîâåíü α, èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ êîýôôèöèåíò k. Çàòåì âû÷èñëÿþòñÿ ãðàíèöû z1 è z2 äîâåðèòåëüíîãî èíòåðâàëà äëÿ z: z1 = 1 1+ r k 1 1+ r k ln − + è z2 = ln . 2 1− r 2 1− r n−3 n−3 Îòñþäà â ðåçóëüòàòå îáðàòíîãî ïðåîáðàçîâàíèÿ Ôèøåðà âû÷èñëÿþòñÿ ãðàíèöû r1 è r2 äîâåðèòåëüíîãî èíòåðâàëà (r1, r2) äëÿ êîýôôèöèåíòà êîððåëÿöèè: r1 = e 2 z1 − 1 e 2 z2 − 1 = r è . 2 e2 z1 + 1 e 2 z2 + 1 Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ïîêàçàíà â ãëàâå 13.  ýòîé æå ãëàâå ïðèâåäåíû êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè. Индекс корреляции и коэффициент детерминации Èíäåêñ êîððåëÿöèè ïðèìåíÿåòñÿ â ìîäåëè Y(Õ) = f(X) + ε, ãäå ε — ñëó÷àéíàÿ ïåðåìåííàÿ, à ïåðåìåííàÿ Õ ìîæåò áûòü âåêòîðîì. Òàêèì îáðàçîì, èíäåêñ êîððåëÿöèè ìîæíî ïðèìåíÿòü òàì, ãäå íå ïðèìåíèì “ñòàíäàðòíûé” êîýôôèöèåíò êîððåëÿöèè, èñïîëüçóåìûé äëÿ àíàëèçà ïàðíûõ íàáëþäåíèé. Îáîçíà÷èì ÷åðåç σ 2Y îáùóþ äèñïåðñèþ ñëó÷àéíîé âåëè÷èíû Y, ÷åðåç σ 2f — äèñïåðñèþ ôóíêöèè f(X), à ÷åðåç σ ε2 — îñòàòî÷íóþ äèñïåðñèþ, îïðåäåëÿåìóþ ñëó÷àéíîé âåëè÷èíîé ε (ôîðìóëû äëÿ âû÷èñëåíèÿ ýòèõ äèñïåðñèé ïðèâåäåíû â ðàçäåëå 3.4.3). Ýòè òðè äèñïåðñèè ñâÿçàíû ðàâåíñòâîì σ 2Y = σ 2f + σ ε2 . Èíäåêñîì êîððåëÿöèè IYX íàçûâàåòñÿ âåëè÷èíà, îïðåäåëÿåìàÿ ñîîòíîøåíèåì 2 I YX = σ 2f σ 2Y = 1− σ ε2 . Î÷åâèäíî, ÷òî 0 ≤ IYX ≤ 1. Åñëè IYX = 0, òîãäà σ 2f = 0 èëè, ÷òî σ 2Y òî æå ñàìîå, σ 2Y = σ ε2 . Ýòî îçíà÷àåò ïîëíîå îòñóòñòâèå êàêîãî-ëèáî âëèÿíèÿ ïåðåìåííîé Õ íà ïåðåìåííóþ Y, ò.å. îòñóòñòâèå êîððåëÿöèîííîé ñâÿçè ìåæäó Õ è Y. Åñëè æå IYX = 1, òî σ ε2 = 0 . Ýòî îçíà÷àåò íàëè÷èå ÷èñòî ôóíêöèîíàëüíîé çàâèñèìîñòè ìåæäó ïåðåìåííûìè Õ è Y. Êâàäðàò èíäåêñà êîððåëÿöèè ïîêàçûâàåò, êàêàÿ äîëÿ äèñïåðñèè ðåçóëüòèðóþùåé âåëè÷èíû Y îïðåäåëÿåòñÿ (äåòåðìèíèðóåòñÿ) âàðèàöèåé (äèñïåðñèåé) ôóíêöèè f(X), çàâèñÿùåé îò âëèÿþùåé ïåðåìåííîé Õ. Ïîýòîìó êâàäðàò èíäåêñà êîððåëÿöèè ÷àñòî íàçûâàþò êîýôôèöèåíòîì äåòåðìèíàöèè è îáîçíà÷àþò êàê R2. Ýòîò êîýôôèöèåíò èñïîëüçóåòñÿ êàê ìåðà àäåêâàòíîñòè ïîäáîðà ôóíêöèè ðåãðåññèè äëÿ àïïðîêñèìàöèè èñõîäíûõ äàííûõ (ñì. ðàçäåë 3.4.3). 3.3.2. Анализ зависимостей между порядковыми переменными Íàïîìíèì, ÷òî ïîðÿäêîâûìè (îðäèíàëüíûìè) íàçûâàþò âåëè÷èíû, çíà÷åíèÿ êîòîðûõ ìîæíî ðàíæèðîâàòü â ñîîòâåòñòâèè ñ íåêîòîðîé çàäàííîé øêàëîé. Òàêèì îáðàçîì, çíà÷åíèÿìè ïîäîáíûõ âåëè÷èí ñ÷èòàþòñÿ ðàíãè, ïðèñâîåííûå èì â ñîîòâåòñòâèè ñ ýòîé øêàëîé. Êëàññè÷åñêèìè ïðèìåðàìè òàêèõ âåëè÷èí ÿâëÿþòñÿ óðîâåíü îáðàçîâàíèÿ ðàáîòíèêîâ â ñîöèîëîãèè, óðîâåíü èñïîëüçîâàíèÿ âûñîêèõ òåõíîëîãèé â ïðîìûøëåííîñòè êàêîãî-ëèáî ðåãèîíà èëè ñòðàíû â öåëîì, Глава 3. Анализ статистических зависимостей 83 ñòåïåíü ýôôåêòèâíîñòè íåêîåãî ìåäèöèíñêîãî ïðåïàðàòà äëÿ ëå÷åíèÿ ðÿäà çàáîëåâàíèé è ò.ï. Êîëè÷åñòâåííûå âåëè÷èíû ÿâëÿþòñÿ ÷àñòíûì ñëó÷àåì ïîðÿäêîâûõ. Ñãðóïïèðîâàííûå êîëè÷åñòâåííûå âåëè÷èíû òàêæå ìîæíî ðàññìàòðèâàòü êàê ïîðÿäêîâûå âåëè÷èíû. (Èìåííî ïîýòîìó ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè, îïèñàííûå íèæå, ÷àñòî ïðèìåíÿþòñÿ è äëÿ àíàëèçà çàâèñèìîñòåé ìåæäó êîëè÷åñòâåííûìè ïåðåìåííûìè.) Åñëè äëÿ àíàëèçà ïðåäîñòàâëÿåòñÿ âûáîðêà, íå ïðåîáðàçîâàííàÿ â ðàíãè, òî ñíà÷àëà ýòó âûáîðêó íåîáõîäèìî ïðåîáðàçîâàòü ñëåäóþùèì îáðàçîì. Ïóñòü íàáëþäàåòñÿ äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X, Y).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x1, y1), (x2, y2), ..., (xn, yn). Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi). Òàêèì îáðàçîì, âìåñòî èñõîäíîé âûáîðêè èìååì ñîâîêóïíîñòü äâóìåðíûõ çíà÷åíèé (r1, q1), (r2, q2), ..., (rn, qn). Ðàíãè ïðèñâàèâàþòñÿ çíà÷åíèÿì xi è yi íåçàâèñèìî ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(n) (ñì. ðàçäåë 2.3.9). ×èñëî i ÷ëåíà âàðèàöèîííîãî ðÿäà õ(i) áóäåò ðàíãîì ñîîòâåòñòâóþùåãî âûáîðî÷íîãî çíà÷åíèÿ. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. Íàïðèìåð, ïóñòü çíà÷åíèÿ õ(k), õ(k+1) è õ(k+2) ðàâíû ìåæäó ñîáîé, òîãäà îíè ïîëó÷àþò îäèí è òîò æå ðàíã (k + k + 1 + k + 2)/3 = k + 1. Ïîýòîìó íåêîòîðûå ðàíãè ìîãóò áûòü äðîáíûìè. Äàëåå áóäåì ïðåäïîëàãàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ (r1, q1), (r2, q2), ..., (rn, qn) ÿâëÿþòñÿ ðàíãàìè. Äëÿ îöåíèâàíèÿ ñòåïåíè çàâèñèìîñòè ìåæäó ïîðÿäêîâûìè ñëó÷àéíûìè âåëè÷èíàìè ðàçðàáîòàíû ñïåöèàëüíûå ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè. Íà ïðàêòèêå íàèáîëåå ÷àñòî èñïîëüçóåòñÿ ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà. Ранговый коэффициент корреляции Спирмена Ýòîò êîýôôèöèåíò êîððåëÿöèè âû÷èñëÿåòñÿ ïî ôîðìóëå n 6 (ri − qi )2 . ∑ n − n i =1 Äîêàçàíî, ÷òî êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà ïî ìîäóëþ íå ïðåâîñõîäèò 1 (òàê æå, êàê è îáû÷íûé êîýôôèöèåíò êîððåëÿöèè). Åñëè âñå ðàíãè (ri, qi) ïîïàðíî ñîâïàäàþò, òî rS = 1. Åñëè æå ýòè ðàíãè ïðîòèâîïîëîæíû, ò.å. qi = n – ri + 1, òî rS = –1. Îòìåòèì, ÷òî, åñëè íåêîòîðûå ðàíãè ñîâïàäàþò, ñóùåñòâóåò ñâîÿ çíà÷èòåëüíî áîëåå ñëîæíàÿ ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè, íî íà ïðàêòèêå è â ýòîì ñëó÷àå èñïîëüçóþò âûøåïðèâåäåííóþ ôîðìóëó. Ïðè óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y Ì(rS) = 0 è D(rS) = 1/(n – 1). Äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà áëèçîê ê îáû÷íîìó êîýôôèöèåíòó êîððåëÿöèè. Íàïðèìåð, â ñëó÷àå äâóìåðíîé íîðìàëüíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), äëÿ êîìïîíåíòîâ êîòîðîé êîýôôèöèåíò êîððåëÿöèè ðàâåí ρ, ñîîòíîøåíèå ìåæäó êîýôôèöèåíòîì êîððåëÿöèè Ñïèðìåíà rS è êîýôôèöèåíò êîððåëÿöèè ρ èìååò rS = 1 − 3 6 ρ 3 ρ3 3ρ5 arcsin = (ρ + + + ...) . π 2 π 24 640 Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà îáû÷íî ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y. Äëÿ ïðîâåðêè ýòîé ãèïîòåçû ïî ìàëûì âûáîðêàì (n ≤ 10) â êà÷åñòâå âèä rS = 84 Часть I. Основные понятия теории вероятностей и математической статистики êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò rS, à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äëÿ áîëüøèõ âûáîðîê (n > 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà t = rS n − 2 1 − rS2 , êîòîðàÿ àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 2) ñòåïåíüþ ñâîáîäû. Ранговый коэффициент корреляции Кендалла “Êîíêóðåíòîì” êîýôôèöèåíòó êîððåëÿöèè Ñïèðìåíà äëÿ îöåíèâàíèÿ ñòåïåíè çàâèñèìîñòè ìåæäó ïîðÿäêîâûìè ñëó÷àéíûìè âåëè÷èíàìè ìîæåò ñëóæèòü ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà. Ïóñòü äëÿ âûáîðî÷íûõ çíà÷åíèé (x1, y1), (x2, y2), ..., (xn, yn) âû÷èñëåíû ðàíãè (r1, q1), (r2, q2), ..., (rn, qn). Ýòà ïîñëåäîâàòåëüíîñòü óïîðÿäî÷èâàþòñÿ ïî âîçðàñòàíèþ ðàíãîâ ri, è ïîëó÷àåòñÿ ïîñëåäîâàòåëüíîñòü (1, q(1)), (2, q(2)), ..., (n, q(n)). Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà âû÷èñëÿåòñÿ ïî ôîðìóëå rK = n n 2 sign(q( j ) − q( i ) ) , ∑ ∑ n(n − 1) i =1 j = i +1 ãäå ôóíêöèÿ sign(x) ïðèíèìàåò çíà÷åíèå +1, åñëè õ > 0, è çíà÷åíèå –1, åñëè õ < 0. Êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà ïî ìîäóëþ íå ïðåâîñõîäèò 1 è ïðè óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y Ì(rÊ) = 0 è D(rK ) = 2(2n + 5) . 9n(n − 1) Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà (òàê æå, êàê è êîýôôèöèåíò Ñïèðìåíà) ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y. Äëÿ ïðîâåðêè ýòîé ãèïîòåçû ïî ìàëûì âûáîðêàì (n ≤ 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò rÊ, à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äëÿ áîëüøèõ âûáîðîê (n > 10) â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà t = rK 9n(n − 1) , êîòîðàÿ 2(2n + 5) àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Åñëè ñðàâíèâàòü ïðèìåíåíèå êîýôôèöèåíòîâ êîððåëÿöèè Ñïèðìåíà è Êåíäàëëà äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X è Y, òî ñ÷èòàåòñÿ, ÷òî êîýôôèöèåíò Êåíäàëëà äàåò áîëåå òî÷íûå ðåçóëüòàòû, îñîáåííî äëÿ ìàëûõ âûáîðîê. Êðîìå òîãî, ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ íåèçâåñòíûõ èñòèííûõ çíà÷åíèé ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè âîçìîæíî òîëüêî ïðèáëèæåííî è òîëüêî íà îñíîâå êîýôôèöèåíòà Êåíäàëëà. Коэффициент согласованности множественных связей Ðàíãîâûå êîýôôèöèåíòû êîððåëÿöèè Ñïèðìåíà è Êåíäàëëà ïðèìåíÿþòñÿ äëÿ îöåíêè ñòàòèñòè÷åñêèõ ñâÿçåé ìåæäó äâóìÿ ïîðÿäêîâûìè ïåðåìåííûìè. Èíîãäà âîçíèêàåò íåîáõîäèìîñòü â îöåíêå ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó íåñêîëüêèìè (áîëüøå äâóõ) ïåðåìåííûìè. Äëÿ ýòèõ öåëåé èñïîëüçóåòñÿ êîýôôèöèåíò ñîãëàñîâàííîñòè (òàêæå íàçûâàåìûé êîýôôèöèåíòîì êîíêîðäàöèè). Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X1, X2, ..., Xm).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x11, x21, ..., xm1), (x12, x22, ..., xm2), ..., Глава 3. Анализ статистических зависимостей 85 (x1n, x2n, ..., xmn). Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (x1i, x2i, ..., xmi) ïðèñâàèâàþòñÿ ðàíãè (r1i, r2i, ..., rmi). Ðàíãè rji ïðèñâàèâàþòñÿ çíà÷åíèÿì xji íåçàâèñèìî ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ äëÿ ðåàëèçàöèè êàæäîãî êîìïîíåíòà Xj òàê æå, êàê ïðè âû÷èñëåíèè êîýôôèöèåíòîâ Ñïèðìåíà è Êåíäàëëà. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. Êîýôôèöèåíò ñîãëàñîâàííîñòè âû÷èñëÿåòñÿ ïî ôîðìóëå 2 W= n m 12 m(n + 1) ∑ rji − . ∑ 2 3 m (n − n) i =1 j =1 2 Ýòîò êîýôôèöèåíò ïðèíèìàåò çíà÷åíèÿ èç èíòåðâàëà [0, 1]. Åñëè W = 0, òî ñ÷èòàåòñÿ, ÷òî êîìïîíåíòû X1, X2, ..., Xm íåçàâèñèìû. Ñ äðóãîé ñòîðîíû, W = 1 òîãäà è òîëüêî òîãäà, êîãäà âñå ðàíãè rji, ñîîòâåòñòâóþùèå âûáîðî÷íîìó çíà÷åíèþ (x1i, x2i, ..., xmi), ðàâíû è ýòî óñëîâèå âûïîëíÿåòñÿ äëÿ âñåõ âûáîðî÷íûõ çíà÷åíèé. Ïðè óñëîâèè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X1, X2, ..., Xm Ì(W) = 1/m è D(W ) = 2(m − 1) . Îòìåòèì, ÷òî ïðè m =2 W = (1 + rS)/2, ãäå rS — êîýôôèöèåíò m3 (n − 1) êîððåëÿöèè Ñïèðìåíà. Äëÿ ïðîâåðêè ãèïîòåçû î çàâèñèìîñòè èëè íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí X1, X2, ..., Xm ïî ìàëûì âûáîðêàì â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ êîýôôèöèåíò W, à êðèòè÷åñêèå çíà÷åíèÿ ïðè çàäàííîì óðîâíå çíà÷èìîñòè îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. Äàííîå ðàñïðåäåëåíèå óäîâëåòâîðèòåëüíî àïïðîêñèìèðóåòñÿ áåòà-ðàïðåäåëåíèåì [4]. Äëÿ âûáîðîê îáúåìîì áîëåå 7 â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ âåëè÷èíà t = m(n − 1)W , êîòîðàÿ àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Èíîãäà èñïîëüçóåòñÿ ñòàòèñòèêà T = 1 (m − 1)W ln 2 1−W , êîòîðàÿ ïðèáëèæåííî èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = n – 1 – 2/m è ν2 = (m – 1)ν1. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ îïèñàííûõ ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè ïîêàçàíà â ãëàâå 13. 3.3.3. Анализ зависимостей между классификационными переменными Íàïîìíèì, ÷òî êëàññèôèêàöèîííûå (íîìèíàëüíûå) ïåðåìåííûå ïðèíèìàþò çíà÷åíèÿ, êîòîðûå ìîæíî ðàçáèòü íà íåïåðåñåêàþùèåñÿ ìíîæåñòâà, íî ýòè ìíîæåñòâà òðóäíî èëè íåâîçìîæíî óïîðÿäî÷èòü ïî êàêîìó-ëèáî ïðèçíàêó. “Êëàññè÷åñêèìè” ïðèìåðàìè òàêèõ ïåðåìåííûõ ÿâëÿþòñÿ ïðîôåññèè ðàáîòíèêîâ èëè ìîòèâû ìèãðàöèè â ñîöèîëîãèè, ïîë îñîáè, âèä è ðîä â áèîëîãèè è ò.ä. Åñëè õîòÿ áû îäíà èç ïåðåìåííûõ ÿâëÿåòñÿ êîëè÷åñòâåííîé, òàêèå äàííûå èññëåäóþòñÿ ìåòîäàìè äèñïåðñèîííîãî àíàëèçà (â ýòîì ñëó÷àå íåêîëè÷åñòâåííûå ïåðåìåííûå ìîæíî îòîæäåñòâèòü ñ ôàêòîðàìè âëèÿíèÿ; ñì. ðàçäåë 3.5).  îáùåì ñëó÷àå îñíîâíûì èíñòðóìåíòîì èññëåäîâàíèÿ çàâèñèìîñòåé ìåæäó êëàññèôèêàöèîííûìè ïåðåìåííûìè ÿâëÿþòñÿ òàáëèöû ñîïðÿæåííîñòè. Ðàññìîòðèì äâóìåðíûå òàáëèöû ñîïðÿæåííîñòè, êîòîðûå ñîîòâåòñòâóþò äâóì êëàññèôèêàöèîííûì ïåðåìåííûì (òàêèå òàáëèöû èíîãäà íàçûâàþò òàáëèöàìè 86 Часть I. Основные понятия теории вероятностей и математической статистики ñîïðÿæåííîñòè ñ äâóìÿ âõîäàìè). Àíàëèç ìíîãîìåðíûõ òàáëèö ñîïðÿæåííîñòè (òàáëèö ñ òðåìÿ è áîëåå âõîäàìè) äîñòàòî÷íî ñëîæåí; ìåòîäû àíàëèçà òàêèõ òàáëèö ìîæíî íàéòè â [3]. Ïóñòü èìååòñÿ äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X, Y), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò çíà÷åíèÿ (ïðèçíàêè) À1, À2, ..., Às, à ñëó÷àéíàÿ âåëè÷èíà Y — çíà÷åíèÿ (ïðèçíàêè) B1, B2, ..., Br1. Âûáîðî÷íûå äàííûå ïðåäñòàâëÿþòñÿ â âèäå ñëåäóþùåé òàáëèöû ñîïðÿæåííîñòè. Çäåñü xij — êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ïðèçíàêè Bi è Aj. B1 À1 À2 ... Às Âñåãî x11 x12 ... x1s n1* = ∑ x1i s i =1 B2 x21 x22 ... x2s s n2* = ∑ x2i i =1 ... ... ... ... ... ... Br xr1 xr2 ... xrs nr * = ∑ xri s i =1 Âñåãî r n*1 = ∑ xi1 i =1 r n*2 = ∑ xi 2 ... i =1 r n*s = ∑ xis i =1 s r i =1 i =1 n = ∑ n*i = ∑ ni* Äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí Õ è Y âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà r s T = n∑∑ i =1 j =1 ( xij − ni* n* j ) 2 ni* n* j r s xij2 = n ∑∑ − 1 . i =1 j =1 ni* n* j Ýòà ñòàòèñòèêà ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñî ñòåïåíüþ ñâîáîäû, ðàâíîé (r – 1)(s – 1). Äëÿ ñëó÷àÿ r = s = 2 èìååòñÿ òî÷íûé êðèòåðèé Ôèøåðà ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè [14, 17]. Åñëè êðèòåðèé ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè óñòàíàâëèâàåò, ÷òî ñóùåñòâóåò ñòàòèñòè÷åñêè çíà÷èìàÿ çàâèñèìîñòü ìåæäó ïåðåìåííûìè Õ è Y, òî ïîëåçíî èìåòü êàêóþ-òî ÷èñëîâóþ ìåðó ýòîé çàâèñèìîñòè (íàïîäîáèå êîýôôèöèåíòà êîððåëÿöèè äëÿ êîëè÷åñòâåííûõ ïåðåìåííûõ). Ñòàòèñòèêà Ò â ñèëó ðÿäà ïðè÷èí íåïîñðåäñòâåííî íå ìîæåò âûñòóïàòü â êà÷åñòâå òàêîé ìåðû çàâèñèìîñòè, îäíàêî íà åå îñíîâå ðàçðàáîòàíî íåñêîëüêî ïîêàçàòåëåé çàâèñèìîñòè êëàññèôèêàöèîííûõ ïåðåìåííûõ, ñðåäè êîòîðûõ âûäåëèì ñëåäóþùèå: 1 Ïîÿñíÿþùèé ïðèìåð. Ïóñòü íåîáõîäèìî ïðîâåðèòü, åñòü ëè çàâèñèìîñòü ìåæäó öâåòîì ãëàç è öâåòîì âîëîñ ó ëþäåé (ïðèìåð èç [14]). Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ — ýòî “öâåò ãëàç”, à âåëè÷èíà Y — “öâåò âîëîñ”, òîãäà À1 = “êàðèé öâåò ãëàç”, À2 = “ñèíèé öâåò ãëàç” è ò.ä., Â1 = “áëîíäèí(êà)”, Â2 = “áðþíåò(êà)” è ò.ä. Êàæäûé èíäèâèäóóì, èíôîðìàöèÿ î êîòîðîì âêëþ÷åíà â èññëåäóåìóþ âûáîðêó, õàðàêòåðèçóåòñÿ äâóìÿ ïðèçíàêàìè: Aij è Bik, ãäå i — íîìåð èíäèâèäóóìà, j — íîìåð öâåòà ãëàç, k — íîìåð öâåòà âîëîñ. Глава 3. Анализ статистических зависимостей 87 • êîýôôèöèåíò ñîïðÿæåííîñòè C = • ìåðà ñâÿçè ×óïðîâà K = • êîýôôèöèåíò ϕ = T ; T +n T n (r − 1)( s − 1) ; T . n Ýòè êîýôôèöèåíòû èñïîëüçóþòñÿ â ðàçëè÷íûõ ñèòóàöèÿõ è êàæäûé èç íèõ èìååò ñâîè ïðåèìóùåñòâà è íåäîñòàòêè.  çàêëþ÷åíèå îòìåòèì, ÷òî äëÿ àíàëèçà çàâèñèìîñòè êëàññèôèêàöèîííûõ ïåðåìåííûõ ðàçðàáîòàíû òàê íàçûâàåìûå èíôîðìàöèîííûå ïîêàçàòåëè çàâèñèìîñòè, èñïîëüçóþùèå ïîíÿòèå ýíòðîïèè è êîëè÷åñòâà èíôîðìàöèè, ÷òî ïîçâîëÿåò îïðåäåëÿòü íàïðàâëåííûå ìåðû çàâèñèìîñòè ìåæäó ïåðåìåííûìè. Ýòè âåñüìà èíòåðåñíûå ïîêàçàòåëè çàâèñèìîñòè îïèñàíû â [1]. 3.4. Регрессионный анализ Ðàññìîòðèì áîëåå ïîäðîáíî âèäû çàâèñèìîñòåé ìåæäó êîëè÷åñòâåííûìè ïåðåìåííûìè Õ è Y (îäíà èëè îáå ýòè ïåðåìåííûå ìîãóò áûòü âåêòîðíûìè). Çäåñü âîçìîæíû ñëåäóþùèå ñëó÷àè. Ðåãðåññèîííàÿ çàâèñèìîñòü ñëó÷àéíîãî ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y îò íåñëó÷àéíûõ âõîäíûõ ïåðåìåííûõ Õ. Ïðèðîäà òàêîé ñâÿçè ìîæåò íîñèòü äâîéñòâåííûé õàðàêòåð: a) ðåãèñòðàöèÿ ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y íåèçáåæíî ñâÿçàíà ñ íåêîòîðûìè ñëó÷àéíûìè îøèáêàìè èçìåðåíèÿ ε, â òî âðåìÿ êàê âõîäíûå ïåðåìåííûå Õ èçìåðÿþòñÿ áåç îøèáîê (èëè âåëè÷èíû ýòèõ îøèáîê ïðåíåáðåæèìî ìàëû ïî ñðàâíåíèþ ñ îøèáêàìè èçìåðåíèÿ Y); b) çíà÷åíèÿ ïåðåìåííûõ Y çàâèñÿò íå òîëüêî îò ñîîòâåòñòâóþùèõ çíà÷åíèé Õ, íî è îò ðÿäà íåêîíòðîëèðóåìûõ ôàêòîðîâ, ïîýòîìó ïðè êàæäîì ôèêñèðîâàííîì çíà÷åíèè Õ ñîîòâåòñòâóþùèå çíà÷åíèÿ ðåçóëüòèðóþùåãî ïîêàçàòåëÿ Y(Õ), èçìåðåííûå â ðÿäå îïûòîâ, íåèçáåæíî ïîäâåðæåíû íåêîòîðîìó ñëó÷àéíîìó ðàçáðîñó. Óäîáíîé ìàòåìàòè÷åñêîé ìîäåëüþ òàêîãî ðîäà çàâèñèìîñòåé ÿâëÿåòñÿ óðàâíåíèå âèäà Y(Õ) = f(X) + ε, ãäå ε — ñëó÷àéíàÿ ïåðåìåííàÿ. Ýòî óðàâíåíèå íàçûâàåòñÿ óðàâíåíèåì ðåãðåññèè; ôóíêöèÿ f(Õ) — ôóíêöèåé ðåãðåññèè. Îòíîñèòåëüíî ñëó÷àéíîé âåëè÷èíû ε îáû÷íî äåëàåòñÿ ïðåäïîëîæåíèå, ÷òî îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. 3.4.1. Выбор функции регрессии Âûáîð íàèëó÷øåé â íåêîòîðîì ñìûñëå ôóíêöèè f(Õ) ñîñòàâëÿåò çàäà÷ó ðåãðåññèîííîãî àíàëèçà. Íî ñíà÷àëà íåîáõîäèìî óñòàíîâèòü êðèòåðèé, ñ ïîìîùüþ êîòîðîãî ìîæíî îïðåäåëèòü, ÷òî òàêîå “íàèëó÷øàÿ” ôóíêöèÿ ðåãðåññèè. Îäíèì èç øèðîêî ïðèìåíÿåìûõ íà ïðàêòèêå êðèòåðèåâ îïòèìàëüíîñòè ôóíêöèè ðåãðåññèè ÿâëÿåòñÿ êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ. Îí ôîðìóëèðóåòñÿ 88 Часть I. Основные понятия теории вероятностей и математической статистики ñëåäóþùèì îáðàçîì. Ïóñòü èìåþòñÿ íàáëþäåíèÿ (õ1, y1), (õ2, y2), ..., (õn, yn). Ôóíêöèÿ f(õ) ïîäáèðàåòñÿ òàêèì îáðàçîì, ÷òîáû ñóììà êâàäðàòîâ (y1 – f(x1))2 + (y2 – f(x2))2 + ... + (yn – f(xn))2 áûëà ìèíèìàëüíîé. Ïðè îïðåäåëåíèè ôóíêöèè ðåãðåññèè ýòîò êðèòåðèé ïîçâîëÿåò èñïîëüçîâàòü õîðîøî ðàçðàáîòàííûé ìåòîä íàèìåíüøèõ êâàäðàòîâ, îáåñïå÷èâàþùèé ïîñòðîåíèå ôóíêöèè ðåãðåññèè, õàðàêòåðèçóåìîé ìèíèìàëüíûì ñðåäíèì êâàäðàòîì åå îòêëîíåíèÿ îò ýêñïåðèìåíòàëüíûõ äàííûõ. Îïðåäåëèâ êðèòåðèé îïòèìàëüíîñòè ðåãðåññèè, ñëåäóåò ïåðåéòè ê âûáîðó òèïà ôóíêöèè ðåãðåññèè. Òèï ôóíêöèè ðåãðåññèè â çíà÷èòåëüíîé ìåðå çàâèñèò îò ýêñïåðèìåíòàëüíûõ äàííûõ, îäíàêî íàèáîëåå ÷àñòî èñïîëüçóþò ìíîãî÷ëåí âèäà Y = a + b1X + b2X2 + ... + bmXm (êîýôôèöèåíòû a è bi îïðåäåëÿþòñÿ íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ). Òàêàÿ ôóíêöèÿ ðåãðåññèè íàçûâàåòñÿ ïîëèíîìèàëüíîé. Îñòàíîâèìñÿ íà ïðîáëåìå âûáîðà ñòåïåíè ìíîãî÷ëåíà. Âûáîð îïòèìàëüíîé ñòåïåíè àïïðîêñèìèðóþùåãî ìíîãî÷ëåíà çàâèñèò îò ìíîãèõ ôàêòîðîâ. Âîïåðâûõ, îò ñâîéñòâ àïïðîêñèìèðóåìîé ôóíêöèè Y = f(X) (îò åå ãëàäêîñòè [11]); âî-âòîðûõ, îò ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê íàáëþäàåìûõ çíà÷åíèé Y (îñîáåííî îò äèñïåðñèè). Åñëè àïðèîðíàÿ èíôîðìàöèÿ î ôóíêöèè f(X) è ñòàòèñòè÷åñêèõ õàðàêòåðèñòèêàõ íàáëþäàåìûõ çíà÷åíèé ìèíèìàëüíà èëè îòñóòñòâóåò, òî íà ïðàêòèêå ñ÷èòàåòñÿ, ÷òî ñòåïåíü ìíîãî÷ëåíà íå ìåíåå ÷åì íà ïîðÿäîê äîëæíà áûòü ìåíüøå ÷èñëà òî÷åê äàííûõ, íî íå áîëåå 6–8. Îáû÷íî èñïîëüçóþò ìíîãî÷ëåíû íåáîëüøîé ñòåïåíè, ÷àñòî — ïåðâîé èëè âòîðîé. Òàêæå ÷àñòî ïðèìåíÿþòñÿ ôóíêöèè âèäà • Y = a + b ln(X); • Y = a + bX + c • Y= 1 1 èëè = a + bX ; Y a + bX • Y= 1 1 èëè = a + b1X + b2 X 2 + ... + bm X m ; 2 m Y a + b1X + b2 X + ... + bm X • Y = ea + b X èëè ln(Y) = a + b X; • Y = à Õb èëè ln(Y) = a1 + b1 ln(X). 1 ; X Îáðàùàåì âíèìàíèå, ÷òî âñå ïðèâåäåííûå ôóíêöèè èëè èõ ïðåîáðàçîâàíèÿ ëèíåéíû îòíîñèòåëüíî êîýôôèöèåíòîâ.  îáùåì ñëó÷àå òàêèå ôóíêöèè ìîæíî ïðåäñòàâèòü â âèäå Ψ(Y) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X). Çäåñü ôóíêöèè Ψ è ϕi çàäàíû è, êàê ïðàâèëî, îáëàäàþò “õîðîøèìè” ñâîéñòâàìè, íàïðèìåð äèôôåðåíöèðóåìîñòüþ. Êîýôôèöèåíòû bi îïðåäåëÿþòñÿ íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ. Ëèíåéíîñòü îòíîñèòåëüíî êîýôôèöèåíòîâ bi äàííûõ ôóíêöèé çíà÷èòåëüíî óïðîùàåò âû÷èñëåíèå çíà÷åíèé ýòèõ êîýôôèöèåíòîâ. Êîíå÷íî, ïðè íåîáõîäèìîñòè ìîæíî èñïîëüçîâàòü ôóíêöèè, íåëèíåéíûå îòíîñèòåëüíî íåèçâåñòíûõ ïàðàìåòðîâ (êîýôôèöèåíòîâ). Îíè íàçûâàþòñÿ ôóíêöèÿìè íåëèíåéíîé ðåãðåññèè.  ýòîì ñëó÷àå êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ òàêæå ñîõðàíÿåò ñâîþ ñèëó, íî íåïîñðåäñòâåííîå âû÷èñëåíèå çíà÷åíèé ýòèõ Глава 3. Анализ статистических зависимостей 89 íåèçâåñòíûõ ïàðàìåòðîâ ðåçêî óñëîæíÿåòñÿ — íåîáõîäèìî ïðèìåíÿòü ìåòîäû íåëèíåéíîé îïòèìèçàöèè. Êðîìå òîãî, âîçðàñòàåò ñëîæíîñòü èññëåäîâàíèÿ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê âû÷èñëåííûõ ïàðàìåòðîâ è óðàâíåíèÿ ðåãðåññèè â öåëîì. Åñëè ïåðåìåííàÿ Õ ÿâëÿåòñÿ âåêòîðîì, ò.å. Õ = (Õ1, Õ2, ..., Õn), òî èìååì òàê íàçûâàåìóþ ìíîæåñòâåííóþ ðåãðåññèþ: ôóíêöèÿ ðåãðåññèè çäåñü ìîæåò çàâèñåòü êàê îò îòäåëüíûõ êîìïîíåíòîâ âåêòîðà Õ, òàê è îò ëþáîé êîìáèíàöèè ýòèõ êîìïîíåíòîâ. Ïðîñòåéøèìè ôóíêöèÿìè ìíîæåñòâåííîé ðåãðåññèè ÿâëÿþòñÿ ïîëèíîìû âèäà n n n Y = a + ∑ bi X i + ∑ ci X i2 + ... + ∑ di X im + i =1 i =1 i =1 ∑ m eij ...k X imi X j j ...X mk k . i , j ,..., k Çäåñü ïîñëåäíÿÿ ñóììà ïðåäñòàâëÿåò âñåâîçìîæíûå ïðîèçâåäåíèÿ ïåðåìåííûõ Õ1, Õ2, ..., Õn â ðàçíûõ ñòåïåíÿõ. Íàèáîëüøàÿ ñòåïåíü ïåðåìåííûõ Õi èëè ñóììû ñòåïåíåé èõ ïðîèçâåäåíèé íàçûâàåòñÿ ñòåïåíüþ ïîëèíîìà. Îòìåòèì, ÷òî çäåñü ôóíêöèÿ ðåãðåññèè òàêæå ëèíåéíà îòíîñèòåëüíî êîýôôèöèåíòîâ ïîëèíîìà. Íà ïðàêòèêå ðåäêî èñïîëüçóþòñÿ òàêîãî òèïà ïîëèíîìû ñòåïåíè, áîëüøåé 2 èëè 3. Ïîñëå âûáîðà òèïà ôóíêöèè ðåãðåññèè íåîáõîäèìî âû÷èñëèòü ïàðàìåòðû ýòîé ôóíêöèè è ïðîâåðèòü àäåêâàòíîñòü ïîñòðîåííîé ôóíêöèè èìåþùèìñÿ äàííûì, íà îñíîâå êîòîðûõ ðàññ÷èòûâàëèñü ïàðàìåòðû. Ýòèì âîïðîñàì ïîñâÿùåíû ñëåäóþùèå ðàçäåëû.  ðàìêàõ ðåãðåññèîííîãî àíàëèçà òàêæå ðåøàþòñÿ çàäà÷è ïðîâåðêè çíà÷èìîñòè ðåãðåññèè, ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè è ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ êîýôôèöèåíòîâ, âû÷èñëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y ïðè òåõ çíà÷åíèÿõ Õ, êîòîðûõ íåò â èñõîäíûõ äàííûõ (çàäà÷à ïðîãíîçèðîâàíèÿ) è äð. Ïåðå÷èñëåííûå çàäà÷è áóäóò êðàòêî ðàññìîòðåíû íèæå. Ïðàêòè÷åñêèå ìåòîäû èõ ðåøåíèÿ îïèñàíû â ãëàâå 15. 3.4.2. Построение функции регрессии Ðàññìîòðèì ìåòîä íàèìåíüøèõ êâàäðàòîâ â ñàìîì îáùåì ñëó÷àå, êîãäà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ âèäà Ψ(Y) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X). Êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ çàïèøåòñÿ êàê n ∑ ( Ψ ( y ) − b ϕ ( x ) − b ϕ ( x ) − ... − b ϕ i i =1 0 0 i 1 0 i m ( xi ) ) = min . 2 m Çäåñü (õ1, y1), (õ2, y2), ..., (õn, yn) — èñõîäíûå äàííûå. Äëÿ îïðåäåëåíèÿ íåèçâåñòíûõ êîýôôèöèåíòîâ b0, b1, ..., bm ïîñëåäíåå âûðàæåíèå ñëåäóåò ïðîäèôôåðåíöèðîâàòü ïî ýòèì êîýôôèöèåíòàì è ïîëó÷åííûå ïðîèçâîäíûå ïðèðàâíÿòü ê íóëþ. Ïîëó÷èì òàê íàçûâàåìóþ ñèñòåìó íîðìàëüíûõ óðàâíåíèé: n n n n 2 b0 ∑ ϕ0 ( xi ) + b1 ∑ ϕ0 ( xi )ϕ1 ( xi ) + ... + bm ∑ ϕ0 ( xi )ϕ m ( xi ) = ∑ Ψ ( yi )ϕ 0 ( xi ); i =1 i =1 i =1 i =1 n n n n 2 b0 ∑ ϕ0 ( xi )ϕ1 ( xi ) + b1 ∑ ϕ1 ( xi ) + ... + bm ∑ ϕ1 ( xi )ϕ m ( xi ) = ∑ Ψ ( yi )ϕ1 ( xi ); i =1 i =1 i =1 i =1 … n n n n 2 b ϕ ( x ) ϕ ( x ) + b ϕ ( x ) ϕ ( x ) + ... + b ϕ ( x ) = Ψ ( yi )ϕ m ( xi ). ∑ ∑ ∑ ∑ i m i i m i m m i 0 0 1 1 i =1 i =1 i =1 i =1 Çíà÷åíèÿ êîýôôèöèåíòîâ b0, b1, ..., bm îïðåäåëÿþòñÿ êàê ðåøåíèÿ ýòîé ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé. Çà èñêëþ÷åíèåì ðåäêèõ ñëó÷àåâ 90 Часть I. Основные понятия теории вероятностей и математической статистики âûðîæäåííîñòè ñèñòåìû íàõîæäåíèå ðåøåíèÿ íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé — â Excel èìååòñÿ íåñêîëüêî ñðåäñòâ ðåøåíèÿ òàêèõ ñèñòåì (ñì. ãëàâó 6). Ïðè ïðîñòåéøåé àïïðîêñèìàöèè ìíîãî÷ëåíîì ïåðâîé ñòåïåíè óðàâíåíèå ëèíåéíîé ðåãðåññèè èìååò âèä Y = a + bX.  íåì ñëåäóåò îïðåäåëèòü çíà÷åíèÿ êîýôôèöèåíòîâ à è b, óäîâëåòâîðÿþùèå êðèòåðèþ ìèíèìóìà ñóììû êâàäðàòîâ.  äàííîì ñëó÷àå ýòîò êðèòåðèé çàïèøåòñÿ êàê n ∑(y i − a − bxi ) 2 = min . i =1 Íîðìàëüíàÿ ñèñòåìà óðàâíåíèé áóäåò èìåòü âèä n n + = an b x yi ; ∑ ∑ i i =1 i =1 n n n a x + b x 2 = yi xi . ∑ ∑ i i ∑ i =1 i =1 i =1 Ðåøåíèåì ýòîé ñèñòåìû áóäóò ñëåäóþùèå ôîðìóëû äëÿ âû÷èñëåíèÿ êîýôôèöèåíòîâ à è b: n n 2 i a= n n ∑x ∑ y −∑x ∑ y x i =1 i i =1 i i =1 i =1 2 n n∑ xi2 − ∑ xi i =1 i =1 n n i i , b= n n i =1 i =1 n∑ yi xi − ∑ xi ∑ yi i =1 n n∑ xi2 − ∑ xi i =1 i =1 n 2 . Ïðè àïïðîêñèìàöèè èñõîäíûõ äàííûõ ìíîãî÷ëåíàìè áîëåå âûñîêèõ ñòåïåíåé ïðèìåíÿåòñÿ ïîäîáíûé ñïîñîá âû÷èñëåíèÿ íåèçâåñòíûõ êîýôôèöèåíòîâ ìíîãî÷ëåíà.  Excel èìååòñÿ íåñêîëüêî ñðåäñòâ, ïîçâîëÿþùèõ âû÷èñëÿòü êîýôôèöèåíòû êàê ëèíåéíîé ðåãðåññèè, òàê è ïîëèíîìèàëüíîé. Ýòè ñðåäñòâà îïèñàíû â ÷àñòè II, à èõ ïðàêòè÷åñêîå ïðèìåíåíèå — â ãëàâå 15. 3.4.3. Проверка адекватности функции регрессии Ïóñòü íà îñíîâå ýêñïåðèìåíòàëüíûõ äàííûõ (õ1, y1), (õ2, y2), ..., (õn, yn) ïîñòðîåíà ôóíêöèÿ ðåãðåññèè f(õ), çàâèñÿùàÿ îò k ïàðàìåòðîâ, çíà÷åíèÿ êîòîðûõ ðàññ÷èòûâàþòñÿ ïî èñõîäíûì äàííûì. Îáîçíà÷èì ÷åðåç yˆ i çíà÷åíèÿ ôóíêöèè f(õ) â òî÷êàõ õ1, õ2, ..., xn: yˆi = f ( xi ) , i = 1, 2, ..., n. Äëÿ ïðîâåðêè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè èñõîäíûì äàííûì âû÷èñëÿåòñÿ äèñïåðñèîííàÿ òàáëèöà ñëåäóþùåãî âèäà. Èñòî÷íèê âàðèàöèè (êîìïîíåíòû äèñïåðñèè) Ðåãðåññèÿ Ñóììà êâàäðàòîâ n SS1 = ∑ ( yˆi − y ) 2 ×èñëî ñòåïåíåé ñâîáîäû k Äèñïåðñèÿ s 2f = i =1 Îñòàòêè n SS 2 = ∑ ( yi − yˆi ) 2 n–k–1 i =1 Ïîëíàÿ (îáùàÿ) âàðèàöèÿ n SS = ∑ ( yi − y ) 2 i =1 n–1 sε2 = SS1 n SS2 n − k −1 sY2 = SS n Глава 3. Анализ статистических зависимостей 91 Çäåñü y = 1 n ∑ yi . Äîêàçàíî, ÷òî sY2 = s 2f + sε2 . Ìåðîé àäåêâàòíîñòè ôóíêöèè n i =1 ðåãðåññèè èìåþùèìñÿ äàííûì ñëóæèò âåëè÷èíà R 2 = s 2f sY2 , êîòîðàÿ íàçûâàåòñÿ êîýôôèöèåíòîì äåòåðìèíàöèè. Ýòîò êîýôôèöèåíò ïðèíèìàåò çíà÷åíèÿ îò 0 äî 1 è ïîêàçûâàåò, íàñêîëüêî âåëèêî îáùåå îòêëîíåíèå çíà÷åíèé ôóíêöèè ðåãðåññèè îò ôàêòè÷åñêèõ çíà÷åíèé âåëè÷èíû Y. Åñëè íàéäåíà èäåàëüíàÿ ôóíêöèÿ ðåãðåññèè, òî R2 = 1 (ìàêñèìàëüíîå çíà÷åíèå).  ñëó÷àå ëèíåéíîé ðåãðåññèè R2 ðàâíî êâàäðàòó êîýôôèöèåíòà êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Õ è Y; êîðåíü èç R2 íàçûâàåòñÿ èíäåêñîì êîððåëÿöèè IYX (ñì. ðàçäåë 3.3.1). Òàêèì îáðàçîì, ÷åì áëèæå êîýôôèöèåíò äåòåðìèíàöèè ê 1, òåì áîëåå òî÷íî âûáðàííàÿ ôóíêöèÿ ðåãðåññèè ñîîòâåòñòâóåò ýêñïåðèìåíòàëüíûì äàííûì. Åñëè ñëó÷àéíàÿ âåëè÷èíà ε èç óðàâíåíèÿ çàâèñèìîñòè Y(Õ) = f(X) + ε èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì, òî ñóùåñòâóåò êðèòåðèé ïðîâåðêè çíà÷èìîñòè êîýôôèöèåíòà äåòåðìèíàöèè.  ýòîì ñëó÷àå è ïðè óñëîâèè ñïðàâåäëèâîñòè íóëåâîé ãèïîòåçû Í0: R2 = 0 ñòàòèñòèêà F = s 2f sε2 èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1). (Ñòàòèñòèêà F ñâÿçàíà ñ êîýôôèöèåíòîì R2 ñîîòíîøåíèåì F = n − k −1 R2 .) Åñëè íàéäåíà êâàí⋅ k 1 − R2 òèëü t ïîðÿäêà 1 – α (α — çàäàííûé óðîâåíü çíà÷èìîñòè) F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1), òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè F ≤ t.  ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêîé çíà÷èìîñòè ðåãðåññèè. Êðîìå êîýôôèöèåíòà äåòåðìèíàöèè, èñïîëüçóþòñÿ äðóãèå ïîêàçàòåëè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè èñõîäíûì äàííûì, â ÷àñòíîñòè óïîìèíàåìûé âûøå èíäåêñ êîððåëÿöèè. Òàêæå ÷àñòî èñïîëüçóåòñÿ ïîêàçàòåëü ñðåäíåé îòíîñèòåëüíîé îøèáêè àïïðîêñèìàöèè ε= 1 n yi − yˆi . ∑ n i =1 yi ×åì ìåíüøå ýòîò ïîêàçàòåëü, òåì ëó÷øå ôóíêöèÿ ðåãðåññèè àïïðîêñèìèðóåò ýêñïåðèìåíòàëüíûå äàííûå. 3.4.4. Статистические характеристики параметров функции регрессии  ðåãðåññèîííîì àíàëèçå îòíîñèòåëüíî êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè ðåøàþòñÿ ñëåäóþùèå çàäà÷è. 1. Ïðîâåðêà çíà÷èìîñòè êàæäîãî êîýôôèöèåíòà ðåãðåññèè. Åñëè çíà÷åíèÿ êîýôôèöèåíòîâ ðåãðåññèè ñòàòèñòè÷åñêè íåçíà÷èìû, òî èõ ñëåäóåò èñêëþ÷èòü èç óðàâíåíèÿ ðåãðåññèè. 2. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ çíà÷èìûõ êîýôôèöèåíòîâ ðåãðåññèè. Äîâåðèòåëüíûå èíòåðâàëû ïîêàçûâàþò òî÷íîñòü âû÷èñëåííûõ çíà÷åíèé êîýôôèöèåíòîâ. 92 Часть I. Основные понятия теории вероятностей и математической статистики Ýòè çàäà÷è îáû÷íî ðåøàþòñÿ â ïðåäïîëîæåíèè, ÷òî ñëó÷àéíàÿ îøèáêà ε â óðàâíåíèè ðåãðåññèîííîé çàâèñèìîñòè èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì, à ñëó÷àéíûå ïîãðåøíîñòè εi êàæäîãî èçìåðåíèÿ yi (ðåàëèçàöèè ñëó÷àéíîé âåëè÷èíû ε) íåçàâèñèìû è èìåþò îäèíàêîâûå äèñïåðñèè. Åñëè ýòè ïðåäïîëîæåíèÿ âûïîëíÿþòñÿ, òî âû÷èñëåííûå êîýôôèöèåíòû ÿâëÿþòñÿ íåñìåùåííûìè è ñîñòîÿòåëüíûìè2 îöåíêàìè èñòèííûõ êîýôôèöèåíòîâ è àñèìïòîòè÷åñêè èìåþò íîðìàëüíûå ðàñïðåäåëåíèÿ.  äàííîì ñëó÷àå äëÿ ïðîâåðêè èõ çíà÷èìîñòè è ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ èñïîëüçóþòñÿ ñòàíäàðòíûå ìåòîäû, îñíîâàííûå íà ðàñïðåäåëåíèè Ñòüþäåíòà. Ýòè ìåòîäû îïèñàíû â ðàçäåëå 15.3. Îòìåòèì, ÷òî äëÿ ðåøåíèÿ îáåèõ çàäà÷ èñïîëüçóþòñÿ îöåíêè äèñïåðñèé âû÷èñëåííûõ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè. Ôîðìóëû äëÿ îïðåäåëåíèÿ ýòèõ îöåíîê èçâåñòíû è âíåøíå íåñëîæíû, åñëè èñïîëüçîâàòü ìàòðè÷íûå îáîçíà÷åíèÿ. Ïðèâåäåì ôîðìóëû äëÿ äèñïåðñèé êîýôôèöèåíòîâ à è b óðàâíåíèÿ ëèíåéíîé ðåãðåññèè Y = a + bX: n Da = σ 2 ∑ xi2 i =1 n n∑ x − ∑ xi i =1 i =1 n 2 i 2 , Db = σ2n n n∑ x − ∑ xi i =1 i =1 n 2 . 2 i Çäåñü σ2 — äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû ε (íàïîìíèì çàâèñèìîñòü Y(Õ) = f(X) + ε). Ïðè âû÷èñëåíèÿõ σ2 çàìåíÿþò âåëè÷èíîé sε2 èç äèñïåðñèîííîé òàáëèöû. Äëÿ âû÷èñëåíèÿ äèñïåðñèé êîýôôèöèåíòîâ ïîëèíîìèàëüíîé ðåãðåññèè â Excel åñòü ñïåöèàëüíûå ñðåäñòâà, êîòîðûå áóäóò ïðåäñòàâëåíû â ãëàâå 4 (ôóíêöèÿ ЛИНЕЙН) è ãëàâå 5 (ñðåäñòâî Регрессия) è èñïîëüçîâàíû â ãëàâå 15. 3.4.5. Прогнозирование Ðåãðåññèîííûé àíàëèç ÷àñòî ïðèìåíÿåòñÿ äëÿ îïðåäåëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y â íåêîòîðîé òî÷êå õ0, íå âõîäÿùåé â èñõîäíîå ìíîæåñòâî çíà÷åíèé {x1, x2, ..., xn} ïåðåìåííîé Õ. Äëÿ ýòîãî èñïîëüçóåòñÿ ïîñòðîåííàÿ ôóíêöèÿ ðåãðåññèè f(X) è çíà÷åíèåì ïåðåìåííîé Y â òî÷êå õ0 ñ÷èòàåòñÿ âåëè÷èíà yˆ = f ( x0 ) . Ñ òî÷êè çðåíèÿ ìàòåìàòèêà, çäåñü íåîáõîäèìî ðàçëè÷àòü äâå âîçìîæíûå ñèòóàöèè. • Òî÷êà õ0 ïðèíàäëåæèò èíòåðâàëó, îãðàíè÷åííîìó ìèíèìàëüíûì è ìàêñèìàëüíûì çíà÷åíèÿìè ìíîæåñòâà {x1, x2, ..., xn}, åñëè ïåðåìåííàÿ Õ îäíîìåðíà.  ñëó÷àå, êîãäà ïåðåìåííàÿ Õ ÿâëÿåòñÿ âåêòîðîì, ìíîãîìåðíàÿ òî÷êà õ0 ïðèíàäëåæèò âûïóêëîé îáëàñòè, òàêæå îïðåäåëåííîé èñõîäíûìè çíà÷åíèÿìè ïåðåìåííîé Õ.  ýòîé ñèòóàöèè çàäà÷à îïðåäåëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y íàçûâàåòñÿ çàäà÷åé âîññòàíîâëåíèÿ çíà÷åíèé è ÿâëÿåòñÿ âïîëíå êîððåêòíîé ñ ìàòåìàòè÷åñêîé òî÷êè çðåíèÿ. • Òî÷êà õ0 íå ïðèíàäëåæèò èíòåðâàëó, îïðåäåëåííîìó ìèíèìàëüíûì è ìàêñèìàëüíûì çíà÷åíèÿìè ìíîæåñòâà {x1, x2, ..., xn} (ïåðåìåííàÿ Õ îäíîìåðíà), èëè ñîîòâåòñòâóþùåé îáëàñòè äëÿ ìíîãîìåðíîé ïåðåìåííîé Õ.  ýòîé 2 Íåáîëüøîå óòî÷íåíèå: äëÿ ñîñòîÿòåëüíîñòè îöåíîê äîïîëíèòåëüíî íåîáõîäèìî óñëîâèå íåâûðîæäåííîñòè ìàòðèöû, ñîñòàâëåííîé èç âñåâîçìîæíûõ ïîïàðíûõ ïðîèçâåäåíèé xixj. Глава 3. Анализ статистических зависимостей 93 ñèòóàöèè çàäà÷à îïðåäåëåíèÿ çíà÷åíèÿ ïåðåìåííîé Y íàçûâàåòñÿ çàäà÷åé ýêñòðàïîëÿöèè (èëè çàäà÷åé ïðîãíîçèðîâàíèÿ; ýòîò òåðìèí ÷àñòî èñïîëüçóåòñÿ ïðè ýêîíîìè÷åñêîé èíòåðïðåòàöèè èñõîäíûõ äàííûõ) è â îáùåì ñëó÷àå ÿâëÿåòñÿ íåêîððåêòíîé ñ ìàòåìàòè÷åñêîé òî÷êè çðåíèÿ.  ñòàòèñòèêå îáû÷íî ýòè äâå ñèòóàöèè ÷åòêî íå ðàçëè÷àþòñÿ, íî èõ íåîáõîäèìî ó÷èòûâàòü ïðè ïðîâåäåíèè ïðàêòè÷åñêîãî àíàëèçà.  îáùåì ñëó÷àå íåñìîòðÿ íà èäåàëüíóþ ïîäãîíêó ôóíêöèè ðåãðåññèè ê èñõîäíûì äàííûì ðåøåíèå çàäà÷è ïðîãíîçèðîâàíèÿ ìîæåò áûòü êàê óãîäíî äàëåêèì îò èñòèííîãî çíà÷åíèÿ Y(x0), åñëè íå íàêëàäûâàòü àïðèîðíûõ ïðåäïîëîæåíèé î ãëàäêîñòè ôóíêöèè, îïèñûâàþùåé èñòèííóþ çàâèñèìîñòü ìåæäó Õ è Y. Äîâåðèòåëüíûå èíòåðâàëû, êîòîðûå îáû÷íî ñòðîÿòñÿ äëÿ âåëè÷èíû yˆ = f ( x0 ) (ñì. ðàçäåë 15.4), ñòðîãî ãîâîðÿ, èìåþò ïðàâî íà ñóùåñòâîâàíèå òîëüêî äëÿ çàäà÷è âîññòàíîâëåíèÿ çíà÷åíèé, õîòÿ èõ ïðèìåíÿþò â îáåèõ ñèòóàöèÿõ. Íà ïðàêòèêå ïðîãíîçèðîâàíèå ìîæíî ïðèìåíÿòü äîñòàòî÷íî “áåçîïàñíî”, åñëè çàâèñèìîñòü ìåæäó Õ è Y ìîæíî îïèñàòü ãëàäêîé ôóíêöèåé, õîòÿ áû äèôôåðåíöèðóåìîé, è òî÷êà x0 ðàñïîëîæåíà íåäàëåêî îò îáëàñòè, îïðåäåëÿåìîé èìåþùèìèñÿ çíà÷åíèÿìè ïåðåìåííîé Õ. (Íî çäåñü âîçíèêíåò âîïðîñ, ÷òî ïîíèìàòü ïîä ñëîâîì íåäàëåêî.) 3.5. Дисперсионный анализ Äèñïåðñèîííûé àíàëèç3 — ýòî ñòàòèñòè÷åñêèé ìåòîä àíàëèçà ðåçóëüòàòîâ íàáëþäåíèé, çàâèñÿùèõ îò ðàçëè÷íûõ ôàêòîðîâ, îïðåäåëåíèå íàèáîëåå âëèÿþùèõ ôàêòîðîâ è îöåíêà ýòîãî âëèÿíèÿ. Ôàêòîðàìè îáû÷íî íàçûâàþò âíåøíèå óñëîâèÿ, âëèÿþùèå íà ðåçóëüòàòû íàáëþäåíèé. Äèñïåðñèîííûé àíàëèç çàêëþ÷àåòñÿ â ðàçëîæåíèè îáùåé âàðèàöèè (äèñïåðñèè) íàáëþäàåìîé ñëó÷àéíîé âåëè÷èíû íà îòäåëüíûå ñëàãàåìûå, êàæäîå èç êîòîðûõ õàðàêòåðèçóåò âëèÿíèå òîãî èëè èíîãî ôàêòîðà. 3.5.1. Статистическая модель Äèñïåðñèîííûé àíàëèç ïðèìåíÿåòñÿ â óñëîâèÿõ ñëåäóþùåé ñòàòèñòè÷åñêîé ìîäåëè. Íàáëþäàþòñÿ n ñëó÷àéíûõ âåëè÷èí Õ1, Õ2, ..., Õn, êàæäàÿ èç êîòîðûõ ïðåäñòàâèìà â âèäå Õi = µ + β1 + β2 + ... + βm + εi, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), βj — çíà÷åíèå j-ãî ôàêòîðà, εi — “îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà, ïðåäñòàâëÿþùàÿ îøèáêè íàáëþäåíèé, âëèÿíèå íåó÷òåííûõ ôàêòîðîâ è ò.ï. Êàê ïðàâèëî, ïðåäïîëàãàåòñÿ, ÷òî ñëó÷àéíûå âåëè÷èíû εi íåçàâèñèìû ìåæäó ñîáîé, îäèíàêîâî ðàñïðåäåëåíû ïî íîðìàëüíîìó çàêîíó ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Ôàêòîðû îáû÷íî ÿâëÿþòñÿ êëàññèôèêàöèîííûìè èëè ïîðÿäêîâûìè âåëè÷èíàìè, ïðèíèìàþùèìè êîíå÷íîå ìíîæåñòâî çíà÷åíèé.  òàêîì ñëó÷àå, êîãäà βj ïðèíèìàåò êîíêðåòíîå k-å çíà÷åíèå èç ýòîãî ìíîæåñòâà, ãîâîðÿò î k-ì óðîâíå j-ãî ôàêòîðà. Öåëü äèñïåðñèîííîãî àíàëèçà çàêëþ÷àåòñÿ â îöåíêå àäåêâàòíîñòè ìîäåëè èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì (äëÿ ÷åãî îïðåäåëÿþòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ñëó÷àéíûõ âåëè÷èí εi), à òàêæå â îöåíêå âëèÿíèÿ ôàêòîðîâ (äðóãèìè ñëîâàìè, ïðîâåðÿþòñÿ ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé ñëó÷àéíûõ âåëè÷èí Õ1, Õ2, ..., Õn). 3  ñîâðåìåííîé ðóññêîé ñòàòèñòè÷åñêîé ëèòåðàòóðå äèñïåðñèîííûé àíàëèçà èíîãäà íàçûâàþò ìåòîäîì ANOVA (îò àíãë. Analisis of Variance — àíàëèç äèñïåðñèé). 94 Часть I. Основные понятия теории вероятностей и математической статистики Ìîäåëü, â êîòîðîé âñå βj ÿâëÿþòñÿ äåòåðìèíèðîâàííûìè, íàçûâàåòñÿ ìîäåëüþ ñ ïîñòîÿííûìè ôàêòîðàìè. Åñëè âñå βj ÿâëÿþòñÿ ñëó÷àéíûìè âåëè÷èíàìè, òàêàÿ ìîäåëü íàçûâàåòñÿ ìîäåëüþ ñî ñëó÷àéíûìè ôàêòîðàìè.  ñëó÷àå, êîãäà ñðåäè βj åñòü êàê äåòåðìèíèðîâàííûå, òàê è ñëó÷àéíûå âåëè÷èíû, ãîâîðÿò î ñìåøàííîé ìîäåëè.  çàâèñèìîñòè îò êîëè÷åñòâà ôàêòîðîâ ðàçëè÷àþò îäíîôàêòîðíûé è ìíîãîôàêòîðíûé (äâóõôàêòîðíûé, òðåõôàêòîðíûé è ò.ä.) äèñïåðñèîííûé àíàëèç. Ïðåæäå ÷åì ïðèìåíÿòü ìåòîäû äèñïåðñèîííîãî àíàëèçà, íåîáõîäèìî ïðîâåðèòü îáÿçàòåëüíîå óñëîâèå: äèñïåðñèè âñåõ èññëåäóåìûõ âûáîðîê äîëæíû áûòü îäèíàêîâûìè. Åñëè èìåþòñÿ òîëüêî äâå âûáîðêè, äëÿ ýòîãî ìîæíî ïðèìåíèòü êðèòåðèé Ôèøåðà ñðàâíåíèÿ äèñïåðñèé (îïèñàíèå êðèòåðèÿ ïðèâîäèòñÿ â ðàçäåëå 2.4.2, à åãî ïðàêòè÷åñêàÿ ðåàëèçàöèÿ — â ðàçäåëå 12.3.2). Äëÿ ïðîâåðêè ðàâåíñòâà äèñïåðñèé íåñêîëüêèõ âûáîðîê èñïîëüçóåòñÿ êðèòåðèé Áàðòëåòòà (ñì. ðàçäåë 12.3.2). 3.5.2. Однофакторный дисперсионный анализ Ïóñòü èìååòñÿ k âûáîðîê (x11, x12, ..., x1n1 ), (x21, x22, ..., x2n2 ), ..., (xk1, xk2, ..., xknk ) îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, êîòîðûå ÿâëÿþòñÿ ðåàëèçàöèÿìè ñëó÷àéíûõ âåëè÷èí Õ1, Õ2, ..., Õk. Ïðåäïîëàãàåòñÿ, ÷òî êàæäàÿ ñëó÷àéíàÿ âåëè÷èíà Xi ïðåäñòàâèìà â âèäå Õi = µ + β + εi, ãäå β — ôàêòîð, êîòîðûé ìîæåò ïðèíèìàòü êîíå÷íîå ìíîæåñòâî çíà÷åíèé (êàæäîå çíà÷åíèå ôàêòîðà íàçûâàåòñÿ óðîâíåì ôàêòîðà), εi — “îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Âñå ñëó÷àéíûå âåëè÷èíû εi íåçàâèñèìû. Ñ÷èòàåòñÿ, ÷òî êàæäàÿ âûáîðêà ñîîòâåòñòâóåò îäíîìó óðîâíþ ôàêòîðà. Äëÿ êàæäîé âûáîðêè ïî ñòàíäàðòíûì ôîðìóëàì (ñì. ðàçäåë 2.1) ïîäñ÷èòûâàåòñÿ âûáîðî÷íîå ñðåäíåå x1 , x2 , ..., xk , âûáîðî÷íûå äèñïåðñèè S12 , S 22 , ..., S k2 è îáùåå ñðåäíåå x = k 1 k x , ãäå n = ni . ∑i ∑ n i =1 i =1 Äàëåå ðàññ÷èòûâàþòñÿ ñóììû êâàäðàòîâ: k ìåæãðóïïîâàÿ ñóììà êâàäðàòîâ SS1 = ∑ ni ( xi − x ) 2 , i =1 k k ni âíóòðèãðóïïîâàÿ ñóììà êâàäðàòîâ SS 2 = ∑ (ni − 1) Si2 = ∑∑ ( xij − xi ) 2 , i =1 k i =1 j =1 ni ïîëíàÿ ñóììà êâàäðàòîâ SS = SS1 + SS 2 = ∑∑ ( xij − x )2 . i =1 j =1 Ìåæãðóïïîâóþ ñóììó êâàäðàòîâ òàêæå íàçûâàþò ðàññåèâàíèåì ïî ôàêòîðàì, âíóòðèãðóïïîâóþ ñóììó êâàäðàòîâ — îñòàòî÷íûì ðàññåèâàíèåì, ïîëíóþ ñóììó êâàäðàòîâ — ïîëíîé (èëè îáùåé) ñóììîé êâàäðàòîâ îòêëîíåíèé îòäåëüíûõ íàáëþäåíèé îò îáùåãî ñðåäíåãî x . Äëÿ êàæäîé èç ýòèõ ñóìì îïðåäåëÿþòñÿ ñòåïåíè ñâîáîäû: äëÿ ìåæãðóïïîâîé ñóììû êâàäðàòîâ ÷èñëî ñòåïåíåé ñâîáîäû ðàâíî k – 1, äëÿ âíóòðèãðóïïîâîé ñóììû êâàäðàòîâ — n – k, à äëÿ ïîëíîé ñóììû — n – 1. Íà îñíîâàíèè çíà÷åíèé ñóìì êâàäðàòîâ è ñîîòâåòñòâóþùèõ ñòåïåíåé ñâîáîäû âû÷èñëÿþòñÿ ñëåäóþùèå äèñïåðñèè: ìåæãðóïïîâàÿ äèñïåðñèÿ s12 = SS1 1 k = ∑ ni ( xi − x )2 , k − 1 k − 1 i =1 Глава 3. Анализ статистических зависимостей 95 âíóòðèãðóïïîâàÿ äèñïåðñèÿ s22 = ïîëíàÿ äèñïåðñèÿ s 2 = SS 2 1 k ni = ∑∑ ( xij − xi )2 , n − k n − k i =1 j =1 SS 1 k ni = ∑∑ ( xij − x )2 . n − 1 n − 1 i =1 j =1 Ìåæãðóïïîâàÿ äèñïåðñèÿ ïîêàçûâàåò, íàñêîëüêî ðàçëè÷àþòñÿ âûáîðî÷íûå ñðåäíèå. Îíà ðàâíà íóëþ, åñëè ñðåäíèå ðàâíû, è ÷åì ñèëüíåå ðàçëè÷àþòñÿ ñðåäíèå â ðàçíûõ âûáîðêàõ, òåì îíà áîëüøå. Ýòà äèñïåðñèÿ ÿâëÿåòñÿ ìåðîé ðàçáðîñà âûáîðî÷íûõ ñðåäíèõ âñëåäñòâèå âëèÿíèÿ ôàêòîðà. Âíóòðèãðóïïîâàÿ äèñïåðñèÿ ïîêàçûâàåò, íàñêîëüêî íåîäíîðîäíà êàæäàÿ âûáîðêà (ãðóïïà). Îíà ïîêàçûâàåò âëèÿíèå íåó÷òåííûõ “îñòàòî÷íûõ” ôàêòîðîâ (âåëè÷èí εi). Ïðîâåäåííûå âû÷èñëåíèÿ ïðèíÿòî ïðåäñòàâëÿòü â âèäå òàáëèöû äèñïåðñèîííîãî àíàëèçà, èëè â äèñïåðñèîííîé òàáëèöå, ñëåäóþùåãî âèäà. Èñòî÷íèê âàðèàöèè (êîìïîíåíòû äèñïåðñèè) Ñóììà êâàäðàòîâ Ìåæãðóïïîâàÿ âàðèàöèÿ (ðàçëè÷èÿ ìåæäó âûáîðêàìè) SS1 = ∑ ni ( xi − x ) 2 k ×èñëî ñòåïåíåé ñâîáîäû k–1 Äèñïåðñèÿ s12 = SS1 k −1 s22 = SS2 n−k s2 = SS n −1 i =1 Âíóòðèãðóïïîâàÿ âàðèàöèÿ (ðàçëè÷èÿ âíóòðè âûáîðîê) k ni SS 2 = ∑∑ ( xij − xi ) 2 n–k i =1 j =1 Ïîëíàÿ (îáùàÿ) âàðèàöèÿ k ni SS = ∑∑ ( xij − x )2 n–1 i =1 j =1 Îòíîøåíèå R 2 = s12 s 2 íàçûâàåòñÿ êîýôôèöèåíòîì äåòåðìèíàöèè è ïîêàçûâàåò, êàêàÿ ÷àñòü ïîëíîé äèñïåðñèè îáúÿñíÿåòñÿ âëèÿíèåì ôàêòîðà. Äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé âî âñåõ âûáîðêàõ ïðèìåíÿþò êðèòåðèàëüíóþ ñòàòèñòèêó F = s12 s22 , êîòîðàÿ â ñëó÷àå èñòèííîñòè ïðîâåðÿåìîé ãèïîòåçû èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (k – 1) è (n – k). Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå α êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ýòîãî ðàñïðåäåëåíèÿ. Åñëè F < têð, òî ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé íå îòêëîíÿåòñÿ (äðóãèìè ñëîâàìè, âëèÿíèå ôàêòîðà âî âñåõ âûáîðêàõ îäèíàêîâî).  ñëó÷àå F ≥ têð ýòà ãèïîòåçà îòâåðãàåòñÿ. Îòìåòèì, ÷òî ñòàòèñòèêà F ≥ 1, â ïðîòèâíîì ñëó÷àå ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé ïðèíèìàåòñÿ áåç ïðîâåðêè, ïîñêîëüêó òîãäà ðàçëè÷èÿ ìåæäó âûáîðêàìè ìåíüøå ðàçëè÷èé âíóòðè âûáîðîê, ò.å. âëèÿíèå ôàêòîðà ìåíåå çíà÷èìî, ÷åì âëèÿíèå “îñòàòî÷íûõ” ôàêòîðîâ. Åñëè ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé îòâåðãàåòñÿ, íåîáõîäèìî óçíàòü, ìàòåìàòè÷åñêèå îæèäàíèÿ êàêèõ âûáîðîê çíà÷èìî îòëè÷àþòñÿ îò äðóãèõ.  ýòîì ñëó÷àå íåëüçÿ íåïîñðåäñòâåííî ïîïàðíî ñðàâíèâàòü îòäåëüíûå âûáîðêè ñ ïîìîùüþ, íàïðèìåð, êðèòåðèÿ Ñòüþäåíòà (ñì. ðàçäåë 2.4.2), ïîñêîëüêó ðåçêî âîçðàñòàåò ãðóïïîâàÿ îøèáêà ïåðâîãî ðîäà (ò.å. âîçðàñòàåò âåðîÿòíîñòü òîãî, ÷òî ïî êðàéíåé ìåðå îäèí èç òåñòîâ íåâåðíî îòâåðãíåò íóëåâóþ ãèïîòåçó).  òàêîé ñèòóàöèè äëÿ ïîïàðíûõ ñðàâíåíèé ñëåäóåò ïðèìåíÿòü ëèáî ìåòîä ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå (îïèñàííûé â ðàçäåëå 12.3.1), ëèáî ìîäèôèöèðîâàííûé êðèòåðèé Ñòüþäåíòà. 96 Часть I. Основные понятия теории вероятностей и математической статистики Ìîäèôèêàöèÿ êðèòåðèÿ Ñòüþäåíòà çàêëþ÷àåòñÿ â òîì, ÷òî êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå T = xi − x j 1 1 SS2 + n1 n2 , ãäå xi è x j — ñðåäíèå ñðàâíèâàåìûõ âûáîðîê, n1 è n2 — îáúåìû ýòèõ âûáîðîê, à SS2 — âíóòðèãðóïïîâàÿ ñóììà êâàäðàòîâ, êîòîðàÿ ðàññ÷èòûâàåòñÿ â äèñïåðñèîííîé òàáëèöå ïî âñåì âûáîðêàì. Äëÿ îïðåäåëåíèÿ êðèòè÷åñêîãî çíà÷åíèÿ áåðåòñÿ êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k) ñòåïåíüþ ñâîáîäû (îáðàòèòå âíèìàíèå íà çíà÷åíèå ñòåïåíè ñâîáîäû). 3.5.3. Двухфакторный дисперсионный анализ  äâóõôàêòîðíîì äèñïåðñèîííîì àíàëèçå ïðåäïîëàãàåòñÿ, ÷òî ñëó÷àéíûå âåëè÷èíû Õi ïðåäñòàâèìû â âèäå Õi = µ + β + γ + εi, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), β è γ — çíà÷åíèÿ ôàêòîðîâ, εi — “îñòàòî÷íàÿ” ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ñòàíäàðòíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (ò.å. âñå εi íåçàâèñèìû è èìåþò îäèíàêîâûå íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè). Ïðè èñïîëüçîâàíèè äâóõôàêòîðíîãî àíàëèçà âîçìîæíû äâå ñèòóàöèè.  ïåðâîé ñèòóàöèè èìååòñÿ îäíà âûáîðêà, â êîòîðîé êàæäîå âûáîðî÷íîå çíà÷åíèå ñîîòâåòñòâóåò îäíîé êîìáèíàöèè óðîâíåé ôàêòîðîâ β è γ, âî âòîðîé ñèòóàöèè èìååòñÿ íåñêîëüêî ïîäîáíûõ âûáîðîê4. Ðàññìîòðèì ñíà÷àëà ïðèìåíåíèå äèñïåðñèîííîãî àíàëèçà â óñëîâèÿõ ïåðâîé ñèòóàöèè. Двухфакторный дисперсионный анализ без повторений Èòàê, èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij, èíäåêñ i ñîîòâåòñòâóåò i-ìó óðîâíþ ôàêòîðà β (áóäåì îáîçíà÷àòü óðîâíè ôàêòîðà β êàê βi), èíäåêñ j ñîîòâåòñòâóåò j-ìó óðîâíþ ôàêòîðà γ (óðîâíè ýòîãî ôàêòîðà îáîçíà÷èì êàê γj). Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t óðîâíåé. Òàêèì îáðàçîì, â îáùåì ñëó÷àå âûáîðêà èìååò ðàçìåðíîñòü r×t5. Òàêóþ âûáîðêó óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû6. 4 Ñðàçó ñêàæåì, ÷òî â óñëîâèÿõ ïåðâîé ñèòóàöèè ïðèìåíÿåòñÿ ñðåäñòâî Excel Двухфакторный дисперсионный анализ без повторений, à â óñëîâèÿõ âòîðîé — Двухфакторный дисперсионный анализ с повторениями (ñì. ãëàâó 5). Ýòè äâå ñèòóàöèè íå ñîâñåì ÷åòêî ïðåäñòàâëåíû â îïèñàíèè äàííûõ ñðåäñòâ â ñïðàâî÷íîé ñèñòåìå Excel. 5 Ïðè ÷òåíèè ìàòåðèàëà î äâóõôàêòîðíîì àíàëèçå ïîëåçíî èìåòü â âèäó “êëàññè÷åñêóþ” ìîäåëü. Èìååòñÿ ðÿä ñåëüñêîõîçÿéñòâåííûõ ïîëåé (ó÷àñòêîâ), ê êàæäîìó èç íèõ ïðèìåíÿåòñÿ ñâîé ñïîñîá îáðàáîòêè çåìëè (åñòü r ðàçëè÷íûõ ñïîñîáîâ îáðàáîòêè) è âíîñèòñÿ t ðàçëè÷íûõ óäîáðåíèé (íà êàæäûé ó÷àñòîê âíîñèòñÿ îäèí òèï óäîáðåíèÿ). Òðåáóåòñÿ èññëåäîâàòü óðîæàéíîñòü íåêîòîðîé ñåëüñêîõîçÿéñòâåííîé êóëüòóðû â çàâèñèìîñòè îò äâóõ ôàêòîðîâ — ñïîñîáà îáðàáîòêè çåìëè è âèäà óäîáðåíèÿ.  äàííîì ñëó÷àå çíà÷åíèåì ñëó÷àéíîé âåëè÷èíû Õ ÿâëÿåòñÿ óðîæàéíîñòü íà êàæäîì îïûòíîì ó÷àñòêå. “Êëàññèêà” çäåñü çàêëþ÷àåòñÿ â òîì, ÷òî äèñïåðñèîííûé àíàëèç ïåðâîíà÷àëüíî áûë ïðåäëîæåí Ð. Ôèøåðîì (Fisher, 1925) äëÿ îáðàáîòêè ðåçóëüòàòîâ àãðîíîìè÷åñêèõ îïûòîâ ïî îïðåäåëåíèþ óñëîâèé, ïðè êîòîðûõ èñïûòûâàåìûé ñîðò ñåëüñêîõîçÿéñòâåííîé êóëüòóðû äàåò íàèáîëüøèé óðîæàé. 6 Ýòà òàáëèöà íàïîìèíàåò òàáëèöó ñîïðÿæåííîñòè (ñì. ðàçäåë 3.3.3), íî âåëè÷èíû xij â íèõ èìåþò ðàçíûé ñìûñë — â òàáëèöå ñîïðÿæåííîñòè âåëè÷èíà xij ðàâíà êîëè÷åñòâó íàáëþäåíèé, ñîîòâåòñòâóþùèõ ïðèçíàêàì Ài è Bj, çäåñü æå xij — çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Õ. Глава 3. Анализ статистических зависимостей 97 γ1 γ2 ... γt β1 x11 x12 ... x1t β2 x21 x22 ... x2t ... ... ... ... ... βr xr1 xr2 ... xrt Ñðåäíèå x*1 = ∑ xi1 r ... x*t = ∑ xit r i =1 x*2 = ∑ xi 2 i =1 Ñðåäíèå x1* = 1 t ∑ x1i t i =1 x2* = 1 t ∑ x2i t i =1 ... xr * = r x= i =1 Òî÷å÷íîé îöåíêîé îáùåãî ñðåäíåãî µ ÿâëÿåòñÿ âåëè÷èíà x = 1 t ∑ xri t i =1 1 r t ∑∑ xij rt i =1 j =1 1 r t ∑∑ xij . Âåëèrt i =1 j =1 r 1 t xki è x*m = ∑ xim íàçûâàþòñÿ ñðåäíèìè ïî óðîâíÿì ôàêòîðîâ: ∑ t i =1 i =1 — ñðåäíåå ïî óðîâíþ k ôàêòîðà β, x*m — ñðåäíåå ïî óðîâíþ m ôàêòîðà γ. ÷èíû xk * = xk * Îïðåäåëåíèå ñòåïåíè âëèÿíèÿ ôàêòîðîâ âûïîëíÿåòñÿ òàê æå, êàê è â îäíîôàêòîðíîì àíàëèçå, íà îñíîâå äèñïåðñèîííîé òàáëèöû, êîòîðàÿ äëÿ äâóõôàêòîðíîãî àíàëèçà áåç ïîâòîðåíèé èìååò ñëåäóþùóþ ñòðóêòóðó. Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ (êîìïîíåíòû äèñïåðñèè) Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòðîêàì (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà β) SS1 = t ∑ ( xi* − x ) 2 Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòîëáöàì (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà γ) SS 2 = r ∑ ( x*i − x ) 2 Îñòàòî÷íàÿ âàðèàöèÿ (ðàçëè÷èÿ âíóòðè âûáîðêè) SS3 = ∑∑ ( xij − xi * − x* j + x )2 Ïîëíàÿ (îáùàÿ) âàðèàöèÿ SS = ∑∑ ( xij − x )2 r ×èñëî ñòåïå- Äèñïåðñèÿ íåé ñâîáîäû r–1 s12 = SS1 r −1 s22 = SS2 t −1 s32 = SS3 (r − 1)(t − 1) s2 = SS rt − 1 i =1 t t–1 i =1 r t i =1 j =1 r t i =1 j =1 (r – 1) (t – 1) rt – 1 Äëÿ îïðåäåëåíèÿ ñòåïåíè âëèÿíèÿ ôàêòîðîâ ñðàâíèâàþò äèñïåðñèè ïî ôàêòîðàì ñ îñòàòî÷íîé äèñïåðñèåé. Íàïðèìåð, äëÿ ïðîâåðêè íóëåâîé ãèïîòåçû î ðàâåíñòâå ñðåäíèõ ïî óðîâíÿì ôàêòîðà β (åñëè ýòà ãèïîòåçà ïðèíèìàåòñÿ, òî âëèÿíèå ôàêòîðà β íåçíà÷èìî) âû÷èñëÿþòñÿ ñíà÷àëà êðèòåðèàëüíàÿ ñòàòèñòèêà T = s12 /s32 , à çàòåì — 98 Часть I. Основные понятия теории вероятностей и математической статистики êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α (α — çàäàííûé óðîâåíü çíà÷èìîñòè) F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòêëîíÿåòñÿ. Àíàëîãè÷íî îïðåäåëÿåòñÿ ñòåïåíü âëèÿíèÿ ôàêòîðà γ.  Excel äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç áåç ïîâòîðåíèé âûïîëíÿåò îäíîèìåííîå ñðåäñòâî èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.13). Âûïîëíåíèå ýòîãî àíàëèçà áåç ïðèìåíåíèÿ äàííîãî ñðåäñòâà ïîêàçàíî â ðàçäåëå 14.3.1. Двухфакторный дисперсионный анализ с повторениями Ýòà ðàçíîâèäíîñòü äèñïåðñèîííîãî àíàëèçà ïðåäïîëàãàåò, ÷òî èìååòñÿ íåñêîëüêî äâóìåðíûõ âûáîðîê òàêîãî æå âèäà, ÷òî è â äâóõôàêòîðíîì àíàëèçå áåç ïîâòîðåíèé. Çäåñü âñå âûáîðî÷íûå çíà÷åíèÿ òàêæå ìîæíî ïðåäñòàâèòü â âèäå òàáëèöû, êàê è â ñëó÷àå îäíîé âûáîðêè. Íî òåïåðü â êàæäîé ÿ÷åéêå ýòîé òàáëèöû, ñîîòâåòñòâóþùåé i-ìó óðîâíþ ôàêòîðà β è j-ìó óðîâíþ ôàêòîðà γ, áóäåò íàõîäèòüñÿ íå îäíî çíà÷åíèå xij, à m çíà÷åíèé xijk (k = 1, ..., m), m — êîëè÷åñòâî âûáîðîê. Ïðåäïîëàãàåì, ÷òî îáúåìû âñåõ âûáîðîê îäèíàêîâû, ò.å. â êàæäîé ÿ÷åéêå òàáëèöû ñîäåðæèòñÿ îäèíàêîâîå êîëè÷åñòâî çíà÷åíèé. Åñëè ýòî íå òàê, òî ïðèâåäåííûå íèæå ôîðìóëû íåñêîëüêî óñëîæíÿþòñÿ [24]. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ: • ñðåäíèå ïî êàæäîé ÿ÷åéêå xij * = • ñðåäíèå ïî ñòðîêàì xi ** = • ñðåäíèå ïî ñòîëáöàì x* j * = • îáùåå ñðåäíåå x = 1 m ∑ xijk ; m k =1 1 t ∑ xij* ; t j =1 1 r ∑ xij* ; r i =1 1 r t ∑∑ xij* . rt i =1 j =1 Ïîðÿäîê ïðîâåäåíèÿ äèñïåðñèîííîãî àíàëèçà â äàííîì ñëó÷àå òàêîé æå, êàê è ïðåæäå: ñíà÷àëà âû÷èñëÿþòñÿ ñóììû êâàäðàòîâ, çàòåì âû÷èñëÿþòñÿ îöåíêè äèñïåðñèé, äàëåå äëÿ ïðîâåðêè ãèïîòåç î âëèÿíèè ôàêòîðîâ âû÷èñëÿþòñÿ îòíîøåíèÿ äèñïåðñèé, êîòîðûå ñðàâíèâàþòñÿ ñ êðèòè÷åñêèìè çíà÷åíèÿìè, ïîëó÷åííûìè êàê êâàíòèëè F-ðàñïðåäåëåíèÿ. Äèñïåðñèîííàÿ òàáëèöà èìååò ñëåäóþùèé âèä. Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ (êîìïîíåíòû äèñïåðñèè) Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòðîêàì (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà β) r SS1 = mt ∑ ( xi** − x )2 ×èñëî ñòåïåíåé ñâîáîäû r–1 Äèñïåðñèÿ s12 = SS1 r −1 s22 = SS2 t −1 i =1 Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòîëáöàì SS 2 = mr (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà γ) t ∑ (x * j* j =1 − x )2 t–1 Глава 3. Анализ статистических зависимостей 99 Îêîí÷àíèå òàáë. Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ (êîìïîíåíòû äèñïåðñèè) ×èñëî ñòåïåíåé ñâîáîäû Âçàèìîäåéñòâèå ôàêòîðîâ β è γ SS3 = m∑∑ ( xij * − xi** − x* j * + x ) 2 (r – 1)(t – 1) Îñòàòî÷íàÿ âàðèàöèÿ SS 4 = ∑∑∑ ( xijk − xij * ) 2 r t Äèñïåðñèÿ s32 = SS3 (r − 1)(t − 1) s42 = SS4 rt (m − 1) s2 = SS rtm − 1 i =1 j =1 m r t rt(m – 1) k =1 i =1 j =1 Ïîëíàÿ (îáùàÿ) âàðèàöèÿ m r t SS = ∑∑∑ ( xijk − x )2 k =1 i =1 j =1 rtm – 1 Êàê âèäíî èç ýòîé òàáëèöû, ïîÿâèëñÿ íîâûé èñòî÷íèê âàðèàöèè, à èìåííî — ýôôåêò îò âçàèìîäåéñòâèÿ ôàêòîðîâ β è γ. Ýòîò ýôôåêò íå íàáëþäàåòñÿ â ñëó÷àå îäíîé âûáîðêè, ïîñêîëüêó òàì ðàçíîñòè xijk − xij * ðàâíû íóëþ. Îáû÷íî íåÿâíî ïðåäïîëàãàåòñÿ, ÷òî ýòî âçàèìîäåéñòâèå ìîæíî îïèñàòü êàê ïðîèçâåäåíèå δβiγj è äèñïåðñèîííûé àíàëèç äîëæåí îïðåäåëèòü, íàñêîëüêî çíà÷èìî âåëè÷èíà δ îòëè÷àåòñÿ îò íóëÿ. Íåîáõîäèìî îòìåòèòü, ÷òî ñóùåñòâóþò è äðóãèå ìîäåëè âçàèìîäåéñòâèÿ ôàêòîðîâ [1].  Excel äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ñ ïîâòîðåíèÿìè âûïîëíÿåò îäíîèìåííîå ñðåäñòâî èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.12). Ìíîãîôàêòîðíûé äèñïåðñèîííûé àíàëèç âûïîëíÿåòñÿ àíàëîãè÷íî äâóõôàêòîðíîìó: âû÷èñëÿþòñÿ ñíà÷àëà ñðåäíèå ïî êàæäîìó óðîâíþ âñåõ ôàêòîðîâ, çàòåì — ñóììû êâàäðàòîâ äëÿ êàæäîãî ôàêòîðà è âçàèìîäåéñòâèé âñåõ âîçìîæíûõ êîìáèíàöèé ôàêòîðîâ, ïîñëå — ñòåïåíè ñâîáîäû è ñîîòâåòñòâóþùèå äèñïåðñèè. Äàëåå äëÿ ïðîâåðêè ãèïîòåç î âëèÿíèè ôàêòîðîâ âû÷èñëÿþòñÿ îòíîøåíèÿ äèñïåðñèé ôàêòîðîâ èëè èõ âçàèìîäåéñòâèé ê îñòàòî÷íîé äèñïåðñèè (ýòî êðèòåðèàëüíûå ñòàòèñòèêè) è íàõîäÿòñÿ êðèòè÷åñêèå çíà÷åíèÿ êàê êâàíòèëè F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ñòåïåíÿìè ñâîáîäû. Åñëè çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê ìåíüøå êðèòè÷åñêèõ çíà÷åíèé, òî íóëåâûå ãèïîòåçû ïðèíèìàþòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàþòñÿ. Ïîäðîáíî ìíîãîôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â [24]. 100 Часть I. Основные понятия теории вероятностей и математической статистики Часть II Средства Excel для статистического анализа В этой части... Ãëàâà 4. Ñòàòèñòè÷åñêèå ôóíêöèè Ãëàâà 5. Íàäñòðîéêà Ïàêåò àíàëèçà Ãëàâà 6. Äîïîëíèòåëüíûå âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà Ãëàâà 7. Ìîäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí  ýòîé ÷àñòè îïèñàíû âîçìîæíîñòè Excel äëÿ ïðîâåäåíèÿ ñòàòèñòè÷åñêîãî àíàëèçà. Ïðåäïîëàãàåòñÿ, ÷òî ÷èòàòåëü çíàêîì ñ îñíîâàìè ðàáîòû â ýòîé ýëåêòðîííîé òàáëèöå õîòÿ áû â ñëåäóþùåì îáúåìå: îí ìîæåò ââîäèòü è ðåäàêòèðîâàòü äàííûå, ñîçäàâàòü ôîðìóëû, èñïîëüçîâàòü ôóíêöèè, ñòðîèòü äèàãðàììû è ãðàôèêè, ôîðìàòèðîâàòü ðàáî÷èé ëèñò è ò.ï. Íåïîñðåäñòâåííî äëÿ ñòàòèñòè÷åñêîé îáðàáîòêè äàííûõ â Excel ïðåäóñìîòðåíû ìíîãî÷èñëåííûå ñòàòèñòè÷åñêèå ôóíêöèè (îêîëî 80) è ñðåäñòâà íàäñòðîéêè Пакет анализа. Ñòàòèñòè÷åñêèå ôóíêöèè (ãëàâà 4) è ñðåäñòâà, ïðåäîñòàâëÿåìûå íàäñòðîéêîé Пакет анализа (ãëàâà 5), â äàííîé ÷àñòè îïèñàíû äîñòàòî÷íî ïîëíî. Êðîìå ñòàòèñòè÷åñêèõ ôóíêöèé è ñðåäñòâ ïàêåòà àíàëèçà, çäåñü ðàññìîòðåíû îáùèå ñðåäñòâà è íàäñòðîéêè Excel, êîòîðûå òàêæå ìîæíî èñïîëüçîâàòü â ñòàòèñòè÷åñêîì àíàëèçå (ãëàâà 6). Ýòî ôîðìóëû ìàññèâîâ, ñïåöèàëüíîãî âèäà äèàãðàììû è ãðàôèêè, à òàêæå íàäñòðîéêà Поиск решения.  ãëàâå 7 ìû êðàòêî îñòàíîâèìñÿ íà âîçìîæíîñòÿõ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí â Excel. Глава 4 Статистические функции Ê ñòàòèñòè÷åñêèì ôóíêöèÿì Excel îáû÷íî îòíîñÿò òå ôóíêöèè, êîòîðûå ïðèâåäåíû â ìàñòåðå ôóíêöèé (èëè â ñïðàâî÷íîé ñèñòåìå Excel) â êàòåãîðèè Статистические. Îäíàêî ýòà êàòåãîðèÿ ñîäåðæèò òàêæå ôóíêöèè, êîòîðûå ñêîðåå ìîæíî îòíåñòè ê êàòåãîðèè ïðîñòî ìàòåìàòè÷åñêèõ (íàïðèìåð, ôóíêöèè МИН è МАКС) ëèáî èíôîðìàöèîííûõ ôóíêöèé (ôóíêöèè СЧЁТ è СЧЁТЗ). Ñ äðóãîé ñòîðîíû, â äðóãèõ êàòåãîðèÿõ ôóíêöèé òàêæå èìåþòñÿ ôóíêöèè, êîòîðûå ìîæíî èñïîëüçîâàòü ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà (íàïðèìåð, íåêîòîðûå ôóíêöèè äëÿ ìàòðè÷íûõ âû÷èñëåíèé). Ïîýòîìó ìû ðàçîáüåì êàòåãîðèþ ñòàòèñòè÷åñêèõ ôóíêöèé íà íåñêîëüêî ãðóïï ôóíêöèé, âûïîëíÿþùèõ îäíîòèïíûå äåéñòâèÿ (íàïðèìåð, âû÷èñëÿþùèå çíà÷åíèÿ ôóíêöèé ðàñïðåäåëåíèé ëèáî âûïîëíÿþùèå òåñòû), âûäåëèâ ãðóïïó äîïîëíèòåëüíûõ è âñïîìîãàòåëüíûõ ôóíêöèé. Ê ñîæàëåíèþ, ñïðàâî÷íûå ðàçäåëû Excel, ïîñâÿùåííûå ñòàòèñòè÷åñêèì ôóíêöèÿì, íàïèñàíû âåñüìà íåâíÿòíî, èìåþò ìíîãî íåòî÷íîñòåé, à ïîðîé ïðîñòî ñîäåðæàò îøèáêè. Ïîýòîìó áóäåì îïèñûâàòü ýòè ôóíêöèè ïî âîçìîæíîñòè ïîëíî. 4.1. Функции для определения экстремальных значений выборки  ýòó ãðóïïó ôóíêöèé âõîäÿò ñëåäóþùèå ôóíêöèè. Ôóíêöèÿ Íàçíà÷åíèå ÌÀÊÑ Âîçâðàùàåò ìàêñèìàëüíîå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ ÌÀÊÑÀ Âîçâðàùàåò íàèáîëüøåå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ. Íàðÿäó ñ ÷èñëîâûìè çíà÷åíèÿìè âûïîëíÿåò òàêæå ñðàâíåíèå òåêñòîâûõ è ëîãè÷åñêèõ çíà÷åíèé ÌÈÍ Âîçâðàùàåò ìèíèìàëüíîå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ ÌÈÍÀ Âîçâðàùàåò íàèìåíüøåå çíà÷åíèå èç ñïèñêà àðãóìåíòîâ. Íàðÿäó ñ ÷èñëîâûìè çíà÷åíèÿìè âûïîëíÿåò òàêæå ñðàâíåíèå òåêñòîâûõ è ëîãè÷åñêèõ çíà÷åíèé ÍÀÈÁÎËÜØÈÉ Âîçâðàùàåò k-å íàèáîëüøåå çíà÷åíèå èç ìàññèâà äàííûõ ÍÀÈÌÅÍÜØÈÉ Âîçâðàùàåò k-å íàèìåíüøåå çíà÷åíèå èç ìàññèâà äàííûõ 102 Часть II. Средства Excel для статистического анализа 4.1.1. Функции МАКС, МАКСА, МИН, МИНА Ýòè ôóíêöèè èìåþò ñëåäóþùèé ñèíòàêñèñ (äàëåå, åñëè áóäåò ïðèâîäèòüñÿ ñèíòàêñèñ äëÿ ãðóïïû ôóíêöèé, â îïèñàíèè ñèíòàêñèñà áóäåì èñïîëüçîâàòü âìåñòî êîíêðåòíîãî íàçâàíèÿ ôóíêöèè ñëîâî ФУНКЦИЯ): ФУНКЦИЯ(×èñëî1;×èñëî2;...) Ôóíêöèè ìîãóò ñîäåðæàòü äî 30 àðãóìåíòîâ. Àðãóìåíòàìè ìîãóò áûòü êîíêðåòíûå ÷èñëà, àäðåñà äèàïàçîíîâ ëèáî ññûëêè íà îòäåëüíûå ÿ÷åéêè ðàáî÷åãî ëèñòà.  äèàïàçîíàõ ïóñòûå ÿ÷åéêè è ÿ÷åéêè ñ òåêñòîì èãíîðèðóþòñÿ.  ôóíêöèÿõ МАКСА è МИНА àðãóìåíòû, ñîäåðæàùèå çíà÷åíèå ИСТИНА, èíòåðïðåòèðóþòñÿ êàê åäèíèöà, à àðãóìåíòû, ñîäåðæàùèå çíà÷åíèå ЛОЖЬ èëè òåêñò, èíòåðïðåòèðóþòñÿ êàê íóëü; â ôóíêöèÿõ МАКС è МИН òàêèå àðãóìåíòû èãíîðèðóþòñÿ. 4.1.2. Функции НАИБОЛЬШИЙ и НАИМЕНЬШИЙ Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(Ìàññèâ;k) Àðãóìåíò Массив — ññûëêà íà äèàïàçîí ÿ÷ååê, èç êîòîðîãî âûáèðàåòñÿ k-å íàèáîëüøåå (íàèìåíüøåå) ÷èñëîâîå çíà÷åíèå. Öåëîå ÷èñëî k çàäàåò ïîçèöèþ (íà÷èíàÿ ñ íàèáîëüøåé â ôóíêöèè НАИБОЛЬШИЙ è ñ íàèìåíüøåé â ôóíêöèè НАИМЕНЬШИЙ). Åñëè àðãóìåíò Массив íå çàäàí ëèáî åñëè ÷èñëî k ìåíüøå 0 èëè áîëüøå êîëè÷åñòâà ÿ÷ååê â äèàïàçîíå Массив, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЧИСЛО!. Ïîêàæåì, êàê ñ ïîìîùüþ ôóíêöèé НАИБОЛЬШИЙ è НАИМЕНЬШИЙ îïðåäåëèòü âûáîðî÷íîå çíà÷åíèå, êîòîðîìó ñîîòâåòñòâóåò çàäàííûé ðàíã (ðàíã — íîìåð ïîçèöèè âûáîðî÷íîãî çíà÷åíèÿ â âàðèàöèîííîì ðÿäå, ïîñòðîåííîì ïî âûáîðêå; î âàðèàöèîííîì ðÿäå è ðàíãàõ âûáîðî÷íûõ çíà÷åíèé ðå÷ü èäåò â ðàçäåëå 2.3.9). Îòìåòèì, ÷òî äëÿ ðåøåíèÿ äàííîé çàäà÷è âàðèàöèîííûé ðÿä çàðàíåå íå ñòðîèòñÿ — îí ïîëó÷àåòñÿ â ðåçóëüòàòå âû÷èñëåíèé. Ïóñòü âûáîðî÷íûå çíà÷åíèÿ ðàñïîëàãàþòñÿ â ñòîëáöå À (íà ðèñ. 4.1 âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû ñ ïîìîùüþ ôóíêöèè СЛЧИС, óìíîæåííîé íà 10).  îäíîì èç ñîñåäíèõ ñòîëáöîâ ââîäÿòñÿ íàòóðàëüíûå ÷èñëà îò 1 äî n (n — îáúåì âûáîðêè).  ÿ÷åéêó D2 ââîäèòñÿ ôîðìóëà =НАИМЕНЬШИЙ($A$2:$A$16;C2), êîòîðàÿ çàòåì êîïèðóåòñÿ âíèç.  ðåçóëüòàòå ïîëó÷àåì âàðèàöèîííûé ðÿä, ÷èñëà â ñòîëáöå Ñ ïîêàçûâàþò ðàíãè çíà÷åíèé ýòîãî ðÿäà. Àíàëîãè÷íîãî ðåçóëüòàòà ìîæíî äîáèòüñÿ ñ ïîìîùüþ ôóíêöèè НАИБОЛЬШИЙ, äëÿ ÷åãî â ÿ÷åéêó ââîäèòñÿ ôîðìóëà =НАИБОЛЬШИЙ($A$2:$A$16;16-C2), êîòîðàÿ çàòåì òàêæå êîïèðóåòñÿ âíèç (çäåñü ÷èñëî 16 — ýòî ÷èñëî, íà 1 áîëüøåå îáúåìà âûáîðêè). Îòìåòèì, ÷òî âûáðàòü íàèáîëüøèå èëè íàèìåíüøèå çíà÷åíèÿ èç âûáîðêè (åñëè âûáîðî÷íûå çíà÷åíèÿ ðàñïîëîæåíû â îäíîì ñòîëáöå) ìîæíî òàêæå ñ ïîìîùüþ ñðåäñòâà Excel Автофильтр (êîìàíäà ДанныеÖФильтрÖАвтофильтр) èëè Расширенный фильтр (êîìàíäà ДанныеÖФильтрÖРасширенный фильтр), ïðè÷åì â ýòîì ñëó÷àå ìîæíî âûáðàòü íå îòäåëüíûå çíà÷åíèÿ, à íåñêîëüêî çíà÷åíèé, íàïðèìåð 5 íàèáîëüøèõ èëè 10 íàèìåíüøèõ çíà÷åíèé (ìîæíî êîëè÷åñòâî âûáèðàåìûõ çíà÷åíèé çàäàòü â âèäå ïðîöåíòà îò îáúåìà âûáîðêè). Íåäîñòàòêîì èñïîëüçîâàíèÿ ôèëüòðîâ ÿâëÿåòñÿ òî, ÷òî ýòî ñðåäñòâî íå “èíòåðàêòèâíî”; ïîýòîìó, ÷òîáû ñíîâà ïîëó÷èòü íóæíûå çíà÷åíèÿ ïðè èçìåíåíèè íåêîòîðûõ âûáîðî÷íûõ çíà÷åíèé, ôèëüòð íåîáõîäèìî ïðèìåíèòü åùå ðàç — â îòëè÷èå îò ôóíêöèé, êîòîðûå àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ ïðè âíåñåíèè èçìåíåíèé â âûáîðêó. Глава 4. Статистические функции 103 Ðèñ. 4.1. Ïîñòðîåíèå âàðèàöèîííîãî ðÿäà 4.2. Функции для работы с порядковыми статистиками  ýòîì ðàçäåëå ðàññìîòðèì ñëåäóþùèå ôóíêöèè, êîòîðûå ÿâíî èëè íåÿâíî ñâÿçàíû ñ ïîðÿäêîâûìè ñòàòèñòèêàìè è ðàíæèðîâàíèåì äàííûõ (î ïîðÿäêîâûõ ñòàòèñòèêàõ è âàðèàöèîííîì ðÿäå, êîòîðûé óïîìèíàåòñÿ íèæå, ðå÷ü èäåò â ðàçäåëå 2.3.9). Ôóíêöèÿ Íàçíà÷åíèå ÊÂÀÐÒÈËÜ Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò êâàðòèëè ÌÅÄÈÀÍÀ Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò ìåäèàíó ÏÅÐÑÅÍÒÈËÜ Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿåò ïðîöåíòèëè ÏÐÎÖÅÍÒÐÀÍà Ïî âûáîðêå âû÷èñëÿåò ïðîöåíòíûå ðàíãè âûáîðî÷íûõ çíà÷åíèé ÐÀÍà Ïî âûáîðêå âû÷èñëÿåò ðàíãè âûáîðî÷íûõ çíà÷åíèé 4.2.1. Функция КВАРТИЛЬ Ðàññìîòðèì ñíà÷àëà ôóíêöèþ КВАРТИЛЬ. Íàïîìíèì, ÷òî êâàðòèëüþ ïîðÿäêà ð (ð ïðèíèìàåò çíà÷åíèÿ 0,25, 0,5 è 0,75) ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = ð (ñì. ðàçäåë 1.2.3). Ôóíêöèÿ КВАРТИЛЬ âû÷èñëÿåò êâàðòèëè ξ0,25, ξ0,5 è ξ0,75 íà îñíîâå âûáîðî÷íûõ çíà÷åíèé ñëåäóþùèì îáðàçîì. Ïî âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä è îïðåäåëÿþòñÿ çíà÷åíèÿ, ïðèíèìàåìûå çà êâàðòèëè ñîîòâåòñòâóþùåãî ïîðÿäêà, êîòîðûå äåëÿò âàðèàöèîííûé ðÿä íà ÷åòûðå ðàâíîâåëèêèå ÷àñòè (ðàâíîâåëèêèå ïî ÷èñëó âûáîðî÷íûõ çíà÷åíèé, ñîñòàâëÿþùèõ ýòè ÷àñòè ðÿäà). 104 Часть II. Средства Excel для статистического анализа Ïóñòü õ(1) ≤ õ(2) ≤ ... ≤ õ(n) — âàðèàöèîííûé ðÿä, ïîñòðîåííûé ïî âûáîðêå õ1, õ2, ..., xn îáúåìîì n. Òîãäà êâàðòèëü ξð âû÷èñëÿåòñÿ ïî ôîðìóëå ξð = õ(ðn) + (1 – ð)(õ(ðn+1) – õ(ðn)), åñëè ïðîèçâåäåíèå ðn — öåëîå ÷èñëî. Åñëè ðn — äðîáíîå ÷èñëî, òî ξð = õ([ðn]+1), ãäå [ðn] — öåëàÿ ÷àñòü ÷èñëà ðn. Ñèíòàêñèñ ôóíêöèè: КВАРТИЛЬ(Ìàññèâ;×àñòü) Àðãóìåíò Массив — ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî ÷èñëîâûå çíà÷åíèÿ, ïî êîòîðûì îïðåäåëÿåòñÿ çíà÷åíèå êâàðòèëÿ. Àðãóìåíò Часть ïðèíèìàåò öåëî÷èñëåííûå çíà÷åíèÿ îò 0 äî 4, è â çàâèñèìîñòè îò ýòîãî çíà÷åíèÿ ôóíêöèÿ âîçâðàùàåò ñëåäóþùèå çíà÷åíèÿ: 0 — ìèíèìàëüíîå çíà÷åíèå â âûáîðêå, 1 — êâàðòèëü ξ0,25, 2 — êâàðòèëü ξ0,5, 3 — êâàðòèëü ξ0,75, 4 — ìàêñèìàëüíîå çíà÷åíèå â âûáîðêå. Íà ðèñ. 4.2 ïîêàçàíû çíà÷åíèÿ ôóíêöèè КВАРТИЛЬ ïðè ðàçëè÷íûõ âàðèàíòàõ çíà÷åíèé àðãóìåíòà Часть. Ðèñ. 4.2. Ôóíêöèÿ КВАРТИЛЬ Îòìåòèì, ÷òî ôóíêöèè МИН, МЕДИАНА è МАКС âîçâðàùàþò òî æå çíà÷åíèå, ÷òî è ôóíêöèÿ КВАРТИЛЬ, åñëè åå àðãóìåíò Часть ðàâåí 0, 2 èëè 4 ñîîòâåòñòâåííî. 4.2.2. Функция ПЕРСЕНТИЛЬ Ýòà ôóíêöèÿ âû÷èñëÿåò ïðîöåíòèëè ξ0,01, ξ0,02, ..., ξ0,99, ò.å. êâàíòèëè ïîðÿäêà îò 0,01 äî 0,99 (ñì. ðàçäåë 1.2.3). Ýòà ôóíêöèÿ âûïîëíÿåò âû÷èñëåíèÿ àíàëîãè÷íî ôóíêöèè КВАРТИЛЬ. Ñèíòàêñèñ ôóíêöèè: ПЕРСЕНТИЛЬ(Ìàññèâ;k) Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî ÷èñëîâûå çíà÷åíèÿ, ïî êîòîðûì îïðåäåëÿåòñÿ çíà÷åíèå ïðîöåíòèëåé. Àðãóìåíò k çàäàåò ïîðÿäîê âû÷èñëÿåìîãî ïðîöåíòèëÿ. Îí ìîæåò ïðèíèìàòü çíà÷åíèÿ îò 0 äî 1 âêëþ÷èòåëüíî. Íà ðèñ. 4.3 ïîêàçàíû çíà÷åíèÿ ôóíêöèè ПЕРСЕНТИЛЬ ïðè ðàçëè÷íûõ âàðèàíòàõ çíà÷åíèé àðãóìåíòà k. Глава 4. Статистические функции 105 Ðèñ. 4.3. Ôóíêöèÿ ПЕРСЕНТИЛЬ 4.2.3. Функция МЕДИАНА Ýòà ôóíêöèÿ âîçâðàùàåò ìåäèàíó — êâàíòèëü ïîðÿäêà 0,5. Ìåäèàíà â äàííîì ñëó÷àå îïðåäåëÿåòñÿ êàê ÷èñëî, êîòîðîå ÿâëÿåòñÿ ñåðåäèíîé âàðèàöèîííîãî ðÿäà õ(1) ≤ õ(2) ≤ ... ≤ õ(n), ò.å. ïîëîâèíà ÷èñåë èìååò çíà÷åíèÿ, áîëüøèå ÷åì ìåäèàíà, à ïîëîâèíà — ìåíüøèå ÷åì ìåäèàíà. Åñëè n — íå÷åòíîå ÷èñëî (n = 2k + 1), òî â êà÷åñòâå ìåäèàíû áåðåòñÿ ÷èñëî õ(k); åñëè æå n — ÷åòíîå ÷èñëî (n = 2k), òî ìåäèàíà âû÷èñëÿåòñÿ êàê ñðåäíåå ÷èñåë õ(k–1) è õ(k). Ñèíòàêñèñ ôóíêöèè: МЕДИАНА(×èñëî1;×èñëî2;...) Ôóíêöèÿ ìîæåò èìåòü 30 àðãóìåíòîâ Число. Ýòè àðãóìåíòû äîëæíû áûòü ÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ ÷èñëà. Åñëè â çàäàííîì äèàïàçîíå ÿ÷ååê èìåþòñÿ ÿ÷åéêè, ñîäåðæàùèå òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, òî îíè èãíîðèðóþòñÿ; íî ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. 4.2.4. Функция ПРОЦЕНТРАНГ Äàííàÿ ôóíêöèÿ âû÷èñëÿåò òàê íàçûâàåìûé ïðîöåíòíûé ðàíã âûáîðî÷íûõ çíà÷åíèé. Îí âû÷èñëÿåòñÿ ñëåäóþùèì îáðàçîì. Ïî âûáîðêå õ1, õ2, ..., xn ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Íîìåð r ÷ëåíà ðÿäà x(r) — ýòî ðàíã çíà÷åíèÿ x(r). Ïðîöåíòíûé ðàíã ýòîãî çíà÷åíèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå (r – 1)/(n – 1), ãäå n — îáúåì âûáîðêè. Ìîæíî ñ÷èòàòü, ÷òî äàííàÿ ôóíêöèÿ îáðàòíàÿ ê ôóíêöèè ПЕРСЕНТИЛЬ, ãäå ïî çíà÷åíèþ ïîðÿäêà êâàíòèëÿ (÷òî ïðàêòè÷åñêè ñîâïàäàåò ñî çíà÷åíèåì ïîðÿäêîâîãî ðàíãà) íàõîäèòñÿ ñîîòâåòñòâóþùàÿ ïðîöåíòèëü, ò.å. âûáîðî÷íîå çíà÷åíèå (åñëè ïðîöåíòèëü ñîâïàäàåò ñ âûáîðî÷íûì çíà÷åíèåì). Ñèíòàêñèñ ôóíêöèè: ПРОЦЕНТРАНГ(Ìàññèâ;õ;Ðàçìåðíîñòü) 106 Часть II. Средства Excel для статистического анализа Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò х — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ïðîöåíòíûé ðàíã. Åñëè ýòî çíà÷åíèå íå ñîâïàäàåò ñ êàêèì-ëèáî âûáîðî÷íûì çíà÷åíèåì, òî ôóíêöèÿ ПРОЦЕНТРАНГ äëÿ ýòîãî çíà÷åíèÿ âû÷èñëÿåò ðàíã êàê ñðåäíåå ðàíãîâ òåõ ÷ëåíîâ âàðèàöèîííîãî ðÿäà, ìåæäó êîòîðûìè çàêëþ÷åíî äàííîå çíà÷åíèå х. Íåîáÿçàòåëüíûé àðãóìåíò Размерность îïðåäåëÿåò êîëè÷åñòâî äåñÿòè÷íûõ çíàêîâ ïîñëå çàïÿòîé â âû÷èñëåííîì çíà÷åíèè ïðîöåíòíîãî ðàíãà. Åñëè ýòîò àðãóìåíò îïóùåí, òî ïî óìîë÷àíèþ ïðîöåíòíûé ðàíã çàïèñûâàåòñÿ ñ òðåìÿ äåñÿòè÷íûìè çíàêàìè. 4.2.5. Функция РАНГ Èç ñàìîãî íàçâàíèÿ ôóíêöèè РАНГ ïîíÿòíî, ÷òî äàííàÿ ôóíêöèÿ âû÷èñëÿåò ðàíã âûáîðî÷íîãî çíà÷åíèÿ, ò.å. íîìåð r çíà÷åíèÿ x(r) âàðèàöèîííîãî ðÿäà õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Îòìåòèì, ÷òî ôóíêöèÿ ìîæåò óïîðÿäî÷èòü âûáîðêó êàê ïî âîçðàñòàíèþ, òàê è ïî óáûâàíèþ (ñïîñîá óïîðÿäî÷èâàíèÿ çàäàåò àðãóìåíò ôóíêöèè Порядок, î ÷åì ðå÷ü èäåò íèæå), è, êîíå÷íî, âîçâðàùàåìûå ôóíêöèåé çíà÷åíèÿ áóäóò ðàçëè÷íû äëÿ ðàçíûõ ñïîñîáîâ óïîðÿäî÷èâàíèÿ âûáîðêè. Åñëè â âûáîðêå åñòü ñîâïàäàþùèå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, à ïîñëåäóþùåìó çíà÷åíèþ ïðèñâàèâàåòñÿ ðàíã, çíà÷åíèå êîòîðîãî áóäåò áîëüøå ïðåäûäóùåãî ðàíãà íà êîëè÷åñòâî îäèíàêîâûõ âûáîðî÷íûõ çíà÷åíèé. Íàïðèìåð, åñëè â âûáîðêå äâàæäû âñòðå÷àåòñÿ ÷èñëî 10, èìåþùåå ðàíã 5, òî ñëåäóþùåå ïî âåëè÷èíå ÷èñëî 11 áóäåò èìåòü ðàíã 7 è íè îäíî èç ÷èñåë íå áóäåò èìåòü ðàíã 6 (ïðèìåð âçÿò èç ñïðàâî÷íîé ñèñòåìû Excel). Ñèíòàêñèñ ôóíêöèè: РАНГ(×èñëî;Ìàññèâ;Ïîðÿäîê) Àðãóìåíò Массив — ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò Число — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ðàíã. Åñëè ýòî çíà÷åíèå íå ñîâïàäàåò íè ñ îäíèì âûáîðî÷íûì çíà÷åíèåì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д!. Íåîáÿçàòåëüíûé àðãóìåíò Порядок îïðåäåëÿåò ñïîñîá óïîðÿäî÷èâàíèÿ âûáîðêè. Åñëè Порядок ðàâåí 0 (íóëþ) èëè îïóùåí, òî âûáîðêà óïîðÿäî÷èâàåòñÿ ïî óáûâàíèþ. Åñëè Порядок — ëþáîå íåíóëåâîå ÷èñëî, òî âûáîðêà óïîðÿäî÷èâàåòñÿ ïî âîçðàñòàíèþ. Îòìåòèì, ÷òî ñ ïîìîùüþ äàííîé ôóíêöèè ìîæíî âû÷èñëèòü íå òîëüêî ðàíã îäíîãî âûáîðî÷íîãî çíà÷åíèÿ, íî îäíîâðåìåííî ðàíãè âñåõ âûáîðî÷íûõ çíà÷åíèé. Äëÿ ýòîãî íàäî ïðèìåíèòü åå â ôîðìóëå ìàññèâà. Î ôîðìóëàõ ìàññèâà ïîäðîáíåå ïîãîâîðèì â ãëàâå 6, â ðàçäåëå 6.1, çäåñü æå ïðîñòî ïîêàæåì, êàê ïîäñ÷èòàòü âñå ðàíãè îäíîé âûáîðêè. 1. Ïóñòü âûáîðî÷íûå çíà÷åíèÿ çàïèñàíû â îäíîì ñòîëáöå À, êàê ïîêàçàíî íà ðèñ. 4.4. 2. Âû÷èñëåííûå ðàíãè áóäóò çàïèñàíû â ñòîëáöå Â. Âûäåëèòå äèàïàçîí ÿ÷ååê Â2:Â17 è â ïåðâóþ ÿ÷åéêó âûäåëåííîãî äèàïàçîíà ââåäèòå ôîðìóëó =РАНГ(A2:A17;A2:A17;1) (ñì. ðèñ. 4.4). Глава 4. Статистические функции 107 3. Íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter> (ââîä ôîðìóëû ìàññèâà). Ðàíãè áóäóò âû÷èñëåíû äëÿ âñåé âûáîðêè, êàê ïîêàçàíî íà ðèñ. 4.5. Îáðàòèòå âíèìàíèå íà ðàâíûå ðàíãè â ÿ÷åéêàõ Â10, Â11 è Â13; âûáîðî÷íûå çíà÷åíèÿ â ÿ÷åéêàõ À10, À11 è À13 òàêæå îäèíàêîâû. Ðèñ. 4.4. Ââîä ôîðìóëû ìàññèâà Ðèñ. 4.5. Âû÷èñëåííûå ðàíãè 108 Часть II. Средства Excel для статистического анализа 4.3. Функции для вычисления средних Ôóíêöèè ýòîé ãðóïïû âû÷èñëÿþò ñðåäíèå çíà÷åíèÿ: ñðåäíåå àðèôìåòè÷åñêîå, ñðåäíåå ãåîìåòðè÷åñêîå è ñðåäíåå ãàðìîíè÷åñêîå. Ôóíêöèÿ Íàçíà÷åíèå ÑÐÃÀÐÌ Âîçâðàùàåò ñðåäíåå ãàðìîíè÷åñêîå ìíîæåñòâà äàííûõ ÑÐÃÅÎÌ Âîçâðàùàåò ñðåäíåå ãåîìåòðè÷åñêîå ìíîæåñòâà äàííûõ ÑÐÇÍÀ× Âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå ñâîèõ àðãóìåíòîâ ÑÐÇÍÀ×À Âû÷èñëÿåò ñðåäíåå àðèôìåòè÷åñêîå ñâîèõ àðãóìåíòîâ; ïîìèìî ÷èñåë, â ðàñ÷åòå ìîãóò ó÷àñòâîâàòü òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ ÓÐÅÇÑÐÅÄÍÅÅ Âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå, ðàññ÷èòàííîå ïîñëå îòáðàñûâàíèÿ êðàéíèõ çíà÷åíèé ìàññèâà äàííûõ Âñå ïåðå÷èñëåííûå ôóíêöèè, êðîìå ôóíêöèè УРЕЗСРЕДНЕЕ, èìåþò ñëåäóþùèé ñèíòàêñèñ: ФУНКЦИЯ(×èñëî1;×èñëî2;...) Îíè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü èëè íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, èëè ññûëêè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè èãíîðèðóþòñÿ, à ÿ÷åéêè ñ íóëåâûìè çíà÷åíèÿìè çàñ÷èòûâàþòñÿ. Ôóíêöèÿ СРЗНАЧА èíòåðïðåòèðóåò ëîãè÷åñêîå çíà÷åíèå ИСТИНА êàê 1, à ëîãè÷åñêîå çíà÷åíèå ЛОЖЬ è òåêñòîâûå çíà÷åíèÿ — êàê 0. Äðóãèå ôóíêöèè ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ èãíîðèðóþò. Ôóíêöèè СРГАМ è СРГЕОМ òàêæå òðåáóþò, ÷òîáû âñå ÷èñëîâûå çíà÷åíèÿ, êîòîðûå îíè îáðàáàòûâàþò, áûëè ïîëîæèòåëüíûìè. Èíà÷å îíè âîçâðàùàþò îøèáêó #ЧИСЛО!. 4.3.1. Функция СРГАМ Ýòà ôóíêöèÿ âû÷èñëÿåò ñðåäíåå ãàðìîíè÷åñêîå Í çíà÷åíèé õ1, õ2, ..., xn ïî ôîðìóëå H = n n 1 ∑ i =1 xi . Ñðåäíåå ãàðìîíè÷åñêîå íå ïðåâûøàåò ñðåäíåãî ãåîìåòðè÷å- ñêîãî, êîòîðîå, â ñâîþ î÷åðåäü, íå ïðåâûøàåò ñðåäíåãî àðèôìåòè÷åñêîãî. 4.3.2. Функция СРГЕОМ Äàííàÿ ôóíêöèÿ âû÷èñëÿåò ñðåäíåå ãåîìåòðè÷åñêîå G çíà÷åíèé õ1, õ2, ..., xn ïî ôîðìóëå G = n x1 x2 ⋅ ... ⋅ xn . 4.3.3. Функции СРЗНАЧ и СРЗНАЧА Ýòè ôóíêöèè âû÷èñëÿþò ñðåäíåå àðèôìåòè÷åñêîå (âûáîðî÷íîå ñðåäíåå) x çíà÷åíèé õ1, õ2, ..., xn ïî ôîðìóëå x = 1 n ∑ xi . Ðàçëè÷èå ìåæäó ôóíêöèÿìè n i =1 СРЗНАЧ è СРЗНАЧА çàêëþ÷àåòñÿ òîëüêî â èíòåðïðåòàöèè ëîãè÷åñêèõ è òåêñòîâûõ Глава 4. Статистические функции 109 çíà÷åíèé. Ôóíêöèÿ СРЗНАЧ èõ èãíîðèðóåò, à СРЗНАЧА ïðèñâàèâàåò èì ÷èñëîâûå çíà÷åíèÿ: çíà÷åíèå 1 — ëîãè÷åñêîìó çíà÷åíèþ ИСТИНА è çíà÷åíèå 0 — ëîãè÷åñêîìó çíà÷åíèþ ЛОЖЬ è òåêñòîâûì çíà÷åíèÿì. 4.3.4. Функция УРЕЗСРЕДНЕЕ Ýòà ôóíêöèÿ âîçâðàùàåò ñðåäíåå àðèôìåòè÷åñêîå, ðàññ÷èòàííîå ïîñëå îòáðàñûâàíèÿ çàäàííîãî êîëè÷åñòâà êðàéíèõ çíà÷åíèé ìàññèâà äàííûõ. Ñèíòàêñèñ ôóíêöèè: УРЕЗСРЕДНЕЕ(Ìàññèâ;Äîëÿ) Àðãóìåíò Массив — ýòî ÷èñëîâîé ìàññèâ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùåãî äàííûå. Àðãóìåíò Доля — ýòî äîëÿ òî÷åê äàííûõ, èñêëþ÷àåìûõ èç âû÷èñëåíèé, ò.å. êîëè÷åñòâî èñêëþ÷àåìûõ òî÷åê âû÷èñëÿåòñÿ êàê Доля×n, ãäå n — îáùåå êîëè÷åñòâî òî÷åê äàííûõ. Äàííîå ïðîèçâåäåíèå îêðóãëÿåòñÿ ñ íåäîñòàòêîì äî áëèæàéøåãî ÷åòíîãî ÷èñëà è ïîëîâèíà ýòîãî ÷èñëà ïðåäñòàâëÿåò ñîáîé ðàâíûå êîëè÷åñòâà îòáðàñûâàåìûõ íàèìåíüøèõ è íàèáîëüøèõ çíà÷åíèé èç ìàññèâà äàííûõ. Åñëè çíà÷åíèå àðãóìåíòà Доля îòðèöàòåëüíî èëè áîëüøå 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.4. Функции для вычисления геометрических характеристик распределения  ýòó ãðóïïó ôóíêöèé âõîäÿò ñëåäóþùèå ôóíêöèè. Ôóíêöèÿ Íàçíà÷åíèå ÑÊÎÑ Âîçâðàùàåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè ÝÊÑÖÅÑÑ Âîçâðàùàåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(×èñëî1;×èñëî2;...) Îíè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, ÷èñëîâûå ìàññèâû èëè ññûëêè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè, à òàêæå ÿ÷åéêè, ñîäåðæàùèå ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ, èãíîðèðóþòñÿ, íî ÿ÷åéêè ñ íóëåâûìè çíà÷åíèÿìè çàñ÷èòûâàþòñÿ. 4.4.1. Функция СКОС Ýòà ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè ðàñïðåäåëåíèÿ (î êîýôôèöèåíòå àñèììåòðèè è åãî çíà÷åíèè ðå÷ü èäåò â ðàçäåëå 1.2.3). Åñëè åñòü âûáîðêà õ1, õ2, ..., xn (çàäàåòñÿ àðãóìåíòàìè Число), ôóíêöèÿ СКОС âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè ïî ñëåäóþùåé ôîðìóëå: 2 n xi − x n β̂1 = , ∑ (n − 1)(n − 2) i =1 sn 110 Часть II. Средства Excel для статистического анализа ãäå n — îáúåì âûáîðêè, x = 1 n 1 n 2 ( xi − x )2 . x , s = ∑ i n n −1 ∑ n i =1 i =1 Åñëè n < 3 èëè sn = 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. 4.4.2. Функция ЭКСЦЕСС Ýòà ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà ðàñïðåäåëåíèÿ (î êîýôôèöèåíòå ýêñöåññà è åãî çíà÷åíèè ðå÷ü èäåò â ðàçäåëå 1.2.3). Åñëè åñòü âûáîðêà õ1, õ2, ..., xn (çàäàåòñÿ àðãóìåíòàìè Число), òî ôóíêöèÿ ЭКСЦЕСС âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà ïî ñëåäóþùåé ôîðìóëå: 4 β̂ 2 = n xi − x 3(n − 1) 2 n(n + 1) , − ∑ (n − 1)(n − 2)(n − 3) i =1 sn (n − 3)(n − 3) ãäå n — îáúåì âûáîðêè, x = 1 n 1 n xi , sn2 = ∑ ∑ ( xi − x )2 . n i =1 n − 1 i =1 Åñëè n < 4 èëè sn = 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. 4.5. Функции для вычисления выборочной дисперсии и отклонения  ýòó ãðóïïó âêëþ÷åíû ôóíêöèè, êîòîðûå âû÷èñëÿþò òó èëè èíóþ ìåðó ðàçáðîñà âûáîðî÷íûõ çíà÷åíèé îòíîñèòåëüíî ñðåäíåãî. Ôóíêöèÿ Íàçíà÷åíèå ÄÈÑÏ Âû÷èñëÿåò íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè ÄÈÑÏÀ Âû÷èñëÿåò íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè, ó÷èòûâàÿ ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ ÄÈÑÏÐ Âû÷èñëÿåò àñèìïòîòè÷åñêè íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè ÄÈÑÏÐÀ Âû÷èñëÿåò àñèìïòîòè÷åñêè íåñìåùåííóþ îöåíêó äèñïåðñèè âûáîðêè, ó÷èòûâàÿ ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ ÊÂÀÄÐÎÒÊË Âîçâðàùàåò ñóììó êâàäðàòîâ îòêëîíåíèé ÑÐÎÒÊË Âîçâðàùàåò ñðåäíåå çíà÷åíèå àáñîëþòíûõ âåëè÷èí îòêëîíåíèé òî÷åê äàííûõ îò ñðåäíåãî ÑÒÀÍÄÎÒÊËÎÍ Îöåíèâàåò ñòàíäàðòíîå îòêëîíåíèå ïî âûáîðêå ÑÒÀÍÄÎÒÊËÎÍÀ Îöåíèâàåò ñòàíäàðòíîå îòêëîíåíèå ïî âûáîðêå, â ðàñ÷åòå òàêæå ó÷èòûâàþòñÿ òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ ÑÒÀÍÄÎÒÊËÎÍÏ Âû÷èñëÿåò ñòàíäàðòíîå îòêëîíåíèå ïî ãåíåðàëüíîé ñîâîêóïíîñòè ÑÒÀÍÄÎÒÊËÎÍÏÀ Âû÷èñëÿåò ñòàíäàðòíîå îòêëîíåíèå ïî ãåíåðàëüíîé ñîâîêóïíîñòè, â ðàñ÷åòå òàêæå ó÷èòûâàþòñÿ òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ Глава 4. Статистические функции 111 Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(×èñëî1;×èñëî2;...) Ôóíêöèè ìîãóò èìåòü äî 30 àðãóìåíòîâ Число. Ýòèìè àðãóìåíòàìè ìîãóò áûòü íåïîñðåäñòâåííî ÷èñëîâûå çíà÷åíèÿ, ÷èñëîâûå ìàññèâû èëè ññûëêè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ, ïðè ýòîì ïóñòûå ÿ÷åéêè èãíîðèðóþòñÿ, à ÿ÷åéêè ñ íóëåâûìè çíà÷åíèÿìè çàñ÷èòûâàþòñÿ. Ôóíêöèè ДИСПА, ДИСПРА, СТАНДОТКЛОНА è СТАНДОТКЛОНПА èíòåðïðåòèðóþò ëîãè÷åñêîå çíà÷åíèå ИСТИНА êàê 1, à ëîãè÷åñêîå çíà÷åíèå ЛОЖЬ è òåêñòîâûå çíà÷åíèÿ — êàê 0. Äðóãèå ôóíêöèè ëîãè÷åñêèå è òåêñòîâûå çíà÷åíèÿ èãíîðèðóþò. 4.5.1. Функции ДИСП и ДИСПА Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íóþ äèñïåðñèþ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå sn2 = 1 n 1 n ( xi − x )2 , ãäå x = ∑ xi . ∑ n − 1 i =1 n i =1 Ýòî íåñìåùåííàÿ îöåíêà íåèçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. 4.5.2. Функции ДИСПР и ДИСПРА Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íóþ äèñïåðñèþ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå Sn2 = 1 n 1 n ( xi − x ) 2 , ãäå x = ∑ xi . ∑ n i =1 n i =1 Ýòî àñèìïòîòè÷åñêè íåñìåùåííàÿ îöåíêà íåèçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. 4.5.3. Функция КВАДРОТКЛ Ýòà ôóíêöèÿ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) âû÷èñëÿåò ñóììó êâàäðàòîâ îòêëîíåíèé âûáîðî÷íûõ çíà÷åíèé îò âûáîðî÷íîãî n ñðåäíåãî, ò.å. âû÷èñëÿåò âåëè÷èíó ∑ (x i − x )2 , ãäå x = i =1 1 n ∑ xi . n i =1 Çíà÷åíèå, âîçâðàùàåìîå ýòîé ôóíêöèåé, ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ âûáîðî÷íîé äèñïåðñèè èëè âûáîðî÷íîãî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ. 4.5.4. Функции СТАНДОТКЛОН и СТАНДОТКЛОНА Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå (ñòàíäàðòíîå) îòêëîíåíèå ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå sn = 1 n 1 n ( xi − x ) 2 , ãäå x = ∑ xi . ∑ n − 1 i =1 n i =1 112 Часть II. Средства Excel для статистического анализа 4.5.5. Функции СТАНДОТКЛОНП и СТАНДОТКЛОНПА Ýòè ôóíêöèè âû÷èñëÿþò âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå (ñòàíäàðòíîå) îòêëîíåíèå ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) ïî ôîðìóëå Sn = 1 n 1 n ( xi − x ) 2 , ãäå x = ∑ xi . ∑ n i =1 n i =1 4.5.6. Функция СРОТКЛ Ýòà ôóíêöèÿ ïî âûáîðêå õ1, õ2, ..., xn (êîòîðàÿ çàäàåòñÿ àðãóìåíòàìè Число) âû÷èñëÿåò ñðåäíåå àðèôìåòè÷åñêîå ìîäóëåé îòêëîíåíèé âûáîðî÷íûõ çíà÷åíèé 1 n 1 n | xi − x | , ãäå x = ∑ xi . ∑ n i =1 n i =1 Çíà÷åíèå, âîçâðàùàåìîå ýòîé ôóíêöèåé, ïîêàçûâàåò (íàðÿäó ñî ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèåì) ìåðó ðàññåèâàíèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ. îò âûáîðî÷íîãî ñðåäíåãî, ò.å. âåëè÷èíó 4.6. Функции для вычисления значений функций распределения Ýòî, ïî-âèäèìîìó, ñàìàÿ îáøèðíàÿ ãðóïïà ñòàòèñòè÷åñêèõ ôóíêöèé.  íåå âõîäÿò òàêèå ôóíêöèè. Ôóíêöèÿ Íàçíà÷åíèå FÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ôóíêöèè F-ðàñïðåäåëåíèÿ ÁÅÒÀÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ôóíêöèè áåòà-ðàñïðåäåëåíèÿ ÁÈÍÎÌÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ÂÅÉÁÓËË Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî ÃÀÌÌÀÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ãàììà-ðàñïðåäåëåíèÿ ÃÈÏÅÐÃÅÎÌÅÒ Âîçâðàùàåò çíà÷åíèÿ ãèïåðãåîìåòðè÷åñêîãî ðàñïðåäåëåíèÿ ËÎÃÍÎÐÌÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ÍÎÐÌÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ÍÎÐÌÑÒÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ ÎÒÐÁÈÍÎÌÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ îòðèöàòåëüíîãî áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ÏÓÀÑÑÎÍ Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ïóàññîíà ÑÒÜÞÄÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ÕÈ2ÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ðàñïðåäåëåíèÿ χ2 ÝÊÑÏÐÀÑÏ Âîçâðàùàåò çíà÷åíèÿ ýêñïîíåíöèàëüíîãî ðàñïðåäåëåíèÿ Глава 4. Статистические функции 113 4.6.1. Функция FРАСП Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç. Îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà) ñ (m, n) ñòåïåíÿìè ñâîáîäû (ñì. ðàçäåë 1.5.7)1. ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè âû÷èñëèòü çíà÷åíèå ôóíêöèè F-ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî ïðèìåíèòü ôîðìóëó =1 – FРАСП(u;m;n) (m è n — çàäàííûå çíà÷åíèÿ ñòåïåíåé ñâîáîäû), êàê ïîêàçàíî íà ðèñ. 4.6. Ñèíòàêñèñ ôóíêöèè: FРАСП(õ;Ñòåïåíü_ñâîáîäû1;Ñòåïåíü_ñâîáîäû2) Çäåñü x — ýòî çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ, Степень_свободы1 è Степень_свободы2 — çíà÷åíèÿ ñòåïåíåé ñâîáîäû F-ðàñïðåäåëåíèÿ. Åñëè êàêîåëèáî èç ýòèõ çíà÷åíèé íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî ëèáî åñëè çíà÷åíèÿ ñòåïåíåé ñâîáîäû ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ðèñ. 4.6. Ãðàôèêè ôóíêöèé FРАСП и 1 – FРАСП 4.6.2. Функция БЕТАРАСП Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè áåòà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α è β, α è β > 0 (ñì. ðàçäåë 1.5.9). Ñèíòàêñèñ ôóíêöèè: БЕТАРАСП(õ;Àëüôà;Áåòà;À;Â) 1 Îòìåòèì, ÷òî â ñïðàâî÷íîé ñèñòåìå Excel ïðè îïèñàíèè ýòîé ôóíêöèè îøèáî÷íî óêàçàíî, ÷òî îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ < õ) (Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ Fðàñïðåäåëåíèå). Ýòà îøèáêà ïîâòîðÿåòñÿ â áîëüøèíñòâå êíèã, ñîäåðæàùèõ îïèñàíèå ñòàòèñòè÷åñêèõ ôóíêöèé. 114 Часть II. Средства Excel для статистического анализа Àðãóìåíò x — ýòî çíà÷åíèå èç èíòåðâàëà îò A äî B, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Альфа è Бета — ïàðàìåòðû ðàñïðåäåëåíèÿ. Íåîáÿçàòåëüíûå àðãóìåíòû A è В — ñîîòâåòñòâåííî íèæíÿÿ è âåðõíÿÿ ãðàíèöû èíòåðâàëà èçìåíåíèÿ x. Åñëè àðãóìåíòû A è B îïóùåíû, òî ïî óìîë÷àíèþ ïðèíèìàåòñÿ, ÷òî A = 0 è B = 1. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ БЕТАРАСП âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè Альфа èëè Бета ≤ 0 ëèáî åñëè x < A, x > B èëè A = B, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.3. Функция БИНОМРАСП Íàïîìíèì (ñì. ðàçäåë 1.4.3), ÷òî áèíîìèàëüíîå ðàñïðåäåëåíèå ÷àñòî ðàññìàòðèâàþò êàê ìîäåëü ñëó÷àéíûõ ýêñïåðèìåíòîâ, ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé, â ðåçóëüòàòå êàæäîãî èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Òîãäà ñëó÷àéíàÿ âåëè÷èíà, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1” â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Ôóíêöèÿ БИНОМРАСП ïîçâîëÿåò âû÷èñëÿòü êàê çíà÷åíèÿ âåðîÿòíîñòåé Ð(Õ = k) ïðè ëþáûõ n, p è k, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ F(x). Ñèíòàêñèñ ôóíêöèè: БИНОМРАСП(×èñëî_óñïåõîâ;×èñëî_èñïûòàíèé; Âåðîÿòíîñòü_óñïåõà; Èíòåãðàëüíàÿ) Çäåñü àðãóìåíò Число_успехов — ýòî êîëè÷åñòâî èñïûòàíèé k, â êîòîðûõ ïðîèçîøåë èñõîä “1”. Число_испытаний — êîëè÷åñòâî èñïûòàíèé n. Вероятность_успеха — âåðîÿòíîñòü p èñõîäà “1”. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ, ò.å. âåðîÿòíîñòü òîãî, ÷òî ÷èñëî èñõîäîâ “1” íå ìåíåå çíà÷åíèÿ àðãóìåíòà Число_успехов; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ÷èñëî èñõîäîâ “1” â òî÷íîñòè ðàâíî çíà÷åíèþ àðãóìåíòà Число_успехов. Åñëè çíà÷åíèÿ àðãóìåíòîâ Число_успехов è Число_испытаний íå ÿâëÿþòñÿ öåëûìè ÷èñëàìè, òî â êà÷åñòâå àðãóìåíòîâ áåðåòñÿ öåëàÿ ÷àñòü ýòèõ ÷èñåë. Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Число_успехов îòðèöàòåëüíî èëè áîëüøå çíà÷åíèÿ àðãóìåíòà Число_испытаний, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ôóíêöèÿ âîçâðàùàåò òàêóþ æå îøèáêó, åñëè çíà÷åíèå àðãóìåíòà Вероятность_успеха íå ïðèíàäëåæèò èíòåðâàëó (0, 1). 4.6.4. Функция ВЕЙБУЛЛ Äàííàÿ ôóíêöèÿ ìîæåò âû÷èñëÿòü êàê çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè, òàê è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ Âåéáóëëà–Ãíåäåíêî (ñì. ðàçäåë 1.5.11). Ñèíòàêñèñ ôóíêöèè: ВЕЙБУЛЛ(x;Àëüôà;Áåòà;Èíòåãðàëüíàÿ) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Альфа è Бета — íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè. Глава 4. Статистические функции 115 Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ îòðèöàòåëüíû, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.5. Функция ГАММАРАСП Äàííàÿ ôóíêöèÿ ìîæåò âû÷èñëÿòü êàê çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè, òàê è çíà÷åíèÿ ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ (ñì. ðàçäåë 1.5.10). Ñèíòàêñèñ ôóíêöèè: ГАММАРАСП(x;Àëüôà;Áåòà;Èíòåãðàëüíàÿ) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Альфа è Бета — íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè. Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ îòðèöàòåëüíû, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.6. Функция ГИПЕРГЕОМЕТ Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âåðîÿòíîñòè Ð(Õ = k), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ãèïåðãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè N, n è ð (N ≥ n ≥ 0, 0 < p < 1) (ñì. ðàçäåë 1.4.6). Ñèíòàêñèñ ôóíêöèè: ГИПЕРГЕОМЕТ(×èñëî_óñïåõîâ_â_âûáîðêå;Ðàçìåð_âûáîðêè;×èñëî_óñïåõîâ_â_ñîâ îêóïíîñòè;Ðàçìåð_ñîâîêóïíîñòè) Àðãóìåíò Число_успехов_в_выборке — ýòî çíà÷åíèå k, àðãóìåíò Размер_выборки — çíà÷åíèå n, Число_успехов_в_совокупности — çíà÷åíèå ðN, Размер_совокупности — ýòî çíà÷åíèå N. Ôóíêöèÿ ГИПЕРГЕОМЕТ âûïîëíÿåò âû÷èñëåíèÿ ïî ôîðìóëå P(X = k ) = k C Np C Nn −(1k− p ) C Nn , k = 0, 1, 2, ..., n , ãäå Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Âñå àðãóìåíòû ôóíêöèè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ, íå ïðåâûøàþùèõ çàäàííûõ çíà÷åíèé àðãóìåíòîâ. Åñëè êàêîé-ëèáî àðãóìåíò íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Число_успехов_в_выборке îòðèöàòåëüíî èëè ïðåâîñõîäèò ìåíüøåå èç ÷èñåë Размер_выборки è Число_успехов_в_совокупности, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Åñëè àðãóìåíò Размер_выборки îòðèöàòåëüíî èëè ïðåâîñõîäèò çíà÷åíèå àðãóìåíòà Размер_совокупности, ôóíêöèÿ òàêæå âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Òàêèå æå îãðàíè÷åíèÿ íàêëàäûâàþòñÿ íà àðãóìåíò Число_успехов_в_совокупности. Çíà÷åíèå àðãóìåíòà Размер_совокупности äîëæíî áûòü ïîëîæèòåëüíûì ÷èñëîì, èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 116 Часть II. Средства Excel для статистического анализа 4.6.7. Функция ЛОГНОРМРАСП Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8). Ñèíòàêñèñ ôóíêöèè: ЛОГНОРМРАСП(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíò Среднее — ýòî ïàðàìåòð m, à Стандартное_отклонение — ïàðàìåòð σ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x èëè Стандартное_отклонение îòðèöàòåëüíî èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.8. Функция НОРМРАСП Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.4). Ñèíòàêñèñ ôóíêöèè: НОРМРАСП(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå;Èíòåãðàëüíàÿ) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíòû Среднее è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ ñîîòâåòñòâåííî. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè. Åñëè ïåðâûå òðè àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение îòðèöàòåëüíî èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Åñëè Среднее = 0 è Стандартное_отклонение = 1, òî ôóíêöèÿ âîçâðàùàåò òå æå çíà÷åíèÿ, ÷òî è ôóíêöèÿ НОРМСТРАСП. 4.6.9. Функция НОРМСТРАСП Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ äëÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ (ïàðàìåòðû m = 0 è σ2 = 1) (ñì. ðàçäåë 1.5.4). Ñèíòàêñèñ ôóíêöèè: НОРМСТРАСП(x) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Åñëè àðãóìåíò x íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. 4.6.10. Функция ОТРБИНОМРАСП Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ = k), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ èìååò îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ïàñêàëÿ) ñ ïàðàìåòðàìè r è ð (0 < p < 1) (ñì. ðàçäåë 1.4.7). Ýòà âåðîÿòíîñòü âû÷èñëÿåòñÿ ïî ôîðìóëå P(X = k ) = Crk+ k −1 p r (1 − p) r , k = 0, 1, 2, ... , ãäå Cnk — áèíîìèàëüíûé êîýôôèöèåíò. Глава 4. Статистические функции 117 Ñèíòàêñèñ ôóíêöèè: ОТРБИНОМРАСП(×èñëî_k;×èñëî_r;Âåðîÿòíîñòü) Àðãóìåíò Число_k ïðèíèìàåò çíà÷åíèå k, àðãóìåíò Число_r — çíà÷åíèå ïàðàìåòðà r è Вероятность — çíà÷åíèå âåðîÿòíîñòè ð. Çíà÷åíèÿ ïåðâûõ äâóõ àðãóìåíòîâ ôóíêöèè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ, íå ïðåâûøàþùèõ çàäàííûõ çíà÷åíèé àðãóìåíòîâ. Åñëè êàêîé-ëèáî àðãóìåíò íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Åñëè ñóììà ïåðâûõ äâóõ àðãóìåíòîâ ìåíüøå 1, ôóíêöèÿ âîçâðàùàåò òî æå çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.11. Функция ПУАССОН Ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ðàñïðåäåëåíèÿ Ïóàññîíà ñ ïàðàìåòðîì λ, λ > 0 (ñì. ðàçäåë 1.4.4). Ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ äëÿ îïèñàíèÿ ñëó÷àéíîãî ÷èñëà ïîÿâëåíèÿ îïðåäåëåííûõ ñîáûòèé â ôèêñèðîâàííûé ïðîìåæóòîê âðåìåíè èëè â ôèêñèðîâàííîé îáëàñòè ïðîñòðàíñòâà. Ñèíòàêñèñ ôóíêöèè: Пуассон(õ;Ñðåäíåå;Èíòåãðàëüíàÿ) Àðãóìåíò x — êîëè÷åñòâî ñîáûòèé. Àðãóìåíò Среднее — çíà÷åíèå ïàðàìåòðà λ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âû÷èñëÿåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ, ò.å. âåðîÿòíîñòü òîãî, ÷òî ÷èñëî ñëó÷àéíûõ ñîáûòèé áóäåò îò 0 äî x âêëþ÷èòåëüíî; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ âåðîÿòíîñòü òîãî, ÷òî ñîáûòèé áóäåò â òî÷íîñòè x. Åñëè x — íå öåëîå ÷èñëî, òî â êà÷åñòâå àðãóìåíòà áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. Åñëè ïåðâûå äâà àðãóìåíòà ôóíêöèè íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x è Среднее îòðèöàòåëüíû èëè ðàâíû 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.12. Функция СТЬЮДРАСП Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç.  çàâèñèìîñòè îò çíà÷åíèÿ àðãóìåíòà Хвосты îíà âû÷èñëÿåò ëèáî âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ n ñòåïåíÿìè ñâîáîäû (ñì. ðàçäåë 1.5.6), ëèáî âåðîÿòíîñòü 1 – Ð(|Õ| ≤ õ) = Ð(Õ ≤ –õ) + Ð(Õ ≥ õ). ( ñèëó ñèììåòðèè ðàñïðåäåëåíèÿ Ñòüþäåíòà âî âòîðîì ñëó÷àå çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé, áóäåò â äâà ðàçà áîëüøå ÷åì çíà÷åíèå, âîçâðàùàåìîå â ïåðâîì ñëó÷àå.) ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè âû÷èñëèòü çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî ïðèìåíèòü ôîðìóëó =1 – СТЬЮДРАСП(u;n;1) (n — çàäàííîå çíà÷åíèå ñòåïåíè ñâîáîäû, 1 — çíà÷åíèå àðãóìåíòà Хвосты). Ñèíòàêñèñ ôóíêöèè: СТЬЮДРАСП(õ;Ñòåïåíü_ñâîáîäû;Õâîñòû) Çäåñü x — íåîòðèöàòåëüíîå çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ, Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû ðàñïðåäåëåíèÿ. Àðãóìåíò Хвосты 118 Часть II. Средства Excel для статистического анализа ìîæåò ïðèíèìàòü çíà÷åíèå 1 èëè 2: åñëè ýòîò àðãóìåíò ðàâåí 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≥ õ); åñëè æå àðãóìåíò ðàâåí 2, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≤ –õ) + Ð(Õ ≥ õ). Åñëè êàêîå-ëèáî èç çíà÷åíèé ïîñëåäíèõ äâóõ àðãóìåíòîâ íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî ëèáî åñëè çíà÷åíèå ñòåïåíè ñâîáîäû ìåíüøå 1 èëè çíà÷åíèå àðãóìåíòà Хвосты âûõîäèò çà èíòåðâàë (1, 3), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.13. Функция ХИ2РАСП Ýòà ôóíêöèÿ èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç. Îíà âû÷èñëÿåò âåðîÿòíîñòü Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû (ñì. ðàçäåë 1.5.5). ×òîáû ñ ïîìîùüþ ýòîé ôóíêöèè âû÷èñëèòü çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ F(u), íåîáõîäèìî ïðèìåíèòü ôîðìóëó =1 – ХИ2РАСП(u;n) (n — çàäàííîå çíà÷åíèå ñòåïåíåé ñâîáîäû). Ñèíòàêñèñ ôóíêöèè: ХИ2РАСП(õ;Ñòåïåíü_ñâîáîäû) Çäåñü x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ, Степень_свободы — çíà÷åíèå ñòåïåíåé ñâîáîäû ðàñïðåäåëåíèÿ. Åñëè çíà÷åíèå àðãóìåíòà Степень_свободы íå öåëîå, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî çíà÷åíèÿ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x îòðèöàòåëüíî, ëèáî åñëè çíà÷åíèå ñòåïåíåé ñâîáîäû ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.6.14. Функция ЭКСПРАСП Ýòà ôóíêöèÿ âû÷èñëÿåò çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ äëÿ ýêñïîíåíöèàëüíîãî (ïîêàçàòåëüíîãî) ðàñïðåäåëåíèÿ ñ ïàðàìåòðîì λ, λ > 0 (ñì. ðàçäåë 1.5.3). Ñèíòàêñèñ ôóíêöèè: ЭКСПРАСП(x;Ëÿìáäà;Èíòåãðàëüíàÿ) Àðãóìåíò x — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Àðãóìåíò Лямбда — ïàðàìåòð ðàñïðåäåëåíèÿ λ. Àðãóìåíò Интегральная ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА (èëè 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè ðàñïðåäåëåíèÿ; åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ (èëè 0), òî âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè ïëîòíîñòè âåðîÿòíîñòè. Åñëè ïåðâûå äâà àðãóìåíòà íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà х îòðèöàòåëüíî ëèáî åñëè çíà÷åíèå àðãóìåíòà Лямбда ìåíüøå èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7. Функции, обратные к функциям распределения  ýòó ãðóïïó âõîäÿò ôóíêöèè, âû÷èñëÿþùèå çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ. Глава 4. Статистические функции 119 Ôóíêöèÿ Íàçíà÷åíèå FÐÀÑÏÎÁÐ Âîçâðàùàåò îáðàòíîå çíà÷åíèå äëÿ F-ðàñïðåäåëåíèÿ ÁÅÒÀÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ áåòà-ðàñïðåäåëåíèÿ ÃÀÌÌÀÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ãàììà-ðàñïðåäåëåíèÿ ÊÐÈÒÁÈÍÎÌ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ËÎÃÍÎÐÌÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ÍÎÐÌÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ ÍÎÐÌÑÒÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ ÑÒÜÞÄÐÀÑÏÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà ÕÈ2ÎÁÐ Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 Ýòè ôóíêöèè èìåþò îáÿçàòåëüíûé àðãóìåíò Вероятность (è, êîíå÷íî, àðãóìåíòû, çàäàþùèå ïàðàìåòðû ðàñïðåäåëåíèÿ), â ñîîòâåòñòâèè ñ êîòîðûì âû÷èñëÿåòñÿ çíà÷åíèå ôóíêöèè. Îáðàùàåì âíèìàíèå íà òî, ÷òî íå âñå èç ýòèõ ôóíêöèé âû÷èñëÿþò çíà÷åíèÿ ôóíêöèé, îáðàòíûõ ê ôóíêöèÿì ðàñïðåäåëåíèÿ. Åñëè îïðåäåëåíèå çíà÷åíèÿ îáðàòíîé ôóíêöèè ýêâèâàëåíòíî ðåøåíèþ óðàâíåíèÿ Ð(Õ ≤ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ äàííîå ðàñïðåäåëåíèå, p — çàäàííàÿ âåðîÿòíîñòü, à u — èñêîìàÿ âåëè÷èíà (ò.å. u = F–1(p), F–1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ F(u) = Ð(Õ ≤ u)), òî íåêîòîðûå ôóíêöèè èç ýòîé ãðóïïû ðåøàþò óðàâíåíèå Ð(Õ ≥ u) = p. ×òîáû â ýòîì ñëó÷àå íàéòè çíà÷åíèå îáðàòíîé ôóíêöèè, íåîáõîäèìî âû÷èñëèòü ñòàòèñòè÷åñêóþ ôóíêöèþ ýòîãî òèïà ñ àðãóìåíòîì Вероятность = 1 – ð. Òàêèå ôóíêöèè óäîáíî èñïîëüçîâàòü äëÿ ïîñòðîåíèÿ êðèòè÷åñêèõ îáëàñòåé êðèòåðèåâ ïðîâåðêè ãèïîòåç. Ôóíêöèè, âû÷èñëÿþùèå çíà÷åíèÿ îáðàòíûõ ôóíêöèé, óäîáíî ïðèìåíÿòü äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ çàäàííîå ðàñïðåäåëåíèå. 4.7.1. Функция FРАСПОБР Ýòî ôóíêöèÿ, âû÷èñëÿþùàÿ êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà) ñ (m, n) ñòåïåíÿìè ñâîáîäû (m, n ≥ 1) (ñì. ðàçäåë 1.5.7). Ñèíòàêñèñ ôóíêöèè: FРАСПОБР(Âåðîÿòíîñòü;Ñòåïåíü_ñâîáîäû1;Ñòåïåíü_ñâîáîäû2) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Степень_свободы1 è Степень_свободы2 — çíà÷åíèÿ ñòåïåíåé ñâîáîäû, ò.å. ïàðàìåòðû m è n. Åñëè çíà÷åíèå êàêîãî-ëèáî èç ïîñëåäíèõ àðãóìåíòîâ íå ÿâëÿåòñÿ öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. 120 Часть II. Средства Excel для статистического анализа Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò èíòåðâàëó (0, 1) ëèáî åñëè çíà÷åíèÿ àðãóìåíòîâ Степень_свободы1 è Степень_свободы2 ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.2. Функция БЕТАОБР Äàííàÿ ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áåòàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α è β (α > 0, β > 0) (ñì. ðàçäåë 1.5.9). Ñèíòàêñèñ ôóíêöèè: БЕТАОБР(Âåðîÿòíîñòü;Àëüôà;Áåòà;A;B) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Альфа è Бета — íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ. Íåîáÿçàòåëüíûå àðãóìåíòû A è B çàäàþò ñîîòâåòñòâåííî íèæíþþ è âåðõíþþ ãðàíèöû èíòåðâàëà èçìåíåíèÿ ñëó÷àéíîé âåëè÷èíû. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ íå çàäàíû, òî ïî óìîë÷àíèþ ïðèíèìàåòñÿ, ÷òî A = 0 è B = 1. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ Альфа è Бета ìåíüøå èëè ðàâíû 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.3. Функция ГАММАОБР Ýòà ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ãàììàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α è λ (α > 0, λ > 0) (ñì. ðàçäåë 1.5.10). Ñèíòàêñèñ ôóíêöèè: ГАММАОБР(Âåðîÿòíîñòü;Àëüôà;Áåòà) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Альфа è Бета — íåîòðèöàòåëüíûå ïàðàìåòðû ðàñïðåäåëåíèÿ, ïðè ýòîì ïàðàìåòð Бета ðàâåí 1/λ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ Альфа è Бета ìåíüøå èëè ðàâíû 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.4. Функция ЛОГНОРМОБР Ýòà ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8). Ñèíòàêñèñ ôóíêöèè: ЛОГНОРМОБР(Âåðîÿòíîñòü;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Среднее è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение ìåíüøå èëè ðàâíî 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Глава 4. Статистические функции 121 4.7.5. Функция НОРМОБР Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.4). Ñèíòàêñèñ ôóíêöèè: НОРМОБР(Âåðîÿòíîñòü;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíòû Среднее è Стандартное_отклонение — ïàðàìåòðû ðàñïðåäåëåíèÿ m è σ. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Стандартное_отклонение ìåíüøå èëè ðàâíî 0 ëèáî åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.6. Функция НОРМСТОБР Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ (â ýòîì ñëó÷àå m = 0 è σ2 = 1) (ñì. ðàçäåë 1.5.4). Ñèíòàêñèñ ôóíêöèè: НОРМ`СТОБР(Âåðîÿòíîñòü) Àðãóìåíò Вероятность — çíà÷åíèå âåðîÿòíîñòè p. Åñëè àðãóìåíò íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность âûõîäèò çà èíòåðâàë (0, 1), ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.7. Функция СТЬЮДРАСПОБР Ýòî ôóíêöèÿ, âû÷èñëÿþùàÿ êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ n ñòåïåíÿìè ñâîáîäû (n ≥ 1) (ñì. ðàçäåë 1.5.6). Ñèíòàêñèñ ôóíêöèè: СТЬЮДРАСПОБР(Âåð`îÿòíîñòü;Ñòåïåíü_ñâîáîäû) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíò Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû, ò.å. ïàðàìåòð n. Åñëè çíà÷åíèå ýòîãî àðãóìåíòà íå ÿâëÿåòñÿ öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò èíòåðâàëó (0, 1) ëèáî åñëè çíà÷åíèå àðãóìåíòà Степень_свободы ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.8. Функция ХИ2ОБР Ôóíêöèÿ âû÷èñëÿåò êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p, ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ n ñòåïåíÿìè ñâîáîäû (n ≥ 1) (ñì. ðàçäåë 1.5.5). Ñèíòàêñèñ ôóíêöèè: ХИ2ОБР(Âåðîÿòíîñòü;Ñòåïåíü_ñâîáîäû) Àðãóìåíò Вероятность — ýòî çíà÷åíèå âåðîÿòíîñòè p. Àðãóìåíò Степень_свободы — çíà÷åíèå ñòåïåíè ñâîáîäû, ò.å. ïàðàìåòð n. Åñëè çíà÷åíèå ýòîãî àðãóìåíòà íå ÿâëÿåòñÿ öåëûì ÷èñëîì, áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. 122 Часть II. Средства Excel для статистического анализа Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå àðãóìåíòà Вероятность íå ïðèíàäëåæèò èíòåðâàëó (0, 1) ëèáî åñëè çíà÷åíèå àðãóìåíòà Степень_свободы ìåíüøå 1 èëè áîëüøå 1010, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.7.9. Функция КРИТБИНОМ Ôóíêöèÿ âîçâðàùàåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p (0 < p < 1, n ≥ 1). Íàïîìíèì (ñì. ðàçäåë 1.4.3), ÷òî áèíîìèàëüíîå ðàñïðåäåëåíèå ÿâëÿåòñÿ ìîäåëüþ ñëó÷àéíûõ ýêñïåðèìåíòîâ, ñîñòîÿùèõ èç n íåçàâèñèìûõ îäèíàêîâûõ èñïûòàíèé, è â ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Òîãäà ñëó÷àéíàÿ âåëè÷èíà Õ, ðàâíàÿ êîëè÷åñòâó k èñõîäîâ “1” â n èñïûòàíèÿõ, èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå. Ôóíêöèÿ КРИТБИНОМ âû÷èñëÿåò íàèìåíüøåå çíà÷åíèå k, ïðè êîòîðîì Ð(Õ = k) ≥ α (α — çàäàííîå ÷èñëî). Ñèíòàêñèñ ôóíêöèè: КРИТБИНОМ(×èñëî_èñïûòàíèé;Âåðîÿòíîñòü;Àëüôà) Àðãóìåíò Число_испытаний — êîëè÷åñòâî íåçàâèñèìûõ èñïûòàíèé n. Åñëè çíà÷åíèå ýòîãî àðãóìåíòà — íå öåëîå ÷èñëî, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. Àðãóìåíò Вероятность — âåðîÿòíîñòü p èñõîäà “1” â êàæäîì èñïûòàíèè, ò.å. ïàðàìåòð ðàñïðåäåëåíèÿ. Àðãóìåíò Альфа — çíà÷åíèå âåðîÿòíîñòè α. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèå Число_испытаний îòðèöàòåëüíî ëèáî åñëè çíà÷åíèÿ àðãóìåíòîâ Вероятность è Альфа âûõîäÿò çà èíòåðâàë (0, 1), òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.8. Функции для проверки статистических критериев Ôóíêöèè ýòîé ãðóïïû âûïîëíÿþò ðàñ÷åòû äëÿ ðàçëè÷íûõ ñòàòèñòè÷åñêèõ êðèòåðèåâ. Ôóíêöèÿ Íàçíà÷åíèå ZÒÅÑÒ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ íîðìàëüíî ðàñïðåäåëåííîé ãåíåðàëüíîé ñîâîêóïíîñòè ÒÒÅÑÒ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê (êðèòåðèé Ñòüþäåíòà) ÔÒÅÑÒ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ðàâåíñòâå (íåðàâåíñòâå) äèñïåðñèé äâóõ âûáîðîê ÕÈ2ÒÅÑÒ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè âûáîðêè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé (êðèòåðèé χ2) Глава 4. Статистические функции 123 4.8.1. Функция ZТЕСТ Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåííîé ïî íîðìàëüíîìó çàêîíó, ïðè èçâåñòíîé äèñïåðñèè ðàñïðåäåëåíèÿ. ×òîáû ïîÿñíèòü âû÷èñëåíèÿ, âûïîëíÿåìûå ôóíêöèåé ZТЕСТ, íàïîìíèì ñòàòèñòè÷åñêóþ ìîäåëü è ïðîâåðÿåìûå ãèïîòåçû (ñì. ðàçäåë 2.4.1). Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ è ñ íåèçâåñòíûì ìàòåìàòè÷åñêèì îæèäàíèåì µ è èçâåñòíîé äèñïåðñèåé σ2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: µ = m0 Í0: µ ≤ m0 Í0: µ ≥ m0 Í1: µ ≠ m0 Í1: µ > m0 Í1: µ < m0 Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Ôóíêöèÿ ZТЕСТ ñíà÷àëà âû÷èñëÿåò çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè T= n ( x − m0 ) 1 n , ãäå x = ∑ xi , à çàòåì — âåðîÿòíîñòü ZТЕСТ = 1 – F(T), ãäå F — n i =1 σ ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ñëó÷àé à). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî α/2 ≤ ZТЕСТ ≤ 1 – α/2, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè ZТЕСТ ≤ 1 – α. Ñëó÷àé â). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè α ≤ ZТЕСТ. Ñèíòàêñèñ ôóíêöèè: ZТЕСТ(Ìàññèâ;x;Ñèãìà) Àðãóìåíò Массив — ìàññèâ äàííûõ èëè àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., õn. Àðãóìåíò x — ïðîâåðÿåìîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ (ò.å. çíà÷åíèå m0). Íåîáÿçàòåëüíûé àðãóìåíò Сигма — çíà÷åíèå ñòàíäàðòíîãî îòêëîíåíèÿ σ ãåíåðàëüíîé ñîâîêóïíîñòè. Åñëè ýòîò àðãóìåíò îïóùåí, òî èñïîëüçóåòñÿ âûáîðî÷íîå ñòàíäàðòíîå îòêëîíåíèå. (Íî ïîñêîëüêó â ýòîì ñëó÷àå âñå ðàâíî èñïîëüçóåòñÿ ôóíêöèÿ ðàñïðåäåëåíèÿ íîðìàëüíîãî çàêîíà, â òàêîì âàðèàíòå ôóíêöèþ ZТЕСТ ìîæíî èñïîëüçîâàòü òîëüêî ïðè äîñòàòî÷íî áîëüøîì îáúåìå âûáîðêè.) Åñëè àðãóìåíò Массив ïóñò, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. 4.8.2. Функция ТТЕСТ Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) íåèçâåñòíûõ ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, ðàñïðåäåëåííûõ ïî íîðìàëüíîìó çàêîíó, ïðè÷åì ôóíêöèÿ ðàáîòàåò êàê äëÿ çàâèñèìûõ âûáîðîê, òàê è äëÿ íåçàâèñèìûõ è ïðè óñëîâèÿõ ðàâåíñòâà è íåðàâåíñòâà äèñïåðñèé âûáîðîê. ×òîáû ïîÿñíèòü âû÷èñëåíèÿ, âûïîëíÿåìûå ôóíêöèåé ТТЕСТ, ïðèâåäåì ñîîòâåòñòâóþùèå ñòàòèñòè÷åñêèå ìîäåëè è ïðîâåðÿåìûå ãèïîòåçû (ñì. ðàçäåë 2.4.2). Ñòàòèñòè÷åñêàÿ ìîäåëü 1. Äâóìåðíàÿ âûáîðêà (õ1, y1), (õ2, y2), ..., (õn, ón) îáúåìîì n èçâëå÷åíà èç äâóìåðíîé íîðìàëüíîé ñîâîêóïíîñòè ñ íåèçâåñòíûìè 124 Часть II. Средства Excel для статистического анализа ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2 êîìïîíåíòîâ âûáîðêè. Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 1 àðãóìåíòà Тип. Ñòàòèñòè÷åñêàÿ ìîäåëü 2. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ ðàâíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 2 àðãóìåíòà Тип. Ñòàòèñòè÷åñêàÿ ìîäåëü 3. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåðàâíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ýòîé ìîäåëè â ôóíêöèè ТТЕСТ ñîîòâåòñòâóåò çíà÷åíèå 3 àðãóìåíòà Тип. Âî âñåõ ñòàòèñòè÷åñêèõ ìîäåëÿõ ïðîâåðÿþòñÿ ñëåäóþùèå ãèïîòåçû. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Í1: µ1 > µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Ñèíòàêñèñ ôóíêöèè: ТТЕСТ(Ìàññèâ1,Ìàññèâ2,Õâîñòû,Òèï) Àðãóìåíò Массив1 ïðåäñòàâëÿåò ïåðâóþ âûáîðêó õ1, õ2, ..., õn, àðãóìåíò Массив2 — âòîðóþ âûáîðêó y1, y2, ..., ym. Çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1 äëÿ ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé è ðàâíî 2 äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå. Àðãóìåíò Тип äîëæåí èìåòü çíà÷åíèå 1 äëÿ ñòàòèñòè÷åñêîé ìîäåëè 1, çíà÷åíèå 2 äëÿ ìîäåëè 2 è çíà÷åíèå 3 äëÿ ìîäåëè 3.  çàâèñèìîñòè îò ñòàòèñòè÷åñêîé ìîäåëè ôóíêöèÿ ТТЕСТ âûïîëíÿåò òàêèå âû÷èñëåíèÿ. Ñòàòèñòè÷åñêàÿ ìîäåëü 1 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 1). Âû÷èñëÿþòñÿ n ðàçíîñòåé d1 = x1 – y1, d2 = x2 – y2, ..., dn = xn – yn è ïî íèì îïðåäåëÿþòñÿ ñðåäíåå d = 1 n 1 n 2 d è âûáîðî÷íàÿ äèñïåðñèÿ ðàçíîñòåé S = ∑ i ∑ (di − d )2 . Ïî âû÷èñn n i =1 n i =1 ëåííîìó çíà÷åíèþ êðèòåðèàëüíîé ñòàòèñòèêè T = d Sn / n ôóíêöèÿ ТТЕСТ âîç- âðàùàåò çíà÷åíèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 – F(T) + F(–T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α. Íàïîìíèì, ÷òî äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, à äëÿ ïðîâåðêè ãèïîòåçû î íåðàâåíñòâå çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Парный двухвыборочный t-тест для средних èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.9). Ñòàòèñòè÷åñêàÿ ìîäåëü 2 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 2). Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x = 1 n ∑ xi , n i =1 Глава 4. Статистические функции 125 S x2 = 1 n ∑ ( xi − x )2 , n i =1 y= 1 m 1 m 2 y , S = ( yi − y ) 2 . Ïî âû÷èñëåííîìó çíà÷åíèþ ∑ i y m∑ m i =1 i =1 êðèòåðèàëüíîé ñòàòèñòèêè T = n + m − 2( x − y ) n+m (n − 1) S x2 + (m − 1) S y2 nm ôóíêöèÿ ТТЕСТ âîç- âðàùàåò çíà÷åíèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 – F(T) + F(–T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с одинаковыми дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.7). Ñòàòèñòè÷åñêàÿ ìîäåëü 3 (çíà÷åíèå àðãóìåíòà Тип ðàâíî 3). Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: S x2 = 1 n ∑ ( xi − x )2 , n i =1 y= x= 1 n ∑ xi , n i =1 1 m 1 m yi , S y2 = ∑ ( yi − y ) 2 . Ïî âû÷èñëåííîìó çíà÷åíèþ ∑ m i =1 m i =1 êðèòåðèàëüíîé ñòàòèñòèêè T = x−y S / n + S y2 / m 2 x ôóíêöèÿ ТТЕСТ âîçâðàùàåò çíà÷å- íèÿ 1 – F(T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 1, èëè 1 – F(T) + F(–T), åñëè çíà÷åíèå àðãóìåíòà Хвосты ðàâíî 2, ãäå F(õ) — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû k, êîòîðàÿ ðàññ÷èòûâàåòñÿ ïî ôîðìóëå k = ( S x2 / n + S y2 / m)2 2 2 ( S x2 / n) 2 ( S y / m) + n −1 m −1 . Ãèïîòåçû î ðàâåíñòâå è íåðàâåíñòâå ïðèíèìàþòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ТТЕСТ, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α.  Excel ýòîò êðèòåðèé ðåàëèçóåò ñðåäñòâî Двухвыборочный t-тест с различными дисперсиями èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.8). Íà àðãóìåíòû ôóíêöèè ТТЕСТ íàêëàäûâàþòñÿ ñëåäóþùèå îãðàíè÷åíèÿ. Åñëè Тип = 1 (ïàðíûé êðèòåðèé), òî Массив1 è Массив2 äîëæíû ïðåäñòàâëÿòü âûáîðêè îäèíàêîâûõ îáúåìîâ, èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д.  ñëó÷àå äðîáíûõ çíà÷åíèé àðãóìåíòîâ Хвосты è Тип áåðåòñÿ öåëàÿ ÷àñòü ýòèõ çíà÷åíèé. Åñëè çíà÷åíèÿ ýòèõ àðãóìåíòîâ íå ÿâëÿþòñÿ ÷èñëàìè, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè àðãóìåíò Хвосты èìååò çíà÷åíèå, îòëè÷íîå îò 1 è 2, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.8.3. Функция ФТЕСТ Ýòà ôóíêöèÿ ðåàëèçóåò êðèòåðèé Ôèøåðà ïðîâåðêè ðàâåíñòâà äèñïåðñèé äâóõ íåçàâèñèìûõ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé (ñì. ðàçäåë 2.4.2). Íàïîìíèì, ÷òî ýòîò êðèòåðèé ðåàëèçóåòñÿ ïðè âûïîëíåíèè ñëåäóþùåé ñòàòèñòè÷åñêîé ìîäåëè. 126 Часть II. Средства Excel для статистического анализа Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ïðè çàäàííîì óðîâíå çíà÷èìîñòè α ïðîâåðÿåòñÿ íóëåâàÿ ãèïîòåçà Í0: σ12 = σ22 ïðîòèâ àëüòåðíàòèâíîé ãèïîòåçû Í1: σ12 ≠ σ22. Ñèíòàêñèñ ôóíêöèè: ФТЕСТ(Ìàññèâ1,Ìàññèâ2) Àðãóìåíò Массив1 ïðåäñòàâëÿåò ïåðâóþ âûáîðêó õ1, õ2, ..., õn, àðãóìåíò Массив2 — âòîðóþ âûáîðêó y1, y2, ..., ym. Ôóíêöèÿ âûïîëíÿåò ñëåäóþùèå âû÷èñëåíèÿ. Äëÿ êàæäîé âûáîðêè âû÷èñëÿþòñÿ ñíà÷àëà âûáîðî÷íûå äèñïåðñèè S x2 = òåì — èõ îòíîøåíèå F = 1 n 1 m ( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 , à çà∑ n i =1 m i =1 S x2 , êîòîðîå ÿâëÿåòñÿ êðèòåðèàëüíîé ñòàòèñòèêîé. S y2 Ôóíêöèÿ ФТЕСТ âîçâðàùàåò çíà÷åíèå 1 – F(F), ãäå F(õ) — ôóíêöèÿ Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1 (î F-ðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7). Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé, áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α. Åñëè îáúåì âûáîðêè, çàäàâàåìîé àðãóìåíòîì Массив1 èëè Массив2, ìåíüøå äâóõ ëèáî åñëè äèñïåðñèÿ îäíîé èç âûáîðîê ðàâíà íóëþ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. Ýòîò êðèòåðèé òàêæå ðåàëèçóåò ñðåäñòâî Двухвыборочный F-тест для дисперсий èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.10). 4.8.4. Функция ХИ2ТЕСТ Ýòà ôóíêöèÿ ÿâëÿåòñÿ ÷àñòüþ êðèòåðèÿ χ2 ïðîâåðêè ãèïîòåç î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè îïðåäåëåííîìó êëàññó ðàñïðåäåëåíèé. Ïðèâåäåì ñòàòèñòè÷åñêóþ ìîäåëü äëÿ ýòîãî êðèòåðèÿ (ñì. ðàçäåë 2.4.3). Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u) è çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ íåèçâåñòíî. Ïðîâåðÿåòñÿ íóëåâàÿ ãèïîòåçà Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u) (çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì) ïðîòèâ àëüòåðíàòèâíîé ãèïîòåçû Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. ×òîáû ïðîâåðèòü ýòè ãèïîòåçû, åùå äî ïðèìåíåíèÿ ôóíêöèè ХИ2ТЕСТ íåîáõîäèìî ïðîâåñòè ñëåäóþùèå âû÷èñëåíèÿ. 1. Îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé ðàçáèòü íà k íåïåðåñåêàþùèõñÿ èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 = (õ(2), õ(3)), ..., ∆k = (õ(k), õ(k+1)). 2. Ïîäñ÷èòàòü, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé ïîïàëî â êàæäûé èíòåðâàë ∆i. Ïîëó÷àåì ðÿä ÷èñåë n1, n2, ..., nk. Глава 4. Статистические функции 127 3.  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå νi = n[F(x(i+1)) – F(x(i))] âû÷èñëèòü îæèäàåìîå çíà÷åíèå ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i) è x(i+1) — ãðàíèöû èíòåðâàëà ∆i. Èòàê, èìåþòñÿ äâà ìàññèâà äàííûõ: {n1, n2, ..., nk} è {ν1, ν2, ..., νk}. Äàëåå âñòóïàåò â ðàáîòó ôóíêöèÿ ХИ2ТЕСТ. Ïî çàäàííûì ìàññèâàì {n1, n2, k ..., nk} è {ν1, ν2, ..., νk} îíà âû÷èñëÿåò êðèòåðèàëüíóþ ñòàòèñòèêó T = ∑ i =1 (ni − ν i ) 2 νi è çàòåì âîçâðàùàåò âåðîÿòíîñòü Ð(Õ > T), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Åñëè çíà÷åíèå, âîçâðàùàåìîå ôóíêöèåé ХИ2ТЕСТ áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, òî ãèïîòåçà Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Îáðàùàåì âíèìàíèå, ÷òî ôóíêöèÿ ХИ2ТЕСТ èñïîëüçóåò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû, à íå ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Ïîýòîìó êðèòåðèé, âûïîëíÿåìûé ñ ïîìîùüþ ýòîé ôóíêöèè, èìååò áîëüøóþ âåðîÿòíîñòü îøèáêè âòîðîãî ðîäà, ò.å. áîëüøóþ âåðîÿòíîñòü ïðèíÿòü íóëåâóþ ãèïîòåçó, åñëè îíà íåâåðíà. Ñèíòàêñèñ ôóíêöèè: ХИ2ТЕСТ(Ôàêòè÷åñêèé_èíòåðâàë;Îæèäàåìûé_èíòåðâàë) Àðãóìåíò Фактический_интервал — ýòî ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèõ ÷èñëà n1, n2, ..., nk. Àðãóìåíò Ожидаемый_интервал — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèõ ÷èñëà ν1, ν2, ..., νk. Åñëè àðãóìåíòû ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà ÷èñåë, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ êðèòåðèÿ χ2 ïîêàçàíà â ãëàâå 9, â ðàçäåëå 9.3. 4.9. Функции для построения уравнения регрессии и прогнозирования Ôóíêöèè ýòîé ãðóïïû âåñüìà ïîëåçíû ïðè ïðîâåäåíèè ðåãðåññèîííîãî àíàëèçà. Ôóíêöèÿ Íàçíà÷åíèå ËÃÐÔÏÐÈÁË Âîçâðàùàåò ïàðàìåòðû êðèâîé, ïîëó÷åííîé â ðåçóëüòàòå ýêñïîíåíöèàëüíîé àïïðîêñèìàöèè Âîçâðàùàåò ìàññèâ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè, ïîëó÷åííûé â ðåçóëüòàòå àïïðîêñèìàöèè èñõîäíûõ äàííûõ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ Âîçâðàùàåò íàêëîí ïðÿìîé ëèíåéíîé ðåãðåññèè Âîçâðàùàåò îòðåçîê, îòñåêàåìûé íà îñè ïðÿìîé ëèíåéíîé ðåãðåññèè Âîçâðàùàåò ïðåäñêàçàííîå çíà÷åíèå ôóíêöèè â òî÷êå X íà îñíîâå ëèíåéíîé ðåãðåññèè äëÿ ìàññèâîâ èçâåñòíûõ çíà÷åíèé X è Y èëè èíòåðâàëîâ äàííûõ Ðàññ÷èòûâàåò ïðîãíîçèðóåìûé ýêñïîíåíöèàëüíûé ðîñò íà îñíîâàíèè èìåþùèõñÿ äàííûõ Âîçâðàùàåò äëÿ êàæäîãî çíà÷åíèÿ X ñòàíäàðòíóþ îøèáêó ïðåäñêàçàííûõ çíà÷åíèé Y (ò.å. âû÷èñëåííûõ çíà÷åíèé ôóíêöèè ðåãðåññèè) Âîçâðàùàåò çíà÷åíèå â ñîîòâåòñòâèè ñ ëèíåéíîé ôóíêöèåé ðåãðåññèè ËÈÍÅÉÍ ÍÀÊËÎÍ ÎÒÐÅÇÎÊ ÏÐÅÄÑÊÀÇ ÐÎÑÒ ÑÒÎØYX ÒÅÍÄÅÍÖÈß 128 Часть II. Средства Excel для статистического анализа Êàæäàÿ èç ýòèõ ôóíêöèé èìååò íå ìåíåå äâóõ àðãóìåíòîâ, îäèí èç êîòîðûõ çàäàåò ìàññèâ çíà÷åíèé íåçàâèñèìîé ïåðåìåííîé Õ, à âòîðîé — ìàññèâ çíà÷åíèé çàâèñèìîé ïåðåìåííîé Y.  íåêîòîðûõ ôóíêöèÿõ ìîæíî çàäàâàòü íå òîëüêî îäíîìåðíûé ìàññèâ ïåðåìåííîé Õ, íî è äâóìåðíûé, ò.å. èìååòñÿ âîçìîæíîñòü èññëåäîâàòü çàâèñèìîñòü ìåæäó âåêòîðíîé ïåðåìåííîé Õ è ñêàëÿðíîé Y è ñòðîèòü ìíîæåñòâåííóþ ðåãðåññèþ. Ôóíêöèè ЛГРФПРИБЛ è РОСТ ðàáîòàþò ñ ýêñïîíåíöèàëüíîé ðåãðåññèåé, îñòàëüíûå — ñ ëèíåéíîé. Ïðè ïîñòðîåíèè óðàâíåíèé ðåãðåññèè âñå ôóíêöèè èñïîëüçóþò ìåòîä íàèìåíüøèõ êâàäðàòîâ (ñì. ðàçäåë 3.4). Îòìåòèì, ÷òî äðóãèå ñðåäñòâà Excel, â ÷àñòíîñòè íàäñòðîéêà Пакет анализа (ñì. ãëàâó 5) è ñðåäñòâà ïîñòðîåíèÿ äèàãðàìì (ñì. ãëàâó 6), èìåþò çíà÷èòåëüíî áîëüøèå âîçìîæíîñòè äëÿ ïîñòðîåíèÿ è âèçóàëèçàöèè ðåãðåññèîííûõ çàâèñèìîñòåé. 4.9.1. Функция ЛИНЕЙН Ïðèìåíÿÿ ìåòîä íàèìåíüøèõ êâàäðàòîâ, äàííàÿ ôóíêöèÿ ðàññ÷èòûâàåò êîýôôèöèåíòû ëèíåéíîé (îòíîñèòåëüíî ýòèõ êîýôôèöèåíòîâ) ðåãðåññèè, êîòîðàÿ íàèëó÷øèì îáðàçîì àïïðîêñèìèðóåò èìåþùèåñÿ äàííûå. Èòàê, èìååòñÿ ìàññèâ ñî çíà÷åíèÿìè ïåðåìåííîé Õ: îäíîìåðíûé {õ1, õ2, ..., õn} (n — êîëè÷åñòâî íàáëþäåíèé), åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y òîëüêî îò îäíîé ïåðåìåííîé, ëèáî äâóìåðíûé {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,}, åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y îò k ïåðåìåííûõ (ò.å. ïåðåìåííàÿ Õ â ýòîì ñëó÷àå ÿâëÿåòñÿ âåêòîðîì, ñîñòîÿùèì èç k êîìïîíåíòîâ: Õ = (Õ1, Õ2, ..., Õk)). Çàäàí òàêæå ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Ïî ýòèì äàííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b â ñëó÷àå îäíîìåðíîé ïåðåìåííîé Õ èëè Ŷ = m1X1 + m2X2 + ... + mkÕk + b â ñëó÷àå, êîãäà Õ = (Õ1, Õ2, ..., Õk). Ôóíêöèÿ ЛИНЕЙН ïî ìàññèâàì èñõîäíûõ äàííûõ âû÷èñëÿåò êîýôôèöèåíòû mi è b, à òàêæå ìîæåò âû÷èñëèòü íåêîòîðûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ýòèõ êîýôôèöèåíòîâ è âñåãî óðàâíåíèÿ ðåãðåññèè â öåëîì. Äàííóþ ôóíêöèþ ìîæíî òàêæå èñïîëüçîâàòü äëÿ ïîñòðîåíèÿ óðàâíåíèÿ ïîëèíîìèàëüíîé ðåãðåññèè. Åñëè ìàññèâ çíà÷åíèé Õ èìååò ñòðóêòóðó {õ1, õ2, ..., õn, õ12, õ22, ..., õn2, ..., õ1k, õ2k, ..., õnk,}, òî â ýòîì ñëó÷àå ñòðîèòñÿ ïîëèíîìèàëüíàÿ ðåãðåññèÿ Ŷ = m1X + m2X2 + ... + mkÕk + b. Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b (íå ìåíåå äâóõ çíà÷åíèé), ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû ìàññèâà (ñ èñïîëüçîâàíèåì äëÿ ââîäà êîìáèíàöèè êëàâèø <Ctrl+Shift+Enter>), â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå òîëüêî êîýôôèöèåíòà mk. Ñèíòàêñèñ ôóíêöèè: ЛИНЕЙН(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Êîíñòàíòà;Ñòàòèñòèêà) Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Y. Íåîáÿçàòåëüíûé àðãóìåíò Значения_X — ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Õ. Åñëè äàííûé àðãóìåíò îïóùåí, ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ Значения_Y . Åñëè ìàññèâ Значения_Y ðàñïîëîæåí â îäèí ñòîëáåö, òî êàæäûé ñòîëáåö ìàññèâà Значения_X èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àíàëîãè÷íî, åñëè ìàññèâ Глава 4. Статистические функции 129 Значения_Y ðàñïîëîæåí â îäíó ñòðîêó, òî êàæäàÿ ñòðîêà ìàññèâà Значения_X èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àðãóìåíò Константа — ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, äîëæåí ëè êîýôôèöèåíò b áûòü ðàâíûì 0. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА, 1 èëè îïóùåí, òî êîýôôèöèåíò b âû÷èñëÿåòñÿ êàê îáû÷íî. Åñëè àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî b ïîëàãàåòñÿ ðàâíûì 0 è çíà÷åíèÿ êîýôôèöèåíòîâ mi ïîäáèðàþòñÿ òàê, ÷òîáû óðàâíåíèå ðåãðåññèè èìåëî âèä Ŷ = m1X1 + m2X2 + ... + mkÕk. Àðãóìåíò Статистика ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, òðåáóåòñÿ ëè ðàññ÷èòûâàòü äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ðåãðåññèè. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА èëè 1, òî ôóíêöèÿ ðàññ÷èòûâàåò è âûâîäèò ýòè äîïîëíèòåëüíûå õàðàêòåðèñòèêè (ñì. òàáëèöó, ïðèâåäåííóþ íèæå; îïèñàíèå è ïîÿñíåíèÿ ê ýòèì õàðàêòåðèñòèêàì äàíû â ðàçäåëå 3.4.3). Åñëè àðãóìåíò Статистика èìååò çíà÷åíèå ЛОЖЬ, 0 èëè îïóùåí, òî ôóíêöèÿ âîçâðàùàåò òîëüêî çíà÷åíèÿ êîýôôèöèåíòîâ mi è b. Таблица. Статистические характеристики, рассчитываемые функцией ЛИНЕЙН Õàðàêòåðèñòèêà Îïèñàíèå s1, s2, ..., sk Ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ äëÿ êîýôôèöèåíòîâ m1, m2, ..., mk sb Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äëÿ êîýôôèöèåíòà b (sb = #Н/Д, åñëè àðãóìåíò Константа èìååò çíà÷åíèå ЛОЖЬ) R2 Êîýôôèöèåíò äåòåðìèíàöèè. Ñðàâíèâàþòñÿ ôàêòè÷åñêèå çíà÷åíèÿ Y è çíà÷åíèÿ Ŷ , ïîëó÷àåìûå èç óðàâíåíèÿ ðåãðåññèè; ïî ðåçóëüòàòàì ñðàâíåíèÿ âû÷èñëÿåòñÿ êîýôôèöèåíò äåòåðìèíàöèè, íîðìèðîâàííûé îò 0 äî 1. Åñëè îí ðàâåí 1, òî íåò ðàçëè÷èÿ ìåæäó ôàêòè÷åñêèì è ðàñ÷åòíûìè çíà÷åíèÿìè Y.  ïðîòèâîïîëîæíîì ñëó÷àå, åñëè êîýôôèöèåíò äåòåðìèíàöèè ðàâåí 0, óðàâíåíèå ðåãðåññèè ïëîõî îïèñûâàåò çíà÷åíèÿ Y sε Îñòàòî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå F Êðèòåðèàëüíàÿ ñòàòèñòèêà äëÿ ïðîâåðêè çíà÷èìîñòè óðàâíåíèÿ ðåãðåññèè df Ñòåïåíü ñâîáîäû SS1 Ñóììà êâàäðàòîâ ðåãðåññèè SS2 Ñóììà êâàäðàòîâ îñòàòêîâ Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b (íå ìåíåå äâóõ çíà÷åíèé), à òàêæå äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (åñëè àðãóìåíò Статистика ðàâåí ИСТИНА). Ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû ìàññèâà, â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå òîëüêî êîýôôèöèåíòà mk.  âûõîäíîì ìàññèâå äàííûå ðàñïîëàãàþòñÿ ñëåäóþùèì îáðàçîì. 130 Часть II. Средства Excel для статистического анализа mk mk–1 ... m2 m1 b sk sk–1 ... s2 s1 sb R 2 sε F df SS1 SS2 Îñòàëüíûå ÿ÷åéêè ýòîãî ìàññèâà çàïîëíÿþòñÿ çíà÷åíèÿìè #Н/Д. Ðàññìîòðèì ïðèìåð ïðèìåíåíèÿ ôóíêöèè ЛИНЕЙН. Ïóñòü, êàê ïîêàçàíî íà ðèñ. 4.7, ìàññèâ çíà÷åíèé ïåðåìåííîé Õ ðàñïîëîæåí â ñòîëáöàõ À è Â, à ìàññèâ çíà÷åíèé ïåðåìåííîé Y — â ñòîëáöå Ñ. Òàêèì îáðàçîì, ïåðåìåííàÿ Õ — äâóìåðíàÿ, èìååò êîìïîíåíòû Õ1 è Õ2. Âûäåëèì äèàïàçîí Å2:G6, â êîòîðîì áóäóò ñîäåðæàòüñÿ ðåçóëüòàòû âû÷èñëåíèé. Ââîäèì ôîðìóëó =ЛИНЕЙН(C2:C17;A2:B17;;1) (ñì. ðèñ. 4.7). Çàòåì íàæèìàåì êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter> (ââîä ôîðìóëû ìàññèâà). Ðåçóëüòàò ïîêàçàí íà ðèñ. 4.8 (äëÿ óäîáñòâà èíòåðïðåòàöèè ðåçóëüòàòîâ äîáàâëåíû ïîäïèñè ê ÿ÷åéêàì). Ðèñ. 4.7. Ââîä ôîðìóëû 4.9.2. Функции НАКЛОН и ОТРЕЗОК Ýòè ôóíêöèè âû÷èñëÿþò êîýôôèöèåíòû óðàâíåíèÿ ëèíåéíîé ðåãðåññèè Ŷ = mX + b, ïîäñ÷èòàííûå ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ (ñì. ðàçäåë 3.4.2): ôóíêöèÿ НАКЛОН âû÷èñëÿåò êîýôôèöèåíò m, ôóíêöèÿ ОТРЕЗОК — êîýôôèöèåíò b. (×òîáû ñðàçó âû÷èñëèòü îáà êîýôôèöèåíòà, ñëåäóåò âîñïîëüçîâàòüñÿ ôóíêöèåé ЛИНЕЙН.) Глава 4. Статистические функции 131 Ðèñ. 4.8. Ðåçóëüòàòû âû÷èñëåíèé Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X) Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д. 4.9.3. Функция СТОШYX Ôóíêöèÿ ñî ñòðàííûì íàçâàíèåì СТОШYX (êñòàòè, ïîñëåäíèå áóêâû â ýòîì íàçâàíèè — ýòî íå ðóññêîå ìîëîäåöêîå “ÓÕ-Õ!”, à ñïîêîéíûå ëàòèíñêèå áóêâû “èãðåê” è “èêñ”) âû÷èñëÿåò ñòàíäàðòíóþ îøèáêó ðåãðåññèè èëè êîðåíü êâàäðàòíûé èç ñðåäíåé ñóììû îñòàòêîâ (ñì. ðàçäåë 3.4.3). Ýòó æå âåëè÷èíó âû÷èñëÿåò ôóíêöèÿ ЛИНЕЙН ñðåäè ñâîèõ äîïîëíèòåëüíûõ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê ïîä íàçâàíèåì sε — îñòàòî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå. Ïóñòü èìååòñÿ ìàññèâ {õ1, õ2, ..., õn} çíà÷åíèé Õ è ìàññèâ {ó1, ó2, ..., ón} çíà÷åíèé Y, ïî êîòîðûì ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b. Îñòàòêàìè íàçûâàþòñÿ ðàçíîñòè di = yi – yˆ i = yi – mxi – b. sY = Ñòàíäàðòíàÿ îøèáêà ðåãðåññèè âû÷èñëÿåòñÿ ïî ôîðìóëå 1 n ∑ ( yi − yˆi )2 . Ýòà âåëè÷èíà õàðàêòåðèçóåò òî÷íîñòü àïïðîêñèìàöèè n − 2 i =1 èñõîäíûõ äàííûõ ëèíåéíîé ôóíêöèåé. Ñèíòàêñèñ ôóíêöèè: СТОШYX(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X) 132 Часть II. Средства Excel для статистического анализа Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д. 4.9.4. Функция ПРЕДСКАЗ Ïóñòü èìååòñÿ ìàññèâ {õ1, õ2, ..., õn} çíà÷åíèé Õ è ìàññèâ {ó1, ó2, ..., ón} çíà÷åíèé Y, ïî êîòîðûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ ñòðîèòñÿ óðàâíåíèå ëèíåéíîé ðåãðåññèè Ŷ = mX + b. Äàííàÿ ôóíêöèÿ âû÷èñëÿåò çíà÷åíèå ŷ = mx + b äëÿ çàäàííîãî çíà÷åíèÿ õ, ò.å. “ïðåäñêàçûâàåò” çíà÷åíèå ïåðåìåííîé Y, îòêóäà è íàçâàíèå ôóíêöèè. Ñèíòàêñèñ ôóíêöèè: ПРЕДСКАЗ(õ;Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X) Àðãóìåíò х — çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè. Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Åñëè àðãóìåíò x íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè àðãóìåíòû ñîäåðæàò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Åñëè àðãóìåíòû ïóñòû èëè ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà äàííûõ, ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #Н/Д. Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà х íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà (íàæàâ êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>) ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }. 4.9.5. Функция ТЕНДЕНЦИЯ Ýòà ôóíêöèÿ, ïîäîáíî ïðåäûäóùåé ôóíêöèè, âû÷èñëÿåò â ñîîòâåòñòâèè ñ ïîñòðîåííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ óðàâíåíèåì ðåãðåññèè çíà÷åíèå Ŷ äëÿ êîíêðåòíîãî çíà÷åíèÿ X. Íî â îòëè÷èå îò ôóíêöèè ПРЕДСКАЗ ôóíêöèÿ ТЕНДЕНЦИЯ ìîæåò ðàáîòàòü êàê ñ ìíîæåñòâåííîé ëèíåéíîé ðåãðåññèåé, òàê è ñ ïîëèíîìèàëüíîé ðåãðåññèåé, ÷òî çàâèñèò îò ñòðóêòóðû ñîäåðæèìîãî âõîäíîãî ìàññèâà çíà÷åíèé ïåðåìåííîé Õ. Ïóñòü çàäàí ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Åñëè ìàññèâ çíà÷åíèé ïåðåìåííîé Õ ÿâëÿåòñÿ äâóìåðíûì ìàññèâîì âèäà {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,}, òî â ýòîì ñëó÷àå èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y îò k ïåðåìåííûõ Õ1, Õ2, ..., Õk è ñòðîèòñÿ ìíîæåñòâåííàÿ ëèíåéíàÿ ðåãðåññèÿ Ŷ = m1X1 + m2X2 + ... + mkÕk + b. Åñëè æå äàííûé ìàññèâ èìååò ñòðóêòóðó {õ1, õ2, ..., õn, õ12, õ22, ..., õn2, ..., õ1k, õ2k, ..., õnk,}, òî â ýòîì ñëó÷àå Глава 4. Статистические функции 133 ñòðîèòñÿ ïîëèíîìèàëüíàÿ ðåãðåññèÿ Ŷ = m1X + m2X2 + ... + mkÕk + b. Ôóíêöèÿ ТЕНДЕНЦИЯ ïî çàäàííûì çíà÷åíèÿì (õ1, õ2, ..., õk) è ïî óðàâíåíèþ ìíîæåñòâåííîé ëèíåéíîé ðåãðåññèè èëè ïî çíà÷åíèÿì (õ, õ2, ..., õk) è ïî óðàâíåíèþ ïîëèíîìèàëüíîé ðåãðåññèè âû÷èñëÿåò çíà÷åíèå ŷ . Åñëè èñõîäíûé ìàññèâ çíà÷åíèé Õ ñîâïàäàåò ïî ðàçìåðó ñ ìàññèâîì çíà÷åíèé Y, òî ôóíêöèÿ ТЕНДЕНЦИЯ äëÿ âû÷èñëåíèÿ íîâîãî çíà÷åíèÿ ŷ èñïîëüçóåò îáû÷íóþ ëèíåéíóþ ðåãðåññèþ è â ýòîì ñëó÷àå îíà íå îòëè÷àåòñÿ îò ôóíêöèè ПРЕДСКАЗ. Ñèíòàêñèñ ôóíêöèè: ТЕНДЕНЦИЯ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Íîâûå_çíà÷åíèÿ_x;Êîíñòàíòà) Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Новые_значения_x — çíà÷åíèÿ, äëÿ êîòîðûõ âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè. Åñëè àðãóìåíò Значения_X îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ àðãóìåíòà Значения_Y . Åñëè îïóùåí àðãóìåíò Новые_значения_x, òî ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî îí ñîâïàäàåò ñ àðãóìåíòîì Значения_X. Àðãóìåíò Константа ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè îí èìååò çíà÷åíèå ИСТИНА èëè 1 ëèáî îïóùåí, òî êîýôôèöèåíò óðàâíåíèÿ ðåãðåññèè b âû÷èñëÿåòñÿ êàê îáû÷íî; åñëè æå îí èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî êîýôôèöèåíò b ïîëàãàåòñÿ ðàâíûì 0 è çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âû÷èñëÿþòñÿ ñ ó÷åòîì ýòîãî óñëîâèÿ. Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà х íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà (íàæàâ êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>) ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }. 4.9.6. Функция ЛГРФПРИБЛ Ïðèìåíÿÿ ìåòîä íàèìåíüøèõ êâàäðàòîâ, äàííàÿ ôóíêöèÿ ðàññ÷èòûâàåò êîýôôèöèåíòû ýêñïîíåíöèàëüíîé ðåãðåññèè, ò.å. ïî èñõîäíûì äàííûì ñòðîèò ôóíêöèè âèäà Ŷ = b0mX (åñëè èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y òîëüêî îò îäíîé ïåðåìåííîé Õ) è Ŷ = b0 ⋅ m1 1 ⋅ m2 X X2 ⋅ ... ⋅ mk Xk (åñëè ïåðåìåííàÿ Y çàâèñèò îò k ïåðåìåííûõ Õ1, Õ2, ..., Õk). Âèä ýêñïîíåíöèàëüíîé ðåãðåññèè, êîýôôèöèåíòû êîòîðîé mi è b0 âû÷èñëÿåò ôóíêöèÿ ЛГРФПРИБЛ, îïðåäåëÿåòñÿ ñòðóêòóðîé ìàññèâà çíà÷åíèé ïåðåìåííîé Õ: îäíîìåðíûé ìàññèâ {õ1, õ2, ..., õn} äëÿ ðåãðåññèè ïåðâîãî âèäà, äâóìåðíûé ìàññèâ {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,} äëÿ ðåãðåññèè âòîðîãî âèäà. Îäíèì èç àðãóìåíòîâ ôóíêöèè ÿâëÿåòñÿ òàêæå ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Ôóíêöèÿ ЛГРФПРИБЛ ïî ìàññèâàì èñõîäíûõ äàííûõ âû÷èñëÿåò êîýôôèöèåíòû mi è b0, à òàêæå ìîæåò âû÷èñëèòü íåêîòîðûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ýòèõ êîýôôèöèåíòîâ è âñåãî óðàâíåíèÿ ðåãðåññèè â öåëîì. Ñèíòàêñèñ ôóíêöèè: ЛГРФПРИБЛ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Êîíñòàíòà;Ñòàòèñòèêà) 134 Часть II. Средства Excel для статистического анализа Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Y. Íåîáÿçàòåëüíûé àðãóìåíò Значения_X — ìàññèâ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ) çíà÷åíèé Õ. Åñëè äàííûé àðãóìåíò îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ Значения_Y . Åñëè ìàññèâ Значения_Y ðàñïîëîæåí â îäèí ñòîëáåö, òî êàæäûé ñòîëáåö ìàññèâà Значения_X èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àíàëîãè÷íî, åñëè ìàññèâ Значения_Y ðàñïîëîæåí â îäíó ñòðîêó, òî êàæäàÿ ñòðîêà ìàññèâà Значения_X èíòåðïðåòèðóåòñÿ êàê çíà÷åíèÿ îòäåëüíîé ïåðåìåííîé Õi. Àðãóìåíò Константа — ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, äîëæåí ëè êîýôôèöèåíò b0 áûòü ðàâíûì 1. Åñëè ýòîò àðãóìåíò èìååò çíà÷åíèå ИСТИНА, 1 èëè îïóùåí, òî êîýôôèöèåíò b0 âû÷èñëÿåòñÿ êàê îáû÷íî. Åñëè àðãóìåíò èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî b0 ïîëàãàåòñÿ ðàâíûì 1 è çíà÷åíèÿ êîýôôèöèåíòîâ mi âû÷èñëÿþòñÿ ñ ó÷åòîì ýòîãî óñëîâèÿ. Àðãóìåíò Статистика ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå, êîòîðîå óêàçûâàåò, òðåáóåòñÿ ëè ðàññ÷èòûâàòü äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ðåãðåññèè. Åñëè îí èìååò çíà÷åíèå ИСТИНА èëè 1, òî ôóíêöèÿ ðàññ÷èòûâàåò è âûâîäèò ýòè äîïîëíèòåëüíûå õàðàêòåðèñòèêè (ñì. òàáëèöó â îïèñàíèè ôóíêöèè ЛИНЕЙН; îïèñàíèå è ïîÿñíåíèÿ ê ýòèì õàðàêòåðèñòèêàì äàíû â ðàçäåëå 3.4.3). Åñëè àðãóìåíò Статистика èìååò çíà÷åíèå ЛОЖЬ, 0 èëè îïóùåí, òî ôóíêöèÿ âîçâðàùàåò òîëüêî çíà÷åíèÿ êîýôôèöèåíòîâ mi è b0. Îòìåòèì, ÷òî ôóíêöèÿ âîçâðàùàåò ìàññèâ çíà÷åíèé êîýôôèöèåíòîâ mi è b0 (íå ìåíåå äâóõ çíà÷åíèé), à òàêæå äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè (åñëè àðãóìåíò Статистика ðàâåí ИСТИНА). Ïîýòîìó ôóíêöèÿ äîëæíà çàäàâàòüñÿ â âèäå ôîðìóëû ìàññèâà, â ïðîòèâíîì ñëó÷àå (ïðè ââîäå ôóíêöèè â îäíó ÿ÷åéêó) áóäåò âûâåäåíî çíà÷åíèå òîëüêî êîýôôèöèåíòà mk.  âûõîäíîì ìàññèâå äàííûå ðàñïîëàãàþòñÿ òàê æå, êàê è â âûõîäíîì ìàññèâå ôóíêöèè ЛИНЕЙН (ñì. ðàçäåë 4.9.1). 4.9.7. Функция РОСТ Ýòà ôóíêöèÿ ÿâëÿåòñÿ àíàëîãîì ôóíêöèè ТЕНДЕНЦИЯ äëÿ ýêñïîíåíöèàëüíîé ðåãðåññèè. Îíà âû÷èñëÿåò â ñîîòâåòñòâèè ñ ïîñòðîåííûì ìåòîäîì íàèìåíüøèõ êâàäðàòîâ óðàâíåíèåì ðåãðåññèè çíà÷åíèå Ŷ äëÿ êîíêðåòíîãî çíà÷åíèÿ X. Íî â îòëè÷èå îò ôóíêöèè ТЕНДЕНЦИЯ ýòà ôóíêöèÿ ðàáîòàåò ñ ýêñïîíåíöèàëüíîé ðåãðåññèåé. Ïóñòü çàäàí ìàññèâ {ó1, ó2, ..., ón} ñî çíà÷åíèÿìè ïåðåìåííîé Y. Åñëè ìàññèâ çíà÷åíèé ïåðåìåííîé Õ ÿâëÿåòñÿ äâóìåðíûì ìàññèâîì âèäà {õ11, õ12, ..., õ1n, õ21, õ22, ..., õ2n, ..., õk1, õk2, ..., õkn,}, òî â ýòîì ñëó÷àå èññëåäóåòñÿ çàâèñèìîñòü ïåðåìåííîé Y îò k ïåðåìåííûõ Õ1, Õ2, ..., Õk è ñòðîèòñÿ ýêñïîíåíöèàëüíàÿ ðåãðåññèÿ âèäà Ŷ = b0 ⋅ m1 1 ⋅ m2 X X2 ⋅ ... ⋅ mk Xk . Ôóíêöèÿ РОСТ ïî çàäàííûì çíà÷åíèÿì (õ1, õ2, ..., õk) è ïî óðàâíåíèþ ðåãðåññèè âû÷èñëÿåò çíà÷åíèå ŷ . Åñëè èñõîäíûé ìàññèâ çíà÷åíèé Õ ñîâïàäàåò ïî ðàçìåðó ñ ìàññèâîì çíà÷åíèé Y, òî ôóíêöèÿ РОСТ äëÿ âû÷èñëåíèÿ íîâîãî çíà÷åíèÿ ŷ èñïîëüçóåò ýêñïîíåíöèàëüíóþ ðåãðåññèþ âèäà Ŷ = b0mX. Ñèíòàêñèñ ôóíêöèè: РОСТ(Çíà÷åíèÿ_Y;Çíà÷åíèÿ_X;Íîâûå_çíà÷åíèÿ_x;Êîíñòàíòà) Глава 4. Статистические функции 135 Àðãóìåíò Значения_Y — îäíîìåðíûé ìàññèâ çíà÷åíèé Y (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Значения_X — ìàññèâ çíà÷åíèé Õ (èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòîò ìàññèâ). Àðãóìåíò Новые_значения_x — çíà÷åíèÿ, äëÿ êîòîðûõ âû÷èñëÿåòñÿ óðàâíåíèå ðåãðåññèè. Åñëè àðãóìåíò Значения_X îïóùåí, òî ïðåäïîëàãàåòñÿ, ÷òî ýòî ìàññèâ íàòóðàëüíûõ ÷èñåë {1; 2; 3; ...} òàêîãî æå ðàçìåðà, êàê è ìàññèâ àðãóìåíòà Значения_Y . Åñëè îïóùåí àðãóìåíò Новые_значения_x, òî ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî îí ñîâïàäàåò ñ àðãóìåíòîì Значения_X. Àðãóìåíò Константа ïðèíèìàåò ëîãè÷åñêîå çíà÷åíèå: åñëè îí èìååò çíà÷åíèå ИСТИНА èëè 1 ëèáî îïóùåí, òî êîýôôèöèåíò óðàâíåíèÿ ðåãðåññèè b0 âû÷èñëÿåòñÿ êàê îáû÷íî; åñëè æå îí èìååò çíà÷åíèå ЛОЖЬ èëè 0, òî êîýôôèöèåíò b0 ïîëàãàåòñÿ ðàâíûì 1 è çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âû÷èñëÿþòñÿ ñ ó÷åòîì ýòîãî óñëîâèÿ. Ýòó ôóíêöèþ ìîæíî èñïîëüçîâàòü äëÿ îäíîâðåìåííîãî âû÷èñëåíèÿ ìàññèâà çíà÷åíèé { ŷ } ïî çàäàííîìó ìàññèâó çíà÷åíèé {õ}, äëÿ ÷åãî â êà÷åñòâå àðãóìåíòà Новые_значения_x íàäî óêàçàòü ìàññèâ {õ}, à ñàìó ôóíêöèþ ïðèìåíèòü êàê ôîðìóëó ìàññèâà ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, â êîòîðîì áóäåò çàïèñàí âûõîäíîé ìàññèâ çíà÷åíèé { ŷ }. 4.10. Функции для вычисления ковариации и коэффициента корреляции  ýòó ãðóïïó âõîäÿò ñëåäóþùèå ôóíêöèè. Ôóíêöèÿ Íàçíà÷åíèå ÊÎÂÀÐ Âîçâðàùàåò êîâàðèàöèþ, ò.å. ñðåäíåå ïðîèçâåäåíèé îòêëîíåíèé äëÿ êàæäîé ïàðû òî÷åê äàííûõ ÊÎÐÐÅË Âîçâðàùàåò êîýôôèöèåíò êîððåëÿöèè ìåæäó äâóìÿ íàáîðàìè äàííûõ ÏÈÐÑÎÍ Âîçâðàùàåò êîýôôèöèåíò êîððåëÿöèè Ïèðñîíà ÊÂÏÈÐÑÎÍ Âîçâðàùàåò êâàäðàò êîýôôèöèåíòà êîððåëÿöèè Ïèðñîíà ÔÈØÅÐ Âîçâðàùàåò ïðåîáðàçîâàíèå Ôèøåðà ÔÈØÅÐÎÁÐ Âîçâðàùàåò ôóíêöèþ, îáðàòíóþ ïðåîáðàçîâàíèþ Ôèøåðà 4.10.1. Функция КОВАР Ôóíêöèÿ ïî äâóìåðíîé âûáîðêå (ïàðíûì íàáëþäåíèÿì) âû÷èñëÿåò âûáîðî÷íóþ êîâàðèàöèþ, êîòîðàÿ ÿâëÿåòñÿ îöåíêîé êîâàðèàöèè äâóìåðíîãî ðàñïðåäåëåíèÿ ñëó÷àéíîãî âåêòîðà (Õ, Y). Íàïîìíèì (ñì. ðàçäåë 1.3), ÷òî êîâàðèàöèÿ îïðåäåëÿåòñÿ êàê ìàòåìàòè÷åñêîå îæèäàíèå îò ïðîèçâåäåíèÿ (X – MX)(Y – MY), ò.å. cov(X, Y) = M[(X – MX)(Y – MY)]. Åñëè èìåþòñÿ ïàðíûå íàáëþäåíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) — çíà÷åíèÿ äâóìåðíîé âûáîðêè îáúåìîì n, òî âûáîðî÷íàÿ êîâàðèàöèÿ âû÷èñëÿåòñÿ ïî ôîðìóëå cov(X, Y) = 1 n 1 n 1 n ( xi − x )( yi − y ) , ãäå x = ∑ xi è y = ∑ yi . ∑ n i =1 n i =1 n i =1 136 Часть II. Средства Excel для статистического анализа Ñèíòàêñèñ ôóíêöèè: КОВАР(Ìàññèâ1;Ìàññèâ2) Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà äëÿ âû÷èñëåíèÿ êîâàðèàöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ. Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. 4.10.2. Функция КОРРЕЛ Äàííàÿ ôóíêöèÿ âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè r, ò.å. îöåíêó êîýôôèöèåíòà êîððåëÿöèè ρ ñëó÷àéíûõ âåëè÷èí X è Y: ρ = cov(X, Y) DX ⋅ DY (ñì. ðàçäåë 1.3). Âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè r âû÷èñëÿåòñÿ ïî ôîðìóëå r = cov(X, Y) , ãäå cov(X, Y) — âûáîðî÷íàÿ êîâàðèàöèÿ (ñì. ôóíêöèþ SX S Y 1 n 1 n 1 n 1 n ( xi − x ) 2 , x = ∑ xi è SY = ( yi − y )2 , y = ∑ yi . ∑ ∑ n i =1 n i =1 n i =1 n i =1 Ñèíòàêñèñ ôóíêöèè: КОРРЕЛ(Ìàññèâ1;Ìàññèâ2) Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ. Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. КОВАР), S X = 4.10.3. Функция ПИРСОН Ýòà ôóíêöèÿ, êàê è ôóíêöèÿ КОРРЕЛ, âû÷èñëÿåò âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè, ïðè÷åì ðåçóëüòàòû âû÷èñëåíèé îáåèõ ôóíêöèé ñîâïàäàþò (êîíå÷íî, íà îäíîì è òîì æå íàáîðå äàííûõ). Íî â òàêîì ñëó÷àå âûáîðî÷íûé Глава 4. Статистические функции 137 êîýôôèöèåíò êîððåëÿöèè íàçûâàåòñÿ êîýôôèöèåíòîì êîððåëÿöèè Ïèðñîíà2. Èñòîðè÷åñêè òàê ñëîæèëîñü, ÷òî “îáû÷íûé” âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè âû÷èñëÿåòñÿ ïî ôîðìóëàì, ïðèâåäåííûì â îïèñàíèè ôóíêöèé КОВАР è КОРРЕЛ. Êîýôôèöèåíò êîððåëÿöèè Ïèðñîíà âû÷èñëÿåòñÿ ïî àíàëîãè÷íûì ôîðìóëàì, íî ñ èñïîëüçîâàíèåì è sY2 = íåñìåùåííûõ îöåíîê äèñïåðñèé sX2 = 1 n ∑ ( xi − x )2 n − 1 i =1 1 n ∑ ( yi − y )2 ; â ýòîì ñëó÷àå îöåíêà êîâàðèàöèè âû÷èñëÿåòñÿ ïî ôîðìón − 1 i =1 1 n ∑ ( xi − x )( yi − y ) . Î÷åâèäíî, ÷òî ðåçóëüòàòû âû÷èñëåíèé â îáîn − 1 i =1 èõ ñëó÷àÿõ áóäóò îäèíàêîâû, íî “òðàäèöèÿ — åñòü òðàäèöèÿ”. Ñèíòàêñèñ ôóíêöèè: ëå cov(X, Y) = ПИРСОН(Ìàññèâ1;Ìàññèâ2) Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ. Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. 4.10.4. Функция КВПИРСОН Ôóíêöèÿ âû÷èñëÿåò êâàäðàò êîýôôèöèåíòà êîððåëÿöèè Ïèðñîíà. Ýòà âåëè÷èíà íîñèò íàçâàíèå êîýôôèöèåíòà äåòåðìèíàöèè R2 è ïîêàçûâàåò ïðè ïîñòðîåíèè ëèíåéíîé ðåãðåññèè ñòåïåíü òî÷íîñòè àïïðîêñèìàöèè âûáîðî÷íûõ äàííûõ ïðÿìîé ëèíèåé (ñì. îïèñàíèå ôóíêöèè ЛИНЕЙН è ðàçäåë 3.4.3). Ñèíòàêñèñ ôóíêöèè: КВПИРСОН(Ìàññèâ1;Ìàññèâ2) Àðãóìåíò Массив1 — ïåðâûé ìàññèâ äàííûõ (çíà÷åíèé ïåðåìåííîé Õ èëè çíà÷åíèé ïåðåìåííîé Y; ïîñêîëüêó ôîðìóëà âû÷èñëåíèÿ êîýôôèöèåíòà êîððåëÿöèè ñèììåòðè÷íà îòíîñèòåëüíî çíà÷åíèé Õ è Y, íå ñóùåñòâåííî, ìàññèâ çíà÷åíèé êàêîé ïåðåìåííîé îïðåäåëÿòü ïåðâûì). Àðãóìåíò Массив2 — âòîðîé ìàññèâ äàííûõ3. 2 Êàðë Ïèðñîí (Karl Pearson, 1857–1936) — àíãëèéñêèé ìàòåìàòèê, áèîëîã, ôèëîñîô, ÷ëåí Ëîíäîíñêîãî êîðîëåâñêîãî îáùåñòâà, ïðîôåññîð Ëîíäîíñêîãî óíèâåðñèòåòà. Ðàçðàáîòàë ìíîãèå ìåòîäû ìàòåìàòè÷åñêîé ñòàòèñòèêè. 3 Îòìåòèì, ÷òî â ñïðàâî÷íîé ñèñòåìå Excel ïðè îïèñàíèè ýòîé ôóíêöèè Массив1 îáîçíà÷àåòñÿ êàê Значения_Y, à Массив2 — êàê Значения_Х, ò.å. ïðåäïîëàãàåòñÿ íåðàâíîçíà÷íîñòü ýòèõ àðãóìåíòîâ. Íà ñàìîì äåëå íå ñóùåñòâåííî, êàêîé àðãóìåíò ïðåäñòàâëÿåò çíà÷åíèÿ ïåðåìåííîé Õ, à êàêîé — çíà÷åíèÿ ïåðåìåííîé Y. Ïîýêñïåðèìåíòèðóéòå è óáåäèòåñü â ýòîì ñàìè. 138 Часть II. Средства Excel для статистического анализа Àðãóìåíòû äîëæíû áûòü ÷èñëàìè èëè èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê. Åñëè ñðåäè çíà÷åíèé èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Îáà àðãóìåíòà äîëæíû ñîäåðæàòü îäèíàêîâûå êîëè÷åñòâà çíà÷åíèé. Åñëè îíè èìåþò ðàçëè÷íûå îáúåìû äàííûõ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Åñëè õîòÿ áû îäèí àðãóìåíò íå çàäàí, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ДЕЛ/0!. 4.10.5. Функции ФИШЕР и ФИШЕРОБР Ýòè ôóíêöèè îáû÷íî èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ êîððåëÿöèè èëè äëÿ ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç î çíà÷èìîñòè âûáîðî÷íûõ êîýôôèöèåíòîâ êîððåëÿöèè (ñì. ðàçäåë 3.2.1). Èìåííî ïî ýòîé ïðè÷èíå äàííûå ôóíêöèè âêëþ÷åíû â îäíó ãðóïïó ôóíêöèé, íî, êîíå÷íî, èõ ìîæíî èñïîëüçîâàòü è â äðóãèõ ñèòóàöèÿõ. Ïðàêòè÷åñêîå èñïîëüçîâàíèå ýòèõ ôóíêöèé ïîêàçàíî â ãëàâå 13. Ôóíêöèÿ ФИШЕР ïî çàäàííîìó àðãóìåíòó õ âû÷èñëÿåò çíà÷åíèå Z = 1 1+ x ln . 2 1− x Ôóíêöèÿ ФИШЕРОБР îáðàòíàÿ ê ôóíêöèè ФИШЕР. Îíà ïî çàäàííîìó àðãóìåíòó õ âû÷èñëÿåò çíà÷åíèå y = e2 x − 1 . e2 x + 1 Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(õ) Åñëè àðãóìåíò х íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЗНАЧ!. Àðãóìåíò х ôóíêöèè ФИШЕР äîëæåí áûòü èç èíòåðâàëà (–1, 1), èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.11. Дополнительные функции  ýòó ãðóïïó âîøëè ôóíêöèè, êîòîðûå áûëî òðóäíî ïîìåñòèòü â êàêóþ-ëèáî èç ïðèâåäåííûõ âûøå ãðóïï ôóíêöèé. Ïîýòîìó îíè íåñêîëüêî “ðàçíîøåðñòíûå”, íî âñå êàê-òî ñâÿçàíû ñ âû÷èñëåíèåì âåðîÿòíîñòåé.  ñëåäóþùåì ðàçäåëå ñîáðàíû âñå îñòàëüíûå ôóíêöèè, êîòîðûå åùå îñòàëèñü â êàòåãîðèè ñòàòèñòè÷åñêèõ ôóíêöèé. Ôóíêöèÿ Íàçíà÷åíèå ÂÅÐÎßÒÍÎÑÒÜ Âîçâðàùàåò âåðîÿòíîñòü òîãî, ÷òî çàäàííûå çíà÷åíèÿ íàõîäÿòñÿ âíóòðè îïðåäåëåííîãî èíòåðâàëà ÄÎÂÅÐÈÒ Âîçâðàùàåò äîâåðèòåëüíûé èíòåðâàë äëÿ ñðåäíåãî ãåíåðàëüíîé ñîâîêóïíîñòè ÌÎÄÀ Âîçâðàùàåò ìîäó (íàèáîëåå ÷àñòî âñòðå÷àþùååñÿ çíà÷åíèå) íàáîðà äàííûõ ×ÀÑÒÎÒÀ Âîçâðàùàåò ìàññèâ ÷èñåë, ðàâíûõ êîëè÷åñòâó âûáîðî÷íûõ çíà÷åíèé, ïîïàäàþùèõ â çàäàííîå ìíîæåñòâî èíòåðâàëîâ Глава 4. Статистические функции 139 4.11.1. Функция ВЕРОЯТНОСТЬ Ýòà ôóíêöèÿ ðàáîòàåò ñ ïðîèçâîëüíûì äèñêðåòíûì ðàñïðåäåëåíèåì. Äëÿ åå ðàáîòû íåîáõîäèìî èìåòü ìàññèâ çíà÷åíèé xi è ìàññèâ âåðîÿòíîñòåé pi, ñ êîòîðûìè ïðèíèìàþòñÿ ýòè çíà÷åíèÿ, ò.å. âåðîÿòíîñòíóþ òàáëèöó ñëåäóþùåãî âèäà. Çíà÷åíèÿ xi Âåðîÿòíîñòè pi õ1 p1 õ2 p2 xn pn ... ... Ôóíêöèÿ íå òðåáóåò, ÷òîáû çíà÷åíèÿ xi áûëè îòñîðòèðîâàíû â ïîðÿäêå âîçðàñòàíèÿ èëè íå èìåëè îäèíàêîâûõ çíà÷åíèé. Íåîáõîäèìî òîëüêî, ÷òîáû ñóììà âñåõ âåðîÿòíîñòåé pi ðàâíÿëàñü 1. Ôóíêöèÿ ВЕРОЯТНОСТЬ ïî çàäàííîìó çíà÷åíèþ õ îïðåäåëÿåò âåðîÿòíîñòü ýòîãî çíà÷åíèÿ; åñëè ñðåäè çíà÷åíèé xi íåò çíà÷åíèÿ, ñîâïàäàþùåãî ñ çàäàííûì çíà÷åíèåì õ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå 0. Ìîæíî òàêæå çàäàòü èíòåðâàë [a, b] — è ôóíêöèÿ îïðåäåëèò, ñêîëüêî çíà÷åíèé xi ïîïàäàåò â ýòîò èíòåðâàë è âåðíåò âåðîÿòíîñòü, ðàâíóþ ñóììå âåðîÿòíîñòåé òåõ xi, êîòîðûå ïîïàäàþò â ýòîò èíòåðâàë. Ñèíòàêñèñ ôóíêöèè: ВЕРОЯТНОСТЬ(Èíòåðâàë_Õ;Èíòåðâàë_Ð;à;b) Àðãóìåíò Интервал_Х — èíòåðâàë ÷èñëîâûõ çíà÷åíèé xi. Àðãóìåíò Интервал_Р — èíòåðâàë âåðîÿòíîñòåé, ñîîòâåòñòâóþùèõ çíà÷åíèÿì â àðãóìåíòå Интервал_Х. Àðãóìåíò а — íèæíÿÿ ãðàíèöà èíòåðâàëà [a, b], äëÿ êîòîðîãî âû÷èñëÿåòñÿ âåðîÿòíîñòü. Íåîáÿçàòåëüíûé àðãóìåíò b —âåðõíÿÿ ãðàíèöà èíòåðâàëà [a, b]. Åñëè àðãóìåíò b íå çàäàí, òî àðãóìåíò а ñ÷èòàåòñÿ òåì çíà÷åíèåì õ, äëÿ êîòîðîãî íàõîäèòñÿ âåðîÿòíîñòü. Åñëè ëþáîå çíà÷åíèå â àðãóìåíòå Интервал_Р ìåíüøå 0 èëè áîëüøå 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Òàêîå æå çíà÷åíèå îøèáêè ôóíêöèÿ âîçâðàùàåò â ñëó÷àå, åñëè ñóììà çíà÷åíèé â àðãóìåíòå Интервал_Р íå ðàâíà 1. Åñëè Интервал_Х è Интервал_Р ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà çíà÷åíèé, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. 4.11.2. Функция ДОВЕРИТ Äàííàÿ ôóíêöèÿ èñïîëüçóåòñÿ ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå, ïðè óñëîâèè, ÷òî äèñïåðñèÿ σ2 ýòîãî ðàñïðåäåëåíèÿ èçâåñòíà. Íàïîìíèì (ñì. ðàçäåë 2.3.6), ÷òî äëÿ òî÷å÷íîãî îöåíèâàíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ m èñïîëüçóåòñÿ ñòàòèñòèêà x = 1 n ∑ xi , à äîâåðèòåëüíûé èíòåðâàë äëÿ m n i =1 σ n ñ äîâåðèòåëüíûì óðîâíåì ð îïðåäåëÿåòñÿ êàê x − k ,x +k σ , ãäå n — îáúåì n 1+ p –1 , Ô — ôóíêöèÿ, îá 2 âûáîðêè, çíà÷åíèå k íàõîäèòñÿ ïî ôîðìóëå k = Ф −1 ðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. Ôóíêöèÿ ДОВЕРИТ ïî çàäàííûì çíà÷åíèÿì α = 1 – ð, σ è n âû÷èñëÿåò âåëè÷èíó k 140 Часть II. Средства Excel для статистического анализа σ n . Ñèíòàêñèñ ôóíêöèè: ДОВЕРИТ(Àëüôà;Ñòàíä_îòêëîíåíèå;Ðàçìåð) Àðãóìåíò Альфа — óðîâåíü çíà÷èìîñòè, ñâÿçàííûé ñ äîâåðèòåëüíûì óðîâíåì ð ñîîòíîøåíèåì ð = 1 – Альфа. Àðãóìåíò Станд_отклонение — èçâåñòíîå ñòàíäàðòíîå îòêëîíåíèå σ ãåíåðàëüíîé ñîâîêóïíîñòè. Размер — îáúåì âûáîðêè n. Åñëè çíà÷åíèå ýòîãî àðãóìåíòà — íåöåëîå ÷èñëî, òî áåðåòñÿ öåëàÿ ÷àñòü ýòîãî ÷èñëà. Åñëè êàêîé-ëèáî èç àðãóìåíòîâ íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè Альфа ìåíüøå 0 èëè áîëüøå 1, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ýòî æå çíà÷åíèå ôóíêöèÿ âîçâðàùàåò â ñëó÷àå, åñëè çíà÷åíèå Станд_отклонение îòðèöàòåëüíî èëè çíà÷åíèå àðãóìåíòà Размер ìåíüøå 1. 4.11.3. Функция МОДА Äàííàÿ ôóíêöèÿ èìååò ìàëî îáùåãî ñ íàõîæäåíèåì ìîäû, ò.å. íàèáîëüøåãî çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè íåïðåðûâíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 1.2.3). Ïîýòîìó îíà íå âêëþ÷åíà â ãðóïïó ôóíêöèé, âû÷èñëÿþùèõ ãåîìåòðè÷åñêèå õàðàêòåðèñòèêè ðàñïðåäåëåíèÿ. Ôóíêöèÿ МОДА ñðåäè çàäàííîãî íàáîðà ÷èñëîâûõ çíà÷åíèé {õ1, õ2, ..., õn} íàõîäèò çíà÷åíèå, êîòîðîå ïîâòîðÿåòñÿ íàèáîëåå ÷àñòî. Åñëè îäèíàêîâûõ çíà÷åíèé íåò, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Åñëè íåñêîëüêî çíà÷åíèé ïîâòîðÿþòñÿ îäíî è òî æå êîëè÷åñòâî ðàç, òî âûâîäèòñÿ ïåðâîå òàêîå çíà÷åíèå. Ñèíòàêñèñ ôóíêöèè: МОДА(×èñëî1;×èñëî2;...) Ôóíêöèÿ ìîæåò èìåòü äî 30 àðãóìåíòîâ Число. Ýòè àðãóìåíòû ìîãóò áûòü ÷èñëàìè, èìåíàìè äèàïàçîíîâ, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû. Ìîæíî èñïîëüçîâàòü îäèí ìàññèâ èëè îäíó ññûëêó íà äèàïàçîí âìåñòî àðãóìåíòîâ, ðàçäåëÿåìûõ òî÷êîé ñ çàïÿòîé. Åñëè àðãóìåíò, ÿâëÿÿñü ìàññèâîì èëè ññûëêîé, ñîäåðæèò òåêñò, ëîãè÷åñêèå çíà÷åíèÿ èëè ïóñòûå ÿ÷åéêè, ýòè çíà÷åíèÿ èãíîðèðóþòñÿ; ÿ÷åéêè, ñîäåðæàùèå íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. 4.11.4. Функция ЧАСТОТА Ýòà ôóíêöèÿ ÷àñòî èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ ãèñòîãðàìì (ñì. ðàçäåë 8.3). Ôóíêöèÿ ïîäñ÷èòûâàåò, ñêîëüêî çíà÷åíèé èç çàäàííîãî ìàññèâà çíà÷åíèé {õ1, õ2, ..., õn} ïîïàäàåò â èíòåðâàëû (–∞, a1], (a1, a2], ..., (ak–1, ak], (ak, +∞) (òàêèå èíòåðâàëû ÷àñòî íàçûâàþò êàðìàíàìè). Èíòåðâàëû çàäàþòñÿ íàáîðîì ÷èñåë {a1, a2, ..., ak–1, ak}. Õîòÿ ôóíêöèÿ ýòîãî íå òðåáóåò, íî ëîãè÷íî, ÷òîáû âûïîëíÿëîñü óñëîâèå a1 < a2 < ... < ak–1 < ak. Èòàê, ôóíêöèÿ ЧАСТОТА âîçâðàùàåò ìàññèâ ÷èñåë ðàçìåðîì k + 1. Ïîýòîìó îíà äîëæíà ïðèìåíÿòüñÿ êàê ôîðìóëà ìàññèâà ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê, ñîñòîÿùåìó íå ìåíåå ÷åì èç k + 1 ÿ÷åéêè. Åñëè åå ïðèìåíèòü â îäíîé ÿ÷åéêå, òî îíà âåðíåò òîëüêî êîëè÷åñòâî çíà÷åíèé õi, ïîïàâøèõ â èíòåðâàë (–∞, a1]. Ñèíòàêñèñ ôóíêöèè: ЧАСТОТА(Ìàññèâ_äàííûõ;Ìàññèâ_èíòåðâàëîâ) Àðãóìåíò Массив_данных — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ {õ1, õ2, ..., õn}. Åñëè Массив_данных íå ñîäåðæèò çíà÷åíèé, òî ôóíêöèÿ Глава 4. Статистические функции 141 âîçâðàùàåò ìàññèâ íóëåé. Àðãóìåíò Массив_интервалов — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ãðàíèö èíòåðâàëîâ {a1, a2, ..., ak–1, ak}. Ôóíêöèÿ èãíîðèðóåò ïóñòûå ÿ÷åéêè, à òàêæå òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ. 4.12. Вспомогательные функции Ðàññìîòðèì ïîñëåäíèå ôóíêöèè êàòåãîðèè Статистические, êîòîðûå âûïîëíÿþò âñïîìîãàòåëüíûå âû÷èñëåíèÿ. Ôóíêöèÿ Íàçíà÷åíèå ÃÀÌÌÀÍËÎà Âîçâðàùàåò íàòóðàëüíûé ëîãàðèôì ãàììà-ôóíêöèè ÍÎÐÌÀËÈÇÀÖÈß Âîçâðàùàåò íîðìàëèçîâàííóþ âåëè÷èíó ÏÅÐÅÑÒ Âîçâðàùàåò ÷èñëî ïåðåñòàíîâîê äëÿ çàäàííîãî ÷èñëà îáúåêòîâ Ñ×¨Ò Ïîäñ÷èòûâàåò êîëè÷åñòâî ÷èñåë â ñïèñêå àðãóìåíòîâ ÑרÒÇ Ïîäñ÷èòûâàåò êîëè÷åñòâî íåïóñòûõ çíà÷åíèé â ñïèñêå àðãóìåíòîâ 4.12.1. Функция ГАММАНЛОГ ∞ Çíà÷åíèÿ ãàììà-ôóíêöèè Ýéëåðà Γ( x) = ∫ e − u u x −1du ÷àñòî èñïîëüçóþòñÿ â ñòà0 òèñòè÷åñêèõ ðàñ÷åòàõ, ïîñêîëüêó îíà ó÷àñòâóåò â ôîðìóëàõ âû÷èñëåíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ ìíîãèõ ðàñïðåäåëåíèé, íàïðèìåð ðàñïðåäåëåíèÿ Ñòüþäåíòà, ðàñïðåäåëåíèÿ χ2, F-ðàñïðåäåëåíèÿ è äð. Ïîñêîëüêó çíà÷åíèå ôóíêöèè Ã(õ) áûñòðî ðàñòåò ïðè âîçðàñòàíèè çíà÷åíèÿ õ (íàïðèìåð, åñëè õ — íàòóðàëüíîå ÷èñëî, Ã(õ) = (õ – 1)!), òî íà ïðàêòèêå óäîáíåå èñïîëüçîâàòü ëîãàðèôì îò ýòîé ôóíêöèè. Ôóíêöèÿ ГАММАНЛОГ è âû÷èñëÿåò íàòóðàëüíûé ëîãàðèôì îò ôóíêöèè Ã(õ). ×òîáû ïîëó÷èòü çíà÷åíèå ñàìîé ôóíêöèè, ñëåäóåò ïðèìåíèòü ôîðìóëó = EXP(ГАММАНЛОГ(х)) Ñèíòàêñèñ ôóíêöèè: ГАММАНЛОГ(х) Àðãóìåíò x — ýòî çíà÷åíèå, äëÿ êîòîðîãî âû÷èñëÿåòñÿ ôóíêöèÿ. Åñëè x íå ÿâëÿåòñÿ ÷èñëîì, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè x ìåíüøå èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.12.2. Функция НОРМАЛИЗАЦИЯ Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå µ è äèñïåðñèþ σ2, òî ñëó÷àéíàÿ âåëè÷èíà Y = (Õ – µ)/σ èìååò òî æå ðàñïðåäåëåíèå, ÷òî è ñëó÷àéíàÿ âåëè÷èíà Õ, íî ñ ìàòåìàòè÷åñêèì îæèäàíèåì 0 è äèñïåðñèåé σ2 = 1. Òàêàÿ îïåðàöèÿ, ïðåîáðàçîâàíèå Y = (Õ – µ)/σ, íàçûâàåòñÿ íîðìàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ. Äàííàÿ ôóíêöèÿ è âûïîëíÿåò òàêóþ îïåðàöèþ. Ñèíòàêñèñ ôóíêöèè: НОРМАЛИЗАЦИЯ(x;Ñðåäíåå;Ñòàíäàðòíîå_îòêëîíåíèå) 142 Часть II. Средства Excel для статистического анализа Àðãóìåíò x — íîðìàëèçóåìîå çíà÷åíèå. Àðãóìåíò Среднее — çàäàâàåìîå ìàòåìàòè÷åñêîå îæèäàíèå µ. Àðãóìåíò Стандартное_отклонение — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå σ. Åñëè Стандартное_отклонение ìåíüøå èëè ðàâíî 0, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. 4.12.3. Функция ПЕРЕСТ Ôóíêöèÿ âû÷èñëÿåò êîëè÷åñòâî ïåðåñòàíîâîê äëÿ çàäàííîãî ÷èñëà k îáúåêòîâ, êîòîðûå âûáèðàþòñÿ èç îáùåãî ÷èñëà n îáúåêòîâ. Ïåðåñòàíîâêà — ýòî ëþáîå ìíîæåñòâî èëè ïîäìíîæåñòâî îáúåêòîâ, êîòîðûå îòëè÷àþòñÿ ëèáî ñîñòàâîì îáúåêòîâ, ëèáî èõ ïîðÿäêîì. Ïåðåñòàíîâêè îòëè÷àþòñÿ îò ñî÷åòàíèé, äëÿ êîòîðûõ âíóòðåííèé ïîðÿäîê íå èìååò çíà÷åíèÿ. Ýòà ôóíêöèÿ èñïîëüçóåòñÿ äëÿ âû÷èñëåíèÿ âåðîÿòíîñòåé â êîìáèíàòîðíûõ çàäà÷àõ. ×èñëî ïåðåñòàíîâîê îáû÷íî îáîçíà÷àåòñÿ êàê Ðk,n è âû÷èñëÿåòñÿ ïî ôîðìóëå Pk , n = n! = n(n − 1)(n − 2)...(n − k + 1) (n − k )! Ñèíòàêñèñ ôóíêöèè: ПЕРЕСТ(×èñëî;×èñëî_âûáðàííûõ) Àðãóìåíò Число — öåëîå ÷èñëî n, çàäàþùåå êîëè÷åñòâî îáúåêòîâ. Àðãóìåíò Число_выбранных — öåëîå ÷èñëî k, çàäàþùåå êîëè÷åñòâî îáúåêòîâ â êàæäîé ïåðåñòàíîâêå. Åñëè àðãóìåíòû íå ÿâëÿþòñÿ öåëûìè ÷èñëàìè, òî áåðåòñÿ öåëàÿ ÷àñòü ýòèõ ÷èñåë. Åñëè àðãóìåíòû íå ÿâëÿþòñÿ ÷èñëàìè, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè çíà÷åíèÿ àðãóìåíòîâ îòðèöàòåëüíû, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ýòî æå çíà÷åíèå îøèáêè ôóíêöèÿ âîçâðàùàåò â òîì ñëó÷àå, åñëè çíà÷åíèå àðãóìåíòà Число ìåíüøå çíà÷åíèÿ àðãóìåíòà Число_выбранных. 4.12.4. Функции СЧЁТ и СЧЁТЗ Ýòè ôóíêöèè ïîäñ÷èòûâàþò êîëè÷åñòâî ÷èñåë (ôóíêöèÿ СЧЁТ) è êîëè÷åñòâî íåïóñòûõ ÿ÷ååê (ôóíêöèÿ СЧЁТЗ) â çàäàííîì äèàïàçîíå ÿ÷ååê. Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(Çíà÷åíèå1;Çíà÷åíèå2;...) Ôóíêöèè ìîãóò èìåòü äî 30 àðãóìåíòîâ Значение, êîòîðûå ìîãóò áûòü çíà÷åíèÿìè, ìàññèâàìè, èìåíàìè èëè àäðåñàìè äèàïàçîíîâ. Îòìåòèì, ÷òî â Excel èìåþòñÿ ôóíêöèè СЧЁТЕСЛИ è СЧИТАТЬПУСТОТЫ, êîòîðûå òàêæå ìîæíî èñïîëüçîâàòü äëÿ ïîäñ÷åòà êîëè÷åñòâà çíà÷åíèé. 4.13. Функции для генерирования равномерно распределенных случайных чисел Ýòè ôóíêöèè íå âõîäÿò â êàòåãîðèþ Статистические (îíè âõîäÿò â êàòåãîðèþ Математические), ÷àñòî èñïîëüçóþòñÿ â ñòàòèñòè÷åñêîì àíàëèçå äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí (ñì. ãëàâó 7) è áåç íèõ îïèñàíèå ñòàòèñòè÷åñêèõ ôóíêöèé Excel áûëî áû íå ïîëíûì. Глава 4. Статистические функции 143 Ôóíêöèÿ Íàçíà÷åíèå ÑË×ÈÑ Ãåíåðèðóåò ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] ñëó÷àéíûå ÷èñëà ÑËÓ×ÌÅÆÄÓ Ãåíåðèðóåò öåëûå ÷èñëà, ðàâíîìåðíî ðàñïðåäåëåííûå íà çàäàííîì èíòåðâàëå 4.13.1. Функция СЛЧИС Ýòà ôóíêöèÿ âîçâðàùàåò ÷èñëà, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1]. Åå ñèíòàêñèñ — СЛЧИС(), ò.å. îíà íå èìååò àðãóìåíòîâ. Îíà ÷àñòî èñïîëüçóåòñÿ äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë ìåòîäîì îáðàòíîé ôóíêöèè (ñì. ãëàâó 7), à òàêæå â èìèòàöèîííîì ìîäåëèðîâàíèè. Ôóíêöèþ СЛЧИС ìîæíî èñïîëüçîâàòü â ôîðìóëàõ ìàññèâîâ äëÿ ãåíåðèðîâàíèÿ äèàïàçîíîâ ñëó÷àéíûõ ÷èñåë. Íà ðèñ. 4.9 ïîêàçàí ïðîöåññ ñîçäàíèÿ äèàïàçîíà ñëó÷àéíûõ ÷èñåë. Ñíà÷àëà âûäåëÿåòñÿ äèàïàçîí ÿ÷ååê, çàòåì, íå ñíèìàÿ âûäåëåíèÿ, ââîäèòñÿ ôîðìóëà =СЛЧИС() è ïîñëå ýòîãî íàæèìàåòñÿ êîìáèíàöèÿ êëàâèø <Ctrl+Shift+Enter>. Íåîáõîäèìî îòìåòèòü, ÷òî ôîðìóëû, ñîäåðæàùèå ôóíêöèþ СЛЧИС, ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà, íàïðèìåð ïðè ââîäå ëþáîãî çíà÷åíèÿ â ÿ÷åéêó èëè ïðè óäàëåíèè ÷åãî-ëèáî. Ýòî ñâîéñòâî äàííîé ôóíêöèè ïîëåçíî, íàïðèìåð, â èìèòàöèîííîì ìîäåëèðîâàíèè. Îäíàêî â äðóãèõ ñëó÷àÿõ îíî ìîæåò ñèëüíî çàìåäëÿòü ðàáîòó â Excel èëè áûòü ïðîñòî èçëèøíèì. ×òîáû çàôèêñèðîâàòü çíà÷åíèÿ, âû÷èñëÿåìûå ñ ïîìîùüþ ôóíêöèè СЛЧИС, íàäî âûäåëèòü äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, è ñêîïèðîâàòü åãî (êîìàíäà ПравкаÖКопировать). Çàòåì, íå ñíèìàÿ âûäåëåíèÿ äèàïàçîíà, ñëåäóåò âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка, â îòêðûâøåìñÿ äèàÐèñ. 4.9. Ñîçäàíèå ëîãîâîì îêíå Специальная вставка óñòàíîâèòü ïåðåêëþ÷àäèàïàçîíà ñî ñëó- òåëü Значения, êàê ïîêàçàíî íà ðèñ. 4.10, è ùåëêíóòü íà êíîïêå ОК.  ÿ÷åéêè âûäåëåííîãî äèàïàçîíà âìåñòî ôîð÷àéíûìè ÷èñëàìè ìóë áóäóò çàïèñàíû ÷èñëîâûå çíà÷åíèÿ. Ïðèìåíåíèå ôóíêöèè СЛЧИС äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, êîòîðûå èìåþò ðàñïðåäåëåíèÿ, îòëè÷íûå îò ðàâíîìåðíîãî, ïîêàçàíî â ãëàâå 7. 4.13.2. Функция СЛУЧМЕЖДУ Ýòà ôóíêöèÿ ãåíåðèðóåò öåëî÷èñëåííûå çíà÷åíèÿ, ïîä÷èíÿþùèåñÿ äèñêðåòíîìó ðàâíîìåðíîìó ðàñïðåäåëåíèþ (ñì. ðàçäåë 1.4.1). Îòìåòèì, ÷òî îíà äîñòóïíà òîëüêî òîãäà, êîãäà ïîäêëþ÷åíà íàäñòðîéêà Пакет анализа. Ñèíòàêñèñ ôóíêöèè: СЛУЧМЕЖДУ(Íèæíÿÿ_ãðàíèöà;Âåðõíÿÿ_ãðàíèöà) 144 Часть II. Средства Excel для статистического анализа Ðèñ. 4.10. Ïðåîáðàçîâàíèå ôîðìóë â ÷èñëîâûå çíà÷åíèÿ Àðãóìåíò Нижняя_граница çàäàåò íèæíþþ ãðàíèöó èíòåðâàëà èçìåíåíèÿ ñëó÷àéíîé âåëè÷èíû, àðãóìåíò Верхняя_граница — âåðõíþþ ãðàíèöó ýòîãî èíòåðâàëà. Åñëè çíà÷åíèÿ àðãóìåíòîâ äðîáíûå, îíè îêðóãëÿþòñÿ äî áëèæàéøèõ öåëûõ. Åñëè çíà÷åíèå àðãóìåíòà Нижняя_граница áîëüøå çíà÷åíèÿ àðãóìåíòà Верхняя_граница, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ýòà ôóíêöèÿ “íå ðàáîòàåò” â ôîðìóëàõ ìàññèâîâ. Ïîýòîìó, ÷òîáû ñãåíåðèðîâàòü äèàïàçîí çíà÷åíèé, ñíà÷àëà íàäî ââåñòè ôîðìóëó =СЛУЧМЕЖДУ(-10;10) â ïåðâóþ ÿ÷åéêó, à çàòåì ñêîïèðîâàòü åå âî âñå îñòàëüíûå ÿ÷åéêè äèàïàçîíà. (Ïðèâåäåííàÿ ôîðìóëà áóäåò ãåíåðèðîâàòü öåëûå ÷èñëà èç èíòåðâàëà îò –10 äî 10.) Êàê è â ñëó÷àå ñ ôóíêöèåé СЛЧИС, ôîðìóëû, ñîäåðæàùèå ôóíêöèþ СЛУЧМЕЖДУ, ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà. Ïîýòîìó, ÷òîáû çàôèêñèðîâàòü çíà÷åíèÿ, ïîëó÷åííûå ñ ïîìîùüþ ýòîé ôóíêöèè, ñëåäóåò ïðåîáðàçîâàòü ôîðìóëû â çíà÷åíèÿ, êàê îïèñàíî â ïðåäûäóùåì ðàçäåëå. Глава 4. Статистические функции 145 Глава 5 Надстройка Пакет анализа  ñîñòàâ Microsoft Excel âõîäèò íàäñòðîéêà Пакет анализа, êîòîðàÿ ñîäåðæèò 19 ñòàòèñòè÷åñêèõ ïðîöåäóð è îêîëî 50 ôóíêöèé. Ôóíêöèè â îñíîâíîì îòíîñÿòñÿ ê êàòåãîðèÿì èíæåíåðíûõ è ôèíàíñîâûõ è ïîýòîìó çäåñü íå ðàññìàòðèâàþòñÿ. Ñòàòèñòè÷åñêèå ïðîöåäóðû, ñîäåðæàùèåñÿ â íàäñòðîéêå Пакет анализа, ïðåäîñòàâëÿþò øèðîêèé ñïåêòð ñðåäñòâ äëÿ ñòàòèñòè÷åñêîãî àíàëèçà íà÷èíàÿ îò ïðîñòîé îïèñàòåëüíîé ñòàòèñòèêè èëè ñãëàæèâàíèÿ äàííûõ è çàêàí÷èâàÿ àíàëèçîì Ôóðüå è ïðîâåäåíèåì ðàçëè÷íûõ òåñòîâ. Ïîëíûé ñïèñîê ýòèõ ñðåäñòâ è èõ êðàòêîå îïèñàíèå ïðåäñòàâëåíû â òàáë. 5.1 (íàçâàíèÿ ñðåäñòâ ïðèâîäÿòñÿ â ñîîòâåòñòâèè ñî ñïèñêîì èç äèàëîãîâîãî îêíà Анализ данных). Таблица 5.1. Статистические средства надстройки Пакет анализа Ñðåäñòâî Îïèñàíèå Îäíîôàêòîðíûé äèñïåðñèîííûé àíàëèç Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ èëè áîëåå âûáîðîê Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç áåç ïîâòîðåíèé Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç íà îñíîâå îäíîé âûáîðêè Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ñ ïîâòîðåíèÿìè Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç íà îñíîâå íåñêîëüêèõ âûáîðîê Êîððåëÿöèÿ Âû÷èñëÿåò êîððåëÿöèîííóþ ìàòðèöó Êîâàðèàöèÿ Âû÷èñëÿåò ìàòðèöó êîâàðèàöèé Îïèñàòåëüíàÿ ñòàòèñòèêà Ñîçäàåò îò÷åò, ñîäåðæàùèé ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè ïðåäñòàâëåííîé âûáîðêè Ýêñïîíåíöèàëüíîå ñãëàæèâàíèå Ðåàëèçóåò ìåòîä ýêñïîíåíöèàëüíîãî ñãëàæèâàíèÿ äàííûõ Äâóõâûáîðî÷íûé F-òåñò äëÿ äèñïåðñèé Ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ äèñïåðñèé äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé Àíàëèç Ôóðüå Ðåàëèçóåò ìåòîä áûñòðîãî ïðåîáðàçîâàíèÿ Ôóðüå (ÁÏÔ) äëÿ àíàëèçà äàííûõ Ãèñòîãðàììà Èñïîëüçóåòñÿ äëÿ àíàëèçà ðàñïðåäåëåíèÿ âûáîðî÷íûõ äàííûõ è ïîñòðîåíèÿ ãèñòîãðàìì Ñêîëüçÿùåå ñðåäíåå Èñïîëüçóåòñÿ äëÿ ñãëàæèâàíèÿ äàííûõ Ãåíåðàöèÿ ñëó÷àéíûõ ÷èñåë Ãåíåðèðóåò ñëó÷àéíûå ÷èñëà, èìåþùèå çàäàííîå ðàñïðåäåëåíèå Ðàíã è ïåðñåíòèëü Èñïîëüçóåòñÿ äëÿ âû÷èñëåíèÿ ðàíãîâ è êâàíòèëåé Îêîí÷àíèå òàáë. 5.1 Ñðåäñòâî Îïèñàíèå Ðåãðåññèÿ Èñïîëüçóåòñÿ äëÿ ïîñòðîåíèÿ ëèíåéíîé ðåãðåññèè Âûáîðêà Ñîçäàåò ñëó÷àéíóþ âûáîðêó, ðàññìàòðèâàÿ âõîäíîé äèàïàçîí çíà÷åíèé êàê ãåíåðàëüíóþ ñîâîêóïíîñòü Ïàðíûé äâóõâûáîðî÷íûé tòåñò äëÿ ñðåäíèõ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóìåðíîé âûáîðêè äàííûõ Äâóõâûáîðî÷íûé t-òåñò ñ îäèíàêîâûìè äèñïåðñèÿìè Ñëóæèò äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóõ âûáîðîê. Ïðåäïîëàãàåòñÿ ðàâåíñòâî äèñïåðñèé ãåíåðàëüíûõ ñîâîêóïíîñòåé Äâóõâûáîðî÷íûé t-òåñò ñ ðàçíûìè äèñïåðñèÿìè Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé äëÿ äâóõ âûáîðîê. Íå òðåáóåò ïðåäïîëîæåíèÿ î ðàâåíñòâå äèñïåðñèé ãåíåðàëüíûõ ñîâîêóïíîñòåé Äâóõâûáîðî÷íûé z-òåñò äëÿ ñðåäíèõ Èñïîëüçóåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàçëè÷èè ìåæäó ìàòåìàòè÷åñêèìè îæèäàíèÿì äâóõ ãåíåðàëüíûõ ñîâîêóïíîñòåé Îòìåòèì, ÷òî ýòè ñðåäñòâà èìåþò îïðåäåëåííûå îãðàíè÷åíèÿ è èíîãäà óäîáíåå âîñïîëüçîâàòüñÿ ñòàòèñòè÷åñêèìè ôóíêöèÿìè èëè äðóãèìè ñðåäñòâàìè Excel. Ïðåèìóùåñòâîì ôóíêöèé ïåðåä äàííûìè ñðåäñòâàìè ÿâëÿåòñÿ òî, ÷òî ôóíêöèè àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ ïðè ëþáûõ èçìåíåíèÿõ, ñäåëàííûõ â âûáîðêå, òîãäà êàê ýòè ñðåäñòâà íåîáõîäèìî âûïîëíÿòü çàíîâî, åñëè âûáîðêà èçìåíèëàñü.  “îïðàâäàíèå” ýòèõ ñðåäñòâ ñêàæåì, ÷òî îíè ñîõðàíÿþò óñòàíîâêè, ñäåëàííûå ïîëüçîâàòåëåì ïðè ïîñëåäíåì ïðèìåíåíèè ñðåäñòâà, íî òîëüêî â òå÷åíèå îäíîãî ñåàíñà ðàáîòû ñ Excel. Ñðåäñòâà, êîòîðûå âêëþ÷åíû â íàäñòðîéêó Пакет анализа, äîñòóïíû ÷åðåç êîìàíäó СервисÖАнализ данных. (Åñëè êîìàíäû Анализ данных íåò â ìåíþ Сервис, ïîäêëþ÷èòå ýòó íàäñòðîéêó. Äëÿ ýòîãî âûïîëíèòå êîìàíäó СервисÖНадстройки è â îòêðûâøåìñÿ äèàëîãîâîì îêíå Надстройки â ñïèñêå Доступные надстройки óñòàíîâèòå ôëàæîê íàïðîòèâ îïöèè Пакет анализа.) Êîìàíäà СервисÖАнализ данных îòêðûâàåò îäíîèìåííîå äèàëîãîâîå îêíî, â ñïèñêå Инструменты анализа êîòîðîãî ñëåäóåò âûáðàòü íåîáõîäèìîå ñðåäñòâî (ðèñ. 5.1). Ïîñëå âûáîðà êàêîãî-ëèáî ñðåäñòâà (è ïîñëåäóþùåãî ùåë÷êà íà êíîïêå ОК) îòêðûâàåòñÿ äèàëîãîâîå îêíî ýòîãî ñðåäñòâà.  áîëüøèíñòâå òàêèõ äèàëîãîâûõ îêîí (íà ðèñ. 5.2 äëÿ ïðèìåðà ïîêàçàíî äèàëîãîâîå îêíî ñðåäñòâà Описательная статистика) âûäåëåíû îáëàñòè Входные данные è Параметры вывода.  îáëàñòè Входные данные óêàçûâàåòñÿ äèàïàçîí ÿ÷ååê, â êîòîðîì ñîäåðæàòñÿ äàííûå (ïîëå Входной интервал), óêàçûâàåòñÿ, ñãðóïïèðîâàíû ëè äàííûå, è åñëè ñãðóïïèðîâàíû, òî ïî ñòîëáöàì èëè ïî ñòðîêàì (ïåðåêëþ÷àòåëè по столбцам è по строкам). Åñëè çàäàåòñÿ âõîäíîé äèàïàçîí äàííûõ âìåñòå ñ çàãîëîâêàìè, òî óñòàíàâëèâàåòñÿ ôëàæîê îïöèè Метки в первой строке (столбце). (Åñëè çàãîëîâêè íå çàäàþòñÿ, òî äàííûì àâòîìàòè÷åñêè ïðèñâàèâàþòñÿ çàãîëîâêè Столбец1, Столбец2 è ò.ä. èëè Строка1, Строка2 è ò.ä. â çàâèñèìîñòè îò òîãî, ðàñïîëîæåíû äàííûå â ñòîëáöàõ èëè â ñòðîêàõ.)  íåêîòîðûõ Глава 5. Надстройка Пакет анализа 147 äèàëîãîâûõ îêíàõ â îáëàñòè Входные данные íåîáõîäèìî óêàçàòü íåñêîëüêî âõîäíûõ äèàïàçîíîâ (íàïðèìåð, â îêíå Регрессия) ëèáî äîïîëíèòåëüíûå ïàðàìåòðû äëÿ ïðîâåäåíèÿ âûáðàííîé ñòàòèñòè÷åñêîé ïðîöåäóðû, íàïðèìåð äîâåðèòåëüíûé óðîâåíü äëÿ ïðîâåäåíèÿ òåñòîâ. Ðèñ. 5.1. Äèàëîãîâîå îêíî Анализ данных ñî ñïèñêîì èíñòðóìåíòîâ ñòàòèñòè÷åñêîãî àíàëèçà Ðèñ. 5.2. Äèàëîãîâîå îêíî ñðåäñòâà Описательная статистика  îáëàñòè Параметры вывода, êàê ïðàâèëî, íàäî óêàçàòü, êóäà áóäóò âûâîäèòüñÿ ðåçóëüòàòû ðàñ÷åòîâ. Ïðåäóñìîòðåíî òðè âîçìîæíîñòè: íà òåêóùèé ðàáî÷èé ëèñò (ïåðåêëþ÷àòåëü Выходной интервал), ïðè ýòîì íåîáõîäèìî óêàçàòü âûõîäíîé èíòåðâàë (äîñòàòî÷íî óêàçàòü àäðåñ îäíîé ÿ÷åéêè, êîòîðàÿ îïðåäåëÿåò âåðõíèé ëåâûé óãîë âûõîäíîãî äèàïàçîíà); íà íîâûé ðàáî÷èé ëèñò òåêóùåé ðàáî÷åé êíèãè íà÷èíàÿ ñ ÿ÷åéêè À1 (ïåðåêëþ÷àòåëü Новый рабочий лист), ïðè ýòîì ìîæíî ñðàçó çàäàòü èìÿ ýòîìó ëèñòó; â íîâóþ ðàáî÷óþ êíèãó (ïåðåêëþ÷àòåëü Новая рабочая книга), â ýòîì ñëó÷àå àâòîìàòè÷åñêè îòêðûâàåòñÿ íîâàÿ ðàáî÷àÿ êíèãà. Òàêæå â ýòîé îáëàñòè ÷àñòî èìåþòñÿ îïöèè, êîòîðûå óêàçûâàþò, ÷òî 148 Часть II. Средства Excel для статистического анализа èìåííî íåîáõîäèìî âûâåñòè èç âîçìîæíîãî íàáîðà âûõîäíûõ ðåçóëüòàòîâ (íàïðèìåð, ãðàôèêè ëèáî äîïîëíèòåëüíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè).  íåêîòîðûõ äèàëîãîâûõ îêíàõ èìåþòñÿ äðóãèå îáëàñòè, â êîòîðûõ ñîäåðæàòñÿ îïöèè, íåîáõîäèìûå äëÿ ðàáîòû äàííîãî ñðåäñòâà. Ýòè îïöèè áóäóò ïðèâåäåíû ïðè îïèñàíèè êîíêðåòíûõ ñðåäñòâ. Îïöèè îáëàñòåé Входные данные è Параметры вывода áóäåì óïîìèíàòü òîëüêî òîãäà, êîãäà îíè áóäóò îòëè÷àòüñÿ îò îïèñàííûõ âûøå. Ïåðåéäåì ê îïèñàíèþ êîíêðåòíûõ ñðåäñòâ ñòàòèñòè÷åñêîãî àíàëèçà, ïðè ýòîì áóäåì íàçûâàòü èõ òàê, êàê îíè íàçâàíû â ñïèñêå äèàëîãîâîãî îêíà Анализ данных. Îïèøåì èõ â ïîðÿäêå “îò ïðîñòîãî ê ñëîæíîìó” (äðóãèìè ñëîâàìè, â òîì ïîðÿäêå, êîòîðûé áîëüøå íðàâèòñÿ àâòîðó). 5.1. Описательная статистика Ýòî ñðåäñòâî (âìåñòå ñî ñðåäñòâîì Гистограмма, êîòîðîå áóäåò îïèñàíî â ñëåäóþùåì ðàçäåëå) ÿâëÿåòñÿ, ïî-âèäèìîìó, íàèáîëåå ÷àñòî èñïîëüçóåìûì èç âñåãî ïàêåòà àíàëèçà, ïîñêîëüêó áûñòðî è ïðîñòî âû÷èñëÿåò îñíîâíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè îäíîìåðíûõ âûáîðîê. Íà ðèñ. 5.3 ïîêàçàí ðàáî÷èé ëèñò, ñîäåðæàùèé òðè ðÿäà äàííûõ (òðè íåçàâèñèìûå âûáîðêè, èìåþùèå ðàçíûå ðàñïðåäåëåíèÿ) è äèàëîãîâîå îêíî Описательная статистика. Ðèñ. 5.3. Òðè âûáîðêè è äèàëîãîâîå îêíî Описательная статистика Îòìåòèì, ÷òî â äàííîì ñëó÷àå èìåþòñÿ âûáîðêè ðàçíûõ ðàçìåðîâ. Ñðåäñòâî Описательная статистика ïðàâèëüíî îïðåäåëÿåò ðàçìåðû âûáîðîê, èãíîðèðóÿ ïóñòûå ÿ÷åéêè. Íà ðèñ. 5.4 ïîêàçàí ðàáî÷èé ëèñò ñ ðåçóëüòàòàìè ðàñ÷åòîâ.  òàáë. 5.2 ïåðå÷èñëåíû âû÷èñëÿåìûå ñðåäñòâîì Описательная статистика ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðîê, à òàêæå ôóíêöèè, êîòîðûå âîçâðàùàþò òå æå ñàìûå õàðàêòåðèñòèêè. Глава 5. Надстройка Пакет анализа 149 Ðèñ. 5.4. Ðåçóëüòàòû ðàáîòû ñðåäñòâà Описательная статистика Таблица 5.2. Значения, вычисляемые средством Описательная статистика Çíà÷åíèå Îïèñàíèå Ñðåäíåå Âûáîðî÷íîå ñðåäíåå x = 1 n ∑ xi . Ôóíêöèÿ СРЗНАЧ n i =1 Ñòàíäàðòíàÿ Îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ âûáîðî÷íîãî ñðåäíåãî; îøèáêà n 1 âû÷èñëÿåòñÿ ïî ôîðìóëå ( xi − x ) 2 n(n − 1) ∑ i =1 Ìåäèàíà Çíà÷åíèå ìåäèàíû, ò.å. êâàíòèëÿ ïîðÿäêà 0,5. Ôóíêöèÿ МЕДИАНА Ìîäà Çíà÷åíèå ìîäû. Âû÷èñëÿåòñÿ òàê æå, êàê è ôóíêöèåé МОДА (ñì. ðàçäåë 4.11.3), — åñëè íåò îäèíàêîâûõ âûáîðî÷íûõ çíà÷åíèé, òî âîçâðàùàåòñÿ çíà÷åíèå îøèáêè #Н/Д Ñòàíäàðòíîå îòêëîíåíèå Îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ãåíåðàëüíîé ñîâîêóïíî- Äèñïåðñèÿ âûáîðêè ñòè sn = 1 n ∑ ( xi − x )2 . Ôóíêöèÿ СТАНДОТКЛОН n − 1 i =1 Îöåíêà äèñïåðñèè ãåíåðàëüíîé ñîâîêóïíîñòè sn = 2 1 n ( xi − x )2 . ∑ n − 1 i =1 Ôóíêöèÿ ДИСП Ýêñöåññ Âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà (ñì. ðàçäåë 2.3.4). Ôóíêöèÿ ЭКСЦЕСС Àñèììåòðè÷- Âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè (ñì. ðàçäåë 2.3.4). Ôóíêöèÿ íîñòü СКОС 150 Часть II. Средства Excel для статистического анализа Îêîí÷àíèå òàáë. 5.2 Çíà÷åíèå Îïèñàíèå Èíòåðâàë Ðàçìàõ âûáîðêè. Âû÷èñëÿåòñÿ êàê ðàçíîñòü ìåæäó ìàêñèìàëüíûì è ìèíèìàëüíûì âûáîðî÷íûìè çíà÷åíèÿìè Ìèíèìóì Ìèíèìàëüíîå âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ МИН Ìàêñèìóì Ìàêñèìàëüíîå âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ МАКС Ñóììà Ñóììà âûáîðî÷íûõ çíà÷åíèé. Ôóíêöèÿ СУММ Ñ÷åò Îáúåì âûáîðêè. Ôóíêöèÿ СЧЁТ Íàèáîëüøèé Ê-å íàèáîëüøåå çíà÷åíèå. Åñëè Ê = 1, òî âûâîäèòñÿ ìàêñèìàëüíîå (Ê) âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ НАИБОЛЬШИЙ Íàèìåíüøèé Ê-å íàèìåíüøåå çíà÷åíèå. Åñëè Ê = 1, òî âûâîäèòñÿ ìèíèìàëüíîå (Ê) âûáîðî÷íîå çíà÷åíèå. Ôóíêöèÿ НАИМЕНЬШИЙ Óðîâåíü íàäåæíîñòè (Õ%) Ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ñ äîâåðèòåëüíûì óðîâíåì Õ%; äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ êàê âûáîðî÷íîå ñðåäíåå ïëþñ-ìèíóñ äàííîå çíà÷åíèå. Ãðàíèöà âû÷èñëÿåòñÿ ñ ïîìîùüþ ðàñïðåäåëåíèÿ Ñòüþäåíòà (ñì. ðàçäåë 2.3.6), ò.å. çäåñü íåÿâíî èñïîëüçóåòñÿ ïðåäïîëîæåíèå î íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïîýòîìó ê äàííîìó ïîêàçàòåëþ ñëåäóåò îòíîñèòüñÿ îñòîðîæíî, îñîáåííî ïðè ìàëûõ âûáîðêàõ 5.1.1. Опции диалогового окна Описательная статистика Óñòàíîâêà ôëàæêà îïöèè Итоговая статистика óêàçûâàåò, ÷òî â èòîãîâîì îò÷åòå ýòîãî ñðåäñòâà áóäóò âû÷èñëåíû âñå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè, çà èñêëþ÷åíèåì ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà äëÿ ñðåäíåãî è Ê-õ íàèáîëüøèõ è íàèìåíüøèõ çíà÷åíèé, äëÿ êîòîðûõ èìåþòñÿ îòäåëüíûå îïöèè Уровень надежности, К-ый наименьший è К-ый наибольший. Åñëè ôëàæîê îïöèè Итоговая статистика íå óñòàíîâëåí, òî âûâîäèòñÿ òîëüêî òî, ÷òî çàäàåòñÿ ñ ïîìîùüþ îïöèé Уровень надежности, К-ый наименьший è К-ый наибольший. Îïöèÿ Уровень надежности óêàçûâàåò, íàäî ëè âû÷èñëÿòü ãðàíèöó äîâåðèòåëüíîãî èíòåðâàëà äëÿ ñðåäíåãî.  ïîëå ââîäà ðÿäîì ñ ýòîé îïöèåé çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü â ïðîöåíòàõ.  ïîëÿõ ââîäà ðÿäîì ñ îïöèÿìè К-ый наибольший è К-ый наименьший óêàçûâàþòñÿ ïîðÿäêè âûâîäèìûõ íàèáîëüøåãî è íàèìåíüøåãî çíà÷åíèé. Åñëè ýòè ïîðÿäêè ðàâíû 1, òî âûâîäÿòñÿ ñîîòâåòñòâåííî ìàêñèìàëüíîå è ìèíèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ. 5.2. Гистограмма Ýòî ñðåäñòâî ïîëåçíî äëÿ ïåðâè÷íîãî àíàëèçà ðàñïðåäåëåíèÿ âûáîðêè è ïîñòðîåíèÿ ãèñòîãðàìì (ñòîëáöîâûõ äèàãðàìì ýìïèðè÷åñêèõ ïëîòíîñòåé âåðîÿòíîñòåé).  êà÷åñòâå èñõîäíûõ äàííûõ íóæíî óêàçàòü âõîäíîé äèàïàçîí, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, è èíòåðâàë êàðìàíîâ. Èíòåðâàë êàðìàíîâ îïðåäåëÿåò ãðàíèöû äëÿ ñòîëáöîâ ãèñòîãðàììû. Ñðåäñòâî Гистограмма ïîäñ÷èòûâàåò ÷èñëî âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â êàæäûé êàðìàí (ýòè ÷èñëà â âûõîäíûõ äàííûõ Глава 5. Надстройка Пакет анализа 151 íàçûâàþòñÿ Частота), è ïî ýòèì ÷èñëàì ñòðîèò ãèñòîãðàììó. Äàëåå ïîñëåäîâàòåëüíî ñóììèðóþòñÿ ÷àñòîòû (ïîäñ÷èòûâàþòñÿ òàê íàçûâàåìûå íàêàïëèâàþùèå ñóììû), ýòè ñóììû äåëÿòñÿ íà îáúåì âûáîðêè è óìíîæàþòñÿ íà 100. Ïîëó÷àåòñÿ òî, ÷òî çäåñü íàçûâàåòñÿ Интегральный процент. Íà ñàìîì äåëå, åñëè óáðàòü ïðîöåíòû (ò.å. íàêàïëèâàþùèå ñóììû íîðìèðîâàòü íå íà 100%, à íà 1), ýòî ïðîñòî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ. Ñðåäñòâî Гистограмма ïðåäîñòàâëÿåò âîçìîæíîñòü âûâåñòè çíà÷åíèÿ èíòåãðàëüíîãî ïðîöåíòà â âèäå ãðàôèêà.  êà÷åñòâå äîïîëíèòåëüíîé âîçìîæíîñòè ïðåäóñìîòðåíà ñîðòèðîâêà ÷àñòîò ïî óáûâàíèþ è ïîñòðîåíèå ãèñòîãðàììû ïî ýòèì îòñîðòèðîâàííûì ÷àñòîòàì. 5.2.1. Опции диалогового окна Гистограмма Äèàëîãîâîå îêíî Гистограмма ïîêàçàíî íà ðèñ. 5.5.  îáëàñòè Входные данные çàäàþòñÿ àäðåñ äèàïàçîíà ÿ÷ååê ñ âûáîðî÷íûìè çíà÷åíèÿìè (ïîëå ââîäà Входной интервал) è àäðåñ äèàïàçîíà, ñîäåðæàùåãî ãðàíèöû êàðìàíîâ (ïîëå ââîäà Интервал карманов). Ãðàíèöû êàðìàíîâ äîëæíû áûòü ïðåäñòàâëåíû â ïîðÿäêå âîçðàñòàíèÿ. Ïðè ïîäñ÷åòå êîëè÷åñòâà ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàðìàíû â ÷èñëî ïîïàâøèõ â äàííûé êàðìàí âêëþ÷àþòñÿ çíà÷åíèÿ, ðàâíûå íèæíåé ãðàíèöå êàðìàíà è ìåíüøèå âåðõíåé ãðàíèöû êàðìàíà. Åñëè íå óêàçûâàòü èíòåðâàë ãðàíèö êàðìàíîâ, áóäóò àâòîìàòè÷åñêè ñîçäàíû ðàâíîâåëèêèå èíòåðâàëû, êîëè÷åñòâî êîòîðûõ îïðåäåëÿåòñÿ ïî ôîðìóëå Ñòåðäæåññà k = [1 + 3,22 ln(n)] ([õ] — öåëàÿ ÷àñòü ÷èñëà õ). (Áîëåå ïîäðîáíî î ïîñòðîåíèè èíòåðâàëîâ ðå÷ü èäåò â ðàçäåëå 8.3.2.) Ðèñ. 5.5. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Гистограмма Ðàññìîòðèì îïöèè Парето (отсортированная гистограмма), Интегральный процент è Вывод графика èç îáëàñòè Параметры вывода. Åñëè óñòàíîâëåí òîëüêî ôëàæîê îïöèè Парето (отсортированная гистограмма), òî âûâîäÿòñÿ òàáëèöà ÷àñòîò è òàáëèöà îòñîðòèðîâàííûõ â ïîðÿäêå óáûâàíèÿ ÷àñòîò. Åñëè òàêæå óñòàíîâëåí ôëàæîê îïöèè Вывод графика, âûâîäèòñÿ ãèñòîãðàììà îòñîðòèðîâàííûõ ÷àñòîò, êàê ïîêàçàíî íà ðèñ. 5.6. 152 Часть II. Средства Excel для статистического анализа Ðèñ. 5.6. Îòñîðòèðîâàííàÿ ãèñòîãðàììà Åñëè óñòàíîâëåí òîëüêî ôëàæîê îïöèè Интегральный процент, òî âûâîäèòñÿ òàáëèöà, ñîäåðæàùàÿ ÷àñòîòû è çíà÷åíèÿ èíòåãðàëüíîãî ïðîöåíòà. Åñëè åùå óñòàíîâëåí ôëàæîê îïöèè Вывод графика, ýòè äàííûå òàêæå îòîáðàæàþòñÿ ãðàôè÷åñêè, êàê ïîêàçàíî íà ðèñ. 5.7. Ðèñ. 5.7. Ãèñòîãðàììà ÷àñòîò è ãðàôèê èíòåãðàëüíîãî ïðîöåíòà Åñëè óñòàíîâëåíû ôëàæêè îïöèé Парето (отсортированная гистограмма) è Интегральный процент, òî âûâîäÿòñÿ äâå òàáëèöû: îäíà ñîäåðæèò íåîòñîðòèðîâàííûå ÷àñòîòû è èíòåãðàëüíûå ïðîöåíòû, âòîðàÿ — îòñîðòèðîâàííûå ÷àñòîòû è ñîîòâåòñòâóþùèå èíòåãðàëüíûå ïðîöåíòû (ðèñ. 5.8). Åñëè òàêæå óñòàíîâëåí ôëàæîê îïöèè Вывод графика, âûâîäÿòñÿ ãèñòîãðàììà è ãðàôèê èíòåãðàëüíîãî ïðîöåíòà, ïîñòðîåííûå ïî îòñîðòèðîâàííûì ÷àñòîòàì. Глава 5. Надстройка Пакет анализа 153 Ðèñ. 5.8. Âûõîäíûå äàííûå (äâå òàáëèöû) Íàêîíåö, åñëè óñòàíîâëåí ôëàæîê òîëüêî îïöèè Вывод графика, âûâîäÿòñÿ òàáëèöà ÷àñòîò (íå îòñîðòèðîâàííàÿ) è ãèñòîãðàììà. 5.3. Генерация случайных чисел Ýòî ñðåäñòâî ïðåäíàçíà÷åíî äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ ÷èñåë, èìåþùèõ çàäàííîå ðàñïðåäåëåíèå, ò.å. äëÿ ïîëó÷åíèÿ ñëó÷àéíûõ âûáîðîê. Ñðåäñòâî èìååò âîçìîæíîñòü ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà, èìåþùèå ñëåäóþùèå ðàñïðåäåëåíèÿ. • Ðàâíîìåðíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë â çàäàííîì èíòåðâàëå, äëÿ ÷åãî íåîáõîäèìî óêàçàòü âåðõíþþ è íèæíþþ ãðàíèöû èíòåðâàëà. • Íîðìàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ íîðìàëüíîìó ðàñïðåäåëåíèþ. Çàäàåòñÿ ìàòåìàòè÷åñêîå îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå. • Áåðíóëëè. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïðèíèìàþùèõ òîëüêî çíà÷åíèå 0 èëè 1, â çàâèñèìîñòè îò çàäàííîé âåðîÿòíîñòè óñïåõà (èñõîäà “1”). (Î ðàñïðåäåëåíèè Áåðíóëëè ðå÷ü èäåò â ðàçäåëå 1.4.2.) • Áèíîìèàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ðàâíàÿ êîëè÷åñòâó èñõîäîâ “1” â n íåçàâèñèìûõ èñïûòàíèÿõ.  ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.3). Çäåñü íåîáõîäèìî çàäàòü ÷èñëî èñïûòàíèé n è âåðîÿòíîñòü p. • Ïóàññîíà. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà ñ çàäàííûì ïàðàìåòðîì λ. (Î ðàñïðåäåëåíèè Ïóàññîíà ðå÷ü èäåò â ðàçäåëå 1.4.4.) • Ìîäåëüíîå. Ïðè âûáîðå ýòîãî ðàñïðåäåëåíèÿ íà ñàìîì äåëå ãåíåðèðóþòñÿ íå ñëó÷àéíûå ÷èñëà, à ïîâòîðÿþùàÿñÿ ïîñëåäîâàòåëüíîñòü ÷ëåíîâ àðèôìåòè÷åñêîé ïðîãðåññèè, ïðè÷åì ÷ëåíû ïðîãðåññèè òàêæå ìîãóò ïîâòîðÿòüñÿ çàäàííîå ÷èñëî ðàç. Äëÿ ýòîãî ðàñïðåäåëåíèÿ çàäàþòñÿ èíòåðâàë èçìåíåíèÿ 154 Часть II. Средства Excel для статистического анализа ÷ëåíîâ àðèôìåòè÷åñêîé ïðîãðåññèè, øàã ïðîãðåññèè, ÷èñëî ïîâòîðåíèé ÷ëåíîâ ïðîãðåññèè è ÷èñëî ïîâòîðåíèé ýòîé ïîñëåäîâàòåëüíîñòè ÷èñåë. • Äèñêðåòíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ çàäàííîìó äèñêðåòíîìó ðàñïðåäåëåíèþ. Äëÿ çàäàíèÿ ýòîãî ðàñïðåäåëåíèÿ íåîáõîäèìî óêàçàòü äèàïàçîí ÿ÷ååê, ñîñòîÿùèé èç äâóõ ñòîëáöîâ: â ïåðâîì ñòîëáöå ñîäåðæàòñÿ çíà÷åíèÿ, à âî âòîðîì — âåðîÿòíîñòè êàæäîãî çíà÷åíèÿ. Ñóììà âåðîÿòíîñòåé âî âòîðîì ñòîëáöå äîëæíà áûòü ðàâíà 1. 5.3.1. Опции диалогового окна Генерация случайных чисел Äèàëîãîâîå îêíî Генерация случайных чисел ïðè çàäàíèè ðàçëè÷íûõ ðàñïðåäåëåíèé èìååò ðÿä îäèíàêîâûõ ýëåìåíòîâ, íî íàëè÷èå íåêîòîðûõ äðóãèõ îïöèé çàâèñèò îò âûáðàííîãî òèïà ðàñïðåäåëåíèÿ. Âûáîð ðàñïðåäåëåíèÿ îñóùåñòâëÿåòñÿ â ðàñêðûâàþùåìñÿ ñïèñêå Распределение. Ðàññìîòðèì ñíà÷àëà îáùèå ýëåìåíòû âñåõ äèàëîãîâûõ îêîí Генерация случайных чисел.  ïîëå ââîäà Число переменных óêàçûâàåòñÿ êîëè÷åñòâî ãåíåðèðóåìûõ âûáîðîê. Êàæäàÿ âûáîðêà ðàñïîëàãàåòñÿ â îòäåëüíîì ñòîëáöå. Ìàêñèìàëüíîå êîëè÷åñòâî âûáîðîê — 256 (ïî êîëè÷åñòâó ñòîëáöîâ â ðàáî÷åì ëèñòå Excel). Åñëè ýòî ÷èñëî íå ââåäåíî, òî áóäåò ñãåíåðèðîâàíà îäíà ñëó÷àéíàÿ âûáîðêà, èëè, åñëè â ïîëå Выходной интервал óêàçàí äèàïàçîí ÿ÷ååê, â êîòîðîì áóäóò ðàñïîëàãàòüñÿ ñãåíåðèðîâàííûå çíà÷åíèÿ, áóäóò çàïîëíåíû âñå ñòîëáöû ýòîãî äèàïàçîíà.  ïîëå ââîäà Число случайных чисел çàäàåòñÿ êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ò.å. îáúåì ãåíåðèðóåìûõ âûáîðîê), îäíî è òî æå äëÿ âñåõ âûáîðîê. Åñëè ýòî ÷èñëî íå ââåäåíî, òî áóäåò ñãåíåðèðîâàíî îäíî çíà÷åíèå, èëè, åñëè â ïîëå Выходной интервал óêàçàí äèàïàçîí ÿ÷ååê, â êîòîðîì áóäóò ðàñïîëàãàòüñÿ ñãåíåðèðîâàííûå çíà÷åíèÿ, áóäóò çàïîëíåíû âñå ñòðîêè ýòîãî äèàïàçîíà.  áîëüøèíñòâå äèàëîãîâûõ îêîí Генерация случайных чисел (êðîìå îêîí äëÿ ìîäåëüíîãî è äèñêðåòíîãî ðàñïðåäåëåíèé) èìååòñÿ ïîëå ââîäà Случайное рассеивание. ×èñëî, ââåäåííîå â ýòî ïîëå, çàäàåò íà÷àëüíîå çíà÷åíèå, êîòîðîå áóäåò èñïîëüçîâàíî â àëãîðèòìå ãåíåðàöèè ñëó÷àéíûõ ÷èñåë. Îáû÷íî ýòî ïîëå îñòàâëÿþò ïóñòûì. Îäíàêî, ÷òîáû ãåíåðèðîâàòü îäèíàêîâûå ïîñëåäîâàòåëüíîñòè ñëó÷àéíûõ ÷èñåë, íåîáõîäèìî ââåñòè ÷èñëî èç äèàïàçîíà îò 1 äî 32 767 (äîïóñêàþòñÿ òîëüêî öåëûå ÷èñëà). Òîãäà â áóäóùåì ìîæíî ïîëó÷èòü òîò æå íàáîð âûáîðî÷íûõ çíà÷åíèé, åñëè â ýòî ïîëå ñíîâà ââåñòè òî æå ñàìîå íà÷àëüíîå çíà÷åíèå. Âñå äèàëîãîâûå îêíà Генерация случайных чисел èìåþò îáëàñòü Параметры; îïöèè ýòîé îáëàñòè çàâèñÿò îò òèïà âûáðàííîãî ðàñïðåäåëåíèÿ. Íàçíà÷åíèå áîëüøèíñòâà ýòèõ îïöèé î÷åâèäíî, íî íåêîòîðûå òðåáóþò ïîÿñíåíèé. Ðàâíîìåðíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.9. Çäåñü â îáëàñòè Параметры íàäî çàäàòü òîëüêî âåðõíþþ è íèæíþþ ãðàíèöû, â ïðåäåëàõ êîòîðûõ ñîñðåäîòî÷åíî ðàñïðåäåëåíèå. Íîðìàëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.10.  îáëàñòè Параметры çàäàþòñÿ çíà÷åíèÿ ñðåäíåãî (ìàòåìàòè÷åñêîãî îæèäàíèÿ) è ñòàíäàðòíîå (ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå). Äëÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ ñðåäíåå ðàâíî 0, à ñòàíäàðòíîå îòêëîíåíèå — 1. Глава 5. Надстройка Пакет анализа 155 Ðèñ. 5.9. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë Ðèñ. 5.10. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ íîðìàëüíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë Ðàñïðåäåëåíèå Áåðíóëëè. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ äàííîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.11. Çäåñü â îáëàñòè Параметры çàäàåòñÿ òîëüêî îäèí ïàðàìåòð — âåðîÿòíîñòü p. Áèíîìèàëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ ýòîãî ðàñïðåäåëåíèÿ ïîêàçàíî íà ðèñ. 5.12. Äëÿ ýòîãî ðàñïðåäåëåíèÿ çàäàþòñÿ çíà÷åíèÿ âåðîÿòíîñòè ð è êîëè÷åñòâî èñïûòàíèé n. 156 Часть II. Средства Excel для статистического анализа Ðèñ. 5.11. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàñïðåäåëåíèå Áåðíóëëè Ðèñ. 5.12. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ áèíîìèàëüíîå ðàñïðåäåëåíèå Ðàñïðåäåëåíèå Ïóàññîíà. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ äàííîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.13. Çäåñü â îáëàñòè Параметры çàäàåòñÿ òîëüêî îäèí ïàðàìåòð Лямбда. Ìîäåëüíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ ýòîãî ñëó÷àÿ ïîêàçàíî íà ðèñ. 5.14. Глава 5. Надстройка Пакет анализа 157 Ðèñ. 5.13. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàñïðåäåëåíèå Ïóàññîíà Ðèñ. 5.14. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ çàäàííûõ ÷èñåë (ìîäåëüíîå ðàñïðåäåëåíèå) Çäåñü çàäàþòñÿ íèæíÿÿ è âåðõíÿÿ ãðàíèöû ÷èñåë, øàã ïðîãðåññèè, ÷èñëî ïîâòîðåíèé çíà÷åíèé â ïîñëåäîâàòåëüíîñòè è ÷èñëî ïîâòîðåíèé ïîñëåäîâàòåëüíîñòè. Íà ðèñ. 5.15 ïîêàçàíû ñãåíåðèðîâàííûå ÷èñëà ñ ìîäåëüíûì ðàñïðåäåëåíèåì, ïàðàìåòðû êîòîðîãî çàäàíû íà ðèñ. 5.14. 158 Часть II. Средства Excel для статистического анализа Ðèñ. 5.15. Ñãåíåðèðîâàííûå ÷èñëà Äèñêðåòíîå ðàñïðåäåëåíèå. Äèàëîãîâîå îêíî Генерация случайных чисел äëÿ ýòîãî òèïà ðàñïðåäåëåíèÿ âìåñòå ñ íåîáõîäèìûìè âõîäíûìè äàííûìè ïîêàçàíî íà ðèñ. 5.16. Ðèñ. 5.16. Äèàëîãîâîå îêíî äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ çàäàííîå äèñêðåòíîå ðàñïðåäåëåíèå Глава 5. Надстройка Пакет анализа 159 Ðèñ. 5.17. Ñãåíåðèðîâàííûå ÷èñëà Äëÿ çàäàíèÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ â ïîëå Входной интервал значений и вероятностей íåîáõîäèìî óêàçàòü àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû è ñîîòâåòñòâóþùèå èì âåðîÿòíîñòè. Äèàïàçîí äîëæåí ñîñòîÿòü èç äâóõ ñòîëáöîâ: ëåâîãî, ñîäåðæàùåãî çíà÷åíèÿ, è ïðàâîãî, ñîäåðæàùåãî âåðîÿòíîñòè, êàê ïîêàçàíî íà ðèñ. 5.16. Ñóììà âåðîÿòíîñòåé äîëæíà áûòü ðàâíà 1. Íà ðèñ. 5.17 ïðåäñòàâëåíû ñãåíåðèðîâàííûå ÷èñëà ñ ðàñïðåäåëåíèåì, ïàðàìåòðû êîòîðîãî çàäàíû íà ðèñ. 5.16.  çàêëþ÷åíèå îòìåòèì, ÷òî â Excel èìåþòñÿ è äðóãèå ñðåäñòâà ãåíåðèðîâàíèÿ ñëó÷àéíûõ âûáîðîê, íàïðèìåð ôóíêöèè СЛЧИС è СЛУЧМЕЖДУ (ñì. ðàçäåë 4.13). Ïîäðîáíî çàäà÷à ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ âåëè÷èí ðàññìîòðåíà â ãëàâå 7. 5.4. Выборка Ýòî ñðåäñòâî èç èñõîäíîãî ÷èñëîâîãî ìíîæåñòâà âûáèðàåò óêàçàííîå êîëè÷åñòâî ÷èñåë, ïðè÷åì ëèáî ñëó÷àéíûì îáðàçîì, ëèáî ñ çàäàííûì ïåðèîäîì (íàïðèìåð, êàæäîå âòîðîå èëè êàæäîå äåñÿòîå ÷èñëî). Òàêóþ îïåðàöèþ âûáîðà ÷èñëîâûõ çíà÷åíèé èç çàäàííîãî ìíîæåñòâà ìîæíî òðàêòîâàòü êàê ñîçäàíèå âûáîðêè çàäàííîãî îáúåìà, åñëè èñõîäíîå ìíîæåñòâî ðàññìàòðèâàòü êàê ãåíåðàëüíóþ ñîâîêóïíîñòü. Ïîäîáíàÿ îïåðàöèÿ ÷àñòî ñîñòàâëÿåò îäèí èç ýòàïîâ ïðåäâàðèòåëüíîé îáðàáîòêè äàííûõ. Íàïðèìåð, åñëè èñõîäíàÿ âûáîðêà ñëèøêîì âåëèêà äëÿ îáðàáîòêè èëè ïîñòðîåíèÿ äèàãðàìì ëèáî åñëè èñõîäíûå äàííûå ñîäåðæàò ïåðèîäè÷åñêóþ ñîñòàâëÿþùóþ, òî ìîæíî ñîçäàòü âûáîðêó, ñîäåðæàùóþ çíà÷åíèÿ òîëüêî èç îòäåëüíûõ ÷àñòåé ïåðèîäà. 5.4.1. Опции диалогового окна Выборка Äèàëîãîâîå îêíî Выборка ïîêàçàíî íà ðèñ. 5.18. Àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé èñõîäíûé íàáîð ÷èñëîâûõ çíà÷åíèé, çàäàåòñÿ â ïîëå Входной интервал. Åñëè ýòîò äèàïàçîí ñîñòîèò èç íåñêîëüêèõ ñòîëáöîâ, òî çíà÷åíèÿ ñíà÷àëà áóäóò èçâëåêàòüñÿ èç ïåðâîãî ñòîëáöà, çàòåì èç âòîðîãî ñòîëáöà è ò.ä. Ñðåäñòâî Выборка îòêàæåòñÿ ðàáîòàòü (âûâåäåò ñîîòâåòñòâóþùåå îêíî ïðåäóïðåæäåíèÿ), åñëè ñðåäè èñõîäíûõ äàííûõ èìåþòñÿ íå÷èñëîâûå çíà÷åíèÿ.  îáëàñòè Метод выборки íåîáõîäèìî óêàçàòü, êàêèì ñïîñîáîì áóäóò âûáèðàòüñÿ çíà÷åíèÿ èç èñõîäíîãî ìíîæåñòâà. Åñëè óñòàíîâëåí ïåðåêëþ÷àòåëü Периодический, òî èç èñõîäíîãî ìíîæåñòâà áóäåò âûáðàíî êàæäîå n-å çíà÷åíèå; ÷èñëî n çàäàåòñÿ â ïîëå ââîäà Период. Êîëè÷åñòâî âûáðàííûõ çíà÷åíèé áóäåò ðàâíî êîëè÷åñòâó çíà÷åíèé â èñõîäíîì äèàïàçîíå, äåëåííîìó íà çíà÷åíèå â ïîëå Период. Åñëè óñòàíîâëåí ïåðåêëþ÷àòåëü Случайный, çíà÷åíèÿ èç èñõîäíîãî ìíîæåñòâà âûáèðàþòñÿ ñëó÷àéíûì îáðàçîì; êîëè÷åñòâî âûáèðàåìûõ çíà÷åíèé çàäàåòñÿ â ïîëå Число выборок. 160 Часть II. Средства Excel для статистического анализа Ðèñ. 5.18. Äèàëîãîâîå îêíî Выборка 5.5. Ранг и персентиль Ýòî ñðåäñòâî ïîçâîëÿåò ñîçäàòü òàáëèöó, ñîäåðæàùóþ ïîðÿäêîâûé è ïðîöåíòíûé ðàíãè äëÿ êàæäîãî çíà÷åíèÿ â çàäàííîì íàáîðå äàííûõ, ïðè ýòîì çíà÷åíèÿ óïîðÿäî÷èâàþòñÿ â ïîðÿäêå óáûâàíèÿ. Íà ðèñ. 5.19 ïîêàçàíû äèàëîãîâîå îêíî Ранг и персентиль è èñõîäíûå äàííûå, íà ðèñ. 5.20 — ðåçóëüòàò ïðèìåíåíèÿ ýòîãî ñðåäñòâà. Èòîãîâàÿ òàáëèöà ñîäåðæèò ïîðÿäêîâûé íîìåð âûáîðî÷íîãî çíà÷åíèÿ, ñòîëáåö âûáîðî÷íûõ çíà÷åíèé, îòñîðòèðîâàííûõ â ïîðÿäêå óáûâàíèÿ, ñòîëáåö ðàíãîâ è ñòîëáåö ïðîöåíòíûõ ðàíãîâ ýòèõ çíà÷åíèé, ïðè÷åì íàèáîëüøåìó çíà÷åíèþ ïðèñâàèâàåòñÿ ðàíã 1 è ïðîöåíòíûé ðàíã 100%, à íàèìåíüøåìó — íàèáîëüøèé ðàíã è ïðîöåíòíûé ðàíã, ðàâíûé 0%. Åñëè èìååòñÿ ãðóïïà ñîâïàäàþùèõ çíà÷åíèé, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ðàíãó ïåðâîãî ÷èñëà èç ãðóïïû ñîâïàäàþùèõ çíà÷åíèé. Çíà÷åíèþ, ñëåäóþùåìó çà ýòîé ãðóïïîé, ïðèñâàèâàåòñÿ ðàíã, áîëüøèé ðàíãà ñîâïàäàþùèõ çíà÷åíèé íà ÷èñëî ýòèõ îäèíàêîâûõ çíà÷åíèé. Ïðîöåíòíûé ðàíã Ti äëÿ âûáîðî÷íîãî çíà÷åíèÿ xi ðàññ÷èòûâàåòñÿ ïî ôîðìóëå Ti = n − Ri ⋅100% , ãäå Ri — n −1 ðàíã çíà÷åíèÿ xi, ðàññ÷èòàííûé ïðè óñëîâèè óïîðÿäî÷èâàíèÿ äàííûõ ïî óáûâàíèþ, n — îáúåì âûáîðêè. 5.6. Двухвыборочный z"тест для средних Ýòî ñðåäñòâî ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå, ïðè èçâåñòíûõ äèñïåðñèÿõ ýòèõ ðàñïðåäåëåíèé (ñì. ðàçäåë 2.4.2). Ïóñòü èìåþòñÿ äâå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m, èçâëå÷åííûå èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è íåèçâåñòíûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2. Ïðîâåðÿåòñÿ íóëåâàÿ Глава 5. Надстройка Пакет анализа 161 Ðèñ. 5.19. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Ранг и персентиль Ðèñ. 5.20. Ðåçóëüòàò âû÷èñëåíèé ãèïîòåçà Í0: µ1 – µ2 = δ (δ çàäàíî). Z-òåñò ïîçâîëÿåò ïðîâåðèòü ãèïîòåçó Í0 ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ. Êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå 162 Часть II. Средства Excel для статистического анализа z= x − y −δ σ12 σ12 + n m , ãäå x è y — âûáîðî÷íûå ñðåäíèå ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê. Äëÿ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé êðèòåðèàëüíàÿ ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ïîýòîìó ïðè çàäàííîì óðîâíå çíà÷èìîñòè α êðèòè÷åñêàÿ îáëàñòü ñòðîèòñÿ íà îñíîâå ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ — âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ëèáî êâàíòèëü t ïîðÿäêà 1 – α/2 äëÿ ïðîâåðêè ãèïîòåç íåðàâåíñòâà. Íóëåâàÿ ãèïîòåçà î ðàâåíñòâå ïðèíèìàåòñÿ, åñëè |z| < t (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ ïðèíèìàåòñÿ, åñëè z < t; è ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà –t < z. Ðàññìîòðèì ïðèìåð. Èìååòñÿ äâå âûáîðêè1 îáúåìîì ñîîòâåòñòâåííî 50 è 20 çíà÷åíèé, ïîêàçàííûå íà ðèñ. 5.21. Îáå èìåþò íîðìàëüíîå ðàñïðåäåëåíèå, ïåðâàÿ — ñòàíäàðòíîå (ò.å. µ1 = 0 è σ12 = 1), à äëÿ âòîðîé — µ2 = 1 è σ22 = 2. Ïðîâåðèì ñ ïîìîùüþ ñðåäñòâà Двухвыборочный z-тест для средних íóëåâóþ ãèïîòåçó, ÷òî µ2 – µ1 = 1,5 äëÿ ðàçíûõ ñëó÷àåâ êîíêóðèðóþùèõ ãèïîòåç. Çàïîëíåííîå äèàëîãîâîå îêíî äëÿ ýòîãî ïðèìåðà òàêæå ïîêàçàíî íà ðèñ. 5.21. Ðèñ. 5.21. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухвыборочный z-тест для средних Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал переменной 2 1 Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Глава 5. Надстройка Пакет анализа 163 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè.  ïîëÿõ ââîäà Дисперсия переменной 1 è Дисперсия переменной 2 ââîäÿòñÿ çíà÷åíèÿ äèñïåðñèé ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê.  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный z-тест для средних ïîêàçàí íà ðèñ. 5.22. Ðèñ. 5.22. Ðåçóëüòàò âû÷èñëåíèé  èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Среднее — âûáîðî÷íûå ñðåäíèå âûáîðîê. • Известная дисперсия — äèñïåðñèè âûáîðîê, êîòîðûå óêàçàíû â äèàëîãîâîì îêíå. • Наблюдения — îáúåìû âûáîðîê. • Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå. • z — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • P(Z<=z) одностороннее — âåðîÿòíîñòü P(Õ≤z), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, z — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • z критическое одностороннее — çíà÷åíèå êâàíòèëÿ ïîðÿäêà 1 – α/2. • P(Z<=z) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|z|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî ñòàíäàðòíîìó íîðìàëüíîìó çàêîíó, z — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • z критическое двухстороннее — çíà÷åíèå êâàíòèëÿ ïîðÿäêà 1 – α. Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íåò îñíîâàíèé îòâåðãàòü íóëåâóþ ãèïîòåçó ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ. Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ZТЕСТ (ñì. ðàçäåë 4.8.1) âû÷èñëÿåò âåðîÿòíîñòü P(Z<=z) двухстороннее. 164 Часть II. Средства Excel для статистического анализа 5.7. Двухвыборочный t"тест с одинаковыми дисперсиями Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè â ïðåäïîëîæåíèè, ÷òî äèñïåðñèè ðàâíû. Ýòîò êðèòåðèé, íàçûâàåìûé t-òåñòîì èëè òåñòîì Ñòüþäåíòà, ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2. Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ (µ1 è µ2 — íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Двухвыборочный t-тест с одинаковыми дисперсиями ïîêàçàíû íà ðèñ. 5.23. Âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ îäíîé è òîé æå äèñïåðñèåé, ðàâíîé 1, è ìàòåìàòè÷åñêèìè îæèäàíèÿìè 0 è 1 ñîîòâåòñòâåííî2. Ïðîâåðèì ãèïîòåçó, ÷òî µ2 – µ1 = 2 (íà ñàìîì äåëå µ2 – µ1 = 1). Ðèñ. 5.23. Èñõîäíûå äàííûå с одинаковыми дисперсиями è äèàëîãîâîå îêíî Двухвыборочный t-тест Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ t-тест çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный с одинаковыми дисперсиями ïîêàçàí íà ðèñ. 5.24. 2 Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Глава 5. Надстройка Пакет анализа 165 Ðèñ. 5.24. Ðåçóëüòàò âû÷èñëåíèé  èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè. • Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê. • Наблюдения — îáúåìû âûáîðîê. • Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå. • Объединенная дисперсия — “ñðåäíÿÿ” îöåíêà äèñïåðñèè; ðàññ÷èòûâàåòñÿ ïî ôîðìóëå s 2 = (n − 1) s12 + (m − 1) s22 , ãäå n è m — îáúåìû âûáîðîê, si2 — n+m−2 îöåíêè äèñïåðñèé (èõ çíà÷åíèÿ ïðèâîäÿòñÿ â ñòðîêå Дисперсия). • df — число степеней свободы; вычисляется как n + m – 2. • t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t = n + m − 2( x − y − δ) n+m (n − 1) s12 + (m − 1) s22 nm , èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. • P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. 166 Часть II. Средства Excel для статистического анализа • P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t. Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò îòâåðãíóòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ. Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 2 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее. 5.8. Двухвыборочный t"тест с различными дисперсиями Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ íåçàâèñèìûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè è ðàçëè÷íûìè äèñïåðñèÿìè. Ýòîò êðèòåðèé òàêæå íàçûâàåòñÿ t-òåñòîì èëè òåñòîì Ñòüþäåíòà äëÿ íåðàâíûõ äèñïåðñèé, ëèáî êðèòåðèåì Ôèøåðà–Áåðåíñà è ïîäðîáíî îïèñûâàåòñÿ â ðàçäåëå 2.4.2. Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ (µ1 è µ2 — íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Ïîâòîðèì òåñò íà ïðèìåðå äàííûõ èç ïðåäûäóùåãî ðàçäåëà, ò.å. âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ îäíîé è òîé æå äèñïåðñèåé, ðàâíîé 1, è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî 0 è 1. Ïðîâåðèì ãèïîòåçó, ÷òî µ2 – µ1 = 2 (íà ñàìîì äåëå µ2 – µ1 = 1). Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Двухвыборочный t-тест с различными дисперсиями ïîêàçàíû íà ðèñ. 5.25. Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный t-тест с различными дисперсиями ïîêàçàí íà ðèñ. 5.26.  èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè. • Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê. Глава 5. Надстройка Пакет анализа 167 Ðèñ. 5.25. Èñõîäíûå äàííûå с различными дисперсиями è äèàëîãîâîå îêíî Двухвыборочный t-тест Ðèñ. 5.26. Ðåçóëüòàò âû÷èñëåíèé • Наблюдения — îáúåìû âûáîðîê. • Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå. 168 Часть II. Средства Excel для статистического анализа • df — число степеней свободы; вычисляется по формуле s12 s22 + n m 2 ( s12 n) 2 ( s22 m)2 + n −1 m −1 , где s12 и s22 — несмещенные оценки дисперсий (их значения приводятся в строке Дисперсия), n и m — объемы соответственно первой и второй выборок. • t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t = x − y −δ s12 s22 + n m , èìååò ðàñïðåäåëåíèå, áëèçêîå ê ðàñïðåäåëåíèþ Ñòüþ- äåíòà ñ df ñòåïåíÿìè ñâîáîäû. • P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. • P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t. Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò îòâåðãíóòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ. Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 3 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее. 5.9. Парный двухвыборочный t"тест для средних Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå (íåðàâåíñòâå) ìàòåìàòè÷åñêèõ îæèäàíèé ðàñïðåäåëåíèé äâóõ çàâèñèìûõ âûáîðîê, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ. Ýòîò êðèòåðèé òàêæå íàçûâàåòñÿ t-òåñòîì èëè òåñòîì Ñòüþäåíòà äëÿ ïàðíûõ íàáëþäåíèé è ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2. Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: µ1 – µ2 = δ (δ çàäàíî) ïðîòèâ ðàçíûõ êîíêóðèðóþùèõ ãèïîòåç: Í1: µ1 ≠ µ2 + δ èëè Í1: µ1 > µ2 + δ, ëèáî Í1: µ1 < µ2 + δ (µ1 è µ2 — íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê). Ðàññìîòðèì ïðèìåð, êîãäà âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî 0 è 1. Глава 5. Надстройка Пакет анализа 169 Ïðîâåðèì ãèïîòåçó, ÷òî µ2 – µ1 = 1,5 (íà ñàìîì äåëå µ2 – µ1 = 1). Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Парный двухвыборочный t-тест для средних ïîêàçàíû íà ðèñ. 5.27. Ðèñ. 5.27. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Парный двухвыборочный t-тест для средних Îòìåòèì, ÷òî ñðåäñòâî òðåáóåò, ÷òîáû δ, çíà÷åíèå êîòîðîãî çàäàåòñÿ â ïîëå Гипотетическая средняя разность, áûëî íåîòðèöàòåëüíî. Ïîýòîìó ïåðâûì (â ïîëå ââîäà Интервал переменной 1) çàäàåòñÿ àäðåñ äèàïàçîíà ÿ÷ååê, ñîäåðæàùèé âûáîðêó ñ áîëüøèì ìàòåìàòè÷åñêèì îæèäàíèåì, à çàòåì â ïîëå Интервал переменной 2 óêàçûâàåòñÿ àäðåñ âòîðîé âûáîðêè. (Äèàïàçîíû äîëæíû ñîñòîÿòü èç îäíîãî ñòîëáöà èëè îäíîé ñòðîêè.)  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Парный двухвыборочный t-тест для средних ïîêàçàí íà ðèñ. 5.28.  èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè. • Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê. • Наблюдения — îáúåìû âûáîðîê. • Корреляция Пирсона — âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè; âû÷èñëÿåòñÿ n ∑ ( x − x )( y i ïî ôîðìóëå r = i − y) i =1 n . n ∑ (x − x) ⋅ ∑ ( y 2 i i =1 • i − y) 2 i =1 Гипотетическая разность средних — çíà÷åíèå δ, êîòîðîå çàäàíî â äèàëîãîâîì îêíå. 170 Часть II. Средства Excel для статистического анализа Ðèñ. 5.28. Ðåçóëüòàò âû÷èñëåíèé • df — число степеней свободы, равное n – 1. • t-статистика — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè; âû÷èñëÿåòñÿ ïî ôîðìóëå t = d −δ , ãäå d = 1 n 1 n ( xi − yi ) , Sn2 = ∑ ( xi − yi − d ) 2 , è èìååò ðàñ∑ n i =1 n i =1 Sn / n ïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. • P(T<=t) одностороннее — âåðîÿòíîñòü P(Õ≤t), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое одностороннее — çíà÷åíèå êâàíòèëÿ têð2 ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. • P(T<=t) двухстороннее — âåðîÿòíîñòü P(|Õ|≤|t|), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû, t — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • t критическое двухстороннее — çíà÷åíèå êâàíòèëÿ têð1 ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ df ñòåïåíÿìè ñâîáîäû. Íóëåâàÿ ãèïîòåçà Í0: µ1 – µ2 = δ ïðèíèìàåòñÿ, åñëè |t| < têð1 (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ); ãèïîòåçà Í0 ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 > µ2 + δ ïðèíèìàåòñÿ, åñëè t < têð2; ïðè êîíêóðèðóþùåé ãèïîòåçå Í1: µ1 < µ2 + δ íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ ïðè âûïîëíåíèè íåðàâåíñòâà têð2 < t. Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò ïðèíÿòü ïðè ëþáûõ êîíêóðèðóþùèõ ãèïîòåçàõ. Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ТТЕСТ ïðè çíà÷åíèè àðãóìåíòà Тип = 1 (ñì. ðàçäåë 3.8.2) âû÷èñëÿåò âåðîÿòíîñòè P(T<=t) двухстороннее è P(T<=t) одностороннее. Глава 5. Надстройка Пакет анализа 171 5.10. Двухвыборочный F"тест для дисперсий Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé Ôèøåðà ïðîâåðêè ðàâåíñòâà äèñïåðñèé äâóõ íåçàâèñèìûõ âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ äèñïåðñèÿìè ñîîòâåòñòâåííî σ12 è σ 22 . Êðèòåðèé ïîäðîáíî îïèñàí â ðàçäåëå 2.4.2. Ðàññìîòðèì âûõîäíûå äàííûå, âû÷èñëÿåìûå ýòèì ñðåäñòâîì, íà ïðèìåðå ïðîâåðêè íóëåâîé ãèïîòåçû Í0: σ12 = σ 22 ïðîòèâ êîíêóðèðóþùåé ãèïîòåçû Í1: σ12 ≠ σ 22 . Ðàññìîòðèì ïðèìåð, êîãäà âûáîðêè èçâëå÷åíû èç íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé ñ ðàâíûìè äèñïåðñèÿìè 1,5. Èñõîäíûå äàííûå è çàïîëíåííîå äèàëîãîâîå îêíî Двухвыборочный F-тест для дисперсий ïîêàçàíû íà ðèñ. 5.29. Ðèñ. 5.29. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухвыборочный F-тест для дисперсий Îòìåòèì, ÷òî ïåðâîé (â ïîëå Входной интервал 1) äîëæíà çàäàâàòüñÿ âûáîðêà, èìåþùàÿ áîëüøóþ äèñïåðñèþ.  ïîëå Альфа ââîäèòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè α. Ðåçóëüòàò âû÷èñëåíèé ñðåäñòâà Двухвыборочный F-тест для дисперсий ïîêàçàí íà ðèñ. 5.30.  èòîãîâîé òàáëèöå ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Среднее — âûáîðî÷íûå ñðåäíèå äëÿ êàæäîé âûáîðêè. • Дисперсия — íåñìåùåííûå âûáîðî÷íûå îöåíêè äèñïåðñèé âûáîðîê. • Наблюдения — îáúåìû âûáîðîê. • df — числа степеней свободы, равные n – 1 è m – 1; n è m — îáúåìû âûáîðîê. • F — çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, âû÷èñëÿåìîé ïî ôîðìóëå F= S x2 , S y2 ãäå S x2 = 1 n ∑ ( xi − x )2 , n i =1 S y2 = 1 m ∑ ( yi − y )2 , m i =1 è èìåþùåé F- ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k1 = n – 1 è k2 = m – 1 (î Fðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7). 172 Часть II. Средства Excel для статистического анализа Ðèñ. 5.30. Ðåçóëüòàò âû÷èñëåíèé • P(F<=f) одностороннее — âåðîÿòíîñòü P(Õ≤F), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñ df ñòåïåíÿìè ñâîáîäû, F — ïîäñ÷èòàííîå çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè. • F критическое одностороннее — çíà÷åíèå êâàíòèëÿ t ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñ df ñòåïåíÿìè ñâîáîäû. Íóëåâàÿ ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè F < t (â ïðîòèâíîì ñëó÷àå îòâåðãàåòñÿ). Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, â äàííîì ïðèìåðå íóëåâóþ ãèïîòåçó ñëåäóåò ïðèíÿòü. Ñòàòèñòè÷åñêàÿ ôóíêöèÿ ФТЕСТ (ñì. ðàçäåë 4.8.3) âû÷èñëÿåò óäâîåííóþ âåðîÿòíîñòü P(F<=f) одностороннее. 5.11. Однофакторный дисперсионный анализ Ýòî ñðåäñòâî ðåàëèçóåò êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé íåñêîëüêèõ íåçàâèñèìûõ âûáîðîê, ïîñòðîåííûé íà îñíîâå äèñïåðñèîííîãî àíàëèçà. Îäíîôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.4.2. Çäåñü ïîêàæåì ïðèìåíåíèå ñðåäñòâà Однофакторный дисперсионный анализ è îïèøåì åãî âûõîäíûå äàííûå. Íà ðèñ. 5.31 ïîêàçàíû òðè âûáîðêè, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèìè îæèäàíèÿìè 0, 0,5 è 1 è ñðåäíåêâàäðàòè÷åñêèìè îòêëîíåíèÿìè 1, 2 è 3 ñîîòâåòñòâåííî. Îáúåìû âûáîðîê — 50, 40 è 30 çíà÷åíèé. (Âûáîðêè ñãåíåðèðîâàíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел.) Íà ðèñ. 5.31 òàêæå ïîêàçàíî çàïîëíåííîå äèàëîãîâîå îêíî Однофакторный дисперсионный анализ. Îáðàùàåì âíèìàíèå, ÷òî âñå òðè âûáîðêè çàäàþòñÿ â âèäå îäíîãî äèàïàçîíà ÿ÷ååê.  ñëó÷àå, êîãäà âûáîðêè èìåþò ðàçíûå ðàçìåðû, äèàïàçîí çàäàåòñÿ â ñîîòâåòñòâèè ñ íàèáîëüøåé âûáîðêîé è íåèçáåæíî ñîäåðæèò ïóñòûå ÿ÷åéêè. Íî ñðåäñòâî ïðàâèëüíî îïðåäåëÿåò îáúåìû âûáîðîê. Òàêæå îòìåòèì, ÷òî â äàííîì ñëó÷àå ðåçóëüòàòû àíàëèçà áóäóò âûâîäèòüñÿ íà îòäåëüíûé ðàáî÷èé ëèñò ñ èìåíåì Результаты, êîòîðûé àâòîìàòè÷åñêè âñòàâèòñÿ â òåêóùóþ ðàáî÷óþ êíèãó. Глава 5. Надстройка Пакет анализа 173 Ðèñ. 5.31. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Однофакторный дисперсионный анализ Íà ðèñ. 5.32 ïîêàçàíû ðåçóëüòàòû, âûâîäèìûå ñðåäñòâîì Однофакторный дисперсионный анализ. Îíè ïðåäñòàâëåíû â âèäå äâóõ òàáëèö, îçàãëàâëåííûõ ИТОГИ è Дисперсионный анализ.  òàáëèöå ИТОГИ âûâîäÿòñÿ îñíîâíûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðîê: â ñòîëáöå Счет — îáúåìû âûáîðîê, â ñòîëáöå Сумма — ñóììû âûáîðî÷íûõ çíà÷åíèé, â ñòîëáöàõ Среднее è Дисперсия — ñîîòâåòñòâåííî âûáîðî÷íûå ñðåäíèå è äèñïåðñèè. Ðèñ. 5.32. Ðåçóëüòàò âû÷èñëåíèé Çíà÷åíèÿ â ïåðâûõ ÷åòûðåõ ñòîëáöàõ òàáëèöû Дисперсионный анализ ïîâòîðÿþò çíà÷åíèÿ èç äèñïåðñèîííîé òàáëèöû (ñì. ðàçäåë 3.4.2).  ñòîëáöå SS ïðèâåäåíû ñóììû êâàäðàòîâ (ìåæãðóïïîâàÿ, âíóòðèãðóïïîâàÿ è ïîëíàÿ); â ñòîëáöå df — 174 Часть II. Средства Excel для статистического анализа çíà÷åíèÿ ñòåïåíåé ñâîáîäû, à â ñòîëáöå MS — äèñïåðñèè, ìåæãðóïïîâàÿ è âíóòðèãðóïïîâàÿ.  ñòîëáöå F çàïèñàíî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, â ñòîëáöå РЗначение — çíà÷åíèå âåðîÿòíîñòè Ð(Õ ≥ õ), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñ df ñòåïåíÿìè ñâîáîäû (î F-ðàñïðåäåëåíèè ðå÷ü èäåò â ðàçäåëå 1.5.7).  ñòîëáöå F критическое ïðèâîäèòñÿ êðèòè÷åñêîå çíà÷åíèå t, ðàññ÷èòàííîå â ñîîòâåòñòâèè ñ çàäàííûì óðîâíåì çíà÷èìîñòè (ïàðàìåòð Альфа). Ôîðìóëû äëÿ âû÷èñëåíèÿ âñåõ ïåðå÷èñëåííûõ çíà÷åíèé ïðèâåäåíû â ðàçäåëå 3.4.2. Íóëåâàÿ ãèïîòåçà î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé âñåõ âûáîðîê ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ F критическое.  íàøåì ïðèìåðå ýòó ãèïîòåçó ñëåäóåò îòâåðãíóòü. 5.12. Двухфакторный дисперсионный анализ с повторениями Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.5.3. Çäåñü ðàññìîòðèì ñòðóêòóðó âõîäíûõ äàííûõ äëÿ ðàáîòû ñ ýòèì ñðåäñòâîì è îïèøåì âûõîäíûå ðåçóëüòàòû. Ñòðóêòóðà âõîäíûõ äàííûõ ïðåäñòàâëåíà íà ðèñ. 5.33 (îáîçíà÷åíèÿ è ïîÿñíåíèÿ ïðèâåäåíû â ðàçäåëå 3.5.3): â ñòðîêå 1 ïîêàçàíû îáîçíà÷åíèÿ óðîâíåé ôàêòîðà β; â ñòîëáöå À — îáîçíà÷åíèÿ óðîâíåé ôàêòîðà γ; â äàííîì ñëó÷àå èìååòñÿ òðè âûáîðêè, ïîýòîìó ïîä îáùèì îáîçíà÷åíèåì óðîâíåé ôàêòîðà γ çàïèñàíû òðè ñòðîêè ÷èñëîâûõ äàííûõ. Òàêèì îáðàçîì, â äèàïàçîíå, íàïðèìåð, Ñ8:Ñ10 ñîäåðæàòñÿ âûáîðî÷íûå çíà÷åíèÿ, ñîîòâåòñòâóþùèå âòîðîìó óðîâíþ ôàêòîðà β è òðåòüåìó óðîâíþ ôàêòîðà γ. Ðèñ. 5.33. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухфакторный дисперсионный анализ с повторениями Äèàëîãîâîå îêíî ðàññìàòðèâàåìîãî çäåñü ñðåäñòâà ïîêàçàíî íà ðèñ. 5.33.  ïîëå Входной интервал óêàçûâàåòñÿ äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âõîäíûå äàííûå, âêëþ÷àÿ çàãîëîâêè.  ïîëå Число строк для выборки óêàçûâàåòñÿ êî- Глава 5. Надстройка Пакет анализа 175 ëè÷åñòâî ðàññìàòðèâàåìûõ âûáîðîê, â äàííîì ñëó÷àå ââåäåíî ÷èñëî 3.  ïîëå Альфа, êàê îáû÷íî, óêàçûâàåòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè. Íà ðèñ. 5.34 ïîêàçàíû âûõîäíûå ðåçóëüòàòû ðàáîòû äàííîãî ñðåäñòâà, âûâåäåííûå íà îòäåëüíûé ðàáî÷èé ëèñò. Âûõîäíûå ðåçóëüòàòû ñãðóïïèðîâàíû â íåñêîëüêî òàáëèö.  ïåðâîé òàáëèöå, îçàãëàâëåííîé ИТОГИ è ñîñòîÿùåé èç íåñêîëüêèõ ïîäòàáëèö (ïî êîëè÷åñòâó óðîâíåé ôàêòîðà γ), ïðèâîäÿòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèõ êàæäîìó ñî÷åòàíèþ óðîâíåé ôàêòîðà β è ôàêòîðà γ: êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ñòðîêà Счет), ñóììà âûáîðî÷íûõ çíà÷åíèé (ñòðîêà Сумма), âûáîðî÷íîå ñðåäíåå (ñòðîêà Среднее) è âûáîðî÷íàÿ äèñïåðñèÿ (ñòðîêà Дисперсия). Íà ðèñ. 5.34 ïîêàçàíà òàêàÿ ïîäòàáëèöà äëÿ ïåðâîãî óðîâíÿ ôàêòîðà γ (òàáëèöà îáîçíà÷åíà êàê Гамма 1), äðóãèå ïîäîáíûå ïîäòàáëèöû, ñîîòâåòñòâóþùèå äðóãèì óðîâíÿì ôàêòîðà γ, íà ýòîì ðèñóíêå íå ïîêàçàíû.  ñòîëáöå Итого ïîäòàáëèö âûâîäÿòñÿ òàêèå æå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèå îäíîìó óðîâíþ ôàêòîðà γ: êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, âûáîðî÷íîå ñðåäíåå è âûáîðî÷íàÿ äèñïåðñèÿ (âû÷èñëÿåòñÿ ïî âñåì çíà÷åíèÿì äàííîãî óðîâíÿ îòíîñèòåëüíî îáùåãî ñðåäíåãî).  êîíöå òàáëèöû ИТОГИ âûâîäèòñÿ ïîäòàáëèöà Итого, â êîòîðîé ïðèâåäåíû òå æå õàðàêòåðèñòèêè, íî ïîäñ÷èòàííûå ïî âûáîðî÷íûì çíà÷åíèÿì äëÿ êàæäîãî óðîâíÿ ôàêòîðà β. Ðèñ. 5.34. Âûõîäíûå ðåçóëüòàòû ðàáîòû дисперсионный анализ с повторениями ñðåäñòâà Двухфакторный  íèæíåé ÷àñòè âûõîäíûõ ðåçóëüòàòîâ ïðèâåäåíà äèñïåðñèîííàÿ òàáëèöà (îáîçíà÷åíèÿ è âû÷èñëÿþùèå ôîðìóëû äàíû â ðàçäåëå 3.5.3). Çäåñü â ïåðâîì ñòîëáöå, îáîçíà÷åííîì SS, âûâåäåíû ñóììû êâàäðàòîâ: ñîîòâåòñòâåííî SS1, SS2, SS3, SS4 è â ñòðîêå Итого — SS.  ñòîëáöå df ïðèâåäåíû ñòåïåíè ñâîáîäû ñóìì êâàäðàòîâ, à â ñòîëáöå MS — çíà÷åíèÿ ñîîòâåòñòâóþùèõ äèñïåðñèé.  ñòîëáöå F âû÷èñëåíû çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê, ò.å. îòíîøåíèÿ äèñïåðñèé s12 , s22 , s32 ê äèñïåðñèè s42 . 176 Часть II. Средства Excel для статистического анализа  ñòîëáöå Р-Значение âû÷èñëÿþòñÿ âåðîÿòíîñòè Ð(Õ ≥ F), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ ïðèâåäåíû â ñòîëáöå df: ïåðâîå çíà÷åíèå ñòåïåíè ñâîáîäû — èç ñîîòâåòñòâóþùåé ñòðîêè ýòîãî ñòîëáöà, à âòîðîå — âñåãäà èç ÷åòâåðòîé ñòðîêè, F — çíà÷åíèå èç ñòîëáöà F. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå F43 (ñì. ðèñ. 5.34), ìîæíî âû÷èñëèòü ïî ôîðìóëå Excel =FРАСП(E43;C43;C46). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè âåðîÿòíîñòü áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ.  ñòîëáöå F критическое âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ, ñîîòâåòñòâóþùèå çàäàííîìó â äèàëîãîâîì îêíå Двухфакторный дисперсионный анализ с повторениями óðîâíþ çíà÷èìîñòè α. Ýòè çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþòñÿ òàê æå, êàê ïðè âû÷èñëåíèè âåðîÿòíîñòåé èç ñòîëáöà Р-Значение. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå G43 (ñì. ðèñ. 5.34) ìîæíî âû÷èñëèòü ïî ôîðìóëå Excel =FРАСПОБР(0,05;C43;C46). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè çíà÷åíèå â ýòîì ñòîëáöå áîëüøå çíà÷åíèÿ â ñòîëáöå F òîé æå ñòðîêè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Çäåñü ïðèíèìàþòñÿ âñå òðè íóëåâûå ãèïîòåçû îá îòñóòñòâèè âëèÿíèÿ ôàêòîðîâ β è γ è èõ âçàèìíîãî âëèÿíèÿ. Îäíàêî çíà÷åíèå â ñòîëáöå F òðåòüåé ñòðîêè (ñîîòâåòñòâóåò âçàèìíîìó âëèÿíèþ ôàêòîðîâ) çíà÷èòåëüíî áîëüøå àíàëîãè÷íûõ çíà÷åíèé äëÿ îòäåëüíûõ ôàêòîðîâ, è íà ýòî íåîáõîäèìî îáðàòèòü âíèìàíèå. 5.13. Двухфакторный дисперсионный анализ без повторений Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç îïèñàí â ðàçäåëå 3.5.3. Ñòðóêòóðà âõîäíûõ äàííûõ ïîêàçàíà íà ðèñ. 5.35 (îáîçíà÷åíèÿ è ïîÿñíåíèÿ äàíû â ðàçäåëå 3.5.3): â ñòðîêå 1 ïðèâîäÿòñÿ îáîçíà÷åíèÿ óðîâíåé ôàêòîðà β; â ñòîëáöå À — îáîçíà÷åíèÿ óðîâíåé ôàêòîðà γ; â äèàïàçîíå, îáîçíà÷åííîì ýòèìè çàãîëîâêàìè, ââåäåíû ÷èñëîâûå äàííûå. Äèàëîãîâîå îêíî ýòîãî ñðåäñòâà ïîêàçàíî íà ðèñ. 5.35.  ïîëå Входной интервал óêàçûâàåòñÿ äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âõîäíûå äàííûå; åñëè â ýòîò äèàïàçîí âêëþ÷åíû çàãîëîâêè ñòðîê è ñòîëáöîâ, òî ñëåäóåò óñòàíîâèòü ôëàæîê îïöèè Метки.  ïîëå Альфа óêàçûâàåòñÿ çíà÷åíèå óðîâíÿ çíà÷èìîñòè. Íà ðèñ. 5.36 ïðåäñòàâëåíû âûõîäíûå ðåçóëüòàòû ðàáîòû äàííîãî ñðåäñòâà, âûâåäåííûå íà îòäåëüíûé ðàáî÷èé ëèñò. Âûõîäíûå ðåçóëüòàòû ñãðóïïèðîâàíû â äâå òàáëèöû.  ïåðâîé òàáëèöå, îçàãëàâëåííîé ИТОГИ, ïðèâîäÿòñÿ ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðî÷íûõ çíà÷åíèé, ñîîòâåòñòâóþùèõ êàæäîìó óðîâíþ ôàêòîðà β (ãðóïïèðîâêà ïî ñòîëáöàì) è êàæäîìó óðîâíþ ôàêòîðà γ (ãðóïïèðîâêà ïî ñòðîêà): êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (ñòîëáåö Счет), ñóììà âûáîðî÷íûõ çíà÷åíèé (ñòîëáåö Сумма), âûáîðî÷íîå ñðåäíåå (ñòîëáåö Среднее) è âûáîðî÷íàÿ äèñïåðñèÿ (ñòîëáåö Дисперсия).  íèæíåé ÷àñòè âûõîäíûõ ðåçóëüòàòîâ ïðèâåäåíà äèñïåðñèîííàÿ òàáëèöà (îáîçíà÷åíèÿ è âû÷èñëÿþùèå ôîðìóëû äàíû â ðàçäåëå 3.5.3). Çäåñü â ïåðâîì Глава 5. Надстройка Пакет анализа 177 ñòîëáöå, îáîçíà÷åííîì SS, âûâåäåíû ñóììû êâàäðàòîâ: ñîîòâåòñòâåííî SS1, SS2, SS3 è â ñòðîêå Итого — SS.  ñòîëáöå df ïðèâåäåíû ñòåïåíè ñâîáîäû ñóìì êâàäðàòîâ, à â ñòîëáöå MS — çíà÷åíèÿ ñîîòâåòñòâóþùèõ äèñïåðñèé.  ñòîëáöå F âû÷èñëåíû çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê, ò.å. îòíîøåíèÿ äèñïåðñèé s12 è s22 ê äèñïåðñèè s32 . Ðèñ. 5.35. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Двухфакторный дисперсионный анализ без повторений Ðèñ. 5.36. Âûõîäíûå ðåçóëüòàòû ðàáîòû ñðåäñòâà Двухфакторный дисперсионный анализ без повторений 178 Часть II. Средства Excel для статистического анализа  ñòîëáöå Р-Значение âû÷èñëÿþòñÿ âåðîÿòíîñòè Ð(Õ ≥ F), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ ïðèâåäåíû â ñòîëáöå df: ïåðâîå çíà÷åíèå ñòåïåíè ñâîáîäû — èç ñîîòâåòñòâóþùåé ñòðîêè ýòîãî ñòîëáöà, à âòîðîå — âñåãäà èç òðåòüåé ñòðîêè, F — çíà÷åíèå èç ñòîëáöà F. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå Å18 (ñì. ðèñ. 5.36) ìîæíî âû÷èñëèòü ïî ôîðìóëå Excel =FРАСП(D18;C18;C20). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ: åñëè âåðîÿòíîñòü áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ.  ñòîëáöå F критическое âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ, ñîîòâåòñòâóþùèå çàäàííîìó â äèàëîãîâîì îêíå Двухфакторный дисперсионный анализ без повторений óðîâíþ çíà÷èìîñòè α. Ýòè çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû, çíà÷åíèÿ êîòîðûõ îïðåäåëÿþòñÿ òàê æå, êàê ïðè âû÷èñëåíèè âåðîÿòíîñòåé èç ñòîëáöà Р-Значение. Íàïðèìåð, çíà÷åíèå â ÿ÷åéêå G18 (ñì. ðèñ. 5.36) ìîæíî âû÷èñëèòü ïî ôîðìóëå Excel =FРАСПОБР(0,05;C18;C20). Ýòè çíà÷åíèÿ èñïîëüçóþòñÿ äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîì âëèÿíèè ôàêòîðîâ èëè èõ âçàèìíîãî âëèÿíèÿ: åñëè çíà÷åíèå â ýòîì ñòîëáöå áîëüøå çíà÷åíèÿ â ñòîëáöå F òîé æå ñòðîêè, òî íóëåâàÿ ãèïîòåçà îá îòñóòñòâèè âëèÿíèÿ ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Çäåñü ïðèíèìàþòñÿ îáå íóëåâûå ãèïîòåçû îá îòñóòñòâèè âëèÿíèÿ ôàêòîðîâ β è γ. 5.14. Корреляция Ýòî ñðåäñòâî âû÷èñëÿåò êîððåëÿöèîííóþ ìàòðèöó êîìïîíåíòîâ ìíîãîìåðíîé âûáîðêè. Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû ðàâíû åäèíèöå, à âíåäèàãîíàëüíûå — êîýôôèöèåíòàì êîððåëÿöèè ñîîòâåòñòâóþùèõ êîìïîíåíòîâ (î êîýôôèöèåíòàõ êîððåëÿöèè ðå÷ü èäåò â ðàçäåëå 1.2.5). Íà ðèñ. 5.37 ïîêàçàíû ìíîãîìåðíàÿ âûáîðêà, èìåþùàÿ ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïðè÷åì ïåðâàÿ ïàðà êîìïîíåíòîâ çàâèñèìà ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5. Ñ òàêèì æå êîýôôèöèåíòîì êîððåëÿöèè çàâèñèìû òðåòèé è ÷åòâåðòûé êîìïîíåíòû âûáîðêè. Ïåðâàÿ è âòîðàÿ ïàðà êîìïîíåíòîâ ìåæäó ñîáîé íåçàâèñèìû. Ðèñ. 5.37. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Корреляция Глава 5. Надстройка Пакет анализа 179 Âíåäèàãîíàëüíûå ýëåìåíòû êîððåëÿöèîííîé ìàòðèöû ðàññ÷èòûâàþòñÿ ïî ñòàíäàðòíûì ôîðìóëàì: êîýôôèöèåíò êîððåëÿöèè rxy ìåæäó êîìïîíåíòàìè õ è ó ìíîãîìåðíîé âûáîðêè âû÷èñëÿåòñÿ êàê n ∑ ( x − x )( y i rxy = i − y) , ãäå x = i =1 n n ∑ (x − x) ⋅ ∑ ( y 2 i i i =1 − y )2 1 n 1 n xi , y = ∑ yi , n — îáúåì âûáîðêè. ∑ n i =1 n i =1 i =1 Îòìåòèì, ÷òî ýòè æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ КОРРЕЛ (ñì. ðàçäåë 4.10.2). Íà ðèñ. 5.38 ïîêàçàí ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Корреляция. Ïîñêîëüêó êîððåëÿöèîííàÿ ìàòðèöà ñèììåòðè÷íà, âûâîäèòñÿ òîëüêî íèæíÿÿ åå ïîëîâèíà. Ðèñ. 5.38. Ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Корреляция 5.15. Ковариация Ýòî ñðåäñòâî âû÷èñëÿåò êîâàðèàöèîííóþ ìàòðèöó êîìïîíåíòîâ ìíîãîìåðíîé âûáîðêè. Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû ðàâíû âûáîðî÷íûì äèñïåðñèÿì, à âíåäèàãîíàëüíûå — êîâàðèàöèÿì ñîîòâåòñòâóþùèõ êîìïîíåíòîâ (î êîâàðèàöèÿõ ðå÷ü èäåò â ðàçäåëå 1.2.5). Íà ðèñ. 5.39 ïîêàçàíà ìíîãîìåðíàÿ âûáîðêà, èìåþùàÿ ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïðè÷åì ïåðâàÿ ïàðà êîìïîíåíòîâ çàâèñèìà ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5. Ñ òàêèì æå êîýôôèöèåíòîì êîððåëÿöèè çàâèñèìû òðåòèé è ÷åòâåðòûé êîìïîíåíòû âûáîðêè. Ïåðâàÿ è âòîðàÿ ïàðû êîìïîíåíòîâ ìåæäó ñîáîé íåçàâèñèìû. Âíåäèàãîíàëüíûå ýëåìåíòû êîâàðèàöèîííîé ìàòðèöû ðàññ÷èòûâàþòñÿ ïî ôîðìóëàì: êîâàðèàöèÿ cov(X, Y) ìåæäó êîìïîíåíòàìè õ è ó ìíîãîìåðíîé âûáîðêè âû÷èñëÿåòñÿ êàê n cov(X, Y) = ∑ ( xi − x )( yi − y ) , ãäå x = i =1 1 n 1 n xi , y = ∑ yi , n — îáúåì âûáîðêè. ∑ n i =1 n i =1 Îòìåòèì, ÷òî ýòè æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ КОВАР (ñì. ðàçäåë 4.10.1). Äèàãîíàëüíûå ýëåìåíòû ìàòðèöû — âûáîðî÷íûå äèñïåðñèè — âû÷èñëÿþòñÿ ïî 180 Часть II. Средства Excel для статистического анализа ñòàíäàðòíûì ôîðìóëàì Sn2 = 1 n ∑ ( xi − x )2 . Âûáîðî÷íóþ äèñïåðñèþ òàêæå âû÷èñn i =1 ëÿþò ôóíêöèè ДИСПР è ДИСПРА (ñì. ðàçäåë 4.5.2). Ðèñ. 5.39. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Ковариация Íà ðèñ. 5.40 ïîêàçàí ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Ковариация. Ïîñêîëüêó êîâàðèàöèîííàÿ ìàòðèöà ñèììåòðè÷íà, âûâîäèòñÿ òîëüêî íèæíÿÿ åå ïîëîâèíà. Ðèñ. 5.40. Ðåçóëüòàò ïðèìåíåíèÿ ñðåäñòâà Ковариация 5.16. Регрессия Çàäà÷è ðåãðåññèîííîãî àíàëèçà îïèñàíû â ðàçäåëå 3.4. Ïîêàæåì, ÷òî äëÿ ïðîâåäåíèÿ ðåãðåññèîííîãî àíàëèçà ìîæåò ñäåëàòü ñðåäñòâî Регрессия.  îòäåëüíûõ òàáëèöàõ îíî âû÷èñëÿåò (ðèñ. 5.42 è 5.43) ñëåäóþùåå: • ìåòîäîì íàèìåíüøèõ êâàäðàòîâ — êîýôôèöèåíòû ëèíåéíîé (îòíîñèòåëüíî ýòèõ êîýôôèöèåíòîâ) ôóíêöèè ðåãðåññèè; âèä ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé èñõîäíûõ äàííûõ (ïîäðîáíåå îá ýòîì ðå÷ü èäåò íèæå); Глава 5. Надстройка Пакет анализа 181 • êîýôôèöèåíò äåòåðìèíàöèè è ñâÿçàííûå ñ íèì âåëè÷èíû (òàáëèöà Регрессионная статистика); • äèñïåðñèîííóþ òàáëèöó è êðèòåðèàëüíóþ ñòàòèñòèêó äëÿ ïðîâåðêè çíà÷èìîñòè ðåãðåññèè (òàáëèöà Дисперсионный анализ); • äëÿ êàæäîãî êîýôôèöèåíòà ðåãðåññèè — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå è äðóãèå åãî ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè, ïîçâîëÿþùèå ïðîâåðèòü çíà÷èìîñòü ýòîãî êîýôôèöèåíòà è ïîñòðîèòü äëÿ íåãî äîâåðèòåëüíûå èíòåðâàëû; • çíà÷åíèÿ ôóíêöèè ðåãðåññèè è îñòàòêè — ðàçíîñòè ìåæäó èñõîäíûìè çíà÷åíèÿìè ïåðåìåííîé Y è âû÷èñëåííûìè çíà÷åíèÿìè ôóíêöèè ðåãðåññèè (òàáëèöà Вывод остатка); • âåðîÿòíîñòè, ñîîòâåòñòâóþùèå óïîðÿäî÷åííûì ïî âîçðàñòàíèþ çíà÷åíèÿì ïåðåìåííîé Y (òàáëèöà Вывод вероятности). Êðîìå òîãî, ñðåäñòâî Регрессия ñòðîèò òðè òèïà ãðàôèêîâ, êîòîðûå áóäóò ïîêàçàíû íèæå. Ïóñòü âõîäíîé èíòåðâàë Õ ñîñòîèò èç k äèàïàçîíîâ-ñòîëáöîâ, ñîäåðæàùèõ çíà÷åíèÿ {xi1}, {xi2}, ..., {xik} ïåðåìåííûõ Õ1, Õ2, ..., Õk.  êàæäîì äèàïàçîíå ñîäåðæèòñÿ îäèíàêîâîå êîëè÷åñòâî çíà÷åíèé. Âõîäíîé èíòåðâàë Y, ñîñòîÿùèé èç îäíîãî äèàïàçîíà-ñòîëáöà, äîëæåí ñîäåðæàòü òàêîå æå êîëè÷åñòâî çíà÷åíèé. Ñðåäñòâî Регрессия âû÷èñëÿåò êîýôôèöèåíòû ôóíêöèè ðåãðåññèè âèäà Y = m1X1 + m2X2 + ... + mkÕk + b. Ýòî óðàâíåíèå ëèíåéíîé ìíîæåñòâåííîé ðåãðåññèè, åñëè ïåðåìåííûå Xi íåçàâèñèìû. Íà îñíîâå äàííîãî óðàâíåíèÿ, èñïîëüçóÿ ñîîòâåòñòâóþùèå çíà÷åíèÿ ïåðåìåííûõ Xi, ìîæíî ïîëó÷èòü ìíîæåñòâî äðóãèõ óðàâíåíèé ðåãðåññèè. Íàïðèìåð, åñëè â êà÷åñòâå ïåðåìåííûõ Xi âçÿòü çíà÷åíèÿ îäíîé ïåðåìåííîé Õ â ñòåïåíè i (ò.å. Xi = Õi), ïîëó÷èì óðàâíåíèå ïîëèíîìèàëüíîé ðåãðåññèè Y = m1X + m2X2 + ... + mkÕk + b. Íà ðèñ. 5.41 ïîêàçàí ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè: âõîäíîé èíòåðâàë Õ ñîñòîèò èç ïÿòè ñòîëáöîâ.  ïåðâîì ñòîëáöå ïðåäñòàâëåíû çíà÷åíèÿ ïåðåìåííîé Õ1, âî âòîðîì — êâàäðàòû çíà÷åíèé ïåðåìåííîé Õ1, â òðåòüåì — çíà÷åíèÿ âòîðîé ïåðåìåííîé Õ2, â ÷åòâåðòîì — êâàäðàòû çíà÷åíèé ïåðåìåííîé Õ2, â ïÿòîì — ïðîèçâåäåíèÿ çíà÷åíèé ïåðåìåííûõ Õ1 è Õ2. Òàêèì îáðàçîì, â äàííîì ñëó÷àå Регрессия áóäåò âû÷èñëÿòü çíà÷åíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè âèäà Y = m1X1 + m2X12 + m3Õ2 + m4X22 + m5X1X2 + b. Îòìåòèì, ÷òî çíà÷åíèÿ çàâèñèìîé ïåðåìåííîé Y â ñòîëáöå F ïîëó÷åíû ïî ôîðìóëå Y = X1 – 2X12 + 0,5Õ2 – X22 + 5X1X2 + ε. Çäåñü ñëó÷àéíàÿ ïåðåìåííàÿ ε èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. (Î ìîäåëèðîâàíèè ñëó÷àéíûõ âåëè÷èí ðå÷ü èäåò â ãëàâå 7.) Äèàëîãîâîå îêíî ñðåäñòâà Регрессия ïîêàçàíî íà ðèñ. 5.41.  ïîëå Входной интервал Y ââîäèòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî çíà÷åíèÿ çàâèñèìîé ïåðåìåííîé Y. Äèàïàçîí äîëæåí ñîñòîÿòü èç îäíîãî ñòîëáöà.  ïîëå Входной интервал Х ââîäèòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî çíà÷åíèÿ ïåðåìåííîé Õ. Äèàïàçîí äîëæåí ñîñòîÿòü èç îäíîãî èëè íåñêîëüêèõ ñòîëáöîâ, íî íå áîëåå ÷åì èç 16 ñòîëáöîâ. Åñëè óêàçàííûå â ïîëÿõ Входной интервал Y è Входной 182 Часть II. Средства Excel для статистического анализа интервал Х äèàïàçîíû âêëþ÷àþò çàãîëîâêè ñòîëáöîâ, òî íåîáõîäèìî óñòàíîâèòü ôëàæîê îïöèè Метки — ýòè çàãîëîâêè áóäóò èñïîëüçîâàíû â âûõîäíûõ òàáëèöàõ, ñãåíåðèðîâàííûõ ñðåäñòâîì Регрессия. Ðèñ. 5.41. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Регрессия Ôëàæîê îïöèè Константа - ноль ñëåäóåò óñòàíîâèòü, åñëè â óðàâíåíèè ðåãðåññèè êîíñòàíòà b ïðèíóäèòåëüíî ïîëàãàåòñÿ ðàâíîé íóëþ. Îïöèÿ Уровень надежности óñòàíàâëèâàåòñÿ òîãäà, êîãäà íåîáõîäèìî ïîñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äëÿ êîýôôèöèåíòîâ ðåãðåññèè ñ äîâåðèòåëüíûì óðîâíåì, îòëè÷íûì îò 0,95, êîòîðûé èñïîëüçóåòñÿ ïî óìîë÷àíèþ. Ïîñëå óñòàíîâêè ôëàæêà îïöèè Уровень надежности ñòàíîâèòñÿ äîñòóïíûì ïîëå ââîäà, â êîòîðîì ââîäèòñÿ íîâîå çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ.  îáëàñòè Остатки èìåþòñÿ ÷åòûðå îïöèè: Остатки, Стандартизованные остатки, График остатков è График подбора. Åñëè óñòàíîâëåíà õîòÿ áû îäíà èç íèõ, òî â âûõîäíûõ ðåçóëüòàòàõ ïîÿâèòñÿ òàáëèöà Вывод остатка, â êîòîðîé áóäóò âûâåäåíû çíà÷åíèÿ ôóíêöèè ðåãðåññèè è îñòàòêè — ðàçíîñòè ìåæäó èñõîäíûìè çíà÷åíèÿìè ïåðåìåííîé Y è âû÷èñëåííûìè çíà÷åíèÿìè ôóíêöèè ðåãðåññèè. Çíà÷åíèÿ ýòîé òàáëèöû è âîçìîæíîñòè êàæäîé èç îïöèé ïîêàçàíû íèæå.  îáëàñòè Нормальная вероятность èìååòñÿ îäíà îïöèÿ — График нормальной вероятности; åå óñòàíîâêà ïîðîæäàåò â âûõîäíûõ ðåçóëüòàòàõ òàáëèöó Вывод вероятности è ïðèâîäèò ê ïîñòðîåíèþ ñîîòâåòñòâóþùåãî ãðàôèêà. Íà ðèñ. 5.42–5.44 ïîêàçàíû ÷àñòè ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè ñðåäñòâà Регрессия, êîòîðûå ïîëó÷åíû íà îñíîâå èñõîäíûõ äàííûõ, ïðèâåäåííûõ íà ðèñ. 5.41. Ðàññìîòðèì ïîäðîáíåå ýòè ðåçóëüòàòû.  òàáëèöå Регрессионная статистика ïðèâîäÿòñÿ ñëåäóþùèå äàííûå. • Множественный R — êîðåíü èç êîýôôèöèåíòà äåòåðìèíàöèè R2, ïðèâåäåííîãî â ñëåäóþùåé ñòðîêå. Äðóãîå íàçâàíèå ýòîãî ïîêàçàòåëÿ — èíäåêñ êîððåëÿöèè, èëè ìíîæåñòâåííûé êîýôôèöèåíò êîððåëÿöèè (ñì. ðàçäåë 3.3.1). Глава 5. Надстройка Пакет анализа 183 Ðèñ. 5.42. Âåðõíÿÿ ÷àñòü ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè Ðèñ. 5.43. Íèæíÿÿ ÷àñòü ðàáî÷åãî ëèñòà ñ âûõîäíûìè ðåçóëüòàòàìè • R-квадрат — êîýôôèöèåíò äåòåðìèíàöèè R2; âû÷èñëÿåòñÿ êàê îòíîøåíèå ðåãðåññèîííîé ñóììû êâàäðàòîâ (ÿ÷åéêà Ñ12) ê ïîëíîé ñóììå êâàäðàòîâ (ÿ÷åéêà Ñ14). (Î êîýôôèöèåíòå äåòåðìèíàöèè ðå÷ü èäåò â ðàçäåëå 3.4.3.) • Нормированный R-квадрат âû÷èñëÿåòñÿ ïî ôîðìóëå (n − 1) R 2 − k , ãäå n — n − k −1 êîëè÷åñòâî çíà÷åíèé ïåðåìåííîé Y, k — êîëè÷åñòâî ñòîëáöîâ âî âõîäíîì èíòåðâàëå ïåðåìåííîé Õ. • Стандартная ошибка — êîðåíü èç îñòàòî÷íîé äèñïåðñèè (ÿ÷åéêà D13). • Наблюдения — êîëè÷åñòâî çíà÷åíèé ïåðåìåííîé Y. Дисперсионная таблица ñîîòâåòñòâóåò àíàëîãè÷íîé òàáëèöå èç ðàçäåëà 3.4.3.  ñòîëáöå SS ïðèâîäÿòñÿ ñóììû êâàäðàòîâ, â ñòîëáöå df — ÷èñëî ñòåïåíåé ñâîáîäû, â ñòîëáöå MS — äèñïåðñèè. Ñòðîêà Регрессия ñîîòâåòñòâóåò îäíîèìåííîé 184 Часть II. Средства Excel для статистического анализа ñòðîêå èç òàáëèöû â ðàçäåëå 3.4.3, ñòðîêà Остаток — ñòðîêå Остатки è ñòðîêà Итого — ñòðîêå Полная.  äèñïåðñèîííîé òàáëèöå èç ðàçäåëà 3.4.3 ïðèâåäåíû ôîðìóëû, ïî êîòîðûì âû÷èñëÿåò ñîîòâåòñòâóþùèå çíà÷åíèÿ ñðåäñòâî Регрессия.  ñòîëáöå F âû÷èñëåíî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè äëÿ ïðîâåðêè çíà÷èìîñòè ðåãðåññèè. Ýòî çíà÷åíèå âû÷èñëÿåòñÿ êàê îòíîøåíèå ðåãðåññèîííîé äèñïåðñèè ê îñòàòî÷íîé (ÿ÷åéêè D12 è D13).  ñòîëáöå Значимость F âû÷èñëÿåòñÿ âåðîÿòíîñòü ïîëó÷åííîãî çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè. (Ýòó âåðîÿòíîñòü ñ ïîìîùüþ ôîðìóë Excel ìîæíî âû÷èñëèòü êàê =FРАСП(E12;B12;B13).) Åñëè ýòà âåðîÿòíîñòü ìåíüøå, íàïðèìåð, 0,05 (çàäàííîãî óðîâíÿ çíà÷èìîñòè), òî ãèïîòåçà î íåçíà÷èìîñòè ðåãðåññèè (ò.å. ãèïîòåçà î òîì, ÷òî âñå êîýôôèöèåíòû ôóíêöèè ðåãðåññèè ðàâíû íóëþ) îòâåðãàåòñÿ è ñ÷èòàåòñÿ, ÷òî ðåãðåññèÿ çíà÷èìà.  äàííîì ïðèìåðå ðåãðåññèÿ çíà÷èìà ïðàêòè÷åñêè ñ ëþáûì óðîâíåì çíà÷èìîñòè. Ðèñ. 5.44. Ãðàôèêè, âûâîäèìûå ñðåäñòâîì Регрессия  ñëåäóþùåé òàáëèöå (ñì. ðèñ. 5.43), â ñòîëáöå Коэффициенты, çàïèñàíû âû÷èñëåííûå çíà÷åíèÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè, ïðè ýòîì â ñòðîêå Yпересечение çàïèñàíî çíà÷åíèå ñâîáîäíîãî ÷ëåíà b.  ñòîëáöå Стандартная ошибка âû÷èñëåíû ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ êîýôôèöèåíòîâ (î âû÷èñëåíèè äèñïåðñèé êîýôôèöèåíòîâ ðå÷ü èäåò â ðàçäåëå 3.4.4).  ñòîëáöå tстатистика çàïèñàíû îòíîøåíèÿ çíà÷åíèé êîýôôèöèåíòîâ ê èõ ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèÿì. Ýòî çíà÷åíèÿ êðèòåðèàëüíûõ ñòàòèñòèê äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòîâ ðåãðåññèè.  ñòîëáöå P-Значение âû÷èñëÿþòñÿ óðîâíè çíà÷èìîñòè, ñîîòâåòñòâóþùèå çíà÷åíèÿì êðèòåðèàëüíûõ ñòàòèñòèê. (Èõ ìîæíî âû÷èñëèòü ñ ïîìîùüþ ôîðìóëû Excel =СТЬЮДРАСП(ABS(D17);14;2), íàïðèìåð, äëÿ çíà÷åíèÿ â ÿ÷åéêå Å17; âòîðîé àðãóìåíò â ôóíêöèè СТЬЮДРАСП âû÷èñëÿåòñÿ êàê n – k – 1.) Åñëè âû÷èñëåííûé óðîâåíü çíà÷èìîñòè ìåíüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè (íàïðèìåð, 0,05), òî ïðèíèìàåòñÿ ãèïîòåçà î çíà÷èìîì îòëè÷èè êîýôôèöèåíòà îò íóëÿ; â ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà î íåçíà÷èìîì îòëè÷èè êîýôôèöèåíòà îò íóëÿ.  äàííîì ïðèìåðå òîëüêî êîýôôèöèåíò b íåçíà÷èìî îòëè÷àåòñÿ îò íóëÿ. Глава 5. Надстройка Пакет анализа 185  ñòîëáöàõ Нижние 95% è Верхние 95% ïðèâîäÿòñÿ ãðàíèöû äîâåðèòåëüíûõ èíòåðâàëîâ ñ äîâåðèòåëüíûì óðîâíåì 0,95. Ýòè ãðàíèöû âû÷èñëÿþòñÿ ïî ôîðìóëàì Нижние 95% = Коэффициент – Стандартная ошибка × tα; Верхние 95% = Коэффициент + Стандартная ошибка × tα. Çäåñü tα — êâàíòèëü ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû.  äàííîì ñëó÷àå α = 0,95. Àíàëîãè÷íî âû÷èñëÿþòñÿ ãðàíèöû äîâåðèòåëüíûõ èíòåðâàëîâ â ñòîëáöàõ Нижние 90,0% è Верхние 90,0%. Îòìåòèì, ÷òî åñëè â äèàëîãîâîì îêíå Регрессия íå óñòàíàâëèâàòü îïöèþ Уровень надежности, òî áóäóò ïîâòîðåíû ñòîëáöû Нижние 95% è Верхние 95%. Ðàññìîòðèì òàáëèöó Вывод остатка èç âûõîäíûõ ðåçóëüòàòîâ ñðåäñòâà Регрессия. Íàïîìíèì, ÷òî ýòà òàáëèöà ïîÿâëÿåòñÿ â âûõîäíûõ ðåçóëüòàòàõ òîëüêî òîãäà, êîãäà óñòàíîâëåíà õîòÿ áû îäíà îïöèÿ â îáëàñòè Остатки äèàëîãîâîãî îêíà Регрессия.  ñòîëáöå Наблюдение ïðèâîäÿòñÿ ïîðÿäêîâûå íîìåðà çíà÷åíèé ïåðåìåííîé Y.  ñòîëáöå Предсказанное Y âû÷èñëÿþòñÿ çíà÷åíèÿ ôóíêöèè ðåãðåññèè yˆi = f ( xi ) äëÿ òåõ çíà÷åíèé ïåðåìåííîé Õ, êîòîðûì ñîîòâåòñòâóåò ïîðÿäêîâûé íîìåð i â ñòîëáöå Наблюдение.  ñòîëáöå Остатки ñîäåðæàòñÿ ðàçíîñòè (îñòàòêè) ε i = yi − yˆ i , à â ñòîëáöå Стандартные остатки — íîðìèðîâàííûå îñòàòêè, êîòîðûå âû÷èñëÿþòñÿ êàê îòíîøåíèÿ εi/sε, ãäå sε — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå îñòàòêîâ. Êâàäðàò âåëè÷èíû sε âû÷èñëÿåòñÿ ïî ôîðìóëå sε2 = 1 n (ε i − ε)2 , ãäå ε — ñðåäíåå îñòàòêîâ. Çäåñü âåëè÷èíó sε2 ìîæíî âû÷èñ∑ n − 1 i =1 ëèòü êàê îòíîøåíèå äâóõ çíà÷åíèé èç äèñïåðñèîííîé òàáëèöû: ñóììû êâàäðàòîâ îñòàòêîâ (ÿ÷åéêà Ñ13) è ñòåïåíè ñâîáîäû èç ñòðîêè Итого (ÿ÷åéêà Â14). Ïî çíà÷åíèÿì òàáëèöû Вывод остатка ñðåäñòâî Регрессия ñòðîèò äâà òèïà ãðàôèêîâ: ãðàôèêè îñòàòêîâ è ãðàôèêè ïîäáîðà (åñëè óñòàíîâëåíû ñîîòâåòñòâóþùèå îïöèè â îáëàñòè Остатки äèàëîãîâîãî îêíà Регрессия). Íà ðèñ. 5.45 ïîêàçàíû îáðàçöû ýòèõ ãðàôèêîâ (ãðàôèêè íåìíîãî ïåðåôîðìàòèðîâàíû ïî ñðàâíåíèþ ñ îðèãèíàëàìè). Îíè ñòðîÿòñÿ äëÿ êàæäîãî êîìïîíåíòà ïåðåìåííîé Õ â îòäåëüíîñòè. Íà ãðàôèêàõ îñòàòêîâ îòîáðàæàþòñÿ îñòàòêè, ò.å. ðàçíîñòè ìåæäó èñõîäíûìè çíà÷åíèÿìè Y è âû÷èñëåííûìè ïî ôóíêöèè ðåãðåññèè äëÿ êàæäîãî çíà÷åíèÿ êîìïîíåíòà ïåðåìåííîé Õ. Íà ãðàôèêàõ ïîäáîðà îòîáðàæàþòñÿ êàê èñõîäíûå çíà÷åíèÿ Y, òàê è âû÷èñëåííûå çíà÷åíèÿ ôóíêöèè ðåãðåññèè äëÿ êàæäîãî çíà÷åíèÿ êîìïîíåíòà ïåðåìåííîé Õ. (Íà ãðàôèêàõ ïîäáîðà, ïðåäñòàâëåííûõ íà ðèñ. 5.45, ýòè çíà÷åíèÿ ïðàêòè÷åñêè ñîâïàäàþò.) Ïîñëåäíåé òàáëèöåé âûõîäíûõ ðåçóëüòàòîâ ñðåäñòâà Регрессия ÿâëÿåòñÿ òàáëèöà Вывод вероятности (ñì. ðèñ. 5.43). Îíà ïîÿâëÿåòñÿ, åñëè â äèàëîãîâîì îêíå Регрессия óñòàíîâëåíà îïöèÿ График нормальной вероятности. Çíà÷åíèÿ â ñòîëáöå Персентиль âû÷èñëÿþòñÿ ñëåäóþùèì îáðàçîì. Âû÷èñëÿåòñÿ øàã h = (1/n)×100%, ïåðâîå çíà÷åíèå ðàâíî h/2, ïîñëåäíåå ðàâíî 100 – h/2. Íà÷èíàÿ ñî âòîðîãî çíà÷åíèÿ êàæäîå ïîñëåäóþùåå çíà÷åíèå ðàâíî ïðåäûäóùåìó, ê êîòîðîìó ïðèáàâëåí øàã h.  ñòîëáöå Y ïðèâåäåíû çíà÷åíèÿ ïåðåìåííîé Y, óïîðÿäî÷åííûå ïî âîçðàñòàíèþ. Ïî äàííûì ýòîé òàáëèöû ñòðîèòñÿ òàê íàçûâàåìûé ãðàôèê íîðìàëüíîãî ðàñïðåäåëåíèÿ (ðèñ. 5.46). Îí ïîçâîëÿåò âèçóàëüíî îöåíèòü ñòåïåíü ëèíåéíîñòè çàâèñèìîñòè ìåæäó ïåðåìåííûìè Õ è Y. 186 Часть II. Средства Excel для статистического анализа Ðèñ. 5.45. Ïðèìåðû ãðàôèêîâ îñòàòêîâ è ïîäáîðà Ðèñ. 5.46. Ãðàôèê íîðìàëüíîãî ðàñïðåäåëåíèÿ 5.17. Скользящее среднее Ìåòîä ñêîëüçÿùåãî ñðåäíåãî — îäèí èç íàèáîëåå øèðîêî èñïîëüçóåìûõ ñïîñîáîâ ñãëàæèâàíèÿ çíà÷åíèé âðåìåííîãî ðÿäà. Ìåòîä îñíîâàí íà ëîêàëüíîì óñðåäíåíèè, êîãäà çà íîâîå çíà÷åíèå âðåìåííîãî ðÿäà áåðåòñÿ ñðåäíåå k ïîñëåäîâàòåëüíûõ çíà÷åíèé, áëèæàéøèõ ê çàìåíÿåìîìó çíà÷åíèþ. Ïóñòü èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn è çàäàíî ÷èñëî k íàáëþäåíèé, ïî êîòîðûì áóäåò ïðîâîäèòüñÿ óñðåäíåíèå. Çíà÷åíèå ñêîëüçÿùåãî ñðåäíåãî äëÿ çíà÷åíèÿ t âû÷èñëÿåòñÿ ïî ôîðìóëå yt = 1 k −1 ∑ yt −i . Îòìåòèì, ÷òî ïî ýòîé k i =0 Глава 5. Надстройка Пакет анализа 187 ôîðìóëå âûïîëíÿåò âû÷èñëåíèÿ ñðåäñòâî Скользящее среднее, íî ñóùåñòâóþò è äðóãèå ñïîñîáû âû÷èñëåíèÿ ñêîëüçÿùåãî ñðåäíåãî. Íà ðèñ. 5.47 ïîêàçàíû èñõîäíûå äàííûå, äëÿ êîòîðûõ áóäóò âû÷èñëÿòüñÿ ñêîëüçÿùèå ñðåäíèå, è äèàëîãîâîå îêíî Скользящее среднее.  ïîëå ââîäà Входной интервал â êà÷åñòâå èñõîäíûõ äàííûõ çàäàí äèàïàçîí Â1:Â17. Ïîñêîëüêó ýòîò äèàïàçîí ñîäåðæèò çàãîëîâîê, óñòàíîâëåí ôëàæîê îïöèè Метки в первой строке.  ïîëå Интервал ââîäèòñÿ ÷èñëî k — êîëè÷åñòâî çíà÷åíèé, ïî êîòîðûì ïîäñ÷èòûâàåòñÿ ñêîëüçÿùåå ñðåäíåå. Åñëè ýòîò ïàðàìåòð íå çàäàí, òî ïî óìîë÷àíèþ èñïîëüçóåòñÿ çíà÷åíèå 3. Åñëè óñòàíîâëåí ôëàæîê îïöèé Вывод графика, òî áóäåò ïîñòðîåí ãðàôèê, îòîáðàæàþùèé èñõîäíûå çíà÷åíèÿ yi è ñãëàæåííûå ñêîëüçÿùèì ñðåäíèì çíà÷åíèÿ (ðèñ. 5.48). Åñëè òàêæå óñòàíîâëåí ôëàæîê îïöèè Стандартные погрешности, òî ê çíà÷åíèÿì âû÷èñëåííûõ ñðåäíèõ áóäåò äîáàâëåí ñòîëáåö, â êîòîðîì áóäóò çàïèñàíû ñòàíäàðòíûå ïîãðåøíîñòè, âû÷èñëÿåìûå êàê ñóììà êâàäðàòîâ ðàçíîñòåé ìåæäó èñõîäíûìè è ðàñ÷åòíûìè k çíà÷åíèÿ yi, äåëåííàÿ íà ÷èñëî k. Ôîðìóëà Excel, ïî êîòîðîé ïîäñ÷èòûâàþòñÿ ñòàíäàðòíûå ïîãðåøíîñòè, ïîêàçàíà íà ðèñ. 5.48. Ðèñ. 5.47. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Скользящее среднее 5.18. Экспоненциальное сглаживание Ýêñïîíåíöèàëüíîå ñãëàæèâàíèå, êàê è ñêîëüçÿùåå ñðåäíåå (ñì. ðàçäåë 5.17), èñïîëüçóåòñÿ äëÿ âûðàâíèâàíèÿ (ñãëàæèâàíèÿ) çíà÷åíèé âðåìåííûõ ðÿäîâ. Åñëè èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn, òî ñãëàæåííûå çíà÷åíèÿ âû÷èñëÿþòñÿ ïî ôîðìóëå yˆt +1 = αyt + (1 − α) yˆt , ãäå yˆ t — ñãëàæåííîå çíà÷åíèå äëÿ ïðåäûäóùåãî t, α — ïîñòîÿííàÿ ñãëàæèâàíèÿ, òàêæå íàçûâàåìàÿ ôàêòîðîì çàòóõàíèÿ (ýòî ÷èñëî èç èíòåðâàëà (0, 1)). 188 Часть II. Средства Excel для статистического анализа Ðèñ. 5.48. Ðåçóëüòàòû âû÷èñëåíèé Íà ðèñ. 5.49 ïîêàçàíû ðàáî÷èé ëèñò Excel ñ èñõîäíûìè äàííûìè (äàííûå âçÿòû èç ïðèìåðà ïðåäûäóùåãî ðàçäåëà) è äèàëîãîâîå îêíî Экспоненциальное сглаживание.  ïîëå Входной интервал óêàçûâàåòñÿ àäðåñ äèàïàçîíà, ñîäåðæàùåãî çíà÷åíèÿ yi. Åñëè ýòîò äèàïàçîí âêëþ÷àåò çàãîëîâîê, òî íàäî óñòàíîâèòü ôëàæîê îïöèè Метки.  ïîëå Фактор затухания çàäàåòñÿ ïîñòîÿííàÿ ñãëàæèâàíèÿ; åñëè îíà íå çàäàíà, òî ïî óìîë÷àíèþ èñïîëüçóåòñÿ çíà÷åíèå 0,3. Óñòàíîâêà ôëàæêîâ îïöèé Вывод графика è Стандартные погрешности ïðèâîäèò ê ïîñòðîåíèþ ãðàôèêà, íà êîòîðîì áóäóò îòîáðàæàòüñÿ èñõîäíûå è ñãëàæåííûå çíà÷åíèÿ (ðèñ. 5.50), è ê âûâîäó äîïîëíèòåëüíîãî ñòîëáöà ñî çíà÷åíèÿìè ïîãðåøíîñòåé. Ýòè ïîãðåøíîñòè âû÷èñëÿþòñÿ êàê ñóììà êâàäðàòîâ ðàçíîñòåé ìåæäó òðåìÿ ïîñëåäîâàòåëüíûìè èñõîäíûìè è ðàñ÷åòíûìè çíà÷åíèÿìè, äåëåííàÿ íà ÷èñëî 3. Ôîðìóëà Excel, ïî êîòîðîé ïîäñ÷èòûâàþòñÿ ñòàíäàðòíûå ïîãðåøíîñòè, ïîêàçàíà íà ðèñ. 5.50. 5.19. Анализ Фурье Äàííîå ñðåäñòâî âûïîëíÿåò äèñêðåòíîå ïðåîáðàçîâàíèå Ôóðüå. Ýòî ïðåîáðàçîâàíèå èñïîëüçóåòñÿ â àíàëèçå ëèíåéíûõ ñèñòåì è ïðèìåíÿåòñÿ ê âðåìåííûì ðÿäàì äëÿ âûÿâëåíèÿ ïåðèîäè÷åñêèõ (ñïåêòðàëüíûõ) ñîñòàâëÿþùèõ òàêèõ ðÿäîâ. Åñëè èìåþòñÿ äèñêðåòíûå íàáëþäåíèÿ y1, y2, ..., yn, òî ïðÿìîå äèñêðåòíîå ïðån îáðàçîâàíèå Ôóðüå âûïîëíÿåòñÿ â ñîîòâåòñòâèè ñ ôîðìóëîé Yk = ∑ y j e −i 2π jk n , k = 0, j =1 1, ..., n – 1. Ðåçóëüòàòû ïðåîáðàçîâàíèÿ Yk ÿâëÿþòñÿ êîìïëåêñíûìè ÷èñëàìè, ìîäóëü êîòîðûõ ðàâåí àìïëèòóäå k-é ñïåêòðàëüíîé ñîñòàâëÿþùåé (k-é ãàðìîíèêè), à àðãóìåíò êîìïëåêñíîãî ÷èñëà Yk ðàâåí ôàçå ýòîé ãàðìîíèêè. Àíàëîãè÷íî îïðån −1 äåëÿåòñÿ îáðàòíîå äèñêðåòíîå ïðåîáðàçîâàíèå Ôóðüå ( y j = ∑ Yk e i 2π jk n ), êîòîðîå ïðå- k =0 îáðàçóåò ñïåêòðàëüíîå ïðåäñòàâëåíèå âðåìåííîãî ðÿäà â äåéñòâèòåëüíîå. Глава 5. Надстройка Пакет анализа 189 Ðèñ. 5.49. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Экспоненциальное сглаживание Ðèñ. 5.50. Ðåçóëüòàòû âû÷èñëåíèé Ñðåäñòâî Анализ Фурье âûïîëíÿåò êàê ïðÿìîå òàê è îáðàòíîå ïðåîáðàçîâàíèÿ ìåòîäîì áûñòðîãî ïðåîáðàçîâàíèÿ Ôóðüå (ÁÏÔ). Ïðèìåíåíèå ìåòîäà ÁÏÔ äèêòóåò óñëîâèå, ÷òîáû êîëè÷åñòâî èñõîäíûõ çíà÷åíèé êàê äëÿ ïðÿìîãî, òàê è äëÿ îáðàòíîãî ïðåîáðàçîâàíèé, áûëî ðàâíî íåêîòîðîé ïîëîæèòåëüíîé ñòåïåíè ÷èñëà 2. Ìàêñèìàëüíîå ÷èñëî çíà÷åíèé, êîòîðîå ìîæåò îáðàáîòàòü ñðåäñòâî Анализ Фурье, ñîñòàâëÿåò 4096 (= 212). Äëÿ ïðèìåíåíèÿ îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå èñõîäíûå çíà÷åíèÿ äîëæíû áûòü â ôîðìàòå êîìïëåêñíûõ ÷èñåë x + yi èëè x + yj (i è j — îáîçíà÷åíèå ìíèìîé åäèíèöû). Åñëè x ÿâëÿåòñÿ îòðèöàòåëüíûì ÷èñëîì, ïåðåä íèì ñòàâèòñÿ àïîñòðîô ('). 190 Часть II. Средства Excel для статистического анализа Íà ðèñ. 5.51 ïîêàçàíû ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè è äèàëîãîâîå îêíî Анализ Фурье. Ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå ïîêàçàí íà ðèñ. 5.52. Ïåðâîå çíà÷åíèå (ÿ÷åéêà Ñ2) ðàâíî ñóììå èñõîäíûõ äàííûõ. Ðèñ. 5.51. Èñõîäíûå äàííûå è äèàëîãîâîå îêíî Анализ Фурье Ðèñ. 5.52. Ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå Íà ðèñ. 5.53 ïîêàçàíû ðàáî÷èé ëèñò ñ èñõîäíûìè äàííûìè (ðåçóëüòàò ïðÿìîãî ïðåîáðàçîâàíèÿ Ôóðüå) äëÿ îáðàòíîãî ïðåîáðàçîâàíèÿ è äèàëîãîâîå îêíî Анализ Фурье, â êîòîðîì óñòàíîâëåí ôëàæîê îïöèè Инверсия. Ðåçóëüòàò îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå ïîêàçàí íà ðèñ. 5.54; îí ñîâïàäàåò ñ ïåðâîíà÷àëüíûìè äàííûìè èç ñòîëáöà B. Глава 5. Надстройка Пакет анализа 191 Ðèñ. 5.53. Èñõîäíûå äàííûå äëÿ îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå è äèàëîãîâîå îêíî Анализ Фурье Ðèñ. 5.54. Ðåçóëüòàò îáðàòíîãî ïðåîáðàçîâàíèÿ Ôóðüå 192 Часть II. Средства Excel для статистического анализа Глава 6 Дополнительные возможности Excel для проведения статистического анализа  ýòîé ãëàâå îïèñàíû ñðåäñòâà Excel îáùåãî íàçíà÷åíèÿ, êîòîðûå íå âñåãäà ðàññìàòðèâàþòñÿ â “ñòàíäàðòíîì” ó÷åáíîì êóðñå ïî ýëåêòðîííûì òàáëèöàì ëèáî ðàññìàòðèâàþòñÿ íåäîñòàòî÷íî ïîëíî. Çäåñü ïðèâåäåíû ôîðìóëû ìàññèâîâ — ìîùíîå ñðåäñòâî äëÿ ïðîâåäåíèÿ âû÷èñëåíèé, íåêîòîðûå âîçìîæíîñòè ïîñòðîåíèÿ äèàãðàìì, ïîëåçíûå äëÿ âèçóàëèçàöèè ñòàòèñòè÷åñêèõ äàííûõ, íàäñòðîéêà Поиск решения — ñðåäñòâî äëÿ ðåøåíèÿ îïòèìèçàöèîííûõ çàäà÷, êîòîðîå ìîæíî ïðèìåíèòü è ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà, à òàêæå äðóãèå âîçìîæíîñòè Excel. 6.1. Массивы и формулы массивов  ýòîì ðàçäåëå ðàññìîòðåíû äâà îñíîâíûõ ïîíÿòèÿ, êîòîðûå çà÷àñòóþ çíà÷èòåëüíî óïðîùàþò ïðîâåäåíèå âû÷èñëåíèé â Excel. Ýòî ìàññèâ è ôîðìóëà ìàññèâà. Ìàññèâ — íàáîð ÿ÷ååê èëè çíà÷åíèé, êîòîðûå îáðàáàòûâàþòñÿ êàê åäèíàÿ ãðóïïà. Ýëåìåíòû ìàññèâà ìîãóò ñîäåðæàòüñÿ â ãðóïïå ÿ÷ååê èëè áûòü ïîèìåíîâàííîé êîíñòàíòîé (ñì. äàëåå). Ôîðìóëà ìàññèâà — ôîðìóëà, â êîòîðîé èñïîëüçóåòñÿ îäèí èëè íåñêîëüêî ìàññèâîâ íåïîñðåäñòâåííî èëè â êà÷åñòâå àðãóìåíòîâ ôóíêöèé è êîòîðàÿ âîçâðàùàåò îäíî èëè íåñêîëüêî çíà÷åíèé. Íàïîìíèì, ÷òî íåêîòîðûå ñòàòèñòè÷åñêèå ôóíêöèè ðàöèîíàëüíî èñïîëüçîâàòü èìåííî â âèäå ôîðìóë ìàññèâîâ, íàïðèìåð ôóíêöèþ РАНГ (ñì. ðàçäåë 4.2.5). Èòàê, ìàññèâ — ýòî íåêîòîðûé ïîèìåíîâàííûé íàáîð ýëåìåíòîâ.  Excel ìàññèâû ìîãóò áûòü îäíî- èëè äâóìåðíûìè. Îäíîìåðíûé ìàññèâ ìîæåò áûòü ãðóïïîé ÿ÷ååê, êîòîðûå ðàçìåùåíû â îäíîé ñòðîêå (ãîðèçîíòàëüíûé ìàññèâ) èëè â îäíîì ñòîëáöå (âåðòèêàëüíûé ìàññèâ). Äâóìåðíûé ìàññèâ ðàçìåùàåòñÿ â íåñêîëüêèõ ñòðîêàõ è ñòîëáöàõ. Îòìåòèì, ÷òî â ìàññèâàõ êîíñòàíò íåëüçÿ èñïîëüçîâàòü ññûëêè íà ÿ÷åéêè, èìåíà äèàïàçîíîâ èëè ôîðìóëû, íî ìîæíî èñïîëüçîâàòü òåêñòîâûå çíà÷åíèÿ, çàêëþ÷åííûå â êàâû÷êè, è ëîãè÷åñêèå çíà÷åíèÿ ИСТИНА è ЛОЖЬ. Îïåðàöèè íàä ìàññèâàìè ïðîèçâîäÿòñÿ ñ ïîìîùüþ ôîðìóë ìàññèâîâ. ×òîáû ñîçäàòü ôîðìóëó ìàññèâà, âûïîëíèòå ñëåäóþùèå äåéñòâèÿ. 1. Âûäåëèòå ÿ÷åéêó (åñëè ôîðìóëà ìàññèâà âîçâðàùàåò òîëüêî îäíî çíà÷åíèå) èëè äèàïàçîí ÿ÷ååê (åñëè ôîðìóëà ìàññèâà âîçâðàùàåò íåñêîëüêî çíà÷åíèé). 2. Ââåäèòå ôîðìóëó. 3. Íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>. Excel ïîìåñòèò ôîðìóëó ìàññèâà âî âñå âûäåëåííûå ÿ÷åéêè è àâòîìàòè÷åñêè çàêëþ÷èò ôîðìóëû â ôèãóðíûå ñêîáêè, ÷òîáû ïîä÷åðêíóòü, ÷òî ýòî ôîðìóëû ìàññèâà. Ðàññìîòðèì ïðèìåð.  ïàðíîì òåñòå Ñòüþäåíòà íåîáõîäèìî âû÷èñëèòü ñðåäíèå çíà÷åíèÿ ðàçíîñòåé ïàðíûõ íàáëþäåíèé (îá ýòîì òåñòå ðå÷ü èäåò â ðàçäåëå 2.4.2). Ïóñòü äâóìåðíûé ìàññèâ âûáîðî÷íûõ çíà÷åíèé ðàñïîëàãàåòñÿ â ñòîëáöàõ À è Â, êàê ïîêàçàíî íà ðèñ. 6.1.  ñòîëáöå Ñ áóäóò âûâåäåíû ðàçíîñòè. Äëÿ èõ âû÷èñëåíèÿ ìîæíî ïðèìåíèòü ôîðìóëó =А2–В2, êîòîðàÿ çàïèñûâàåòñÿ â ÿ÷åéêå Ñ2, è çàòåì ñêîïèðîâàòü åå âíèç íà äèàïàçîí Ñ3:Ñ51 (èìååòñÿ 50 íàáëþäåíèé).  ðåçóëüòàòå áóäåò ïîëó÷åí äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ðàçíîñòè ïàðíûõ íàáëþäåíèé. Òî æå ñàìîå ìîæíî ñäåëàòü ñ ïîìîùüþ ôîðìóëû ìàññèâà. Âûäåëèòå äèàïàçîí Ñ2:Ñ51, ââåäèòå ôîðìóëó =А2:А51–В2:В51 (ðèñ. 6.2) è íàæìèòå êëàâèøè <Ctrl+Shift+Enter>. Ðåçóëüòàò ïîêàçàí íà ðèñ. 6.3. Åùå ðàç ïîä÷åðêíåì, ÷òî ôîðìóëà ìàññèâà ââîäèòñÿ ïóòåì íàæàòèÿ êëàâèø <Ctrl+Shift+Enter>. Excel àâòîìàòè÷åñêè çàêëþ÷àåò ôîðìóëû â ôèãóðíûå ñêîáêè — âðó÷íóþ èõ ââîäèòü íåëüçÿ, ýòî áóäåò îøèáêîé è Excel íå ïðèìåò òàêóþ ôîðìóëó. Ïîêà ïðåèìóùåñòâ ôîðìóë ìàññèâîâ ïî ñðàâíåíèþ ñ îáû÷íûìè ôîðìóëàìè íå âèäíî (çà èñÐèñ. 6.1. Èñõîäíûå äàííûå êëþ÷åíèåì, âîçìîæíî, âðåìåíè, ñýêîíîìëåííîãî íà êîïèðîâàíèè ôîðìóëû). Òåïåðü âû÷èñëèì ñðåäíåå ýòèõ ðàçíîñòåé, äëÿ ÷åãî âîñïîëüçóåìñÿ ñòàíäàðòíîé ôóíêöèåé СРЗНАЧ, êàê ïîêàçàíî íà ðèñ. 6.4. Ñ ïîìîùüþ ôîðìóëû ìàññèâà ýòî æå çíà÷åíèå ìîæíî ïîëó÷èòü, íå èñïîëüçóÿ âû÷èñëåííûå ðàçíîñòè! Äëÿ ýòîãî ñëåäóåò ïðèìåíèòü ôîðìóëó =СРЗНАЧ(А2:А51– В2:В51), êîòîðàÿ ââîäèòñÿ òîëüêî â îäíó ÿ÷åéêó (à íå â äèàïàçîí ÿ÷ååê), íî ïî çàâåðøåíèè åå ââîäà âñå ðàâíî íåîáõîäèìî íàæàòü êîìáèíàöèþ êëàâèø <Ctrl+Shift+Enter>. Ðåçóëüòàò ïðèìåíåíèÿ ýòîé ôîðìóëû ïîêàçàí íà ðèñ. 6.5. Ïîñëåäíÿÿ ôîðìóëà óæå äåìîíñòðèðóåò ïðåèìóùåñòâà ôîðìóë ìàññèâîâ, ïîñêîëüêó îíà èñêëþ÷èëà íåîáõîäèìîñòü âûïîëíÿòü ïðîìåæóòî÷íûå âû÷èñëåíèÿ äëÿ íàõîæäåíèÿ ðàçíîñòåé.  ýòîé ôîðìóëå èñïîëüçóþòñÿ äâà ìàññèâà. Îíà âû÷èñëÿåò ðàçíîñòè ïàð çíà÷åíèé ÿ÷ååê äèàïàçîíîâ À2:À51 è Â2:Â51 è ñîçäàåò â ïàìÿòè êîìïüþòåðà íîâûé âðåìåííûé ìàññèâ, â êîòîðûé çàïèñûâàåòñÿ ðåçóëüòàò ïîïàðíûõ âû÷èòàíèé. Ôóíêöèÿ СРЗНАЧ âû÷èñëÿåò ñðåäíåå çíà÷åíèå ýëåìåíòîâ íîâîãî ìàññèâà è îòîáðàæàåò åãî â ÿ÷åéêå.  ñóùíîñòè, ôîðìóëà âûïîëíèëà öèêëè÷åñêèå âû÷èñëåíèÿ, êîòîðûå çàòðóäíèòåëüíî íàïðÿìóþ ðåàëèçîâàòü íà ðàáî÷åì ëèñòå Excel. Ïðèâåäåííûå íèæå ïðèìåðû ïîêàæóò äðóãèå äîñòîèíñòâà ôîðìóë ìàññèâîâ. 194 Часть II. Средства Excel для статистического анализа Ðèñ. 6.2. Ñîçäàíèå ôîðìóëû ìàññèâà Ðèñ. 6.3. Âû÷èñëåíèå ôîðìóëû ìàññèâà Ðèñ. 6.4. Ðåçóëüòàò âû÷èñëåíèÿ îáû÷íîé ôîðìóëû Ðèñ. 6.5. Ðåçóëüòàò âû÷èñëåíèÿ ôîðìóëû ìàññèâà Глава 6. Дополнительные возможности Excel для проведения статистического анализа 195 6.1.1. Редактирование формул массивов Ñäåëàåì íåñêîëüêî îáùèõ çàìå÷àíèé î ðåäàêòèðîâàíèè ôîðìóë ìàññèâîâ. Åñëè ôîðìóëà ìàññèâà ïîìåùåíà â íåñêîëüêî ÿ÷ååê, ñëåäóåò ðåäàêòèðîâàòü âñå ÿ÷åéêè äèàïàçîíà êàê îäíó ÿ÷åéêó, ïîñêîëüêó íåëüçÿ èçìåíèòü òîëüêî îäèí ýëåìåíò, ñîäåðæàùèé ôîðìóëó ìàññèâà. Åñëè ïîïûòàòüñÿ ñäåëàòü ýòî, Excel âûäàñò îêíî ñ ñîîáùåíèåì Нельзя изменить часть массива. ×òîáû îòðåäàêòèðîâàòü ôîðìóëó ìàññèâà, âûäåëèòå âñå ÿ÷åéêè ìàññèâà è àêòèâèçèðóéòå ñòðîêó ôîðìóë (ùåëêíèòå íà íåé èëè íàæìèòå <F2>). Ïðè ðåäàêòèðîâàíèè ôîðìóëû Excel óäàëÿåò ôèãóðíûå ñêîáêè. Çàêîí÷èâ ðåäàêòèðîâàíèå ôîðìóëû, íàæìèòå <Ctrl+Shift+Enter>, ÷òîáû âíåñòè èçìåíåíèÿ. Òåïåðü ñîäåðæèìîå âñåõ ÿ÷ååê ìàññèâà áóäåò ñîîòâåòñòâîâàòü âíåñåííûì èçìåíåíèÿì. (Ñîâåò. ×òîáû áûñòðî âûäåëèòü âåñü ìàññèâ, ïåðåéäèòå ê îäíîé èç ÿ÷ååê äèàïàçîíà ìàññèâà è íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+/>, ãäå êëàâèøà </> — ýòî êëàâèøà íà äîïîëíèòåëüíîé öèôðîâîé êëàâèàòóðå.) Ñ ôîðìóëàìè ìàññèâîâ íåëüçÿ äåëàòü ñëåäóþùåå. • Èçìåíÿòü ñîäåðæèìîå îäíîé èç ÿ÷ååê, â êîòîðûõ íàõîäèòñÿ ôîðìóëà ìàññèâà. • Ïåðåìåùàòü îòäåëüíûå ÿ÷åéêè, íà êîòîðûå ðàñïðîñòðàíÿåòñÿ ôîðìóëà ìàññèâà (ìîæíî ïåðåìåùàòü òîëüêî âñå ÿ÷åéêè ñ ôîðìóëîé ìàññèâà ñðàçó). • Óäàëÿòü îòäåëüíûå ÿ÷åéêè, íà êîòîðûå ðàñïðîñòðàíÿåòñÿ ôîðìóëà ìàññèâà (ìîæíî óäàëèòü òîëüêî âåñü ìàññèâ öåëèêîì). • Âñòàâëÿòü íîâûå ÿ÷åéêè â ìàññèâ; ýòî îòíîñèòñÿ òàêæå ê âñòàâêå íîâûõ ñòðîê èëè ñòîëáöîâ, êîòîðûå äîáàâëÿþò íîâûå ÿ÷åéêè ê ìàññèâó. Íåëüçÿ èçìåíèòü ôîðìóëó ìàññèâà â îòäåëüíîé åãî ÿ÷åéêå; òåì íå ìåíåå, ìîæíî ôîðìàòèðîâàòü âåñü ìàññèâ èëè îòäåëüíûå åãî ÷àñòè. 6.1.2. Массивы констант  ïðèâåäåííîì âûøå ïðèìåðå â êà÷åñòâå ìàññèâîâ èñïîëüçîâàëèñü äèàïàçîíû ÿ÷ååê. Îäíàêî â ôîðìóëàõ ìîæíî òàêæå èñïîëüçîâàòü ìàññèâ êîíñòàíò. Òàêîé ìàññèâ ìîæíî ââåñòè íåïîñðåäñòâåííî â ôîðìóëó (íàïðèìåð, êàê àðãóìåíò ôóíêöèè) èëè îïðåäåëèòü çàðàíåå ñ ïîìîùüþ äèàëîãîâîãî îêíà Присвоение имени. Ìàññèâû êîíñòàíò ìîæíî èñïîëüçîâàòü â ôîðìóëàõ âìåñòî ññûëêè íà äèàïàçîíû ÿ÷ååê. ×òîáû èñïîëüçîâàòü ìàññèâ êîíñòàíò, â ôîðìóëó ìàññèâà íåîáõîäèìî ââåñòè íàáîð çíà÷åíèé è çàêëþ÷èòü åãî â ôèãóðíûå ñêîáêè. Ëèáî ñëåäóåò âîñïîëüçîâàòüñÿ èìåíåì ìàññèâà, åñëè îíî åìó áûëî ïðåäâàðèòåëüíî ïðèñâîåíî. Ìàññèâ êîíñòàíò ìîæåò áûòü êàê îäíî-, òàê è äâóìåðíûì. Îäíîìåðíûå ìàññèâû ìîãóò áûòü âåðòèêàëüíûìè èëè ãîðèçîíòàëüíûìè. Ýëåìåíòû îäíîìåðíîãî ãîðèçîíòàëüíîãî ìàññèâà îòäåëÿþòñÿ îäèí îò äðóãîãî òî÷êîé ñ çàïÿòîé, íàïðèìåð {1;2;3;4;5}. Ýëåìåíòû îäíîìåðíîãî âåðòèêàëüíîãî ìàññèâà îòäåëÿþòñÿ äâîåòî÷èåì. Íàïðèìåð, âîò êàê îïðåäåëÿåòñÿ øåñòèýëåìåíòíûé âåðòèêàëüíûé ìàññèâ: {1:2:3:4:5:6}.  äâóìåðíîì ìàññèâå ýëåìåíòû îäíîé ñòðîêè òàêæå îòäåëÿþòñÿ òî÷êîé ñ çàïÿòîé, à ñòðîêè îòäåëÿþòñÿ îäíà îò äðóãîé äâîåòî÷èåì. Âîò ïðèìåð ìàññèâà ðàçìåðíîñòüþ 3×4 (òðè ñòðîêè, êàæäàÿ èç êîòîðûõ çàíèìàåò ÷åòûðå ñòîëáöà): {1;2;3;4:5;6;7;8:9;10;11;12}. Íà ðèñ. 6.6 ïîêàçàíî, êàê ìîæíî ñîçäàòü ïîèìåíîâàííûé ìàññèâ êîíñòàíò ñ ïîìîùüþ äèàëîãîâîãî îêíà Присвоение имени (ýòî îêíî îòêðûâàåòñÿ ñ ïîìîùüþ êîìàíäû ВставкаÖИмяÖПрисвоить). 196 Часть II. Средства Excel для статистического анализа Ðèñ. 6.6. Ñîçäàíèå ìàññèâà êîíñòàíò â äèàëîãîâîì îêíå Присвоение имени Способы использования массивов констант Êàê ãîâîðèëîñü âûøå, ïðè çàäàíèè ôóíêöèé ìàññèâû êîíñòàíò ìîãóò èñïîëüçîâàòüñÿ â êà÷åñòâå îäíîãî èç àðãóìåíòîâ, íàïðèìåð =СУММ(А1:А10;{1;3;5;7;}). Çäåñü ñóììèðóþòñÿ çíà÷åíèÿ, ñîäåðæàùèåñÿ â äèàïàçîíå À1:À10, è çíà÷åíèÿ 1, 3, 5, 7. Âìåñòî íàáîðà çíà÷åíèé, çàêëþ÷åííîãî â ôèãóðíûå ñêîáêè, ìîæíî óêàçàòü èìÿ ìàññèâà, åñëè îíî ñîçäàíî çàðàíåå. Ïóñòü èìåíåì ìàññèâà áóäåò Масс_конст (î äîïóñòèìûõ èìåíàõ ìàññèâîâ ñêàçàíî íèæå), íàïðèìåð =СУММ(А1:А10;Масс_конст). Ââîäèòü òàêèå ôóíêöèè, êàê ôîðìóëû ìàññèâîâ, íåò íåîáõîäèìîñòè. Íà ðèñ. 6.7 ïðèâåäåíî íåñêîëüêî ïðîñòûõ ïðèìåðîâ èñïîëüçîâàíèÿ ìàññèâîâ êîíñòàíò íåïîñðåäñòâåííî â ôîðìóëàõ. Îòìåòèì, ÷òî âñå ýòè ôîðìóëû ââîäèëèñü, êàê ôîðìóëû ìàññèâîâ (ïðåäâàðèòåëüíî áûë âûäåëåí íåîáõîäèìûé äèàïàçîí ÿ÷ååê), õîòÿ çàêëþ÷èòåëüíûå ôèãóðíûå ñêîáêè â ðåæèìå îòîáðàæåíèÿ ôîðìóë Excel íå ïîêàçûâàåò. ×òîáû ïåðåíåñòè ìàññèâ êîíñòàíò íà ðàáî÷èé ëèñò Excel, âûäåëèòå íåîáõîäèìûé äèàïàçîí ÿ÷ååê, ââåäèòå ôîðìóëó òèïà ={1;3;5;7} èëè =Масс_конст (åñëè Масс_конст — èìÿ ñóùåñòâóþùåãî ìàññèâà) è íàæìèòå êëàâèøè <Ctrl+Shift+Enter>. Ïðè ýòîì ñëåäóåò ïîìíèòü î ðàçìåðíîñòè è îðèåíòàöèè ìàññèâà. Íàïðèìåð, ìàññèâ {1;3;5;7} — ãîðèçîíòàëüíûé ìàññèâ (ïîñêîëüêó çäåñü äëÿ îòäåëåíèÿ ýëåìåíòîâ ìàññèâà îäèí îò äðóãîãî èñïîëüçîâàíû òî÷êà ñ çàïÿòîé), è åñëè áóäåò âûäåëåí âåðòèêàëüíûé äèàïàçîí ÿ÷ååê, òî â ýòîò äèàïàçîí áóäåò çàïèñàíî òîëüêî ÷èñëî 1 èç ýòîãî ìàññèâà. 6.1.3. Поименованные массивы и диапазоны Èñïîëüçîâàíèå â ôîðìóëàõ àäðåñîâ äèàïàçîíîâ ÿ÷ååê î÷åíü óòîìèòåëüíî è ÷àñòî ïðèâîäèò ê ñîçäàíèþ ôîðìóë, êîòîðûå òðóäíî ÷èòàòü è ïîíèìàòü (îñîáåííî ÷åðåç íåêîòîðîå âðåìÿ). Excel ïîçâîëÿåò ïðèñâàèâàòü ÿ÷åéêàì, äèàïàçîíàì è ìàññèâàì ñîäåðæàòåëüíûå èìåíà. Íàïðèìåð, äèàïàçîí ìîæíî íàçâàòü Выборка èëè Стат_характеристики. Èñïîëüçîâàíèå ïîäîáíûõ èìåí (ïî ñðàâíåíèþ ñ àäðåñàìè ÿ÷ååê èëè äèàïàçîíîâ) äàåò î÷åâèäíûå ïðåèìóùåñòâà. Íàïðèìåð, ñîäåðæàòåëüíîå èìÿ äèàïàçîíà çàïîìíèòü íàìíîãî ëåã÷å, ÷åì àäðåñ ÿ÷åéêè. Êðîìå òîãî, ïðè ââåäåíèè àäðåñîâ ÿ÷ååê è äèàïàçîíîâ ëåã÷å îøèáèòüñÿ, ÷åì ïðè ââåäåíèè èìåí, à ïðè âûáîðå èìåíè ÿ÷åéêè èëè äèàïàçîíà ýòî èìÿ ïîÿâëÿåòñÿ â ïîëå Глава 6. Дополнительные возможности Excel для проведения статистического анализа 197 Имя â ñòðîêå ôîðìóë. Ïðèìåíåíèå èìåí çíà÷èòåëüíî óïðîùàåò ïðîöåññ ñîçäàíèÿ ôîðìóë — èìÿ ÿ÷åéêè èëè äèàïàçîíà ìîæíî âñòàâèòü â ôîðìóëó, èñïîëüçîâàâ êîìàíäó ВставкаÖИмяÖВставить èëè âûáðàâ ñîîòâåòñòâóþùåå èìÿ â ïîëå Имя. Íàêîíåö, èìåíà äåëàþò ôîðìóëû áîëåå ïîíÿòíûìè è ïðîñòûìè â èñïîëüçîâàíèè. Ðèñ. 6.7. Ïðèìåðû èñïîëüçîâàíèÿ ìàññèâîâ êîíñòàíò Допустимые имена диапазонов и массивов Õîòÿ Excel äîñòàòî÷íî “ëèáåðàëüíà” â îòíîøåíèè èìåí äèàïàçîíîâ è ìàññèâîâ, ñóùåñòâóþò íåêîòîðûå ïðàâèëà èõ âûáîðà. •  èìåíàõ íå äîëæíî áûòü íèêàêèõ ïðîáåëîâ; äëÿ ëó÷øåãî âîñïðèÿòèÿ èìåíè ìîæåòå âîñïîëüçîâàòüñÿ ñèìâîëîì ïîä÷åðêèâàíèÿ èëè òî÷êîé, íàïðèìåð Среднее_выборки1 èëè Среднее.выборки1. • Ìîæíî èñïîëüçîâàòü ëþáûå êîìáèíàöèè áóêâ è öèôð, íî èìÿ íå äîëæíî íà÷èíàòüñÿ ñ öèôðû (íàïðèìåð, 3-йРезультат) èëè áûòü ïîõîæèì íà àäðåñ ÿ÷åéêè (íàïðèìåð, А5). • Èìåíà äîëæíû ñîäåðæàòü íå áîëüøå 255 ñèìâîëîâ. •  êà÷åñòâå èìåíè ìîæíî èñïîëüçîâàòü îäèíî÷íûå áóêâû (çà èñêëþ÷åíèåì R è C), íî ýòî íå ðåêîìåíäóåòñÿ äåëàòü, âåäü ñìûñë ñîñòîèò èìåííî â òîì, ÷òîáû äàâàòü ñîäåðæàòåëüíûå èìåíà.  Excel åñòü íåñêîëüêî èìåí äëÿ âíóòðåííåãî óïîòðåáëåíèÿ. È õîòÿ ìîæíî ñîçäàâàòü èìåíà, çàìåùàþùèå âíóòðåííèå èìåíà Excel, ëó÷øå ýòîãî íå äåëàòü. Ïîýòîìó ñëåäóåò èçáåãàòü èìåí Область_печати, Заголовки_печати, Область_консолидации è Имя_листа. 198 Часть II. Средства Excel для статистического анализа Создание имен Ñóùåñòâóåò íåñêîëüêî ñïîñîáîâ ñîçäàíèÿ èìåí. Èñïîëüçîâàíèå äèàëîãîâîãî îêíà Присвоение имени. ×òîáû ñîçäàòü èìÿ äëÿ ÿ÷åéêè èëè äèàïàçîíà, ñíà÷àëà âûäåëèòå ýòó ÿ÷åéêó èëè äèàïàçîí. Çàòåì âûïîëíèòå êîìàíäó ВставкаÖИмяÖПрисвоить (èëè âîñïîëüçóéòåñü êîìáèíàöèåé êëàâèø <Ctrl+F3>).  ðåçóëüòàòå Excel îòîáðàçèò äèàëîãîâîå îêíî Присвоение имени, ïîêàçàííîå íà ðèñ. 6.6. Ââåäèòå èìÿ â ïîëå ââîäà Имя èëè âîñïîëüçóéòåñü èìåíåì, êîòîðîå ïðåäëîæèò ïðîãðàììà (åñëè îíà åãî, êîíå÷íî, ïðåäëîæèò).  òåêñòîâîì ïîëå Формула ïîÿâèòñÿ àäðåñ àêòèâíîé èëè âûáðàííîé ÿ÷åéêè (èëè âûäåëåííîãî äèàïàçîíà). Óáåäèòåñü â òîì, ÷òî ýòî ïðàâèëüíûé àäðåñ, à çàòåì ùåëêíèòå íà êíîïêå OK, ÷òîáû äîáàâèòü èìÿ è çàêðûòü äèàëîãîâîå îêíî. Âñå ââåäåííûå ðàíåå èìåíà îòîáðàæàþòñÿ â ñïèñêå ýòîãî äèàëîãîâîãî îêíà. Èñïîëüçîâàíèå ïîëÿ Имя. Ñóùåñòâóåò è áîëåå áûñòðûé ñïîñîá — ñîçäàíèå èìåíè ñ ïîìîùüþ ïîëÿ Имя â ñòðîêå ôîðìóë. Âûäåëèòå ÿ÷åéêó (èëè äèàïàçîí), êîòîðîé íóæíî ïðèñâîèòü èìÿ, à çàòåì ùåëêíèòå íà ýòîì ïîëå è ââåäèòå èìÿ. Íàæìèòå êëàâèøó <Enter>, è èìÿ áóäåò ñîçäàíî. Ïîëå Имя — ýòî ðàñêðûâàþùèéñÿ ñïèñîê, â êîòîðîì ñîäåðæàòñÿ âñå èìåíà, èñïîëüçóþùèåñÿ â äàííîé ðàáî÷åé êíèãå. Åñëè âûáðàòü ÿ÷åéêó (èëè äèàïàçîí), êîòîðîé ïðèñâîåíî èìÿ, ýòî èìÿ ïîÿâèòñÿ â ïîëå Имя. ×òîáû âûáðàòü ÿ÷åéêó (èëè äèàïàçîí), êîòîðîé ïðèñâîåíî èìÿ, ùåëêíèòå íà ïîëå Имя è âûáåðèòå èç ñïèñêà íóæíîå èìÿ.  ðåçóëüòàòå Excel âûäåëèò ñîîòâåòñòâóþùóþ ÿ÷åéêó èëè äèàïàçîí. Àâòîìàòè÷åñêîå ñîçäàíèå èìåí. ×àñòî âîçíèêàåò íåîáõîäèìîñòü èñïîëüçîâàòü òåêñò, ñîäåðæàùèéñÿ â ðàáî÷åé òàáëèöå, äëÿ ñîçäàíèÿ èìåí ÿ÷ååê èëè äèàïàçîíîâ. Íà ðèñ. 6.8 ïðèâåäåí ïðèìåð òàêîé òàáëèöû.  äàííîì ñëó÷àå ìîæåò ïîíàäîáèòüñÿ èñïîëüçîâàòü òåêñò èç ÿ÷ååê A1 è Â1 äëÿ ñîçäàíèÿ èìåí ñîîòâåòñòâóþùèõ çíà÷åíèé ñòîëáöîâ À è B. Excel ïîçâîëÿåò ýòî ñäåëàòü ëåãêî è ïðîñòî. Ðèñ. 6.8. Ñîçäàíèå èìåí íà îñíîâå òåêñòà, ðàñïîëîæåííîãî â ñîñåäíèõ ÿ÷åéêàõ Глава 6. Дополнительные возможности Excel для проведения статистического анализа 199 ×òîáû ñîçäàòü èìåíà ñ ïîìîùüþ òåêñòà, ðàñïîëîæåííîãî â ñîñåäíèõ ÿ÷åéêàõ, ñíà÷àëà âûäåëèòå ýòîò òåêñò è ÿ÷åéêè, êîòîðûå íóæíî íàçâàòü (ýòî ìîãóò áûòü êàê îòäåëüíûå ÿ÷åéêè, òàê è äèàïàçîíû). Çàòåì âûáåðèòå êîìàíäó ВставкаÖ ИмяÖСоздать èëè íàæìèòå êîìáèíàöèþ êëàâèø <Ctrl+Shift+F3>.  ðåçóëüòàòå Excel îòîáðàçèò äèàëîãîâîå îêíî Создать имена, ïîêàçàííîå íà ðèñ. 6.8. Ôëàæîê îïöèè â ýòîì äèàëîãîâîì îêíå óñòàíîâëåí íà îñíîâàíèè ïðîâåäåííîãî ïðîãðàììîé Excel àíàëèçà âûäåëåííîãî äèàïàçîíà. Íàïðèìåð, åñëè ïðîãðàììà îáíàðóæèëà òåêñò â ïåðâîé ñòðîêå âûáðàííîãî ìíîæåñòâà ÿ÷ååê, òî îíà ïðåäëîæèò ñîçäàòü èìåíà íà îñíîâå òåêñòà â âåðõíåé ñòðîêå (îïöèÿ в строке выше). Åñëè äîãàäêà Excel íåâåðíà, âû ìîæåòå âûáðàòü äðóãóþ îïöèþ. Ùåëêíèòå íà êíîïêå OK, è èìåíà áóäóò ñîçäàíû. Переопределение имен Ïîñëå îïðåäåëåíèÿ èìåíè ìîæåò ïîíàäîáèòüñÿ èçìåíèòü ÿ÷åéêó (èëè äèàïàçîí), ê êîòîðîé îíî îòíîñèòñÿ. Äëÿ ýòîãî ìîæíî âîñïîëüçîâàòüñÿ äèàëîãîâûì îêíîì Присвоение имени. Âûáåðèòå êîìàíäó ВставкаÖИмяÖПрисвоить, ùåëêíèòå íà èìåíè, êîòîðîå íåîáõîäèìî ïåðåîïðåäåëèòü, è èçìåíèòå àäðåñ ÿ÷åéêè èëè äèàïàçîíà â ïîëå ðåäàêòèðîâàíèÿ Формула. Òî æå ñàìîå ìîæíî ñäåëàòü äðóãèì ñïîñîáîì: ùåëêíóòü íà ïîëå Формула è âûáðàòü íîâóþ ÿ÷åéêó (èëè äèàïàçîí) â ðàáî÷åì ëèñòå, óêàçàâ íà íåå ìûøüþ. Excel àâòîìàòè÷åñêè èñïðàâëÿåò àäðåñà ÿ÷ååê, èìåþùèõ èìåíà. 6.1.4. Примеры использования формул массивов  ýòîì ðàçäåëå ïðåäñòàâëåíî íåñêîëüêî ïðèìåðîâ, êîòîðûå äåìîíñòðèðóþò èñïîëüçîâàíèå ôîðìóë ìàññèâîâ è ïîèìåíîâàííûõ äèàïàçîíîâ è ìàññèâîâ è êîòîðûå ìîãóò áûòü ïîëåçíûìè ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà. Использование условных выражений Äîïóñòèì, èìååòñÿ îäíîìåðíàÿ âûáîðêà è íåîáõîäèìî ïîäñ÷èòàòü êîëè÷åñòâî, ñóììó è ñðåäíåå âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áîëüøå âûáîðî÷íîãî ñðåäíåãî âñåé âûáîðêè, è àíàëîãè÷íûå âåëè÷èíû äëÿ çíà÷åíèé, êîòîðûå ìåíüøå âûáîðî÷íîãî ñðåäíåãî âñåé âûáîðêè. Ñ ïîìîùüþ ôîðìóë ìàññèâîâ òàêèå âû÷èñëåíèÿ âûïîëíÿþòñÿ îòíîñèòåëüíî ïðîñòî. Ïóñòü äèàïàçîí âûáîðî÷íûõ çíà÷åíèé èìååò èìÿ Данные. Ôîðìóëû è ðåçóëüòàòû âû÷èñëåíèé ïîêàçàíû íà ðèñ. 6.9. Ê ñîæàëåíèþ, òàêèå âû÷èñëåíèÿ íåëüçÿ âûïîëíèòü ñ ïîìîùüþ ôóíêöèé СУММЕСЛИ è СЧЁТЕСЛИ, ïîñêîëüêó îíè íå ïîääåðæèâàþò â êà÷åñòâå àðãóìåíòîâ, çàäàþùèõ óñëîâèÿ îòáîðà çíà÷åíèé, ôîðìóë ìàññèâîâ. Íî èõ ìîæíî èñïîëüçîâàòü ñ ïðîñòûìè (áåç ôîðìóë) óñëîâèÿìè îòáîðà. Íàïðèìåð, åñëè íàäî ïîäñ÷èòàòü ñóììó òîëüêî ïîëîæèòåëüíûõ çíà÷åíèé èç äèàïàçîíà Данные, òî âïîëíå ïîäîéäåò ôîðìóëà =СУММЕСЛИ(Данные;”>0”;Данные), ââåäåííàÿ, êàê ôîðìóëà ìàññèâà. Суммирование k#х чисел в выборке Ñëåäóþùèé ïðèìåð íåìíîãî ñëîæíåå, ÷åì ïðåäûäóùèé. Ïðåäïîëîæèì, åñòü âûáîðêà è â íåé íåîáõîäèìî âû÷èñëèòü ñóììó âñåõ òðåòüèõ ÷èñåë (â îáùåì ñëó÷àå k-õ ÷èñåë), ò.å. ñëîæèòü ïåðâîå, ÷åòâåðòîå, ñåäüìîå è ò.ä. ÷èñëà, à òàêæå âû÷èñëèòü èõ ñðåäíåå. Ýòî ìîæíî ñäåëàòü, ïðåäâàðèòåëüíî ïðèìåíèâ ñðåäñòâî Выборка èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.4), êîòîðîå âûâåäåò â îòäåëüíûé ìàññèâ ýòè òðåòüè ÷èñëà. Çàòåì îñòàíåòñÿ òîëüêî ïîäñ÷èòàòü ñóììó è ñðåäíåå ÷èñåë. Íî 200 Часть II. Средства Excel для статистического анализа ýòî æå ìîæíî ñäåëàòü ñ ïîìîùüþ ôîðìóëû ìàññèâà. Ïðåäïîëîæèì, â ÿ÷åéêå ñ èìåíåì Период íàõîäèòñÿ ÷èñëî k, äèàïàçîí âûáîðî÷íûõ çíà÷åíèé èìååò èìÿ Выборка, âûáîðî÷íûå çíà÷åíèÿ ïðîíóìåðîâàíû è èõ íîìåðà íàõîäÿòñÿ â äèàïàçîíå Номер, êàê ïîêàçàíî íà ðèñ. 6.10. Ðèñ. 6.9. Èñïîëüçîâàíèå óñëîâíûõ âûðàæåíèé â ôîðìóëàõ ìàññèâîâ Ðèñ. 6.10. Äëÿ ñóììèðîâàíèÿ k-õ âûáîðî÷íûõ çíà÷åíèé è âû÷èñëåíèÿ èõ ñðåäíåãî èñïîëüçóþòñÿ ôîðìóëû ìàññèâîâ Глава 6. Дополнительные возможности Excel для проведения статистического анализа 201 ×òîáû âû÷èñëèòü ñóììó k-õ âûáîðî÷íûõ çíà÷åíèé, èñïîëüçóåòñÿ ôîðìóëà ìàññèâà {=ЕСЛИ(Период=0;0;СУММ(ЕСЛИ(ОСТАТ(Номер;Период)=0;Выборка;0)))}. Äëÿ îïðåäåëåíèÿ çíà÷åíèé ýëåìåíòîâ âûáîðêè, ïîäëåæàùèõ ñóììèðîâàíèþ, â ôîðìóëå èñïîëüçóåòñÿ ôóíêöèÿ ОСТАТ. Îíà âîçâðàùàåò îñòàòîê îò äåëåíèÿ ïåðâîãî ñâîåãî àðãóìåíòà íà âòîðîé àðãóìåíò. (Çíà÷åíèÿ, âîçâðàùàåìûå ýòîé ôóíêöèåé, ïîêàçàíû íà ðèñ. 6.10 â ñòîëáöå J.) Åñëè ôóíêöèÿ ОСТАТ âîçâðàùàåò 0, òî ÷èñëî âêëþ÷àåòñÿ â ìàññèâ ñóììèðîâàíèÿ. Îáðàòèòå âíèìàíèå, ÷òî ñëó÷àé, êîãäà Период ðàâåí 0, ðàññìîòðåí îòäåëüíî, ïîñêîëüêó ôóíêöèÿ ОСТАТ âîçâðàùàåò îøèáêó, åñëè åå âòîðîé àðãóìåíò ðàâåí 0. Àíàëîãè÷íî ðàáîòàåò ôîðìóëà âû÷èñëåíèÿ ñðåäíåãî {=ЕСЛИ(Период=0;0;СРЗНАЧ(ЕСЛИ(ОСТАТ(Номер;Период)=0;Выборка;0)))}. Ïðèâåäåííûå ôîðìóëû èñïîëüçóþò ìàññèâ íîìåðîâ âûáîðî÷íûõ çíà÷åíèé. Ìîæíî îòêàçàòüñÿ îò ýòîãî ìàññèâà è äëÿ îòáîðà âûáîðî÷íûõ çíà÷åíèé (òî÷íåå, äëÿ îïðåäåëåíèÿ èõ ïîñëåäîâàòåëüíûõ íîìåðîâ â âûáîðêå) ïðèìåíèòü ôóíêöèþ СТРОКА, êîòîðàÿ âîçâðàùàåò íîìåð ñòðîêè, ñîäåðæàùåé åå àðãóìåíò. Îäíàêî â ýòîì ñëó÷àå ôîðìóëû çíà÷èòåëüíî óñëîæíÿþòñÿ, ïîñêîëüêó íåîáõîäèìî ëèáî õðàíèòü àäðåñ ïåðâîé ÿ÷åéêè ìàññèâà Выборка îòäåëüíî, ëèáî íàõîäèòü åãî â ïðîöåññå âû÷èñëåíèé. Вычисление рангов  Excel äëÿ âû÷èñëåíèÿ ðàíãîâ âûáîðî÷íûõ çíà÷åíèé ñóùåñòâóþò ôóíêöèÿ РАНГ (ñì. ðàçäåë 4.2.5) è ñðåäñòâî Ранг и персентиль (ñì. ðàçäåë 5.5). Ñïîñîá, êîòîðûì ýòè ôóíêöèÿ è ñðåäñòâî óñòàíàâëèâàþò ðàíãè, íå âñåãäà óñòðàèâàåò, ïîñêîëüêó îäèíàêîâûì çíà÷åíèÿì îíè ïðèñâàèâàþò îäèíàêîâûå ðàíãè, ðàâíûå ðàíãó ïåðâîãî çíà÷åíèÿ ýòîé ãðóïïû çíà÷åíèé. Íàïðèìåð, åñëè åñòü äâà îäèíàêîâûõ çíà÷åíèÿ, ïðè÷åì ïåðâîìó èç íèõ ïðèïèñûâàåòñÿ ðàíã, íàïðèìåð, 5, òîãäà îáîèì çíà÷åíèÿì óñòàíàâëèâàåòñÿ òîò æå ðàíã 5. Îäíàêî èíîãäà íåîáõîäèìî ïðèñâàèâàòü êàæäîìó èç îäèíàêîâûõ çíà÷åíèé ñðåäíèé ðàíã, â äàííîì ñëó÷àå — 5,5. Íàïðèìåð, òàêèå ðàíãè âû÷èñëÿþòñÿ â êðèòåðèè Óèëêîêñîíà–Ìàííà–Óèòíè äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé (ñì. ðàçäåë 2.4.2). Íà ðèñ. 6.11 ïîêàçàíû âûáîðêà è äâà ìåòîäà ðàíæèðîâàíèÿ âûáîðî÷íûõ çíà÷åíèé.  ñòîëáöàõ C, D, E ðàíãè ïîäñ÷èòàíû ñ ïîìîùüþ ñðåäñòâà Ранг и персентиль è çàòåì îòñîðòèðîâàíû â ïîðÿäêà âîçðàñòàíèÿ çíà÷åíèé ñòîëáöà Точка (ñòîëáåö Процент, òàêæå ãåíåðèðóåìûé ýòèì ñðåäñòâîì, óäàëåí).  ñòîëáöå G äëÿ âû÷èñëåíèÿ ðàíãîâ èñïîëüçóåòñÿ ôîðìóëà ìàññèâà, êîòîðàÿ â ÿ÷åéêå G2 èìååò ñëåäóþùèé âèä: {=ЕСЛИ((СУММ(ЕСЛИ(Выборка=A2;1)))=1;(СУММ(ЕСЛИ(Выборка>=A2;1;0)));(СУММ( ЕСЛИ(Выборка>=A2;1)))-((СУММ(ЕСЛИ(Выборка=A2;1)))-1)*0,5)}. Ýòà ôîðìóëà ââåäåíà â ÿ÷åéêó G2 êàê ôîðìóëà ìàññèâà è çàòåì ñêîïèðîâàíà â ÿ÷åéêè, ðàñïîëîæåííûå íèæå. Ôîðìóëà, íà ïåðâûé âçãëÿä, êàæåòñÿ äîâîëüíî ñëîæíîé, íî, ðàçáèâ åå íà îòäåëüíûå ÷àñòè, â íåé íåòðóäíî ðàçîáðàòüñÿ. Íà ðèñóíêå îòìå÷åíû ðàíãè îäèíàêîâûõ çíà÷åíèé, âû÷èñëÿåìûå ñðåäñòâîì Ранг и персентиль è äàííîé ôîðìóëîé ìàññèâà.  çàêëþ÷åíèå îòìåòèì, ÷òî îñíîâíîå ïðåèìóùåñòâî èñïîëüçîâàíèÿ ôîðìóë ìàññèâîâ ïî ñðàâíåíèþ ñî ñðåäñòâàìè ïàêåòà àíàëèçà (òèïà Ранг и персентиль) çàêëþ- 202 Часть II. Средства Excel для статистического анализа ÷àåòñÿ â òîì, ÷òî ýòè ôîðìóëû äèíàìè÷íû è ñðàçó âûäàþò çíà÷åíèÿ ïðè èçìåíåíèè âõîäíûõ äàííûõ. Êðîìå òîãî, ôîðìóëû ìàññèâîâ ÷àñòî èñêëþ÷àþò íåîáõîäèìîñòü èñïîëüçîâàíèÿ ïðîìåæóòî÷íûõ ôîðìóë (ñì. ïðèìåð èç ïðåäûäóùåãî ðàçäåëà). È, â êîíöå êîíöîâ, îíè ïîçâîëÿþò âûïîëíÿòü âû÷èñëåíèÿ, êîòîðûå òðóäíî èëè íåâîçìîæíî ñäåëàòü ïî-äðóãîìó. Êîíå÷íî, ôîðìóëû ìàññèâîâ èìåþò è ñâîè íåäîñòàòêè, ñðåäè êîòîðûõ îòìåòèì òðóäíîñòü èõ ïîíèìàíèÿ è òî, ÷òî ôîðìóëû ìàññèâîâ íåëüçÿ ýêñïîðòèðîâàòü â ôîðìàòû äðóãèõ ïðîãðàìì ýëåêòðîííûõ òàáëèö, íàïðèìåð ïðîãðàììû Lotus 1-2-3. Ðèñ. 6.11. Ðàíæèðîâàíèå äàííûõ ñ ïîìîùüþ ôîðìóëû ìàññèâà Çàêîí÷èì ðàçäåë, ïîñâÿùåííûé ìàññèâàì è ôîðìóëàì ìàññèâîâ, îïèñàíèåì ôóíêöèé Excel, ïîçâîëÿþùèõ ðàáîòàòü ñ ìàòðèöàìè (ò.å. ñ òåìè æå ìàññèâàìè), à òàêæå ôóíêöèé ñóììèðîâàíèÿ, â ÷àñòíîñòè ñóììèðîâàíèÿ ïðîèçâåäåíèé çíà÷åíèé äâóõ ìàññèâîâ, êîòîðûå ÷àñòî èñïîëüçóþòñÿ ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà äëÿ âûïîëíåíèÿ ñàìûõ ðàçíîîáðàçíûõ âû÷èñëåíèé. 6.1.5. Матричные вычисления Ôóíêöèè äëÿ ðàáîòû ñ ìàòðèöàìè ñëåäóþùèå. Ôóíêöèÿ Íàçíà÷åíèå ÌÎÁÐ Âîçâðàùàåò îáðàòíóþ ìàòðèöó ÌÎÏÐÅÄ Âîçâðàùàåò îïðåäåëèòåëü ìàòðèöû ÌÓÌÍÎÆ Âîçâðàùàåò ïðîèçâåäåíèå ìàòðèö Глава 6. Дополнительные возможности Excel для проведения статистического анализа 203 Ñèíòàêñèñ ôóíêöèé: ФУНКЦИЯ(Ìàññèâ1;Ìàññèâ2) Ôóíêöèè МОБР è МОПРЕД èìåþò ïî îäíîìó àðãóìåíòó Массив, à ôóíêöèÿ МУМНОЖ — äâà. Àðãóìåíò Массив ìîæåò áûòü çàäàí êàê äèàïàçîí ÿ÷ååê, êàê ìàññèâ êîíñòàíò èëè êàê èìÿ äèàïàçîíà èëè ìàññèâà. Åñëè êàêàÿ-ëèáî èç ÿ÷ååê â ìàññèâå ïóñòà èëè ñîäåðæèò òåêñò, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЗНАЧ!.  ôóíêöèÿõ МОБР è МОПРЕД àðãóìåíò Массив äîëæåí èìåòü ðàâíîå êîëè÷åñòâî ñòðîê è ñòîëáöîâ, ïîñêîëüêó ýòè ôóíêöèè ðàáîòàþò òîëüêî ñ êâàäðàòíûìè ìàòðèöàìè. Åñëè Массив èìååò íåðàâíîå ÷èñëî ñòðîê è ñòîëáöîâ, òî ôóíêöèè âîçâðàùàþò çíà÷åíèå îøèáêè #ЗНАЧ!. Åñëè îïðåäåëèòåëü îáðàùàåìîé ìàòðèöû ðàâåí íóëþ, òî â ýòîì ñëó÷àå ôóíêöèÿ МОБР âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!. Ôóíêöèÿ МУМНОЖ âûïîëíÿåò óìíîæåíèå ìàòðèö ñòàíäàðòíûì îáðàçîì è òðåáóåò äâóõ àðãóìåíòîâ: îäíîé ìàòðèöû ðàçìåðîì n×k (n — êîëè÷åñòâî ñòðîê, k — êîëè÷åñòâî ñòîëáöîâ) è âòîðîé ìàòðèöû ðàçìåðîì k×m (çäåñü òàêæå k — êîëè÷åñòâî ñòðîê, à m — êîëè÷åñòâî ñòîëáöîâ). Ðåçóëüòèðóþùàÿ ìàòðèöà áóäåò èìåòü ðàçìåð n×m. Òàêèì îáðàçîì, êîëè÷åñòâî ñòîëáöîâ àðãóìåíòà Массив1 äîëæíî áûòü òàêèì æå, êàê êîëè÷åñòâî ñòðîê àðãóìåíòà Массив2. Åñëè ýòî óñëîâèå íå âûïîëíÿåòñÿ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Ôóíêöèè МОБР è МУМНОЖ äîëæíû ââîäèòüñÿ, êàê ôîðìóëû ìàññèâîâ, ò.å. ñ èñïîëüçîâàíèåì êîìáèíàöèè êëàâèø <Ctrl+Shift+Enter> (ïðåäâàðèòåëüíî ñëåäóåò âûäåëèòü äèàïàçîí ÿ÷ååê, â êîòîðîì áóäåò âûâåäåí ðåçóëüòàò âû÷èñëåíèé). Âñå òðè ôóíêöèè, êîòîðûå çäåñü ðàññìàòðèâàþòñÿ, ïðîèçâîäÿò âû÷èñëåíèÿ ñ òî÷íîñòüþ äî 16 çíà÷àùèõ öèôð, ÷òî ìîæåò ïðèâåñòè ê íåáîëüøèì ÷èñëåííûì îøèáêàì îêðóãëåíèÿ. Ïîýòîìó ÷èñëà, çíà÷åíèÿ êîòîðûõ èìåþò ïîðÿäîê 1E–16 èëè ìåíüøå, ìîæíî ñ÷èòàòü íóëåâûìè. Íà ðèñ. 6.12 ïîêàçàíû ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé è ôîðìóëû, ïî êîòîðûì íàõîäèòñÿ ýòî ðåøåíèå. Òàêóþ ñõåìó âû÷èñëåíèé ìîæíî èñïîëüçîâàòü, íàïðèìåð, äëÿ íàõîæäåíèÿ êîýôôèöèåíòîâ óðàâíåíèÿ ðåãðåññèè (ñì. ðàçäåë 3.4). Ïåðåìíîæåíèå ìàòðèöû ñèñòåìû è îáðàòíîé ê íåé ìàòðèöû ñäåëàíî äëÿ òîãî, ÷òîáû îöåíèòü òî÷íîñòü âû÷èñëåíèé, ïîñêîëüêó ðåçóëüòàòîì ýòîãî ïðîèçâåäåíèÿ ìàòðèö äîëæíà áûòü åäèíè÷íàÿ ìàòðèöà, âíåäèàãîíàëüíûå ýëåìåíòû êîòîðîé ðàâíû íóëþ. 6.1.6. Функции суммирования  Excel èìååòñÿ áîãàòûé àðñåíàë ôóíêöèé ñóììèðîâàíèÿ, ìíîãèå èç êîòîðûõ ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ ñòàòèñòè÷åñêèõ õàðàêòåðèñòèê âûáîðîê. Ìû íå áóäåì îïèñûâàòü “èçâåñòíûå” ôóíêöèè ñóììèðîâàíèÿ СУММ è СУММЕСЛИ; ðàññìîòðèì äðóãèå, “ìåíåå èçâåñòíûå”, ôóíêöèè. Функция СУММКВ Ôóíêöèÿ âû÷èñëÿåò ñóììó êâàäðàòîâ ñâîèõ àðãóìåíòîâ, ò.å. âû÷èñëÿåò ñóììó âèäà ∑x 2 i , ãäå xi — çíà÷åíèÿ ìàññèâà. Åå ìîæíî èñïîëüçîâàòü, íàïðèìåð, ïðè i âû÷èñëåíèè âûáîðî÷íîé äèñïåðñèè èëè ñóìì êâàäðàòîâ â äèñïåðñèîííîì àíàëèçå (ñì. ðàçäåë 3.5). 204 Часть II. Средства Excel для статистического анализа Ðèñ. 6.12. Ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé Ñèíòàêñèñ ôóíêöèè: СУММКВ(×èñëî1;×èñëî2;...) Ìîæåò èìåòü äî 30 àðãóìåíòîâ Число.  êà÷åñòâå àðãóìåíòîâ ìîæíî èñïîëüçîâàòü ìàññèâû è ññûëêè íà ìàññèâû. Åñëè ñðåäè àðãóìåíòîâ èìåþòñÿ òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ, òî îíè èãíîðèðóþòñÿ. Функция СУММКВРАЗН Ôóíêöèÿ âû÷èñëÿåò ñóììó êâàäðàòîâ ïîïàðíûõ ðàçíîñòåé çíà÷åíèé äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà ∑ (x − y ) i i 2 , ãäå xi è yi — çíà÷åíèÿ ìàññèâîâ. i Ñèíòàêñèñ ôóíêöèè: СУММКВРАЗН(Ìàññèâ_x;Ìàññèâ_y) Àðãóìåíòû Массив — ÷èñëà, ìàññèâû èëè ññûëêè íà äèàïàçîíû ÿ÷ååê. Åñëè àðãóìåíò Массив ñîäåðæèò òåêñòîâûå èëè ëîãè÷åñêèå çíà÷åíèÿ ëèáî ïóñòûå ÿ÷åéêè, òî òàêèå çíà÷åíèÿ èãíîðèðóþòñÿ; îäíàêî ÿ÷åéêè, êîòîðûå ñîäåðæàò íóëåâûå çíà÷åíèÿ, ó÷èòûâàþòñÿ. Åñëè àðãóìåíòû Массив_x è Массив_y ñîäåðæàò ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, òî ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Функция СУММПРОИЗВ Ôóíêöèÿ ïåðåìíîæàåò ñîîòâåòñòâóþùèå ýëåìåíòû çàäàííûõ ìàññèâîâ è âîçâðàùàåò ñóììó ýòèõ ïðîèçâåäåíèé, ò.å. âû÷èñëÿåò ñóììó âèäà ∑x y z i i i , ãäå xi, yi i è zi — çíà÷åíèÿ ìàññèâîâ. Ñèíòàêñèñ ôóíêöèè: СУММПРОИЗВ(Ìàññèâ1;Ìàññèâ2;Ìàññèâ3;...) Глава 6. Дополнительные возможности Excel для проведения статистического анализа 205 Ôóíêöèÿ ìîæåò èìåòü äî 30 àðãóìåíòîâ. Àðãóìåíòû Массив äîëæíû èìåòü îäíó è òó æå ðàçìåðíîñòü, ò.å., åñëè õîòÿ áû îäèí àðãóìåíò ÿâëÿåòñÿ îòäåëüíûì ÷èñëîì, òî âñå îñòàëüíûå àðãóìåíòû äîëæíû áûòü ÷èñëàìè. Åñëè æå àðãóìåíò Массив1 ÿâëÿåòñÿ ìàññèâîì èëè ññûëêîé íà äèàïàçîí ÿ÷ååê, âñå îñòàëüíûå àðãóìåíòû äîëæíû èìåòü òàêóþ æå ðàçìåðíîñòü, ÷òî è àðãóìåíò Массив1.  ïðîòèâíîì ñëó÷àå ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЗНАЧ!. Íå÷èñëîâûå ýëåìåíòû àðãóìåíòîâ òðàêòóþòñÿ êàê íóëåâûå. Åñëè çàäàí òîëüêî îäèí àðãóìåíò, âîçâðàùàåòñÿ ñóììà ýëåìåíòîâ ýòîãî àðãóìåíòà. Функция СУММРАЗНКВ Ôóíêöèÿ âîçâðàùàåò ñóììó ïîïàðíûõ ðàçíîñòåé êâàäðàòîâ ñîîòâåòñòâóþùèõ çíà÷åíèé äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà ∑ (x 2 i − yi2 ) , ãäå xi è yi — i çíà÷åíèÿ ìàññèâîâ. Ñèíòàêñèñ ôóíêöèè: СУММРАЗНКВ(Ìàññèâ_x;Ìàññèâ_y) Àðãóìåíòû ôóíêöèè äîëæíû áûòü ÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå ÷èñëà. Òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ, à òàêæå ïóñòûå ÿ÷åéêè â ìàññèâàõ è äèàïàçîíàõ èãíîðèðóþòñÿ. Åñëè àðãóìåíòû Массив_x è Массив_y èìåþò ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Функция СУММСУММКВ Âîçâðàùàåò ñóììó ïîïàðíûõ ñóìì êâàäðàòîâ ñîîòâåòñòâóþùèõ ýëåìåíòîâ äâóõ ìàññèâîâ, ò.å. âû÷èñëÿåò ñóììó âèäà ∑ (x 2 i + yi2 ) , ãäå xi è yi — çíà÷åíèÿ i ìàññèâîâ. Ñèíòàêñèñ ôóíêöèè: СУММСУММКВ(Ìàññèâ_x;Ìàññèâ_y) Àðãóìåíòû ôóíêöèè äîëæíû áûòü ÷èñëàìè, ìàññèâàìè èëè ññûëêàìè íà äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå ÷èñëà. Òåêñòîâûå è ëîãè÷åñêèå çíà÷åíèÿ, à òàêæå ïóñòûå ÿ÷åéêè â ìàññèâàõ è äèàïàçîíàõ èãíîðèðóþòñÿ. Åñëè àðãóìåíòû Массив_x è Массив_y èìåþò ðàçëè÷íûå êîëè÷åñòâà ýëåìåíòîâ, ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. Ðàçëè÷èå ìåæäó îäèíàêîâûìè ôîðìóëàìè =СУММСУММКВ(Х;Y) è =СУММКВ(Х) + СУММКВ(Y) ïðîÿâëÿåòñÿ òîëüêî òîãäà, êîãäà â ìàññèâå Х èëè Y èìåþòñÿ ýëåìåíòû, êîòîðûå èãíîðèðóþòñÿ ôóíêöèÿìè (ò.å. òåêñòîâûå, ëîãè÷åñêèå èëè ïóñòûå ÿ÷åéêè).  ïåðâîé ôîðìóëå èç ñóììû èñêëþ÷àåòñÿ ïàðà ýëåìåíòîâ, ïðèíàäëåæàùèõ ìàññèâàì Х è Y, åñëè õîòÿ áû îäèí èç íèõ èãíîðèðóåòñÿ. Âî âòîðîé ôîðìóëå ïîäîáíûå èñêëþ÷åíèÿ èç ñóìì ïðîèñõîäÿò íåçàâèñèìî. 6.2. Диаграммы Ïðåäïîëàãàÿ, ÷òî ÷èòàòåëü çíàêîì ñ îñíîâàìè ïîñòðîåíèÿ è ïðèìåíåíèÿ äèàãðàìì è ãðàôèêîâ â Excel, çäåñü ìû ðàññìîòðèì òîëüêî íåêîòîðûå èõ âîçìîæíîñòè, à èìåííî — äîáàâëåíèå ëèíèé òðåíäà, äîáàâëåíèå ïëàíîê ïîãðåøíîñòåé è ñîçäàíèå ãèñòîãðàìì ðàñïðåäåëåíèé. 206 Часть II. Средства Excel для статистического анализа 6.2.1. Линии тренда Äîáàâëÿÿ ëèíèþ òðåíäà ê ïîñòðîåííîìó ãðàôèêó èçìåíåíèÿ äàííûõ, ìîæíî îöåíèòü äèíàìèêó èçìåíåíèÿ ýòèõ äàííûõ. Ëèíèÿ òðåíäà — ýòî óðàâíåíèå ðåãðåññèè (ñì. ðàçäåë 3.4), êîòîðîå ñòðîèòñÿ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ íà îñíîâàíèè ñóùåñòâóþùèõ ðÿäîâ äàííûõ è ìîæåò áûòü ýêñòðàïîëèðîâàíî çà èíòåðâàë èñõîäíûõ äàííûõ. Ëèíèè òðåíäà ìîãóò áûòü äîáàâëåíû òîëüêî ê îïðåäåëåííûì òèïàì äèàãðàìì: ê äèàãðàììàì ñ îáëàñòÿìè, ãèñòîãðàììàì, ãðàôèêàì, ëèíåé÷àòûì è òî÷å÷íûì äèàãðàììàì. Äëÿ äîáàâëåíèÿ ê äèàãðàììå ëèíèè òðåíäà âûïîëíèòå ñëåäóþùèå äåéñòâèÿ. 1. Âûäåëèòå äèàãðàììó èëè ðÿä äàííûõ, ê êîòîðûì íåîáõîäèìî äîáàâèòü ëèíèþ òðåíäà. 2. Èç ìåíþ Диаграмма âûáåðèòå êîìàíäó Добавить линию тренда, è îòêðîåòñÿ äèàëîãîâîå îêíî Линия тренда (ðèñ. 6.13). 3. Íà âêëàäêå Тип âûáåðèòå ïîäõîäÿùèé òèï ëèíèè òðåíäà. 4. Ùåëêíèòå íà êíîïêå ОК. Ïðèìåð êâàäðàòè÷íîé ëèíèè òðåíäà ïîêàçàí íà ðèñ. 6.14. Îáðàùàåì âíèìàíèå, ÷òî äîïîëíèòåëüíî ìîæíî âûâåñòè óðàâíåíèå ðåãðåññèè è êîýôôèöèåíò äåòåðìèíàöèè R2. Ðèñ. 6.13. Äèàëîãîâîå îêíî Линия тренда Глава 6. Дополнительные возможности Excel для проведения статистического анализа 207 Ðèñ. 6.14. Ïðèìåð ëèíèè òðåíäà Íà âêëàäêå Тип äèàëîãîâîãî îêíà Линия тренда ìîæíî âûáðàòü ñëåäóþùèå òèïû ëèíèé òðåíäà (áîëåå ïîäðîáíàÿ èíôîðìàöèÿ îá ýòèõ òèïàõ ðåãðåññèè ïðèâåäåíà â ðàçäåëàõ 3.4 è 15.1). • Ëèíåéíàÿ. Ñòðîèò ïðÿìóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ ëèíåéíîé ðåãðåññèè. • Ëîãàðèôìè÷åñêàÿ. Ñòðîèò ëîãàðèôìè÷åñêóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ëîãàðèôìè÷åñêèé òèï çàâèñèìîñòè. • Ïîëèíîìèàëüíàÿ. Ñòðîèò ïîëèíîìèàëüíóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ïîëèíîìèàëüíûé òèï çàâèñèìîñòè.  ïîëå Степень çàäàåòñÿ ñòåïåíü àïïðîêñèìèðóþùåãî ïîëèíîìà (çíà÷åíèå ìîæåò ëåæàòü â èíòåðâàëå îò 2 äî 6). • Ñòåïåííàÿ. Ñòðîèò ñòåïåííóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ñòåïåííîé òèï çàâèñèìîñòè. • Ýêñïîíåíöèàëüíàÿ. Ñòðîèò ýêñïîíåíöèàëüíóþ ëèíèþ íà îñíîâàíèè ðàññ÷èòàííîãî óðàâíåíèÿ íåëèíåéíîé ðåãðåññèè, èñïîëüçóþùåé ýêñïîíåíöèàëüíûé òèï çàâèñèìîñòè. • Ëèíåéíàÿ ôèëüòðàöèÿ. Ñòðîèò êðèâóþ ìåòîäîì ñêîëüçÿùåãî ñðåäíåãî. Êîëè÷åñòâî òî÷åê íà ýòîé êðèâîé ðàâíî ÷èñëó òî÷åê ðÿäà äàííûõ ìèíóñ ÷èñëî, óêàçàííîå â ïîëå Точки.  ýòîì ïîëå çàäàåòñÿ êîëè÷åñòâî òî÷åê, èñïîëüçóåìûõ äëÿ âû÷èñëåíèÿ ñêîëüçÿùåãî ñðåäíåãî. (Î ìåòîäå ñêîëüçÿùåãî ñðåäíåãî ðå÷ü èäåò â ðàçäåëå 5.17.) Íà ýòîé æå âêëàäêå èìååòñÿ ñïèñîê Построен на ряде, â êîòîðîì óêàçûâàåòñÿ, íà îñíîâå êàêîãî ðÿäà äàííûõ ñòðîèòñÿ ëèíèÿ òðåíäà. 208 Часть II. Средства Excel для статистического анализа Параметры линии тренда Îïöèè, ïðèâåäåííûå íà âêëàäêå Параметры äèàëîãîâîãî îêíà Линия тренда (ðèñ. 6.15), ïðåäëàãàþò ñëåäóþùèå âîçìîæíîñòè. • Название аппроксимирующей (сглаженной) кривой. Îïöèè ýòîé ãðóïïû ïîçâîëÿþò çàäàòü íàçâàíèå ëèíèè òðåíäà, ëèáî âûáðàâ ïðåäëàãàåìîå ïî óìîë÷àíèþ (ïåðåêëþ÷àòåëü автоматическое), ëèáî ââåäÿ ñâîé âàðèàíò èìåíè (ïåðåêëþ÷àòåëü другое). • Прогноз. Îïöèè ýòîé ãðóïïû çàäàþò ÷èñëî ïåðèîäîâ (êàê íàçàä, òàê è âïåðåä), íà êîòîðûå áóäåò âûïîëíåíà ýêñòðàïîëÿöèÿ ëèíèè òðåíäà. • Îïöèÿ пересечение кривой с осью Y в точке îïðåäåëÿåò òî÷êó ïåðåñå÷åíèÿ ëèíèè òðåíäà ñ îñüþ Y. • Îïöèè показывать уравнение на диаграмме è поместить на диаграмму величину достоверности аппроксимации (R^2) èñïîëüçóþòñÿ äëÿ îòîáðàæåíèÿ íà äèàãðàììå óðàâíåíèÿ ðåãðåññèè è çíà÷åíèÿ êîýôôèöèåíòà äåòåðìèíàöèè, êàê ïîêàçàíî íà ðèñ. 6.14. Ðèñ. 6.15. Âêëàäêà Параметры äèàëîãîâîãî îêíà Линия тренда Форматирование линии тренда Êàê è â ñëó÷àå èñïîëüçîâàíèÿ äðóãèõ ýëåìåíòîâ äèàãðàììû, ìîæåò âîçíèêíóòü íåîáõîäèìîñòü èçìåíèòü êàêèå-ëèáî ïàðàìåòðû îòîáðàæåíèÿ ëèíèè òðåíäà. Âûäåëèâ ëèíèþ òðåíäà, ìîæíî ôîðìàòèðîâàòü åå òî÷íî òàê æå, êàê è ëþáîé äðóãîé ýëåìåíò äèàãðàììû. Глава 6. Дополнительные возможности Excel для проведения статистического анализа 209 Äëÿ ôîðìàòèðîâàíèÿ ëèíèè òðåíäà âûïîëíèòå ñëåäóþùåå. 1. Âûäåëèòå ëèíèþ òðåíäà. 2. Èç ìåíþ Формат âûáåðèòå êîìàíäó Выделенная линия тренда, è îòêðîåòñÿ äèàëîãîâîå îêíî Формат линии тренда. 3. Íà âêëàäêå Вид äèàëîãîâîãî îêíà Формат линии тренда âûáåðèòå íåîáõîäèìûå ïàðàìåòðû ôîðìàòèðîâàíèÿ (ðèñ. 6.16). Ðèñ. 6.16. Âêëàäêà Вид äèàëîãîâîãî îêíà Формат линии тренда Äâå äðóãèå âêëàäêè äèàëîãîâîãî îêíà Формат линии тренда ïîâòîðÿþò âêëàäêè Тип è Параметры äèàëîãîâîãî îêíà Линия тренда. Ïîýòîìó â îêíå Формат линии тренда ìîæíî òàêæå èçìåíèòü òèï ëèíèè òðåíäà è åå ïàðàìåòðû. 6.2.2. Планки погрешностей Äëÿ îïðåäåëåííûõ òèïîâ äèàãðàìì ìîæíî äîáàâèòü ê òî÷êàì äàííûõ ïëàíêè ïîãðåøíîñòåé. Îíè îáû÷íî èñïîëüçóþòñÿ äëÿ òîãî, ÷òîáû ïîêàçàòü ñòåïåíü èçìåí÷èâîñòè çíà÷åíèÿ äàííûõ â êîíêðåòíîé òî÷êå. Ïëàíêè ïîãðåøíîñòåé äëÿ çíà÷åíèé îñè Y ïðèìåíÿþòñÿ òîëüêî äëÿ äèàãðàìì ñ îáëàñòÿìè, ãèñòîãðàìì, ãðàôèêîâ, ëèíåé÷àòûõ è òî÷å÷íûõ äèàãðàìì. Íàáîð äàííûõ òî÷å÷íîé äèàãðàììû ìîæåò èìåòü ïëàíêè ïîãðåøíîñòåé è äëÿ çíà÷åíèé îñè Õ, è äëÿ çíà÷åíèé îñè Y îäíîâðåìåííî. Ùåëêíèòå â äèàëîãîâîì îêíå Формат ряда данных íà âêëàäêå Y-погрешности, ÷òîáû âûâåñòè íà ýêðàí îïöèè, ïîêàçàííûå íà ðèñ. 6.17. 210 Часть II. Средства Excel для статистического анализа Ðèñ. 6.17. Âêëàäêà Y-погрешности äèàëîãîâîãî îêíà Формат ряда данных  Excel ìîæíî óñòàíîâèòü ñëåäóþùèå òèïû ïëàíîê ïîãðåøíîñòåé. • Ïåðåêëþ÷àòåëü фиксированное значение. Ïëàíêè ïîãðåøíîñòåé èìåþò çàäàííûé ôèêñèðîâàííûé ðàçìåð. • Ïåðåêëþ÷àòåëü относительное значение. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â ïðîöåíòàõ îò êàæäîãî çíà÷åíèÿ. • Ïåðåêëþ÷àòåëü стандартное отклонение. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â åäèíèöàõ ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ îò ñðåäíåãî çíà÷åíèÿ, êîòîðûå Excel âû÷èñëÿåò äëÿ ðÿäà äàííûõ. • Ïåðåêëþ÷àòåëü стандартная погрешность. Ðàçìåð ïëàíêè ïîãðåøíîñòåé çàäàåòñÿ â åäèíèöàõ ñðåäíåêâàäðàòè÷åñêîé îøèáêè, êîòîðóþ âû÷èñëÿåò Excel äëÿ ðÿäà äàííûõ. • Ïåðåêëþ÷àòåëü пользовательская. Çäåñü ìîæíî óêàçàòü ðàçìåð âåðõíåé è íèæíåé ïëàíîê ïîãðåøíîñòåé.  ïîëÿ ââîäà ýòîé îïöèè ìîæíî ââåñòè çíà÷åíèÿ èëè ññûëêó íà äèàïàçîí, â êîòîðîì ñîäåðæàòñÿ çíà÷åíèÿ ïîãðåøíîñòåé. Íà ðèñ. 6.18 ïîêàçàíà äèàãðàììà, ê êîòîðîé áûëè äîáàâëåíû ïëàíêè ïîãðåøíîñòåé. Ìîæíî îòêðûòü äèàëîãîâîå îêíî Формат планок погрешностей è ñ åãî ïîìîùüþ èçìåíèòü âíåøíèé âèä ïëàíîê ïîãðåøíîñòåé, íàïðèìåð ñòèëü ëèíèé è öâåò. Глава 6. Дополнительные возможности Excel для проведения статистического анализа 211 Ðèñ. 6.18. Íà äèàãðàììå ê ðÿäó äàííûõ äîáàâëåíû ïëàíêè ïîãðåøíîñòåé 6.2.3. Построение гистограмм и функций распределения дискретных случайных величин Îáû÷íî äëÿ ïîñòðîåíèÿ ãèñòîãðàìì äèñêðåòíûõ ðàñïðåäåëåíèé â Excel èñïîëüçóåòñÿ òèï äèàãðàììû Гистограмма. Îäíàêî ýòîò òèï äèàãðàììû ìîæíî èñïîëüçîâàòü òîëüêî òîãäà, êîãäà çíà÷åíèÿ, ïðèíèìàåìûå äèñêðåòíîé ñëó÷àéíîé âåëè÷èíîé, ðàñïîëàãàþòñÿ íà îñè ÎÕ ðàâíîìåðíî (ò.å. ÷åðåç ðàâíûå ïðîìåæóòêè). Åñëè æå îíè ðàñïîëàãàþòñÿ íåðàâíîìåðíî, òî ïîäõîäèò òîëüêî òèï äèàãðàììû Точечная. Íî ýòîò òèï äèàãðàììû íå ïîçâîëÿåò ñòðîèòü ñòîëáöîâûå äèàãðàììû. Îòìåòèì, ÷òî ñðåäñòâî Гистограмма èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.2) òàêæå íå ìîæåò ñòðîèòü ãèñòîãðàììû äëÿ íåðàâíîìåðíî ðàñïðåäåëåííûõ çíà÷åíèé. Èç ýòîé ñèòóàöèè ïðåäëàãàåì ñëåäóþùèé âûõîä. Ïóñòü èìååòñÿ âåðîÿòíîñòíàÿ òàáëèöà, â ñòîëáöå À ñîäåðæàùàÿ çíà÷åíèÿ, êîòîðûå ìîæåò ïðèíèìàòü ñëó÷àéíàÿ âåëè÷èíà, à â ñòîëáöå  — âåðîÿòíîñòè ïðèíÿòèÿ ýòèõ çíà÷åíèé, êàê ïîêàçàíî íà ðèñ. 6.19. Ñòðîèòñÿ äèàãðàììà òèïà Точечная áåç ëèíèé, ñîåäèíÿþùèõ òî÷êè äàííûõ. Çàòåì âûäåëÿåòñÿ ðÿä äàííûõ è âûáèðàåòñÿ êîìàíäà ФорматÖВыделенный ряд.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Формат ряда данных ïåðåõîäèì íà âêëàäêó Y-погрешности è çàäàåì ïëàíêó ïîãðåøíîñòè òèïà Минус.  êà÷åñòâå âåëè÷èíû ïîãðåøíîñòè çàäàåì Относительное значение 100% (ðèñ. 6.20). Íà ãðàôèêå ïîÿâëÿþòñÿ âåðòèêàëüíûå ñòîëáöû îò çíà÷åíèé äàííûõ äî îñè Õ. Òåïåðü îñòàåòñÿ îòôîðìàòèðîâàòü ïëàíêè ïîãðåøíîñòåé è çíà÷åíèÿ äàííûõ. Ó çíà÷åíèé äàííûõ óáèðàåì ìàðêåðû (îïöèÿ Отсутствует â îáëàñòè Маркер âêëàäêè Вид äèàëîãîâîãî îêíà Формат ряда данных), äëÿ ïëàíîê ïîãðåøíîñòåé â äèàëîãîâîì îêíå Формат планок погрешностей íà âêëàäêå Вид âûáèðàåì âèä Ðèñ. 6.19. ×àñòîòíàÿ òàáëèöà 212 Часть II. Средства Excel для статистического анализа ïëàíêè áåç ãîðèçîíòàëüíîé ëèíèè è äåëàåì åå ìàêñèìàëüíî “òîëñòîé” (ýòè îïöèè ïîêàçàíû íà ðèñ. 6.21).  ðåçóëüòàòå ïîëó÷àåì ãèñòîãðàììó âûáîðêè, ïîêàçàííóþ íà ðèñ. 6.22. Ðèñ. 6.20. Äèàëîãîâîå îêíî Формат ряда данных Ðèñ. 6.21. Äèàëîãîâîå îêíî Формат планок погрешностей Глава 6. Дополнительные возможности Excel для проведения статистического анализа 213 Ðèñ. 6.22. Ãèñòîãðàììà äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ Òàêóþ äèàãðàììó ìîæíî ñîõðàíèòü êàê íåñòàíäàðòíóþ â ñðåäñòâå ïîñòðîåíèÿ äèàãðàìì Excel äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ. Äëÿ ýòîãî âûäåëèòå äèàãðàììó, âûïîëíèòå êîìàíäó ДиаграммаÖТип диаграммы, â îòêðûâøåìñÿ äèàëîãîâîì îêíå Тип диаграммы ïåðåéäèòå íà âêëàäêó Нестандартные, óñòàíîâèòå ïåðåêëþ÷àòåëü Дополнительные è ùåëêíèòå íà êíîïêå Добавить.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Добавление нового типа диаграммы ïðèñâîéòå èìÿ ýòîìó òèïó äèàãðàììû è äàéòå åå îïèñàíèå. Ïîñòðîåíèå ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí òàêæå èìååò íåêîòîðûå ñëîæíîñòè, ïîñêîëüêó òàêàÿ ôóíêöèÿ èìååò ñòóïåí÷àòûé âèä, íî íè ñðåäñòâî ïîñòðîåíèÿ äèàãðàìì Excel, íè ñðåäñòâî Гистограмма èç ïàêåòà àíàëèçà òàêèå ãðàôèêè ñòðîèòü íå ìîæåò. Ïîêàæåì, êàê âñå-òàêè â Excel ïîñòðîèòü òàêîé ãðàôèê. Ïóñòü çàäàíû çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, êàê ïîêàçàíî íà ðèñ. 6.23. ×òîáû ïîäñ÷èòàòü ýòè çíà÷åíèÿ íà îñíîâå èçâåñòíûõ âåðîÿòíîñòåé îòäåëüíûõ çíà÷åíèé, â ÿ÷åéêó Ñ2 (åñëè äàííûå ðàñïîëàãàþòñÿ òàê æå, êàê íà ðèñ. 6.23) çàïèñûâàåòñÿ ôîðìóëà =В2, â ÿ÷åéêó Ñ3 — =С2+В3. Çàòåì ýòà ôîðìóëà ðàñïðîñòðàíÿåòñÿ âíèç äî ÿ÷åéêè Ñ8. ×òîáû ïîñòðîèòü ñòóïåí÷àòûé ãðàôèê ôóíêöèè ðàñïðåäåëåíèÿ, íåêîòîðûå îïåðàöèè ïðèäåòñÿ âûïîëíèòü âðó÷íóþ. Ñíà÷àëà âñòàâèì ïóñòîé ñòîëáåö ïåðåä ñòîëáöîì, ñîäåðæàùèì çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, è ñêîïèðóåì â íåãî âûáîðî÷íûå çíà÷åíèÿ èç ñòîëáöà À. Çàòåì ïåðåä êàæäîé ñòðîêîé â ñòîëáöàõ Ñ è D (òåïåðü â ñòîëáöå D íàõîäÿòñÿ çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ) âñòàâèì ïî ïóñòîé ñòðîêå, ñäâèãàÿ ÿ÷åéêè âíèç. Äîëæíî ïîëó÷èòüñÿ òàê, êàê ïîêàçàíî íà ðèñ. 6.24. Äàëåå â ÿ÷åéêó Ñ2 ââåäåì ôîðìóëó =С3-0,0000001, à â ÿ÷åéêó D2 — ÷èñëî 0. Ôîðìóëó èç ÿ÷åéêè Ñ2 ñêîïèðóåì â ÿ÷åéêó Ñ4, à â ÿ÷åéêó D4 ââåäåì ôîðìóëó =D3. Âûäåëèì ÿ÷åéêè Ñ4:D4 è ñêîïèðóåì èõ âî âñå ñâîáîäíûå ÿ÷åéêè âíèç äî ñòðîêè 14.  ÿ÷åéêó Ñ16 ìîæíî ââåñòè ÷èñëî 5, à â ÿ÷åéêó D16 — ÷èñëî 1 (íî ýòî íå îáÿçàòåëüíî). Ðàáî÷èé ëèñò íà ýòîì ýòàïå ïîêàçàí íà ðèñ. 6.25. 214 Часть II. Средства Excel для статистического анализа Ðèñ. 6.23. Âû÷èñëåíèå çíà÷åíèé ôóíêöèè ðàñïðåäåëåíèÿ Ðèñ. 6.24. Âñòàâêà ïóñòûõ ÿ÷ååê Òåïåðü äëÿ ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äîñòàòî÷íî ïîñòðîèòü ñðåäñòâàìè Excel äèàãðàììó òèïà Точечная ñ ñîåäèíèòåëüíûìè ëèíèÿìè áåç ìàðêåðîâ íà îñíîâå äàííûõ äèàïàçîíà Ñ2:D16. Ãîòîâàÿ îòôîðìàòèðîâàííàÿ äèàãðàììà ïîêàçàíà íà ðèñ. 6.26. ×òîáû ïðîâåñòè ïóíêòèðíûå ëèíèè â óçëîâûõ òî÷êàõ ãðàôèêà, èñïîëüçóþòñÿ ïëàíêè ïîãðåøíîñòåé, êàê îïèñàíî âûøå, ïðè ïîñòðîåíèè ãèñòîãðàììû. Òàêóþ äèàãðàììó ìîæíî ñîõðàíèòü êàê íåñòàíäàðòíóþ äëÿ äàëüíåéøåãî èñïîëüçîâàíèÿ. 6.2.4. Гистограммы с перекрытием Òî, ÷òî áóäåò ïîêàçàíî â ýòîì ðàçäåëå, îòíîñèòñÿ ê “ìàëåíüêèì ñåêðåòàì” ôîðìàòèðîâàíèÿ äèàãðàìì è íå èãðàåò ïðèíöèïèàëüíîé ðîëè, îäíàêî ïîçâîëÿåò ñäåëàòü, íàïðèìåð, ãèñòîãðàììû ÷àñòîò áîëåå íàãëÿäíûìè äëÿ ñðàâíåíèÿ. Îáû÷íî íà ãèñòîãðàììàõ, ïîñòðîåííûõ ïî íåñêîëüêèì ðÿäàì äàííûõ, ñòîëáöû, ñîîòâåòñòâóþùèå ðàçíûì ðÿäàì äàííûõ, èìåþò îäíó è òó æå øèðèíó, îïðåäåëÿåìóþ ïàðàìåòðîì Ширина зазора íà âêëàäêå Параметры äèàëîãîâîãî îêíà Формат ряда Глава 6. Дополнительные возможности Excel для проведения статистического анализа 215 данных. Åñëè ñîâìåñòèòü ñòîëáöû ðàçíûõ ðÿäîâ äàííûõ, òî îíè ïåðåêðûâàþò äðóã äðóãà è äèàãðàììà ñòàíîâèòñÿ íå÷èòàåìîé. ×òîáû ñäåëàòü ñòîëáöû ðàçíîé øèðèíû, êàê ïîêàçàíî íà ðèñ. 6.27, çíà÷åíèÿ îäíîãî èëè íåñêîëüêèõ ðÿäîâ äàííûõ ñëåäóåò îòëîæèòü íà äîïîëíèòåëüíîé îñè, à çàòåì ñäåëàòü ýòó îñü íåâèäèìîé è îòìåíèòü çàëèâêó äëÿ îäíîãî èç ðÿäîâ äàííûõ. Ðèñ. 6.25. Âñå ãîòîâî äëÿ ïîñòðîåíèÿ ãðàôèêà Ðèñ. 6.26. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ 216 Часть II. Средства Excel для статистического анализа Ðèñ. 6.27. Ãèñòîãðàììà ñ ïåðåêðûòèåì Äëÿ ñîçäàíèÿ ïîäîáíîãî ýôôåêòà âûïîëíèòå ñëåäóþùåå. 1. Íà÷íèòå ñ ïîñòðîåíèÿ ãèñòîãðàììû. 2. Âûäåëèòå îäèí èç ðÿäîâ äàííûõ. 3. Èç ìåíþ Формат âûáåðèòå êîìàíäó Выделенный ряд, è îòêðîåòñÿ äèàëîãîâîå îêíî Формат ряда данных. 4. Ïåðåéäèòå íà âêëàäêó Вид è â ãðóïïå Заливка óñòàíîâèòå ïåðåêëþ÷àòåëü прозрачная. 5. Ïåðåéäèòå íà âêëàäêó вспомогательной оси. Ось è óñòàíîâèòå ïåðåêëþ÷àòåëü по 6. Ïåðåéäèòå íà âêëàäêó Параметры (ðèñ. 6.28). 7. Ïðèñâîéòå ïàðàìåòðó Перекрытие çíà÷åíèå 0, à ïàðàìåòðó Ширина зазора — çíà÷åíèå 50. 8. Ùåëêíèòå íà êíîïêå ОК. 6.3. Надстройка Поиск решения Поиск решения — ýòî íàäñòðîéêà, âõîäÿùàÿ â ïîñòàâêó Excel è ïðåäíàçíà÷åííàÿ äëÿ ðåøåíèÿ çàäà÷ ëèíåéíîé è íåëèíåéíîé îïòèìèçàöèè1. Äëÿ ýòîãî â íåé èñïîëüçóþòñÿ ìåòîäû è àëãîðèòìû ìàòåìàòè÷åñêîãî ïðîãðàììèðîâàíèÿ, êîòîðûå ïîçâîëÿþò íàõîäèòü îïòèìàëüíûå ðåøåíèÿ çàäà÷ îïòèìèçàöèè, ïðåäñòàâëåííûõ â Excel â âèäå òàáëè÷íûõ ìîäåëåé. Äëÿ ëèíåéíûõ çàäà÷ íàäñòðîéêà Поиск решения èñïîëüçóåò ñèìïëåêñ-ìåòîä, äëÿ çàäà÷ öåëî÷èñëåííîãî ïðîãðàììèðîâàíèÿ — 1 Íàäñòðîéêà Поиск решения (â îðèãèíàëüíîé àíãëîÿçû÷íîé âåðñèè Excel îíà íàçûâàåòñÿ Solver) ðàçðàáîòàíà êîìïàíèåé Frontline Systems (http://www.frontsys.com). Ýòîé æå êîìïàíèåé ðàçðàáîòàíî íåñêîëüêî ðàñøèðåííûõ êîììåð÷åñêèõ ïðîãðàìì-îïòèìèçàòîðîâ, â òîì ÷èñëå íàäñòðîéêà Premium Edition Solver, êîòîðàÿ íå òîëüêî ðàñøèðÿåò âîçìîæíîñòè ñòàíäàðòíîé íàäñòðîéêè Поиск решения (íàïðèìåð, ñîäåðæèò íåñêîëüêî ñïîñîáîâ êîððåêöèè îøèáîê è ãåíåðèðóåò äîïîëíèòåëüíûå îò÷åòû), íî è èìååò íåñêîëüêî íîâûõ âñòðîåííûõ àëãîðèòìîâ ðåøåíèÿ ñóùåñòâåííî íåëèíåéíûõ çàäà÷, â òîì ÷èñëå ãåíåòè÷åñêèé àëãîðèòì. Глава 6. Дополнительные возможности Excel для проведения статистического анализа 217 ìåòîä âåòâåé è ãðàíèö è äëÿ íåëèíåéíûõ çàäà÷ — ìåòîä ïðèâåäåííîãî ãðàäèåíòà. Ïîäðîáíûå ñâåäåíèÿ î íàäñòðîéêå Поиск решения è åå èñïîëüçîâàíèè äëÿ ðåøåíèÿ îïòèìèçàöèîííûõ çàäà÷, ìîæíî íàéòè â êíèãå [12]. Ðèñ. 6.28. Óñòàíîâêà çíà÷åíèÿ ïåðåêðûòèÿ è øèðèíû çàçîðà Ñðåäñòâî Поиск решения ìîæíî ýôôåêòèâíî èñïîëüçîâàòü íå òîëüêî ïðè ðåøåíèè çàäà÷ îïòèìèçàöèè, íî è ïðè ïðîâåäåíèè ñòàòèñòè÷åñêîãî àíàëèçà. Íèæå áóäóò ïîêàçàíû ïðèìåðû ïðèìåíåíèÿ ñðåäñòâà Поиск решения äëÿ ðåøåíèÿ ñèñòåì ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé (ìîæíî èñïîëüçîâàòü äëÿ âû÷èñëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè) è äëÿ ïîäáîðà ïàðàìåòðîâ ðàñïðåäåëåíèé. Äðóãèå ïðèìåíåíèÿ ñðåäñòâà Поиск решения äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí ïîêàçàíû â ãëàâå 7. 6.3.1. Задачи оптимизации и средство Поиск решения Ïîñêîëüêó ðàññìàòðèâàåìîå çäåñü ñðåäñòâî ïðåäíàçíà÷åíî, â ïåðâóþ î÷åðåäü, äëÿ ðåøåíèÿ çàäà÷ îïòèìèçàöèè, íåîáõîäèìî èìåòü õîòÿ áû îáùåå ïðåäñòàâëåíèå îá ýòèõ çàäà÷àõ è çíàòü ñîîòâåòñòâóþùóþ òåðìèíîëîãèþ, òàê êàê îíà èñïîëüçóåòñÿ ïðè çàäàíèè ïàðàìåòðîâ äàííîãî ñðåäñòâà. Ïîýòîìó ïðèâåäåì îáùóþ ôîðìóëèðîâêó çàäà÷ îïòèìèçàöèè è ïîêàæåì, êàê ïðåäñòàâèòü åå â âèäå òàáëè÷íîé ìîäåëè íà ðàáî÷åì ëèñòå Excel. Îáùóþ çàäà÷ó îïòèìèçàöèè ìîæíî ñôîðìóëèðîâàòü ñëåäóþùèì îáðàçîì. Ïóñòü X = (x1, x2, ..., xn) — âåêòîð äåéñòâèòåëüíûõ ïåðåìåííûõ. Íåîáõîäèìî ìèíèìèçèðîâàòü (èëè ìàêñèìèçèðîâàòü) öåëåâóþ ôóíêöèþ z = f(X) ïðè âûïîëíåíèè îãðàíè÷åíèé g1(X) ≤ b1, 218 Часть II. Средства Excel для статистического анализа g2(X) ≤ b2, ... gm(X) ≤ bm. Îáû÷íî ïðåäïîëàãàåòñÿ, ÷òî ôóíêöèè f(X) è gi(X) (i = 1, 2, ..., m) äâàæäû íåïðåðûâíî äèôôåðåíöèðóåìû. ×àñòî äîáàâëÿþòñÿ óñëîâèÿ íåîòðèöàòåëüíîñòè ïåðåìåííûõ X ≥ 0, êîòîðûå ìîãóò êàê âêëþ÷àòüñÿ â óêàçàííûå m îãðàíè÷åíèé, òàê è íå âêëþ÷àòüñÿ. Ñðåäè îãðàíè÷åíèé ìîãóò áûòü îãðàíè÷åíèÿ â âèäå íåðàâåíñòâ è â âèäå ðàâåíñòâ. Âåêòîð (b1, b2, ..., bm) íàçûâàåòñÿ âåêòîðîì ïðàâûõ ÷àñòåé îãðàíè÷åíèé. Åñëè âñå ôóíêöèè f(X) è gi(X) ëèíåéíû îòíîñèòåëüíî ïåðåìåííûõ x1, x2, ..., xn, èìååì çàäà÷ó ëèíåéíîé îïòèìèçàöèè; åñëè õîòÿ áû îäíà èç ýòèõ ôóíêöèé íåëèíåéíàÿ, ïîëó÷àåì çàäà÷ó íåëèíåéíîé îïòèìèçàöèè. Èòàê, çàäà÷à îïòèìèçàöèè âêëþ÷àåò òðè “îáúåêòà”: ïåðåìåííûå x1, x2, ..., xn (â ñðåäñòâå Поиск решения ÿ÷åéêè, ñîäåðæàùåé çíà÷åíèÿ ýòèõ ïåðåìåííûõ, îíè íàçûâàþòñÿ èçìåíÿåìûìè ÿ÷åéêàìè), öåëåâàÿ ôóíêöèÿ (ÿ÷åéêà, ñîäåðæàùàÿ çíà÷åíèå ýòîé ôóíêöèè â ñðåäñòâå Поиск решения, íàçûâàåòñÿ öåëåâîé ÿ÷åéêîé) è îãðàíè÷åíèÿ (äëÿ ïðèìåíåíèÿ ñðåäñòâà Поиск решения îãðàíè÷åíèÿ ìîãóò áûòü çàïèñàíû íà ðàáî÷åì ëèñòå è çàòåì óêàçàíû â äèàëîãîâîì îêíå ýòîãî ñðåäñòâà ëèáî çàäàíû íåïîñðåäñòâåííî â ýòîì îêíå áåç çàïèñè íà ðàáî÷åì ëèñòå). Ïðè çàäàíèè îãðàíè÷åíèé îòäåëüíî óêàçûâàþòñÿ ôóíêöèè îãðàíè÷åíèé gi(X) (i = 1, 2, ..., m) è âåêòîð ïðàâûõ ÷àñòåé îãðàíè÷åíèé (b1, b2, ..., bm). Ïðè ñîçäàíèè òàáëè÷íîé ìîäåëè îïòèìèçàöèè â Excel ïðåäëàãàåì ó÷èòûâàòü ñëåäóþùèå ðåêîìåíäàöèè, êîòîðûå îáëåã÷àò äàëüíåéøåå ïðèìåíåíèå ñðåäñòâà Поиск решения. • Çíà÷åíèÿ ïåðåìåííûõ ðàñïîëàãàþòñÿ â îòäåëüíûõ ÿ÷åéêàõ è ãðóïïèðóþòñÿ â îòäåëüíûé áëîê ÿ÷ååê. • Êàæäîìó îãðàíè÷åíèþ îòâîäèòñÿ îòäåëüíàÿ ñòðîêà èëè ñòîëáåö òàáëèöû. Îãðàíè÷åíèÿ ãðóïïèðóþòñÿ â îòäåëüíûé áëîê ÿ÷ååê. • Æåëàòåëüíî, ÷òîáû ÿ÷åéêè, ñîäåðæàùèå ïåðåìåííûå è çíà÷åíèå öåëåâîé ôóíêöèè, à òàêæå âñå îãðàíè÷åíèÿ, èìåëè çàãîëîâêè. • Êîýôôèöèåíòû öåëåâîé ôóíêöèè äîëæíû õðàíèòüñÿ â îòäåëüíîé ñòðîêå, ðàñïîëàãàÿñü íåïîñðåäñòâåííî ïîä èëè íàä ñîîòâåòñòâóþùèìè ïåðåìåííûìè; ôîðìóëà äëÿ âû÷èñëåíèÿ öåëåâîé ôóíêöèè äîëæíà íàõîäèòüñÿ â ñîñåäíåé ÿ÷åéêå. •  êàæäîé ñòðîêå îãðàíè÷åíèé çà ÿ÷åéêàìè, ñîäåðæàùèìè êîýôôèöèåíòû äàííîãî îãðàíè÷åíèÿ, ñëåäóåò ÿ÷åéêà, â êîòîðóþ çàïèñûâàåòñÿ âû÷èñëåííîå çíà÷åíèå ôóíêöèè îãðàíè÷åíèÿ (çíà÷åíèå ëåâîé ÷àñòè îãðàíè÷åíèÿ). Çà íåé ìîæåò ñëåäîâàòü ÿ÷åéêà, â êîòîðîé ñòîèò ñîîòâåòñòâóþùèé çíàê íåðàâåíñòâà èëè ðàâåíñòâà îãðàíè÷åíèÿ, à çàòåì ÿ÷åéêà, ñîäåðæàùàÿ çíà÷åíèå ïðàâîé ÷àñòè îãðàíè÷åíèÿ. Äîïîëíèòåëüíî ìîæíî èìåòü ÿ÷åéêó, â êîòîðîé âû÷èñëåíà ðàçíîñòü ìåæäó çíà÷åíèÿìè ëåâîé è ïðàâîé ÷àñòåé íåðàâåíñòâà. • Óñëîâèÿ íåîòðèöàòåëüíîñòè ïåðåìåííûõ ðåøåíèÿ íå îáÿçàòåëüíî âêëþ÷àòü â òàáëè÷íóþ ìîäåëü. Êàê ïðàâèëî, îíè îïóñêàþòñÿ è óêàçûâàþòñÿ íåïîñðåäñòâåííî â äèàëîãîâîì îêíå ñðåäñòâà Поиск решения. Глава 6. Дополнительные возможности Excel для проведения статистического анализа 219  ðåçóëüòàòå âûïîëíåíèÿ ýòèõ ðåêîìåíäàöèé âñå îñíîâíûå êîýôôèöèåíòû ìîäåëè ñîäåðæàòñÿ â îòäåëüíûõ ÿ÷åéêàõ, ïîýòîìó èõ ëåãêî èçìåíÿòü, íå ìåíÿÿ ôîðìóë ìîäåëè. Áëàãîäàðÿ ãðóïïèðîâàíèþ óïðîùàåòñÿ ðàáîòà ñî ñðåäñòâîì Поиск решения, ïîñêîëüêó äëÿ óêàçàíèÿ ïåðåìåííûõ èëè îãðàíè÷åíèé ìîæíî èñïîëüçîâàòü äèàïàçîíû ÿ÷ååê, ò.å. çàäàâàòü ïåðåìåííûå è îãðàíè÷åíèÿ ãðóïïîé, à íå ïî îòäåëüíîñòè. Íà ðèñ. 6.29 ïîêàçàíà òàáëè÷íàÿ ìîäåëü äëÿ ñëåäóþùåé ïðîñòîé çàäà÷è: ìèíèìèçèðîâàòü z = 2õ1 + 3õ2 + 5õ3 ïðè îãðàíè÷åíèÿõ õ1 + õ2 – õ3 ≥ –5, –6õ1 + 7õ2 – 9õ3 ≤ 4, õ1 + õ2 + 4õ3 = 10. Íà ïåðåìåííûå õ1 è õ2 òàêæå íàêëàäûâàþòñÿ óñëîâèÿ íåîòðèöàòåëüíîñòè2. Ðèñ. 6.29. Òàáëè÷íàÿ ìîäåëü çàäà÷è îïòèìèçàöèè Íà ýòîì æå ïðèìåðå íàíåñåì ïåðâûé “âèçèò” ê ñðåäñòâó Поиск решения. Íî ñíà÷àëà ñäåëàåì ñëåäóþùåå çàìå÷àíèå. Íàäñòðîéêà Поиск решения, õîòÿ è âõîäèò â ïîñòàâêó Excel, íå ïîäêëþ÷àåòñÿ àâòîìàòè÷åñêè ê ýòîé ïðîãðàììå. Ïîýòîìó, åñëè â ìåíþ Сервис íåò êîìàíäû Поиск решения, çíà÷èò, íàäñòðîéêà íå ïîäêëþ÷åíà. Äëÿ åå ïîäêëþ÷åíèÿ íàäî âûïîëíèòü êîìàíäó СервисÖНадстройки è â îòêðûâøåìñÿ äèàëîãîâîì îêíå Надстройки óñòàíîâèòü ôëàæîê ïåðåä îïöèåé Поиск решения. Íàäñòðîéêà Поиск решения èñïîëüçóåòñÿ ñëåäóþùèì îáðàçîì. 1. Îòêðîéòå Excel è ñîçäàéòå òàáëè÷íóþ ìîäåëü. 2. Ïîñëå îòëàäêè ìîäåëè ïåðåéäèòå ê ýòàïó îïòèìèçàöèè, âûáðàâ êîìàíäó Поиск решения â ìåíþ Сервис. 3.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Поиск решения óêàæèòå äàííûå, íåîáõîäèìûå äëÿ ïðîöåññà îïòèìèçàöèè (ðèñ. 6.30). a)  ïîëå Установить целевую ячейку ââîäèòñÿ àäðåñ ÿ÷åéêè, ñîäåðæàùåé çíà÷åíèå öåëåâîé ôóíêöèè. Äëÿ íàøåé ìîäåëè â ýòî ïîëå ñëåäóåò ââå2 Çäåñü ôîðìóëèðîâêà çàäà÷è ïðåäíàìåðåííî íå ïðèâåäåíà ê “ïðàâèëüíîìó” âèäó (êîãäà îãðàíè÷åíèÿ èìåþò îäèí òèï è ò.ï.), ÷òîáû ñäåëàòü ýòîò ìàëåíüêèé ïðèìåð ìàêñèìàëüíî îáîáùåííûì. 220 Часть II. Средства Excel для статистического анализа ñòè Е4, íî ëó÷øå ùåëêíóòü óêàçàòåëåì ìûøè íà ýòîé ÿ÷åéêå, ÷òîáû ââåñòè åå àäðåñ àâòîìàòè÷åñêè. á) Îïöèè îáëàñòè Равной äèàëîãîâîãî îêíà Поиск решения ïîçâîëÿþò çàäàòü òèï îïòèìèçàöèè.  äàííîì ñëó÷àå íåîáõîäèìî ìèíèìèçèðîâàòü çíà÷åíèå öåëåâîé ôóíêöèè. Äëÿ ýòîãî íóæíî ùåëêíóòü íà ïåðåêëþ÷àòåëå минимальному значению. Ùåë÷îê íà ïåðåêëþ÷àòåëå максимальному значению óêàæåò, ÷òî ñëåäóåò ìàêñèìèçèðîâàòü öåëåâóþ ôóíêöèþ. Ìîæíî òàêæå ñäåëàòü çíà÷åíèå öåëåâîé ôóíêöèè ðàâíûì çàäàííîìó ÷èñëó, óñòàíîâèâ ïåðåêëþ÷àòåëü значению è ââåäÿ ýòî ÷èñëî. â) Ïîëå Изменяя ячейки ïîçâîëÿåò óêàçàòü ÿ÷åéêè, â êîòîðûõ ñîäåðæàòñÿ ïåðåìåííûå ìîäåëè; â äàííîì ñëó÷àå ýòî äèàïàçîí B3:D3. (Ìîæíî ïîïðîáîâàòü âîñïîëüçîâàòüñÿ êíîïêîé Предположить, íî ïðè ýòîì îáû÷íî ïðåäëàãàþòñÿ íåâåðíûå àäðåñà ÿ÷ååê ïåðåìåííûõ.) ã) Äàëåå íåîáõîäèìî çàäàòü îãðàíè÷åíèÿ. Ùåë÷îê íà êíîïêå Добавить îòêðûâàåò äèàëîãîâîå îêíî Добавление ограничения, ïîêàçàííîå íà ðèñ. 6.31. Ïî óìîë÷àíèþ ïðåäïîëàãàåòñÿ, ÷òî îãðàíè÷åíèå èìååò âèä íåðàâåíñòâà ñî çíàêîì ≤. Åñëè òàáëè÷íàÿ ìîäåëü îðãàíèçîâàíà òàê, ÷òî íåðàâåíñòâà îäíîãî çíàêà ðàñïîëîæåíû ðÿäîì, òî èõ ìîæíî ââåñòè âñå âìåñòå, èñïîëüçóÿ äèàïàçîíû ÿ÷ååê.  ïðîòèâíîì ñëó÷àå ïðèäåòñÿ ââîäèòü îãðàíè÷åíèÿ ïî îòäåëüíîñòè, ùåëêàÿ íà êíîïêå Добавить äèàëîãîâîãî îêíà Добавление ограничения. Çàìåòèì, ÷òî â ïîëå Ссылка на ячейку íåëüçÿ ââîäèòü ôîðìóëû — ýòî äîëæíû áûòü ññûëêè íà ÿ÷åéêè, êîòîðûå, â ñâîþ î÷åðåäü, ìîãóò ñîäåðæàòü ôîðìóëû. ä) Ñëåäóåò ïîìíèòü îá óñëîâèÿõ íåîòðèöàòåëüíîñòè äëÿ ñîäåðæèìîãî ÿ÷ååê B3 è C3. ×òîáû ââåñòè ýòè îãðàíè÷åíèÿ, â äèàëîãîâîì îêíå Добавление ограничения óêàæèòå äèàïàçîí B3:C3, âûáåðèòå çíàê íåðàâåíñòâà >= è â ïîëå Ограничение ââåäèòå 0. Åñëè óñëîâèå íåîòðèöàòåëüíîñòè íàêëàäûâàåòñÿ íà âñå ïåðåìåííûå, òî ýòî óñëîâèå ìîæíî çàäàòü â äèàëîãîâîì îêíå Параметры поиска решения (îïöèÿ Неотрицательные значения), êîòîðîå îòêðûâàåòñÿ ïîñëå ùåë÷êà íà êíîïêå Параметры äèàëîãîâîãî îêíà Поиск решения. 4. Ïîñêîëüêó ìû ðàáîòàåì ñ ëèíåéíîé ìîäåëüþ, â äèàëîãîâîì îêíå Параметры поиска решения óñòàíîâèòå ôëàæîê îïöèè Линейная модель, à òàêæå Автоматическое масштабирование (ðèñ. 6.32). Ðåæèì Автоматическое масштабирование ïðåäíàçíà÷åí äëÿ ìàñøòàáèðîâàíèÿ ÷èñëîâûõ çíà÷åíèé â ìîäåëè òàêèì îáðàçîì, ÷òîáû ðàçíîñòü ìåæäó íàèáîëüøèì è íàèìåíüøèì ÷èñëàìè â ìîäåëè áûëà êàê ìîæíî ìåíüøåé, èíà÷å â ïðîöåññå âû÷èñëåíèé ìîãóò âîçíèêíóòü áîëüøèå îøèáêè îêðóãëåíèÿ è ðåçóëüòàò ìîæåò áûòü äàëåêèì îò èñòèííîãî ðåøåíèÿ. Îñòàëüíûå îïöèè ýòîãî îêíà ìîæíî îñòàâèòü áåç èçìåíåíèÿ — îíè, â îñíîâíîì, îòíîñÿòñÿ ê îïòèìèçàöèè öåëî÷èñëåííûõ è íåëèíåéíûõ ìîäåëåé. Ùåëêíèòå íà êíîïêå OK, ÷òîáû âåðíóòüñÿ â äèàëîãîâîå îêíî Поиск решения. 5. Ïîñëå çàäàíèÿ íåîáõîäèìûõ äàííûõ (óêàçàíèÿ ÿ÷åéêè, ñîäåðæàùåé ôîðìóëó äëÿ âû÷èñëåíèÿ öåëåâîé ôóíêöèè, óêàçàíèÿ ÿ÷ååê, â êîòîðûõ íàõîäÿòñÿ ïåðåìåííûå, è çàäàíèÿ îãðàíè÷åíèé) ùåëêíèòå íà êíîïêå Выполнить. Глава 6. Дополнительные возможности Excel для проведения статистического анализа 221 6. Ñðåäñòâî Поиск решения âûïîëíÿåò îïòèìèçàöèþ.  ïðîöåññå âû÷èñëåíèé â ñòðîêå ñîñòîÿíèÿ îòîáðàæàþòñÿ ÷èñëî èòåðàöèé è çíà÷åíèÿ öåëåâîé ôóíêöèè ïðè ïåðåáîðå ìíîæåñòâà äîïóñòèìûõ ðåøåíèé çàäà÷è. Ýòà èíôîðìàöèÿ ïîçâîëÿåò ñëåäèòü, êàê ïðîäâèãàåòñÿ ïðîöåññ îïòèìèçàöèè áîëüøèõ ìîäåëåé, ãäå îí ìîæåò äëèòüñÿ äîñòàòî÷íî äîëãî. 7. Åñëè â òàáëè÷íîé ìîäåëè íåò îøèáîê, Поиск решения âûâåäåò íà ýêðàí äèàëîãîâîå îêíî Результаты поиска решения (ðèñ. 6.33), â êîòîðîì ìîæíî óêàçàòü, îáíîâèòü ëè èñõîäíóþ ìîäåëü (ò.å. çàíåñòè ëè â ÿ÷åéêè çíà÷åíèÿ îïòèìàëüíîãî ðåøåíèÿ) è ñîçäàâàòü ëè îò÷åò. . Ðèñ. 6.30. Çàäàíèå ïàðàìåòðîâ äëÿ ïîèñêà ðåøåíèÿ Ðèñ. 6.31. Çàäàíèå îãðàíè÷åíèé 222 Часть II. Средства Excel для статистического анализа Ðèñ. 6.32. Äèàëîãîâîå îêíî Параметры поиска решения Ðèñ. 6.33. Óñïåøíîå çàâåðøåíèå ðåøåíèÿ çàäà÷è îïòèìèçàöèè Äèàëîãîâîå îêíî Результаты поиска решения ñîîáùàåò î çàâåðøåíèè ïîèñêà (ñì. ðèñ. 6.33). Òî, ÷òî ïðîãðàììà Поиск решения çàâåðøèëà ðàáîòó, íå îçíà÷àåò, ÷òî îíà íàøëà îïòèìàëüíîå ðåøåíèå. Åñëè îïòèìàëüíîå ðåøåíèå íàéäåíî, â äèàëîãîâîì îêíå Результаты поиска решения äîëæíû ïðèñóòñòâîâàòü äâà êëþ÷åâûõ ïðåäëîæåíèÿ: Решение найдено è Все ограничения и условия оптимальности выполнены. Åñëè õîòÿ áû îäíîãî èç ýòèõ ïðåäëîæåíèé íåò, ïðîãðàììå íå óäàëîñü îïòèìèçèðîâàòü ìîäåëü.  òàêîì ñëó÷àå ñëåäóåò ñíà÷àëà ïðîâåðèòü ïðàâèëüíîñòü âíåñåíèÿ äàííûõ â äèàëîãîâîå îêíî Поиск решения, çàòåì ïðîâåðèòü òàáëè÷íóþ ìîäåëü è íàêîíåö ïåðåñìîòðåòü èñõîäíóþ ôîðìóëèðîâêó çàäà÷è. Åñëè ïîëó÷åíî ñîîáùåíèå îá óñïåøíîì çàâåðøåíèè ïîèñêà, ìîæíî èëè ñîõðàíèòü íàéäåííîå ðåøåíèå, âûáðàâ ñîîòâåòñòâóþùóþ îïöèþ, èëè îòáðîñèòü åãî, âûáðàâ îïöèþ Восстановить исходные значения.  ðåçóëüòàòå ÿ÷åéêàì ïåðåГлава 6. Дополнительные возможности Excel для проведения статистического анализа 223 ìåííûõ áóäóò âîçâðàùåíû çíà÷åíèÿ, êîòîðûå â íèõ íàõîäèëèñü äî çàïóñêà ïðîãðàììû Поиск решения. Ñóùåñòâóåò âîçìîæíîñòü òàêæå ïîëó÷èòü òðè òèïà îò÷åòîâ î ðåøåíèè. Êàæäûé îò÷åò âûâîäèòñÿ íà íîâûé ëèñò ðàáî÷åé êíèãè. 6.3.2. Задачи, решаемые средством Поиск решения Îïèøåì ÷åòûðå îñíîâíûõ òèïà çàäà÷, êîòîðûå ìîæíî ðåøèòü ñ ïîìîùüþ ñðåäñòâà Поиск решения. Îïòèìèçàöèÿ ïðè íàëè÷èè îãðàíè÷åíèé — ñàìûé îáùèé òèï çàäà÷è îïòèìèçàöèè; äðóãèå òèïû çàäà÷ ïîÿâëÿþòñÿ ïðè îãðàíè÷åíèÿõ ñïåöèàëüíîãî âèäà èëè èõ îòñóòñòâèè. Ýòè çàäà÷è ìîãóò ðåøàòüñÿ è êàê çàäà÷è ëèíåéíîé îïòèìèçàöèè, è êàê çàäà÷è íåëèíåéíîé îïòèìèçàöèè. 1. Ïîèñê äîïóñòèìîãî ðåøåíèÿ. Åñëè íå çàäàâàòü öåëåâóþ ÿ÷åéêó (â ïîëå ââîäà Установить целевую ячейку â äèàëîãîâîì îêíå Поиск решения), òî ñðåäñòâî Поиск решения îñòàíîâèò ðàáîòó, íàéäÿ äîïóñòèìîå ðåøåíèå çàäà÷è, ò.å. íàáîð çíà÷åíèé äëÿ èçìåíÿåìûõ ÿ÷ååê, êîòîðûå óäîâëåòâîðÿþò âñåì îãðàíè÷åíèÿì. Åñëè âñå ôóíêöèè îãðàíè÷åíèé ëèíåéíûå, òî, óñòàíîâèâ ôëàæîê Линейная модель â äèàëîãîâîì îêíå Параметры поиска решения, ìîæíî óñêîðèòü ïîèñê äîïóñòèìîãî ðåøåíèÿ. 2. Ïîäáîð ïàðàìåòðîâ. Öåëåâàÿ ÿ÷åéêà íå çàäàåòñÿ, óêàçûâàþòñÿ îãðàíè÷åíèÿ òîëüêî â âèäå ðàâåíñòâ èëè çàäàåòñÿ êîíêðåòíîå çíà÷åíèå äëÿ öåëåâîé ÿ÷åéêè áåç îïðåäåëåíèÿ êàêèõ-ëèáî îãðàíè÷åíèé.  ïåðâîì ñëó÷àå âûïîëíÿåòñÿ ïîèñê òåõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê, êîòîðûå óäîâëåòâîðÿþò çàäàííîé ñèñòåìå îãðàíè÷åíèé, ò.å., ïî ñóòè, ðåøàåòñÿ ñèñòåìà óðàâíåíèé, â êîòîðîé íåèçâåñòíûìè ÿâëÿþòñÿ çíà÷åíèÿ èçìåíÿåìûõ ÿ÷ååê. (Åñëè íåêîòîðûå îãðàíè÷åíèÿ çàäàíû â âèäå íåðàâåíñòâ, Поиск решения íàõîäèò äîïóñòèìîå ðåøåíèå, îïðåäåëÿåìîå çàäàííîé ñèñòåìîé îãðàíè÷åíèé (ñì. çàäà÷ó 1).) Âî âòîðîì ñëó÷àå (êîãäà çàäàíî êîíêðåòíîå çíà÷åíèå öåëåâîé ôóíêöèè áåç óêàçàíèÿ îãðàíè÷åíèé) Поиск решения ðàáîòàåò ïîäîáíî ñðåäñòâó Excel Подбор параметра, ïðè ýòîì èñïîëüçóÿ äðóãîé àëãîðèòì ïîèñêà. Êðîìå òîãî, â îòëè÷èå îò ñðåäñòâà Подбор параметра, Поиск решения ìîæåò ïðîâîäèòü ïîäáîð íåñêîëüêèõ ïàðàìåòðîâ, äîñòàâëÿþùèõ çàäàííîå çíà÷åíèå öåëåâîé ôóíêöèè. 3. Ïîèñê áåçóñëîâíîãî îïòèìóìà — çàäà÷à íàõîæäåíèÿ ìàêñèìóìà èëè ìèíèìóìà öåëåâîé ôóíêöèè ïðè îòñóòñòâèè îãðàíè÷åíèé. Ýòà çàäà÷à èìååò ñìûñë òîëüêî â òîì ñëó÷àå, åñëè öåëåâàÿ ôóíêöèÿ ÿâëÿåòñÿ íåëèíåéíîé (ïî îòíîøåíèþ ê çíà÷åíèÿì èçìåíÿåìûõ ÿ÷ååê).  ñëó÷àå ïîïûòêè ïîèñêà îïòèìóìà ëèíåéíîé öåëåâîé ôóíêöèè (áåç çàäàíèÿ îãðàíè÷åíèé) áóäåò âûâîäèòüñÿ ñîîáùåíèå î íåîãðàíè÷åííîì ðåøåíèè. Åñëè öåëåâàÿ ôóíêöèÿ èìååò íåñêîëüêî ìàêñèìóìîâ èëè ìèíèìóìîâ, òî Поиск решения íàõîäèò îäèí èç íèõ (ëîêàëüíûé îïòèìóì), êîòîðûé ìîæåò íå ñîâïàäàòü ñ ãëîáàëüíûì îïòèìóìîì. Êàêîé êîíêðåòíî áóäåò íàéäåí ëîêàëüíûé îïòèìóì, çàâèñèò îò íà÷àëüíûõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê. 4. Ïîèñê îïòèìóìà ïðè íàëè÷èè îãðàíè÷åíèé. Íàèáîëåå îáùåé çàäà÷åé ÿâëÿåòñÿ çàäà÷à óñëîâíîé îïòèìèçàöèè, êîãäà çàäàíû îãðàíè÷åíèÿ è àäðåñ ÿ÷åéêè öåëåâîé ôóíêöèè, êîòîðóþ íåîáõîäèìî ìàêñèìèçèðîâàòü èëè ìèíèìèçèðîâàòü. Åñëè öåëåâàÿ ôóíêöèÿ è âñå îãðàíè÷åíèÿ ëèíåéíû, òî ýòî çàäà÷à ëèíåéíîé îïòèìèçàöèè. Ðåøåíèå ýòîé çàäà÷è áóäåò íàéäåíî áûñòðåå, íà- 224 Часть II. Средства Excel для статистического анализа äåæíåå è ñ áîëåå ïîäðîáíîé äîïîëíèòåëüíîé èíôîðìàöèåé, åñëè â äèàëîãîâîì îêíå Параметры поиска решения óñòàíîâëåí ôëàæîê Линейная модель.  ïðîòèâíîì ñëó÷àå Поиск решения èñïîëüçóåò ìåòîä ïðèâåäåííîãî ãðàäèåíòà. Åñëè öåëåâàÿ ôóíêöèÿ èìååò íåñêîëüêî îïòèìóìîâ, êîòîðûå óäîâëåòâîðÿþò îãðàíè÷åíèÿì, òî Поиск решения íàéäåò îäèí èç íèõ (ò.å. ëîêàëüíûé îïòèìóì), êîòîðûé ìîæåò íå áûòü ãëîáàëüíûì. Êàêîé êîíêðåòíî áóäåò íàéäåí ëîêàëüíûé îïòèìóì, çàâèñèò îò íà÷àëüíûõ çíà÷åíèé èçìåíÿåìûõ ÿ÷ååê. 6.3.3. Примеры применения средства Поиск решения Ðàññìîòðèì äâà ïðèìåðà ïðèìåíåíèÿ ñðåäñòâà Поиск решения. Ïåðâûé ïðèìåð ïîêàçûâàåò ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé íà îñíîâå äàííûõ ïðèìåðà èç ðàçäåëà 6.1.5, â êîòîðîì ïîêàçàí äðóãîé ñïîñîá ðåøåíèÿ òàêèõ ñèñòåì. Âî âòîðîì ïðèìåðå ïîêàçàíî, êàê íà îñíîâàíèè êðèòåðèÿ χ2 ïîäîáðàòü ïàðàìåòðû âåðîÿòíîñòíîãî ðàñïðåäåëåíèÿ. Решение системы линейных алгебраических уравнений Èñõîäíàÿ òàáëè÷íàÿ ìîäåëü äëÿ ýòîé çàäà÷è ïîêàçàíà íà ðèñ. 6.34.  äàííîé ìîäåëè âû÷èñëåíèÿ ïðîèçâîäÿòñÿ òîëüêî â ñòîëáöå Å, ãäå âû÷èñëÿþòñÿ çíà÷åíèÿ ëåâûõ ÷àñòåé óðàâíåíèé (ôîðìóëû ïîêàçàíû íà ðèñ. 6.34). Çàïîëíåííîå äèàëîãîâîå îêíî Поиск решения äëÿ äàííîé çàäà÷è ïðåäñòàâëåíî íà ðèñ. 6.35, à íàéäåííîå ðåøåíèå — íà ðèñ. 6.36. Êàê âèäíî íà ïîñëåäíåì ðèñóíêå, ñðåäñòâîì Поиск решения íàéäåíî òî÷íîå ðåøåíèå ñèñòåìû. Ðèñ. 6.34. Èñõîäíàÿ òàáëè÷íàÿ ìîäåëü äëÿ ðåøåíèÿ ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé Подбор параметров вероятностного распределения Íà ðèñ. 6.37 ïîêàçàíû èñõîäíûå äàííûå: âûáîðêà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 1 è ñðåäíåêâàäðàòè÷åñêèì îòêëîíåíèåì 2 (âûáîðêà ñîçäàíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел èç ïàêåòà àíàëèçà). Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка (ýòî èìÿ èñïîëüçóåòñÿ â ôîðìóëàõ). Âûáîðî÷íûå ñðåäíåå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèÿ ðàâíû ñîîòâåòñòâåííî 0,91903 è 2,171256 Глава 6. Дополнительные возможности Excel для проведения статистического анализа 225 (çíà÷åíèÿ â ÿ÷åéêàõ Í1 è Í2). Ãðàíèöû èíòåðâàëîâ êàðìàíîâ çàïèñàíû â äèàïàçîíå Ñ5:Ñ14, à ÷àñòîòû (äèàïàçîí D5:D15) ïîäñ÷èòàíû ñ ïîìîùüþ ñðåäñòâà Гистограмма èç ïàêåòà àíàëèçà. Îæèäàåìûå ÷àñòîòû âû÷èñëÿþòñÿ ïî ôîðìóëàì, êîòîðûå ïîêàçàíû íà ðèñ. 6.38. Ôîðìóëà âû÷èñëåíèÿ çíà÷åíèÿ êðèòåðèàëüíîé ñòàòèñòèêè äëÿ êðèòåðèÿ χ2 (ñì. ðàçäåë 2.4.3) çàïèñàíà â ÿ÷åéêå G7. Îòìåòèì, ÷òî ýòî ôîðìóëà ìàññèâà, êîòîðàÿ ïîçâîëÿåò èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé. Çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè äëÿ ñëó÷àÿ, êîãäà â êà÷åñòâå ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èñïîëüçîâàíû ñîîòâåòñòâóþùèå âûáîðî÷íûå çíà÷åíèÿ, ïîêàçàíî íà ðèñ. 6.37. Ðèñ. 6.35. Äèàëîãîâîå îêíî Поиск решения äëÿ äàííîé çàäà÷è Ðèñ. 6.36. Íàéäåííîå ðåøåíèå ñèñòåìû ëèíåéíûõ àëãåáðàè÷åñêèõ óðàâíåíèé 226 Часть II. Средства Excel для статистического анализа Èçìåíÿÿ çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ, çàïèñàííûå â ÿ÷åéêàõ D1 è D2, ñ ïîìîùüþ ñðåäñòâà Поиск решения ïîïðîáóåì óìåíüøèòü çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè, òåì ñàìûì ïîäîáðàâ çíà÷åíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðîå ëó÷øå ñîîòâåòñòâóåò âûáîðêå. Äèàëîãîâîå îêíî Поиск решения äëÿ ýòîé çàäà÷è ïîêàçàíî íà ðèñ. 6.39.  äàííîì ñëó÷àå ïðèñóòñòâóåò òîëüêî îäíî îãðàíè÷åíèå — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äîëæíî áûòü ïîëîæèòåëüíûì. Íî ìîæíî çàäàòü è äðóãèå îãðàíè÷åíèÿ, íàïðèìåð, ÷òîáû îæèäàåìàÿ ÷àñòîòà â êðàéíèõ êàðìàíàõ èìåëà çíà÷åíèÿ íå ìåíåå 1, êàê ñîâåòóþò íåêîòîðûå ñòàòèñòè÷åñêèå ðóêîâîäñòâà. Ðåøåíèå, ïîëó÷åííîå ñ ïîìîùüþ Поиск решения, ïîêàçàíî íà ðèñ. 6.40. Ïîëó÷åííûå çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ íåìíîãî äàëüøå îò èñòèííûõ, ÷åì âûáîðî÷íûå îöåíêè, íî çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè ñòàëî ìåíüøå, ò.å. ðàñïðåäåëåíèå ñ ýòèìè çíà÷åíèÿìè ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ëó÷øå ïîäõîäèò äëÿ àïïðîêñèìàöèè ðàñïðåäåëåíèÿ âûáîðêè. Ðèñ. 6.37. Èñõîäíûå äàííûå Ðèñ. 6.38. Ôîðìóëû äëÿ âû÷èñëåíèé Глава 6. Дополнительные возможности Excel для проведения статистического анализа 227 Ðèñ. 6.39. Äèàëîãîâîå îêíî Поиск решения Ðèñ. 6.40. Ðåøåíèå 228 Часть II. Средства Excel для статистического анализа Глава 7 Моделирование случайных величин Ì îäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí ÷àñòî èñïîëüçóåòñÿ â ñòàòèñòè÷åñêîì àíàëèçå, õîòÿ áû äëÿ ïîñòðîåíèÿ òåñòîâûõ âûáîðîê ñ çàäàííûìè ñòàòèñòè÷åñêèìè õàðàêòåðèñòèêàìè, íà îñíîâå êîòîðûõ ìîæíî ïðîâåðèòü âû÷èñëèòåëüíûå àëãîðèòìû ìåòîäîâ ìàòåìàòè÷åñêîé ñòàòèñòèêè.  äàííîé êíèãå âñå ïðèìåðû ïðàêòè÷åñêîé ðåàëèçàöèè îïèñûâàåìûõ ìåòîäîâ èëëþñòðèðóþòñÿ ñ èñïîëüçîâàíèåì âûáîðîê, ïîñòðîåííûõ â Excel. Íî îñíîâíîå ïðèìåíåíèå “èñêóññòâåííûå” ñëó÷àéíûå âåëè÷èíû íàõîäÿò â ìåòîäàõ Ìîíòå-Êàðëî è èìèòàöèîííîì ìîäåëèðîâàíèè, ãäå áåç òàêèõ ñëó÷àéíûõ âåëè÷èí ïðîñòî íåâîçìîæíî ãîâîðèòü îá ýòèõ ïðåäìåòàõ. Îáû÷íî ðàññìîòðåíèå òåìû ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí íà÷èíàåòñÿ ñ ìåòîäîâ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1], òàê êàê ýòè âåëè÷èíû ÿâëÿþòñÿ îñíîâîé äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ äðóãèå ðàñïðåäåëåíèÿ. Ìû íå áóäåì ïîäíèìàòü ýòó èíòåðåñíóþ òåìó, ïîñêîëüêó â Excel èìåþòñÿ ãîòîâûå ñðåäñòâà (ôóíêöèÿ СЛЧИС è ñðåäñòâî Генерация случайных чисел) äëÿ ñîçäàíèÿ ïîñëåäîâàòåëüíîñòè ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë. Ðàññìîòðèì ñïîñîáû ìîäåëèðîâàíèÿ ïðîèçâîëüíûõ ñëó÷àéíûõ âåëè÷èí.  Excel åñòü äîâîëüíî ìíîãî ñðåäñòâ äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíûõ âåëè÷èí, èìåþùèõ ðàçëè÷íûå ðàñïðåäåëåíèÿ. Ýòè ñðåäñòâà ïåðå÷èñëåíû íèæå. Íî, êîíå÷íî, âñòðîåííûå ñðåäñòâà Excel íå îáåñïå÷èâàþò ìîäåëèðîâàíèå âåðîÿòíîñòíûõ ðàñïðåäåëåíèé “íà âñå ñëó÷àè æèçíè”. Ïîýòîìó ïðè íåîáõîäèìîñòè ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, ðàñïðåäåëåíèÿ êîòîðûõ íåò â íèæåïðèâåäåííîì ñïèñêå, ïðèõîäèòñÿ âñïîìèíàòü ìåòîäû ïîëó÷åíèÿ ñëó÷àéíûõ çíà÷åíèé, èìåþùèåñÿ â àðñåíàëå òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Íå âäàâàÿñü â “ãëóáîêóþ” òåîðèþ, ïîêàæåì ïðèìåíåíèå ìåòîäà îáðàòíûõ ôóíêöèé, ìåòîäà ñóïåðïîçèöèé è ìåòîäà îòáîðà äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë â Excel.  êîíöå ãëàâû ðàññìîòðèì âîïðîñ î ìîäåëèðîâàíèè çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí. 7.1. Средства Excel для генерирования случайных чисел Ïåðå÷èñëèì èìåþùèåñÿ â Excel ñðåäñòâà äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë. • Ôóíêöèÿ СЛЧИС, âû÷èñëÿþùàÿ ñëó÷àéíûå ÷èñëà, êîòîðûå ðàâíîìåðíî ðàñïðåäåëåíû íà èíòåðâàëå [0, 1] (ñì. ðàçäåë 4.13.1). • Ôóíêöèÿ СЛУЧМЕЖДУ, ãåíåðèðóþùàÿ öåëî÷èñëåííûå çíà÷åíèÿ, êîòîðûå ïîä÷èíÿþòñÿ äèñêðåòíîìó ðàâíîìåðíîìó ðàñïðåäåëåíèþ (ñì. ðàçäåë 4.13.2). (Ôóíêöèÿ äîñòóïíà òîëüêî òîãäà, êîãäà ïîäêëþ÷åíà íàäñòðîéêà Пакет анализа.) • Ñðåäñòâî Генерация случайных чисел èç íàäñòðîéêè Пакет анализа (ñì. ðàçäåë 5.3), ïðåäîñòàâëÿþùåå âîçìîæíîñòü ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà, êîòîðûå èìåþò ñëåäóþùèå ðàñïðåäåëåíèÿ. • Ðàâíîìåðíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë â çàäàííîì èíòåðâàëå. • Íîðìàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ íîðìàëüíîìó ðàñïðåäåëåíèþ. Çàäàåòñÿ ìàòåìàòè÷åñêîå îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå. • Áåðíóëëè. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïðèíèìàþùèõ òîëüêî çíà÷åíèå 0 èëè 1, â çàâèñèìîñòè îò çàäàííîé âåðîÿòíîñòè óñïåõà (èñõîäà “1”). (Î ðàñïðåäåëåíèè Áåðíóëëè ðå÷ü èäåò â ðàçäåëå 1.4.2.) • Áèíîìèàëüíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ðàâíîå êîëè÷åñòâó èñõîäîâ “1” â n íåçàâèñèìûõ èñïûòàíèÿõ.  ðåçóëüòàòå êàæäîãî èç íèõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.3). Çäåñü íåîáõîäèìî çàäàòü ÷èñëî èñïûòàíèé n è âåðîÿòíîñòü p. • Ïóàññîíà. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ ðàñïðåäåëåíèþ Ïóàññîíà ñ çàäàííûì ïàðàìåòðîì λ. (Î ðàñïðåäåëåíèè Ïóàññîíà ðå÷ü èäåò â ðàçäåëå 1.4.4.) • Äèñêðåòíîå. Ãåíåðèðóåòñÿ ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, ïîä÷èíÿþùèõñÿ çàäàííîìó äèñêðåòíîìó ðàñïðåäåëåíèþ. Äëÿ çàäàíèÿ ýòîãî ðàñïðåäåëåíèÿ íåîáõîäèìî óêàçàòü äèàïàçîí ÿ÷ååê, ñîñòîÿùèé èç äâóõ ñòîëáöîâ: â ïåðâîì ñòîëáöå ñîäåðæàòñÿ çíà÷åíèÿ, à âî âòîðîì — âåðîÿòíîñòè êàæäîãî çíà÷åíèÿ. Ìåæäó ñïîñîáàìè âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë, ïîëó÷åííûõ ñ ïîìîùüþ ôóíêöèè СЛЧИС (ñîîòâåòñòâóþùèå ôîðìóëû ïðèâåäåíû â ñëåäóþùèõ ðàçäåëàõ) è ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, â ÷àñòíîñòè ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1], èìåþòñÿ ñóùåñòâåííûå ðàçëè÷èÿ. Ïåðâîå ðàçëè÷èå çàêëþ÷àåòñÿ â òîì, ÷òî ôóíêöèþ СЛЧИС ìîæíî íåïîñðåäñòâåííî èñïîëüçîâàòü â ôîðìóëàõ (â òîì ÷èñëå â ôîðìóëàõ ìàññèâîâ) êàê àðãóìåíò ôîðìóëû èëè äðóãîé ôóíêöèè, òîãäà êàê äëÿ òîãî, ÷òîáû èñïîëüçîâàòü â ôîðìóëàõ ñëó÷àéíûå ÷èñëà, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, ñíà÷àëà íåîáõîäèìî èõ ïîëó÷èòü, ò.å. çàïèñàòü â îòäåëüíîì äèàïàçîíå ÿ÷ååê, è òîëüêî çàòåì èñïîëüçîâàòü â ôîðìóëàõ. Âòîðîå îòëè÷èå ñîñòîèò â òîì, ÷òî ôîðìóëû, ñîäåðæàùèå ôóíêöèþ СЛЧИС, ïåðåñ÷èòûâàþòñÿ ïðè êàæäîì ïåðåñ÷åòå ðàáî÷åãî ëèñòà (íàïðèìåð, ïðè ëþáîì ââîäå çíà÷åíèÿ â ÿ÷åéêó èëè ïðè óäàëåíèè ÷åãî-ëèáî, èëè ïðè íàæàòèè êëàâèøè <F9>), à çíà÷åíèÿ, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, ôèêñèðîâàíû — ïðè íåîáõîäèìîñòè ïîëó÷åíèÿ íîâîé âûáîðêè íà ìåñòå ñòàðîé, ñëåäóåò åùå ðàç âûçâàòü è ïðèìåíèòü ýòî ñðåäñòâî. Ñâîéñòâî 230 Часть II. Средства Excel для статистического анализа “èçìåí÷èâîñòè” ôóíêöèè СЛЧИС ïîëåçíî, íàïðèìåð, â èìèòàöèîííîì ìîäåëèðîâàíèè. Îäíàêî â äðóãèõ ñëó÷àÿõ îíî ìîæåò ñèëüíî çàìåäëÿòü ðàáîòó â Excel èëè áûòü ïðîñòî èçëèøíèì. ×òîáû çàôèêñèðîâàòü çíà÷åíèÿ, âû÷èñëÿåìûå ñ ïîìîùüþ ôóíêöèè СЛЧИС, íàäî âûäåëèòü äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, è ñêîïèðîâàòü åãî (êîìàíäà ПравкаÖКопировать). Çàòåì, íå îòìåíÿÿ âûäåëåíèÿ äèàïàçîíà, ñëåäóåò âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка, â îòêðûâøåìñÿ äèàëîãîâîì îêíå Специальная вставка óñòàíîâèòü ïåðåêëþ÷àòåëü Значения è ùåëêíóòü íà êíîïêå ОК.  ÿ÷åéêè âûäåëåííîãî äèàïàçîíà âìåñòî ôîðìóë áóäóò çàïèñàíû ÷èñëîâûå çíà÷åíèÿ. Ïîêàæåì, êàê ìîæíî èñïîëüçîâàòü ïåðåñ÷åò ôóíêöèè СЛЧИС äëÿ ïîëó÷åíèÿ íà îñíîâå îäíîé âûáîðêè ðåçóëüòàòîâ íåñêîëüêèõ ýêñïåðèìåíòîâ, êîãäà “âûõîäîì” ýêñïåðèìåíòà ÿâëÿåòñÿ ñàìà âûáîðêà. Íà ðèñ. 7.1 â ñòîëáöå À ïîêàçàíà âûáîðêà îáúåìîì 15 çíà÷åíèé, ïîëó÷åííàÿ ïî ôîðìóëå ìàññèâà {=СЛЧИС()}. Ïóñòü ïî âûáîðî÷íûì çíà÷åíèÿì â ñòîëáöå  âû÷èñëÿþòñÿ ñðåäíåå, âûáîðî÷íàÿ äèñïåðñèÿ, ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ ïî ñòàíäàðòíûì ôîðìóëàì. (Ýòè ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè â äàííîì ñëó÷àå âûáðàíû ïðîèçâîëüíî; â çàâèñèìîñòè îò êîíêðåòíûõ öåëåé ìîãóò âû÷èñëÿòüñÿ äðóãèå âåëè÷èíû, íàïðèìåð êðèòåðèàëüíûå ñòàòèñòèêè èëè èíòåðâàëüíûå îöåíêè êàêèõ-ëèáî ïàðàìåòðîâ.) Ðèñ. 7.1. Âûáîðêà è åå õàðàêòåðèñòèêè Åñëè â äàííîé ñèòóàöèè íàæàòü êëàâèøó <F9>, âûáîðî÷íûå çíà÷åíèÿ èçìåíÿòñÿ è ñîîòâåòñòâåííî èçìåíÿòñÿ çíà÷åíèÿ â ñòîëáöå Â. Òàêèì îáðàçîì, ïîëó÷àåòñÿ íîâàÿ âûáîðêà ñ òåì æå ðàñïðåäåëåíèåì. Îñòàëîñü çàôèêñèðîâàòü íîâûå çíà÷åíèÿ õàðàêòåðèñòèê. Äëÿ ýòîãî èõ ìîæíî ñêîïèðîâàòü (êàê çíà÷åíèÿ, à íå ôîðìóëû!) â îòäåëüíûé äèàïàçîí ÿ÷ååê. Íî ýòî íåóäîáíûé ïðèåì, åñëè íàäî ïðîâåñòè íåñêîëüêî ýêñïåðèìåíòîâ ñ îäíîé è òîé æå âûáîðêîé. Ïîêàæåì, êàê ìîæíî âûïîëíèòü ñðàçó ñòîëüêî ýêñïåðèìåíòîâ, ñêîëüêî íåîáõîäèìî, è çàîäíî ñðàçó ïîëó÷èòü âñå çíà÷åíèÿ õàðàêòåðèñòèê äëÿ êàæäîãî ýêñïåðèìåíòà. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü òàáëèöû ïîäñòàíîâêè Excel.  äàííîì ñëó÷àå öåëåñîîáðàçíî èñïîëüçîâàòü òàáëèöó ïîäñòàíîâêè ñ îäíèì âõîäîì. Äëÿ Глава 7. Моделирование случайных величин 231 ñîçäàíèÿ òàêîé òàáëèöû ââåäåì ñíà÷àëà ïîñëåäîâàòåëüíîñòü öåëûõ ÷èñåë îò 1 äî ÷èñëà, çàäàþùåãî êîëè÷åñòâî ýêñïåðèìåíòîâ.  íàøåì ïðèìåðå ââåäåì ÷èñëà îò 1 äî 12 â ñòîëáöå D, êàê ïîêàçàíî íà ðèñ. 7.21.  ÿ÷åéêó Å3 ââåäåì ôîðìóëó =В2, â ÿ÷åéêó F3 — ôîðìóëó =В4, â ÿ÷åéêó G3 — =В6 è â ÿ÷åéêó H3 — =В8. Ýòè ôîðìóëû óêàçûâàþò, êàêèå õàðàêòåðèñòèêè áóäóò âû÷èñëÿòüñÿ â òàáëèöå ïîäñòàíîâêè. Äëÿ ïîÿñíåíèÿ ìîæíî äîáàâèòü çàãîëîâêè ñòîëáöîâ Среднее, Дисперсия è ò.ä., êàê ïîêàçàíî íà ðèñ. 7.2. Ðèñ. 7.2. Ïîäãîòîâêà òàáëèöû ïîäñòàíîâêè Äàëåå ñëåäóåò âûäåëèòü äèàïàçîí ÿ÷ååê D3:Í15 è âûïîëíèòü êîìàíäó ДанныеÖ Таблица подстановки, â ðåçóëüòàòå ÷åãî îòêðîåòñÿ äèàëîãîâîå îêíî Таблица подстановки (ðèñ. 7.3).  ýòîì äèàëîãîâîì îêíå ïîëå Подставлять значения по столбцам в îñòàâèì ïóñòûì (îíî çàïîëíÿåòñÿ, åñëè äëÿ òàáëèöû ïîäñòàíîâêè ÷èñëîâûå çíà÷åíèÿ çàïèñàíû â ñòðîêó, à ôîðìóëû — â ñòîëáåö).  ïîëå Подставлять значения по строкам в ââåäåì àäðåñ ëþáîé ïóñòîé ÿ÷åéêè (íà ðèñ. 7.3 ïîêàçàí àäðåñ ÿ÷åéêè I1).  äàííîì ñëó÷àå, â îòëè÷èå îò “íàñòîÿùèõ” òàáëèö ïîñòàíîâêè, ÷èñëà â ñòîëáöå D íå ó÷àñòâóþò â âû÷èñëåíèÿõ; çäåñü àêò èõ ïîäñòàíîâêè â óêàçàííóþ ÿ÷åéêó ÿâëÿåòñÿ “ñïóñêîâûì ìåõàíèçìîì” äëÿ íîâîãî ïåðåñ÷åòà ôîðìóë, ñîäåðæàùèõ ôóíêöèþ СЛЧИС. Ïîñëå ùåë÷êà íà êíîïêå ОК â îêíå Таблица подстановки âûäåëåííàÿ îáëàñòü áóäåò çàïîëíåíà ðåçóëüòàòàìè ðàñ÷åòîâ, êàê ïîêàçàíî íà ðèñ. 7.4. Ðåçóëüòàòû ðàñ÷åòîâ â òàáëèöå ïîäñòàíîâêè ïîäâåðæåíû èçìåíåíèÿì (ò.å. àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ), íàïðèìåð, ïðè íàæàòèè êëàâèøè <F9>. ×òîáû çàôèêñèðîâàòü ýòè çíà÷åíèÿ, ñëåäóåò èëè ïðåîáðàçîâàòü èõ â çíà÷åíèÿ ñ ïîìîùüþ äèàëîãîâîãî îêíà Специальная вставка, êàê ðàññêàçàíî âûøå, ëèáî ñêîïèðîâàòü è âñòàâèòü èõ êàê çíà÷åíèÿ â íîâûé äèàïàçîí ÿ÷ååê (à â òàáëèöå ïîäñòàíîâêè ìîæíî ïðîäîëæàòü ýêñïåðèìåíòû). 1  ïðèíöèïå, ýòè ÷èñëà ìîãóò áûòü ëþáûìè, â òîì ÷èñëå ðàâíûìè, äðîáíûìè èëè îòðèöàòåëüíûìè, ÷òî íå âëèÿåò íà äàëüíåéøèå âû÷èñëåíèÿ. Íî â âèäå íàòóðàëüíûõ ÷èñåë îíè ìîãóò íåñòè ñìûñëîâóþ íàãðóçêó êàê ïîðÿäêîâûå íîìåðà ýêñïåðèìåíòîâ. 232 Часть II. Средства Excel для статистического анализа Ðèñ. 7.3. Äèàëîãîâîå îêíî Таблица подстановки Ðèñ. 7.4. Ðåçóëüòàòû ðàñ÷åòîâ Ôóíêöèþ СЛЧИС ëåãêî ïðèìåíèòü äëÿ ìîäåëèðîâàíèÿ ñëó÷àéíûõ âåëè÷èí, ðàâíîìåðíî ðàñïðåäåëåííûõ íà ïðîèçâîëüíîì èíòåðâàëå [a, b]. Äëÿ ýòîãî íåîáõîäèìî èñïîëüçîâàòü ôîðìóëó =(b–a)*СЛЧИС()+а, ãäå âìåñòî a è b ïîäñòàâëÿþòñÿ êîíêðåòíûå ÷èñëà èëè ññûëêè íà ÿ÷åéêè, ñîäåðæàùèå ýòè ÷èñëà. Òàêæå îòìåòèì, ÷òî ôîðìóëà =ЦЕЛОЕ((b–a)*СЛЧИС()+а) ãåíåðèðóåò öåëî÷èñëåííûå çíà÷åíèÿ, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [a, b – 1], ò.å. ÿâëÿåòñÿ àíàëîãîì ôóíêöèè СЛУЧМЕЖДУ. Глава 7. Моделирование случайных величин 233 7.2. Метод обратных функций моделирования случайных величин  îñíîâå ýòîãî ìåòîäà ëåæèò èçâåñòíûé ìàòåìàòè÷åñêèé ôàêò, ÷òî åñëè G(x) — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ F(x), òî ñëó÷àéíàÿ âåëè÷èíà Y = G(X), ãäå ñëó÷àéíàÿ âåëè÷èíà X ðàñïðåäåëåíà ðàâíîìåðíî íà èíòåðâàëå [0, 1], èìååò ôóíêöèþ ðàñïðåäåëåíèÿ F(x) (ñì. ðàçäåë 1.3).  Excel åñòü íåñêîëüêî ôóíêöèé, âîçâðàùàþùèõ çíà÷åíèÿ îáðàòíûõ ôóíêöèé äëÿ ðàçëè÷íûõ ðàñïðåäåëåíèé. Ýòî ñëåäóþùèå ôóíêöèè (ñì. ðàçäåë 4.7). • FРАСПОБР. Âîçâðàùàåò îáðàòíîå çíà÷åíèå äëÿ F-ðàñïðåäåëåíèÿ. • БЕТАОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè áåòàðàñïðåäåëåíèÿ. • ГАММАОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ãàììàðàñïðåäåëåíèÿ. • ЛОГНОРМОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ. • НОРМОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè íîðìàëüíîãî ðàñïðåäåëåíèÿ. • НОРМСТОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. • СТЬЮДРАСПОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà. • ХИ2ОБР. Âû÷èñëÿåò çíà÷åíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ χ2. Òàêèì îáðàçîì, ôîðìóëà =ФУНКЦИЯ(СЛЧИС();...), ãäå ФУНКЦИЯ îáîçíà÷àåò îäíó èç âûøåïåðå÷èñëåííûõ ôóíêöèé ñ ñîîòâåòñòâóþùèìè àðãóìåíòàìè, áóäåò ãåíåðèðîâàòü ïîñëåäîâàòåëüíîñòü ñëó÷àéíûõ ÷èñåë, êîòîðûå èìåþò ðàñïðåäåëåíèå, îïðåäåëÿåìîå äàííîé ôóíêöèåé2. Ýòèì ñïîñîáîì ìîæíî ãåíåðèðîâàòü ñëó÷àéíûå âåëè÷èíû, èìåþùèå • F-ðàñïðåäåëåíèå (ðàñïðåäåëåíèå Ñíåäåêîðà); • áåòà-ðàñïðåäåëåíèå; • ãàììà-ðàñïðåäåëåíèå; • ëîãàðèôìè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå; • íîðìàëüíîå ðàñïðåäåëåíèå; • ðàñïðåäåëåíèå Ñòüþäåíòà; • ðàñïðåäåëåíèå χ2. 2 Íåêîòîðûå èç ïåðå÷èñëåííûõ ôóíêöèé ÿâëÿþòñÿ îáðàòíûìè íå ê ôóíêöèè ðàñïðåäåëåíèÿ F(x), à ê ôóíêöèè 1 – F(x), ïîýòîìó, ñòðîãî ãîâîðÿ, â òàêèõ ôóíêöèÿõ âìåñòî àðãóìåíòà СЛЧИС() äîëæåí ñòîÿòü àðãóìåíò 1 – СЛЧИС(). Но ïîñêîëüêó ñëó÷àéíûå âåëè÷èíû Õ è 1 – Õ èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, åñëè Õ ðàâíîìåðíî ðàñïðåäåëåíà íà èíòåðâàëå [0, 1], òî ïðèâåäåííàÿ ôîðìóëà ñïðàâåäëèâà äëÿ ëþáûõ îáðàòíûõ ôóíêöèé. 234 Часть II. Средства Excel для статистического анализа Ìîäåëèðîâàíèå ñëó÷àéíûõ âåëè÷èí, èìåþùèõ ðàñïðåäåëåíèå Ñòüþäåíòà, òðåáóåò ïîÿñíåíèÿ, ïîñêîëüêó ôóíêöèÿ Excel СТЬЮДРАСПОБР íå âîçâðàùàåò îòðèöàòåëüíûõ çíà÷åíèé, — îíà ïðåäíàçíà÷åíà äëÿ èñïîëüçîâàíèÿ â ñòàòèñòè÷åñêèõ êðèòåðèÿõ äëÿ âû÷èñëåíèÿ êðèòè÷åñêèõ çíà÷åíèé, íî íå äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë. Îäíàêî, ïîñêîëüêó ýòî ðàñïðåäåëåíèå ñèììåòðè÷íî îòíîñèòåëüíî íóëÿ, ñëó÷àéíàÿ âåëè÷èíà Õ, èìåþùàÿ ðàñïðåäåëåíèå Ñòüþäåíòà, ñ âåðîÿòíîñòüþ 0,5 ìîæåò ïðèíèìàòü îòðèöàòåëüíûå çíà÷åíèÿ è ñ òàêîé æå âåðîÿòíîñòüþ — ïîëîæèòåëüíûå. Èñõîäÿ èç ýòîãî çàìå÷àíèÿ äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë ñ äàííûì ðàñïðåäåëåíèåì ìîæíî ïðèìåíèòü ôîðìóëó =ЕСЛИ(СЛЧИС()<0,5;–СТЬЮДРАСПОБР(СЛЧИС();К); СТЬЮДРАСПОБР(СЛЧИС();К)). Çäåñü àðãóìåíò К çàäàåò ÷èñëî ñòåïåíåé ñâîáîäû ðàñïðåäåëåíèÿ Ñòüþäåíòà. Ôîðìóëó ìîæíî ïðèìåíÿòü êàê ôîðìóëó ìàññèâà äëÿ ãåíåðèðîâàíèÿ âûáîðêè íóæíîãî ðàçìåðà. Ýòà ôîðìóëà èñïîëüçîâàíà â ïðèìåðå èç ðàçäåëà 9.2.1. Èç âûøåïðèâåäåííîãî ñïèñêà òîëüêî íîðìàëüíî ðàñïðåäåëåííûå ñëó÷àéíûå ÷èñëà ìîæíî ïîëó÷èòü ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Òàêèì îáðàçîì, ìåòîä îáðàòíûõ ôóíêöèé ñ èñïîëüçîâàíèåì âñòðîåííûõ ôóíêöèé Excel ïîçâîëÿåò ìîäåëèðîâàòü øèðîêèé ñïåêòð âåðîÿòíîñòíûõ ðàñïðåäåëåíèé, îñîáåííî ñ ó÷åòîì òîãî, ÷òî ìíîãèå äðóãèå ðàñïðåäåëåíèÿ, íå âîøåäøèå â âûøåïðèâåäåííûé ñïèñîê, ÿâëÿþòñÿ ÷àñòíûìè ñëó÷àÿìè ëèáî áåòà-ðàñïðåäåëåíèÿ (íàïðèìåð, ðàñïðåäåëåíèå àðêñèíóñà, òðåóãîëüíîå è äàæå ðàâíîìåðíîå), ëèáî ãàììà-ðàñïðåäåëåíèÿ (íàïðèìåð, ðàñïðåäåëåíèå Ýðëàíãà è ïîêàçàòåëüíîå ðàñïðåäåëåíèå). Åñëè íåîáõîäèìî ìîäåëèðîâàòü ñëó÷àéíóþ âåëè÷èíó, ðàñïðåäåëåíèÿ êîòîðîé íåò â ïðèâåäåííîì âûøå ñïèñêå, íî èçâåñòíà ôóíêöèÿ, îáðàòíàÿ ê åå ôóíêöèè ðàñïðåäåëåíèÿ, òî èñïîëüçóþò ôîðìóëó, âû÷èñëÿþùóþ ýòó îáðàòíóþ ôóíêöèþ ñ àðãóìåíòîì СЛЧИС. Íàïðèìåð, èçâåñòíî, ÷òî ôóíêöèÿ ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ èìååò âèä F(õ) = 1 – e–λõ (õ ≥ 0), ãäå λ — ïàðàìåòð ðàñïðåäåëåíèÿ, λ > 0. Îáðàòíàÿ ôóíêöèÿ, 1 λ êàê íåòðóäíî ïîêàçàòü, îïðåäåëÿåòñÿ ôîðìóëîé G ( x ) = − ln(1 − x) . Ïîýòîìó äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë, èìåþùèõ ïîêàçàòåëüíîå ðàñïðåäåëåíèå, ìîæíî èñïîëüçîâàòü ôîðìóëó =–LN(СЛЧИС())/А1, åñëè çíà÷åíèå λ çàïèñàíî â ÿ÷åéêå À1. Òàêèì îáðàçîì, åñëè èçâåñòíà ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ, òî ìîäåëèðîâàíèå íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí íå âûçûâàåò îñîáûõ çàòðóäíåíèé. Ìîäåëèðîâàíèå äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí ìåòîäîì îáðàòíûõ ôóíêöèé âûçûâàåò îïðåäåëåííûå ñëîæíîñòè, ñâÿçàííûå ñ òåì, ÷òî äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí ôóíêöèÿ ðàñïðåäåëåíèÿ èìååò ñòóïåí÷àòûé âèä è ïîýòîìó îáðàòíàÿ ôóíêöèÿ îïðåäåëÿåòñÿ íåîäíîçíà÷íî. Ñóùåñòâóåò íåñêîëüêî ïîäõîäîâ ê ïîñòðîåíèþ îáðàòíûõ ôóíêöèé äèñêðåòíûõ ðàñïðåäåëåíèé, è õîòÿ ïî ñóòè îíè äîñòàòî÷íî ïðîñòû, íà ïðàêòèêå èñïîëüçîâàòü èõ íåóäîáíî. Excel ïîçâîëÿåò ìîäåëèðîâàòü äèñêðåòíûå ñëó÷àéíûå âåëè÷èíû áåç íåïîñðåäñòâåííîãî ïîñòðîåíèÿ îáðàòíîé ôóíêöèè. (Íå çàáûâàåì, ÷òî ñðåäñòâî Генерация случайных чисел òàêæå ïîçâîëÿåò ìîäåëèðîâàòü ëþáûå äèñêðåòíûå âåëè÷èíû, íî çäåñü ìû îáîéäåìñÿ áåç ýòîãî ñðåäñòâà.) Íà ðèñ. 7.5 ïîêàçàíà òàáëèöà, ñîäåðæàùàÿ çíà÷åíèÿ, âåðîÿòíîñòè ýòèõ çíà÷åíèé è çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ. ×òîáû ìîäåëèðîâàòü ñëó÷àéíóþ âåëè÷èíó ñ òàêèì ðàñïðåäåëåíèåì, íàäî âûïîëíèòü òàêèå äåéñòâèÿ. Ïåðåä ñòîëáöîì, ñîäåðæàùèì çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû, âñòàâèòü åùå îäèí ñòîëáåö, ñîäåðæàùèé çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, êàê ïîêàçàíî íà ðèñ. 7.6. Îáðàùàåì âíèìàíèå, ÷òî ïåðâîå çíà÷åíèå â ýòîì ñòîëáöå ðàâíî 0. Äàííûå â ñòîëáöàõ C è D â äàëüíåéøåì íå èñïîëüçóþòñÿ. Глава 7. Моделирование случайных величин 235 Ðèñ. 7.5. Ðàñïðåäåëåíèå äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Ðèñ. 7.6. Ïîäãîòîâêà ê ìîäåëèðîâàíèþ Äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë â äàííîì ñëó÷àå èñïîëüçóåòñÿ ôîðìóëà =ВПР(СЛЧИС();A2:B8;2). Ôóíêöèÿ ВПР â ïåðâîì ñòîëáöå òàáëèöû, çàäàâàåìîé âòîðûì àðãóìåíòîì A2:B8, èùåò ñîâïàäåíèÿ ñî çíà÷åíèåì ïåðâîãî àðãóìåíòà СЛЧИС(). Ïðè íàëè÷èè òàêîãî ñîâïàäåíèÿ ôóíêöèÿ âîçâðàùàåò çíà÷åíèå èç âòîðîãî ñòîëáöà (íîìåð ñòîëáöà çàäàåò òðåòèé àðãóìåíò 2) è ñòðîêè, â êîòîðîé áûëî îáíàðóæåíî ñîâïàäåíèå çíà÷åíèé. Åñëè òî÷íîãî ñîâïàäåíèÿ íåò, òî â êà÷åñòâå èñêîìîãî áåðåòñÿ áëèæàéøåå çíà÷åíèå, íå ïðåâîñõîäÿùåå çíà÷åíèå ïåðâîãî àðãóìåíòà. Òàê ðàáîòàåò ýòà ôóíêöèÿ, åñëè íå çàäàí åå ÷åòâåðòûé (íåîáÿçàòåëüíûé) àðãóìåíò. Ïðèâåäåííóþ ôîðìóëó ìîæíî ïðèìåíÿòü êàê ôîðìóëó ìàññèâà äëÿ ãåíåðèðîâàíèÿ íå îäíîãî, à íåñêîëüêèõ ñëó÷àéíûõ ÷èñåë. Íà ðèñ. 7.7 â ñòîëáöå F ïîêàçàí ìàññèâ ñãåíåðèðîâàííûõ çíà÷åíèé. Ýòè çíà÷åíèÿ ïåðåñ÷èòûâàþòñÿ ïðè íàæàòèè êëàâèøè <F9>, ïîýòîìó èõ ìîæíî èñïîëüçîâàòü äëÿ ïîëó÷åíèÿ íåñêîëüêèõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ. Íà ïðàêòèêå ìåòîä îáðàòíûõ ôóíêöèé èñïîëüçóåòñÿ â îñíîâíîì òîãäà, êîãäà èçâåñòíî àíàëèòè÷åñêîå âûðàæåíèå ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ. Íî â Excel åñòü ñðåäñòâà, êîòîðûå ïîçâîëÿþò ãåíåðèðîâàòü ñëó÷àéíûå ÷èñëà áåç èñïîëüçîâàíèÿ ÿâíîãî âèäà îáðàòíîé ôóíêöèè, ÷òî ïîêàçûâàåò ïðèâåäåííûé ïðèìåð ìîäåëèðîâàíèÿ äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû. Äëÿ ìîäåëèðîâàíèÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí ìîæíî èñïîëüçîâàòü ñðåäñòâà Подбор параметра è Поиск решения äëÿ ïîëó÷åíèÿ çíà÷åíèé îáðàòíîé ôóíêöèè ïóòåì ðåøåíèÿ óðàâíåíèÿ F(õ) = ξ, ãäå ξ — çàäàííîå çíà÷åíèå ñëó÷àéíîé âåëè÷èíû, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1]. Ïîêàæåì, êàê ýòî äåëàåòñÿ, íà ïðèìåðå 236 Часть II. Средства Excel для статистического анализа ãåíåðèðîâàíèÿ íîðìàëüíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë, ïîñêîëüêó ñ÷èòàåòñÿ, ÷òî íîðìàëüíî ðàñïðåäåëåííûå ñëó÷àéíûå ÷èñëà ìåòîäîì îáðàòíûõ ôóíêöèé ãåíåðèðîâàòü âåñüìà ñëîæíî è òàêèå ÷èñëà îáû÷íî ãåíåðèðóþò ñ ïîìîùüþ äðóãèõ ìåòîäîâ. Ðèñ. 7.7. Ãåíåðèðîâàíèå ñëó÷àéíûõ ÷èñåë Ñîçäàäèì òàáëèöó, ïîêàçàííóþ íà ðèñ. 7.8.  ñòîëáöå À ââåäåì ñòîëüêî ÷èñåë, ñêîëüêî èõ äîëæíî áûòü â áóäóùåé âûáîðêå. Ýòè ÷èñëà ìîãóò áûòü ïðîèçâîëüíûìè. Åäèíñòâåííîå îãðàíè÷åíèå, êîòîðîå íà íèõ íàêëàäûâàåòñÿ, çàêëþ÷àåòñÿ â òîì, ÷òîáû ôóíêöèÿ ðàñïðåäåëåíèÿ, âû÷èñëÿåìàÿ íà èõ îñíîâå, íå ïðèíèìàëà êðàéíèõ çíà÷åíèé 0 è 1, ïîñêîëüêó ýòî çàòðóäíèò ðàáîòó ñðåäñòâà Поиск решения.  ñòîëáöå  âû÷èñëÿþòñÿ çíà÷åíèÿ ôóíêöèè ðàñïðåäåëåíèÿ, â äàííîì ñëó÷àå ïî ôîðìóëå =НОРМСТРАСП(A2), êîòîðàÿ çàïèñàíà â ÿ÷åéêå Â2 è çàòåì ñêîïèðîâàíà âíèç äî êîíöà èíòåðâàëà.  ñòîëáöå Ñ ñ ïîìîùüþ ôîðìóëû ìàññèâà {=СЛЧИС()} ñãåíåðèðîâàíû ñëó÷àéíûå ÷èñëà, èìåþùèå ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1]. Çàòåì ôîðìóëà ïðåîáðàçóåòñÿ â çíà÷åíèÿ ñ ïîìîùüþ äèàëîãîâîãî îêíà Специальная вставка. Äàëåå ïðèìåíÿåòñÿ ñðåäñòâî Поиск решения, äèàëîãîâîå îêíî êîòîðîãî ïîêàçàíî íà ðèñ. 7.9.  äàííîì ñëó÷àå ñ ïîìîùüþ ýòîãî ñðåäñòâà âû÷èñëÿþòñÿ êîðíè óðàâíåíèé F(õ) = ξ, çíà÷åíèÿ ξ êîòîðûõ çàïèñàíû â ñòîëáöå Ñ, à çíà÷åíèÿ êîðíåé õ áóäóò çàïèñàíû â ñòîëáöå À (îá èñïîëüçîâàíèè ñðåäñòâà Поиск решения äëÿ ðåøåíèÿ óðàâíåíèé ðå÷ü èäåò â ðàçäåëå 6.3). Îäíîâðåìåííî ðåøàåòñÿ ñòîëüêî óðàâíåíèé, ñêîëüêî íåîáõîäèìî ñãåíåðèðîâàòü âûáîðî÷íûõ çíà÷åíèé.  äèàëîãîâîì îêíå Поиск решения öåëåâàÿ ÿ÷åéêà íå çàäàåòñÿ, â êà÷åñòâå èçìåíÿåìûõ ÿ÷ååê óêàçûâàþòñÿ âñå ÿ÷åéêè ñòîëáöà À, â êîòîðûå ââåäåíû ÷èñëà. Îãðàíè÷åíèÿ â äàííîì ñëó÷àå çàäàþòñÿ â âèäå îäíîãî ðàâåíñòâà В2:В16 = С2:С16. Ïîñëå ùåë÷êà íà êíîïêå Выполнить Excel ïîñëå íåêîòîðîãî âðåìåíè “ðàçäóìèé”, äëèòåëüíîñòü êîòîðîãî çàâèñèò îò êîëè÷åñòâà ðåøàåìûõ óðàâíåíèé, íàéäåò êîðíè âñåõ óðàâíåíèé è òåì ñàìûì ñãåíåðèðóåò ñëó÷àéíûå ÷èñëà. Ðåçóëüòàò âû÷èñëåíèé ïîêàçàí íà ðèñ. 7.10. Ïîäîáíûì îáðàçîì ìîæíî ñãåíåðèðîâàòü çíà÷åíèÿ ëþáîé ñëó÷àéíîé âåëè÷èíû ñ èçâåñòíîé ôóíêöèåé ðàñïðåäåëåíèÿ, åñëè ñàìà ôóíêöèÿ ðàñïðåäåëåíèÿ äîñòàòî÷íî ãëàäêàÿ, ïîñêîëüêó Поиск решения äëÿ ðåøåíèÿ óðàâíåíèé èñïîëüçóåò ãðàäèåíòíûé ìåòîä. Глава 7. Моделирование случайных величин 237 Ðèñ. 7.8. Ïîäãîòîâêà ê ìîäåëèðîâàíèþ Ðèñ. 7.9. Äèàëîãîâîå îêíî Поиск решения 7.3. Метод суперпозиций Äàííûé ìåòîä ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ ïðèìåíÿåòñÿ òîãäà, êîãäà åå ôóíêöèþ ðàñïðåäåëåíèÿ F(x) ìîæíî ïðåäñòàâèòü â âèäå ñóììû m F ( x) = ∑ ck Fk ( x) , ãäå âñå Fk(x) — òàêæå ôóíêöèè ðàñïðåäåëåíèÿ, à âñå êîýôôèöèk =1 238 Часть II. Средства Excel для статистического анализа åíòû ñk > 0, ïðè ýòîì ñ1 + ñ2 + ... + cm = 1. (Òàêàÿ ñëó÷àéíàÿ âåëè÷èíà Õ íàçûâàåòñÿ ñìåñüþ ñëó÷àéíûõ âåëè÷èí.) Êîýôôèöèåíòû ñk ìîæíî ðàññìàòðèâàòü êàê âåðîÿòíîñòè, çàäàþùèå ðàñïðåäåëåíèå äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Y, êîòîðàÿ ïðèíèìàåò öåëî÷èñëåííûå çíà÷åíèÿ k ñ âåðîÿòíîñòüþ ñk. Äîêàçàíî [16, ñ. 64], ÷òî åñëè â ñîîòâåòñòâèè ñ ðàñïðåäåëåíèåì âåëè÷èíû Y âûáèðàòü íîìåð k, à çàòåì èç óðàâíåíèÿ Fk(X) = ξ, ãäå ξ — çíà÷åíèå ñëó÷àéíîé âåëè÷èíû, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 1], îïðåäåëèòü Õ, òî ñëó÷àéíàÿ âåëè÷èíà Õ m ïîä÷èíÿåòñÿ âåðîÿòíîñòíîìó çàêîíó ñ ôóíêöèåé ðàñïðåäåëåíèÿ F ( x) = ∑ ck Fk ( x) . k =1 Ðèñ. 7.10. Ñãåíåðèðîâàííûå ñëó÷àéíûå ÷èñëà Íà îñíîâå ýòîãî óòâåðæäåíèÿ ìîæíî ïîñòðîèòü ñëåäóþùóþ ñõåìó âû÷èñëåíèÿ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ. Ïóñòü èìåþòñÿ äâà ñãåíåðèðîâàííûõ íåçàâèñèìûõ ñëó÷àéíûõ ÷èñëà ξ1 è ξ2, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1]. Çíà÷åíèå õ ñëó÷àéíîé âåëè÷èíû Õ âû÷èñëÿåòñÿ ïî ôîðìóëå G1 (ξ 2 ), G (ξ ), 2 2 x = Gk (ξ 2 ), G (ξ ), m 2 если ξ1 < c1 , если c1 < ξ1 < c1 + c2 , # если k −1 k ∑c < ξ1 < ∑ ci , i i =1 i =1 # если m −1 ∑c i < ξ1 < 1, i =1 ãäå Gk — ôóíêöèè, îáðàòíûå ê ôóíêöèÿì ðàñïðåäåëåíèÿ Fk (ò.å. çäåñü èñïîëüçóåòñÿ ìåòîä îáðàòíûõ ôóíêöèé). Глава 7. Моделирование случайных величин 239 Ïîêàæåì, êàê ýòó ôîðìóëó ìîæíî ðåàëèçîâàòü â Excel. Ñíà÷àëà ðàññìîòðèì ïðîñòîé ñëó÷àé, êîãäà m = 2. Ïóñòü F ( x) = 2 3 F1 ( x) + F2 ( x) , F1(x) — ôóíêöèÿ 5 5 ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà ñ ïàðàìåòðîì λ = 2 (äëÿ ýòîãî ðàñïðåäåëå- 1 λ íèÿ îáðàòíàÿ ôóíêöèÿ èìååò âèä G ( x ) = − ln(1 − x) ), F2(x) — ôóíêöèÿ ðàñïðåäåëåíèÿ íîðìàëüíîãî çàêîíà ñ ïàðàìåòðàìè m = 1 è σ = 2 (çäåñü äëÿ âû÷èñëåíèÿ îáðàòíîé ôóíêöèè áóäåì èñïîëüçîâàòü ôóíêöèþ Excel НОРМОБР). Äëÿ ãåíåðèðîâàíèÿ çíà÷åíèé ñëó÷àéíîé âåëè÷èíû, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F ( x) = 2 3 F1 ( x) + F2 ( x) , íàäî ïðèìåíèòü ôîðìóëó 5 5 =ЕСЛИ(СЛЧИС()<2/5;–LN(СЛЧИС())/2;НОРМОБР(СЛЧИС();1;2). Åå ìîæíî èñïîëüçîâàòü êàê ôîðìóëó ìàññèâà, ñãåíåðèðîâàâ ïðè ýòîì ñòîëüêî çíà÷åíèé, ñêîëüêî íåîáõîäèìî. Òàêæå îòìåòèì, ÷òî ýòè çíà÷åíèÿ áóäóò ïåðåñ÷èòûâàòüñÿ ïðè íàæàòèè êëàâèøè <F9>. Òàêèì îáðàçîì êàæäûé ðàç ìîæíî ïîëó÷àòü íîâóþ âûáîðêó. Åñëè m ≥ 3, ïðîñòîé ôîðìóëû äëÿ ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë íå ñóùåñòâóåò3. Äëÿ ñëó÷àéíîãî âûáîðà îáðàòíîé ôóíêöèè Gk, êîòîðàÿ äàñò î÷åðåäíîå çíà÷åíèå ñëó÷àéíîé âåëè÷èíû â ñîîòâåòñòâèè ñ ïðèâåäåííîé âûøå ôîðìóëîé, â Excel ìîæíî èñïîëüçîâàòü ôóíêöèþ ВПР òàê, êàê ïðè ìîäåëèðîâàíèè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí (ñì. ïðåäûäóùèé ðàçäåë). Ïóñòü, íàïðèìåð, F(x) = 0,1F1(x) + 0,3F2(x) + 0,2F3(x) + 0,1F4(x) + 0,3F5(x), ãäå F1 — ôóíêöèÿ áåòà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 1 è 2, F2 — ôóíêöèÿ ãàììàðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 2 è 3, F3 — ôóíêöèÿ ëîãàðèôìè÷åñêè íîðìàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè 1 è 1, F4 — ôóíêöèÿ ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ è F5 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ 10-þ ñòåïåíÿìè ñâîáîäû. Íà ðèñ. 7.11 ïîêàçàíà ïîäãîòîâèòåëüíàÿ òàáëèöà, ñîäåðæàùàÿ êîýôôèöèåíòû, èõ ÷àñòè÷íûå ñóììû, à òàêæå ôîðìóëû ñ èñïîëüçîâàíèåì îáðàòíûõ ôóíêöèé äëÿ âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë.  ÿ÷åéêó D2 ââåäåì ôîðìóëó =ВПР(СЛЧИС();$A$8:$B$12;2) è ñêîïèðóåì åå âíèç ñòîëüêî ðàç, ñêîëüêî íåîáõîäèìî. (Ââîäèòü ýòó ôîðìóëó êàê ôîðìóëó ìàññèâà â äàííîì ñëó÷àå íåöåëåñîîáðàçíî ïî ïðè÷èíàì, êîòîðûå áóäóò ïîíÿòíû ïîçæå.)  ðåçóëüòàòå ïîëó÷èì ñëó÷àéíûå ÷èñëà, ïîêàçàííûå íà ðèñ. 7.12 â ñòîëáöå Случайные числа. Íåòðóäíî çàìåòèòü îäèíàêîâûå çíà÷åíèÿ ñðåäè ñãåíåðèðîâàííûõ ÷èñåë. Ýòî ñëåäñòâèå òîãî, ÷òî ñëó÷àéíûå ÷èñëà áåðóòñÿ èç òàáëèöû Обратные функции, êîòîðàÿ, õîòÿ è ïåðåñ÷èòûâàåòñÿ ïðè êàæäîì âû÷èñëåíèè, èìååò êîíå÷íûé íàáîð çíà÷åíèé. ×òîáû îáîéòè ýòî ïðåïÿòñòâèå è ïîëó÷èòü ïîëíîöåííóþ âûáîðêó, íåêîòîðûå äåéñòâèÿ íåîáõîäèìî âûïîëíèòü âðó÷íóþ. Ïîñëå êàæäîãî ïåðåñ÷åòà òàáëèö Обратные функции è Случайные числа, âûïîëíÿåìîãî ñ ïîìîùüþ êëàâèøè <F9>, 3 Íåëüçÿ èñïîëüçîâàòü âëîæåííûå ôóíêöèè ЕСЛИ äëÿ ïðîâåðêè çíà÷åíèÿ, âîçâðàùàåìîãî ôóíêöèåé СЛЧИС, ïîñêîëüêó äëÿ ïðîâåðêè áîëåå äâóõ óñëîâèé íåîáõîäèìî íåñêîëüêî “ýêçåìïëÿðîâ” ýòîãî çíà÷åíèÿ. Íî åñëè äëÿ ïîëó÷åíèÿ ýòèõ “ýêçåìïëÿðîâ” îïÿòü èñïîëüçîâàòü ôóíêöèþ СЛЧИС, îíà äàñò äðóãîå çíà÷åíèå. Åñëè â ôîðìóëå íåñêîëüêî ðàç âñòðå÷àåòñÿ ôóíêöèÿ СЛЧИС, òî îíà êàæäûé ðàç ãåíåðèðóåò íîâîå çíà÷åíèå. Íàïðèìåð, ôîðìóëà =СЛЧИС()–СЛЧИС() íèêîãäà íå âîçâðàòèò íóëåâîãî çíà÷åíèÿ. 240 Часть II. Средства Excel для статистического анализа Ðèñ. 7.11. Ïîäãîòîâèòåëüíàÿ òàáëèöà Ðèñ. 7.12. Ñãåíåðèðîâàííûå ñëó÷àéíûå ÷èñëà íåîáõîäèìî ïîî÷åðåäíî çàôèêñèðîâàòü ÷èñëà (ïðåîáðàçîâàòü ôîðìóëó â çíà÷åíèå) â ñòîëáöå Случайные числа. (Èç-çà ýòîãî äåéñòâèÿ ôîðìóëó â ñòîëáöå Случайные числа íå ñëåäóåò ââîäèòü êàê ôîðìóëó ìàññèâà, òàê êàê ôîðìóëà ìàññèâà íå ïîçâîëÿåò ìàíèïóëèðîâàòü îòäåëüíûìè çíà÷åíèÿìè.) ×òîáû óïðîñòèòü ýòî äåéñòâèå, ìîæíî íàïèñàòü ïðîñòîé ìàêðîñ, êîòîðûé áóäåò âûïîëíÿòü ñëåäóþùèå äåéñòâèÿ. Ïóñòü âûäåëåíà îòäåëüíàÿ ÿ÷åéêà. Ñíà÷àëà âûïîëíÿåòñÿ êîïèðîâàíèå ñîäåðæèìîãî ÿ÷åéêè ëþáûì ñïîñîáîì (ñ ïîìîùüþ ùåë÷êà íà êíîïêå Копировать ñòàíäàðòíîé ïàíåëè èíñòðóìåíòîâ èëè êîìàíäû ПравкаÖКопировать). Çàòåì ïî êîìàíäå ПравкаÖСпециальная вставка îòêðûâàåòñÿ îäíîèìåííîå äèàëîãîâîå îêíî, â êîòîðîì óñòàíàâëèâàåòñÿ ïåðåêëþ÷àòåëü Значения. Ùåë÷îê íà êíîïêå ОК ýòîãî îêíà — ïîñëåäíåå äåéñòâèå, êîòîðîå íàäî çàïèñàòü â ìàêðîñ. Ïåðåä íà÷àëîì çàïèñè ìàêðîñà (êîìàíäà СервисÖМакросÖНачать запись) â îêíå Запись Глава 7. Моделирование случайных величин 241 макроса ðåêîìåíäóåì çàäàòü êîìáèíàöèþ êëàâèø, ñ ïîìîùüþ êîòîðîé áóäåò âûïîëíÿòüñÿ ìàêðîñ. Ïîñëå ùåë÷êà íà êíîïêå ОК â îêíå Запись макроса îòêðûâàåòñÿ ïàíåëü Остановить запись, ãäå ïåðåä çàïèñüþ äåéñòâèé îáÿçàòåëüíî íàäî ùåëêíóòü íà êíîïêå Относительные ссылки. Åñëè èñïîëüçîâàòü îïèñàííûé ìàêðîñ, òî ïîî÷åðåäíîå ôèêñèðîâàíèå çíà÷åíèé âûáîðêè ñðåäíèõ ðàçìåðîâ (ïîðÿäêà 100 ÷èñåë) çàéìåò âñåãî ïàðó ìèíóò èëè ÷óòü áîëüøå (â çàâèñèìîñòè îò ñêîðîñòè íàæàòèÿ êëàâèø). Íà ðèñ. 7.13 ïîêàçàíà îêîí÷àòåëüíàÿ âûáîðêà. Ðèñ. 7.13. Îêîí÷àòåëüíî ñôîðìèðîâàííàÿ âûáîðêà 7.4. Метод отбора Ýòîò ìåòîä ïðèìåíÿåòñÿ äëÿ ìîäåëèðîâàíèÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí, êîòîðûå èìåþò ñëîæíîå ðàñïðåäåëåíèå íà êîíå÷íîì èíòåðâàëå è äëÿ êîòîðûõ èçâåñòíî àíàëèòè÷åñêîå âûðàæåíèå ïëîòíîñòè âåðîÿòíîñòåé ð(õ). Ìåòîä èñïîëüçóåòñÿ â îñíîâíîì òîãäà, êîãäà äðóãèå ìåòîäû ìîäåëèðîâàíèÿ íåïðèåìëåìû. Ðàññìîòðèì ïðîñòåéøèé âàðèàíò ìåòîäà îòáîðà, êîòîðûé òàêæå íàçûâàþò ìåòîäîì Íåéìàíà (ïî èìåíè åãî ðàçðàáîò÷èêà)4. Íà ðèñ. 7.14 ïîêàçàí ãðàôèê ïëîòíîñòè âåðîÿòíîñòè ó = ð(õ) íåêîòîðîé ñëó÷àéíîé âåëè÷èíû Õ, ðàñïðåäåëåííîé íà èíòåðâàëå [a, b], è ãðàôèê ôóíêöèè ó = ñ, êîòîðàÿ ìàæîðèðóåò ïëîòíîñòü ð(õ). Ïóñòü ξ è η — ñëó÷àéíûå âåëè÷èíû, ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëàõ [a, b] è [0, ñ] ñîîòâåòñòâåííî. Äîêàçàíî [16, ñ. 76], ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ, îïðåäåëÿåìàÿ óñëîâèåì Õ = ξ, åñëè η < ð(ξ), èìååò ðàñïðåäåëåíèå ñ ïëîòíîñòüþ âåðîÿòíîñòåé ð(õ). Äðóãèìè ñëîâàìè, åñëè äâóìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà (ξ, η), ðàâíîìåðíî ðàñïðåäåëåííàÿ â ïðÿìîóãîëüíèêå a ≤ õ ≤ b, 0 ≤ ó ≤ ñ, ïîïàäàåò â îáëàñòü, ëåæàùóþ íèæå ãðàôèêà ó = ð(õ), òî ïðèíèìàåòñÿ, ÷òî Õ = ξ (ðèñ. 7.14). Âåëè÷èíà ñ îáû÷íî 4 Èíîãäà âñå ìåòîäû îòáîðà íàçûâàþò ìåòîäàìè Íåéìàíà. 242 Часть II. Средства Excel для статистического анализа áåðåòñÿ ðàâíîé ìàêñèìóìó ôóíêöèè ð(õ), íî, åñëè ìàêñèìóì íåèçâåñòåí èëè ñëîæíî íàéòè åãî òî÷íîå çíà÷åíèå, âåëè÷èíà ñ áåðåòñÿ çàâåäîìî áîëüøåé, ÷åì ìàêñèìàëüíîå çíà÷åíèå ð(õ). Ðèñ. 7.14. Ïîÿñíÿþùèé ðèñóíîê ê îïèñàíèþ ìåòîäà îòáîðà Íà ýòîì îñíîâàíèè ïîñòðîåí ìåòîä îòáîðà: ãåíåðèðóþòñÿ äâà íåçàâèñèìûõ ñëó÷àéíûõ ÷èñëà ξ1 è ξ2, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 1], è âû÷èñëÿþòñÿ çíà÷åíèÿ õ = a + (b – a)ξ1 è y = cξ2. Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî y < ð(õ), òî çà çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Õ ïðèíèìàåòñÿ çíà÷åíèå õ.  ïðîòèâíîì ñëó÷àå ïàðà ÷èñåë ξ1 è ξ2 îòáðàñûâàåòñÿ è ãåíåðèðóåòñÿ íîâàÿ, äëÿ êîòîðîé âûïîëíÿåòñÿ àíàëîãè÷íàÿ ïðîâåðêà. Ïîêàæåì ðåàëèçàöèþ ýòîãî àëãîðèòìà íà ïðèìåðå ìîäåëèðîâàíèÿ ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé ðàñïðåäåëåíèå íà èíòåðâàëå [–1, 1] ñ ïëîòíîñòüþ âåðîÿòíîñòè p ( x) = 2 1 − x 2 . Çäåñü ïî ñãåíåðèðîâàííûì ñëó÷àéíûì ÷èñëàì ξ1 è ξ2, ðàâπ íîìåðíî ðàñïðåäåëåííûì íà èíòåðâàëå [0, 1], ïðîâåðÿåòñÿ íåðàâåíñòâî 2ξ2/π < ð(2ξ1 – 1), êîòîðîå ìîæíî ïðåîáðàçîâàòü â ýêâèâàëåíòíîå íåðàâåíñòâî ξ22 < 1 – (2ξ1 – 1)2. Åñëè ýòî íåðàâåíñòâî âûïîëíÿåòñÿ, òî çà çíà÷åíèå ñëó÷àéíîé âåëè÷èíû Õ ïðèíèìàåòñÿ ÷èñëî 2ξ1 – 1. Íà ðèñ. 7.15 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöàõ À è  êîòîðîãî ñ ïîìîùüþ ôîðìóë =СЛЧИС() ñãåíåðèðîâàíû ðàâíîìåðíî ðàñïðåäåëåííûå ÷èñëà ξ1 è ξ2.  ñòîëáöå Ñ ïî ôîðìóëå =ЕСЛИ(B2^2<1-(2*A2-1)^2;2*A2-1;"M"), çàïèñàííîé â ÿ÷åéêå Ñ2 è ñêîïèðîâàííîé âíèç, âû÷èñëÿþòñÿ çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ. Åñëè îïðåäåëÿþùåå íåðàâåíñòâî íå âûïîëíÿåòñÿ, â ÿ÷åéêó ñòîëáöà Ñ çàïèñûâàåòñÿ áóêâà М (ìîæíî çàïèñàòü ëþáîå çíà÷åíèå, ïîêàçûâàþùåå, ÷òî â äàííîé ÿ÷åéêå íåò âûáîðî÷íîãî çíà÷åíèÿ). Äàëåå îñòàåòñÿ óäàëèòü èç âûáîðêè ÿ÷åéêè ñ áóêâîé М, ò.å. òå ÿ÷åéêè, â êîòîðûõ íåò âûáîðî÷íûõ çíà÷åíèé. Íåäîñòàòêîì äàííîãî ìåòîäà ãåíåðèðîâàíèÿ ñëó÷àéíûõ ÷èñåë ÿâëÿåòñÿ òî, ÷òî íåâîçìîæíî çàðàíåå ïðåäñêàçàòü, ñêîëüêî çíà÷åíèé áóäåò â êîíå÷íîé âûáîðêå. Ñóùåñòâóþò ðàçëè÷íûå ìîäèôèêàöèè ýòîãî ìåòîäà, óìåíüøàþùèå êîëè÷åñòâî ïðîáíûõ ïàð ðàâíîìåðíî ðàñïðåäåëåííûõ ñëó÷àéíûõ ÷èñåë. Глава 7. Моделирование случайных величин 243 Ðèñ. 7.15. Ãåíåðèðîâàíèå ñëó÷àéíûõ ÷èñåë ïî ìåòîäó îòáîðà 7.5. Моделирование многомерных случайных величин Åñëè êîìïîíåíòû Õ1, Õ2, ..., Xn ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2, ..., Xn) íåçàâèñèìû, òî ìîæíî ìîäåëèðîâàòü êàæäóþ ñëó÷àéíóþ âåëè÷èíó Xk (k = 1, 2, ..., n) íåçàâèñèìî è èç ðåàëèçàöèé ýòèõ âåëè÷èí (ñãåíåðèðîâàííûõ ñëó÷àéíûõ ÷èñåë) ñîñòàâèòü ðÿä n-ìåðíûõ âåêòîðîâ, êîòîðûå îáðàçóþò âûáîðêó èç ãåíåðàëüíîé ñîâîêóïíîñòè ñëó÷àéíîé âåëè÷èíû Õ.  ñëó÷àå çàâèñèìîñòè êîìïîíåíòîâ Õ1, Õ2, ..., Xn äëÿ ìîäåëèðîâàíèÿ ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2, ..., Xn) íåîáõîäèìî èñïîëüçîâàòü ñîâìåñòíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x1, x2, ..., xn) êîìïîíåíòîâ Õ1, Õ2, ..., Xn. Äëÿ óïðîùåíèÿ âûêëàäîê äàëåå ðàññìîòðèì ñëó÷àé äâóìåðíîé íåïðåðûâíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2); ìîäåëèðîâàíèå â îáùåì ñëó÷àå ïîêàçàíî â [16, ãëàâà 2]. Ïóñòü ñîâìåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ F(x1, x2) äâàæäû äèôôåðåíöèðîâàíà è ñóùåñòâóåò ñîâìåñòíàÿ ïëîòíîñòü âåðîÿòíîñòè f ( x1 , x2 ) = ∂F ( x1 , x2 ) . Ýòó ∂x1∂x2 ïëîòíîñòü ìîæíî ïðåäñòàâèòü â âèäå ïðîèçâåäåíèÿ ÷àñòíîé è óñëîâíîé ïëîòíîñòåé âåðîÿòíîñòåé ñëó÷àéíûõ âåëè÷èí Õ1 è Õ2: f(x1, x2) = f1(x1) f2(x2 | x1) = f2(x2) f1(x1 | x2), ãäå f1 ( x1 ) = +∞ ∫ f ( x1 , x2 )dx2 , f 2 ( x2 | x1 ) = −∞ f ( x1 , x2 ) (ôóíêöèè f2(x2) è f1(x1 | x2) âû÷èñf1 ( x1 ) ëÿþòñÿ ïî àíàëîãè÷íûì ôîðìóëàì ñ çàìåíîé èíäåêñîâ 1 íà 2 è 2 íà 1). Äàëåå íåîáõîäèìî âû÷èñëèòü óñëîâíûå ôóíêöèè ðàñïðåäåëåíèÿ: x F1 ( x) = ∫ −∞ x f1 ( x1 )dx1 , F2 ( x | x1 ) = ∫ f ( x2 | x1 )dx2 . −∞ 244 Часть II. Средства Excel для статистического анализа Ìîäåëèðîâàíèå ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2) îñíîâàíî íà òîì ôàêòå, ÷òî ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2, ïîëó÷åííûå ïðè ïîñëåäîâàòåëüíîì ðåøåíèè óðàâíåíèé F1(X1) = Y1, F2(Õ2 | X1) = Y2, ãäå Y1 è Y2 — íåçàâèñèìûå ðàâíîìåðíî ðàñïðåäåëåííûå íà èíòåðâàëå [0, 1] ñëó÷àéíûå âåëè÷èíû, èìåþò ñîâìåñòíóþ ôóíêöèþ ðàñïðåäåëåíèÿ F(x1, x2). Ðàññìîòðèì ïðèìåð ìîäåëèðîâàíèÿ ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2), êîòîðàÿ ìîæåò ïðèíèìàòü çíà÷åíèÿ â òðåóãîëüíèêå x + y = 1, x > 0, y > 0 ñ ïëîòíîñòüþ âåðîÿòíîñòè f(x, ó) = 6ó. Ñíà÷àëà âû÷èñëèì óñëîâíûå ïëîòíîñòè âåðîÿòíîñòåé: f1 ( x) = +∞ ∫ f ( x, y )dy = 1− x ∫ 6 ydy = 3(1 − x) −∞ 2 , f 2 ( y | x) = 0 f ( x, y ) 2y = . f1 ( x) (1 − x)2 Äàëåå âû÷èñëèì óñëîâíûå ôóíêöèè ðàñïðåäåëåíèÿ: x F1 ( x) = x ∫ −∞ f1 (u )du = ∫ 3(1 − u ) 2 du = 1 − (1 − x)3 , 0 y F2 ( y | x) = ∫ y f 2 (u | x)du = −∞ 2 y2 = . udu (1 − x) 2 ∫0 (1 − x) 2  äàííîì ñëó÷àå ðåøåíèå óðàâíåíèé F1(x) = ξ1, F2(ó | x) = ξ2 ìîæíî íàéòè â ÿâíîì âèäå: x = 1 − 3 1 − ξ1 , y = 3 1 − ξ1 ξ 2 . Ïîñêîëüêó ñëó÷àéíûå âåëè÷èíû ξ1 è 1 – ξ1 èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, åñëè âåëè÷èíà ξ1 ðàâíîìåðíî ðàñïðåäåëåíà íà èíòåðâàëå [0, 1], ôîðìóëû äëÿ âû÷èñëåíèÿ õ è ó ìîæíî çàïèñàòü ñëåäóþùèì îáðàçîì: x = 1 − 3 ξ1 , y = 3 ξ1 ξ 2 . Íà ðèñ. 7.16 ïîêàçàí ðàáî÷èé ëèñò, â êîòîðîì ñãåíåðèðîâàíû 15 çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2). Çíà÷åíèÿ ñëó÷àéíûõ âåëè÷èí Õ1 è Õ2 ïîëó÷åíû ñ ïîìîùüþ ôîðìóë ìàññèâà {=1-СТЕПЕНЬ(СЛЧИС();1/3)} è {=(1-A2:A16)*ÊÎÐÅÍÜ(ÑË×ÈÑ())} ñîîòâåòñòâåííî. Îòìåòèì, ÷òî äëÿ ðåøåíèÿ óðàâíåíèé F1(X1) = Y1 è F2(Õ2 | X1) = Y2 â îáùåì ñëó÷àå â Excel ìîæíî èñïîëüçîâàòü ñðåäñòâî Поиск решения. 7.5.1. Моделирование зависимых случайных величин с известным коэффициентом корреляции Îïèñàííûé íèæå ìåòîä îáû÷íî ïðèìåíÿåòñÿ äëÿ ìîäåëèðîâàíèÿ çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí, ðàñïðåäåëåíèå êîòîðûõ ïðèíàäëåæèò êëàññó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé, è ðåæå — äëÿ ñëó÷àéíûõ âåëè÷èí ñ äðóãèìè ðàñïðåäåëåíèÿìè, ïîñêîëüêó â ïîñëåäíåì ñëó÷àå, êàê ïðàâèëî, íåîáõîäèìû ïðåäâàðèòåëüíûå äîñòàòî÷íî ñëîæíûå àíàëèòè÷åñêèå âûêëàäêè. Åñëè ðàñïðåäåëåíèå F ñëó÷àéíîé âåëè÷èíû Õ ïðèíàäëåæèò êëàññó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé, òî ñëó÷àéíóþ âåëè÷èíó Õ ìîæíî ïðåäñòàâèòü êàê ñóììó íåçàâèñèìûõ îäèíàêîâî ðàñïðåäåëåííûõ ñëó÷àéíûõ âåëè÷èí Õ = Õ1 + Õ2, èìåþùèõ òîò æå òèï ðàñïðåäåëåíèÿ F (âîçìîæíî, ñ äðóãèìè ïàðàìåòðàìè). Ñïðàâåäëèâî è îáðàòíîå óòâåðæäåíèå: åñëè ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2 èìåþò îäèí è òîò æå òèï ðàñïðåäåëåíèÿ F, ïðèíàäëåæàùèé êëàññó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé, òî ñëó÷àéíàÿ âåëè÷èíà Õ = Õ1 + Õ2 èìååò òîò æå òèï ðàñïðåäåëåíèÿ F. Êëàññó Глава 7. Моделирование случайных величин 245 áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé ïðèíàäëåæàò ìíîãèå ðàñïðåäåëåíèÿ, âñòðå÷àþùèåñÿ íà ïðàêòèêå, â ÷àñòíîñòè, íîðìàëüíîå ðàñïðåäåëåíèå, ðàñïðåäåëåíèå Ïóàññîíà, áèíîìèàëüíîå ðàñïðåäåëåíèå, ãàììà-ðàñïðåäåëåíèå, ðàñïðåäåëåíèå χ2 è äð. Ðèñ. 7.16. Ìîäåëèðîâàíèå Õ = (Õ1, Õ2) ñëó÷àéíîé âåëè÷èíû Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ1, Õ2, ..., Xn, ÿâëÿþùèåñÿ êîìïîíåíòàìè ìíîãîìåðíîé ñëó÷àéíîé âåëè÷èíû Õ = (Õ1, Õ2, ..., Xn), èìåþò ìàòåìàòè÷åñêèå îæèäàíèÿ m = (m1, m2, ..., mn) è ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ σ = (σ1, σ2, ..., σn). Èõ ñîâìåñòíîå ðàñïðåäåëåíèå õàðàêòåðèçóåòñÿ êîððåëÿöèîííîé ìàòðèöåé R = {rij} (i, j = 1, 2, ..., n), ãäå rij = 1, åñëè i = j, à ïðè i ≠ j rij îíè ÿâëÿþòñÿ êîýôôèöèåíòàìè êîððåëÿöèè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè Xi è Xj. Èçâåñòíî, ÷òî ìàòðèöó R ìîæíî ïðåäñòàâèòü â âèäå ïðîèçâåäåíèÿ äâóõ òðåóãîëüíûõ ìàòðèö: R = SST5. Îáîçíà÷èì êàê Y = (Y1, Y2, ..., Yn) âåêòîð íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ íóëåâûå ìàòåìàòè÷åñêèå îæèäàíèÿ è åäèíè÷íûå äèñïåðñèè. Òîãäà ñëó÷àéíàÿ âåëè÷èíà Z = σSY + m áóäåò èìåòü âåêòîðû ìàòåìàòè÷åñêèõ îæèäàíèé m = (m1, m2, ..., mn) è ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé σ = (σ1, σ2, ..., σn), à çàâèñèìîñòü ìåæäó êîìïîíåíòàìè ýòîãî âåêòîðà áóäåò õàðàêòåðèçîâàòüñÿ êîððåëÿöèîííîé ìàòðèöåé R. ×òîáû íà îñíîâå ïðåîáðàçîâàíèÿ Z = σSY + m ïîëíîñòüþ ñìîäåëèðîâàòü ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Õ, íåîáõîäèìî òàê ïîäîáðàòü ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí Y = (Y1, Y2, ..., Yn), ÷òîáû ÷àñòíûå ðàñïðåäåëåíèÿ êîìïîíåíòîâ Z1, Z2, ..., Zn, ñîñòàâëÿþùèõ âåêòîð Z, ñîâïàäàëè ñ ÷àñòíûìè ðàñïðåäåëåíèÿìè âåëè÷èí Õ1, Õ2, ..., Xn. Óñëîâèå ïðèíàäëåæíîñòè ýòèõ ðàñïðåäåëåíèé îäíîìó òèïó ðàñïðåäåëåíèé èç êëàññà áåçãðàíè÷íî äåëèìûõ çàêîíîâ çíà÷èòåëüíî îáëåã÷àåò ðåøåíèå òàêîé çàäà÷è. Îáîçíà÷èì êàê X1 , X 2 ,..., X n ñòàíäàðòèçîâàííûå 5 Ìàòðèöà R ÿâëÿåòñÿ ïîëîæèòåëüíî îïðåäåëåííîé ìàòðèöåé, ïîýòîìó åå ìîæíî ïðåäñòàâèòü â âèäå òàêîãî ïðîèçâåäåíèÿ. 246 Часть II. Средства Excel для статистического анализа ñëó÷àéíûå âåëè÷èíû, èìåþùèå íóëåâûå ìàòåìàòè÷åñêèå îæèäàíèÿ, åäèíè÷íûå äèñïåðñèè è òàêèå æå ðàñïðåäåëåíèÿ, êàê è âåëè÷èíû Õ1, Õ2, ..., Xn. Ïóñòü ìàòðèöà S — íèæíÿÿ òðåóãîëüíàÿ; òîãäà âñå åå ýëåìåíòû, ñòîÿùèå âûøå ãëàâíîé äèàãîíàëè, ðàâíû íóëþ, è, ïîñêîëüêó ýòà ìàòðèöà ÿâëÿåòñÿ ðàçëîæåíèåì êîððåëÿöèîííîé ìàòðèöû, ñóììà êâàäðàòîâ ýëåìåíòîâ ëþáîé ñòðîêè ìàòðèöû ðàâíà 1. Òîãäà SY = (Y1, s21Y1 + s22Y2, s31Y1 + s32Y2 + s33Y3, ..., sn1Y1 + sn2Y2 + ... + snnYn). Ïîëó÷àåì, ÷òî Y1 = X1 , Y2 = ( X 2 – s21Y1)/s22, Y3 = ( X 3 – s31Y1 – s32Y2)/s33, ..., Yn = ( X n – sn1Y1 – sn2Y2 – ... – sn(n–1)Yn–1. Îòñþäà âèäíî, ÷òî ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Y1 ñîâïàäàåò ñ ðàñïðåäåëåíèåì ñëó÷àéíîé âåëè÷èíû X1 . Çíàÿ ðàñïðåäåëåíèå ñëó÷àéíûõ âåëè÷èí Y1 è X 2 , ìîæíî íàéòè ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Y2 è ò.ä. Òàêèì îáðàçîì ìîæíî ïîñëåäîâàòåëüíî íàéòè ðàñïðåäåëåíèÿ âñåõ âåëè÷èí Y1, Y2, ..., Yn. Ýòè ðàñïðåäåëåíèÿ ìîæíî íàéòè äëÿ ëþáûõ ðàñïðåäåëåíèé âåëè÷èí Õ1, Õ2, ..., Xn, õîòÿ, ìîæåò áûòü, ñ íåêîòîðûìè ñëîæíîñòÿìè. Íî åùå ðàç ïîä÷åðêíåì, ÷òî íàèáîëåå ïðîñòî ýòè ðàñïðåäåëåíèÿ îïðåäåëÿþòñÿ â ñëó÷àå, êîãäà ðàñïðåäåëåíèÿ âåëè÷èí Õ1, Õ2, ..., Xn ïðèíàäëåæàò îäíîìó òèïó áåçãðàíè÷íî äåëèìûõ ðàñïðåäåëåíèé.  ýòîì ñëó÷àå äîñòàòî÷íî âû÷èñëèòü òîëüêî ïàðàìåòðû ðàñïðåäåëåíèé, à íå îïðåäåëÿòü òèï ðàñïðåäåëåíèé. Ïîêàæåì ðåàëèçàöèþ îïèñàííîãî ìåòîäà â óïðîùåííîì (íî íàèáîëåå ÷àñòî èñïîëüçóåìîì íà ïðàêòèêå) âàðèàíòå, êîãäà n = 2, à ñëó÷àéíàÿ âåëè÷èíà Õ = (Õ1, Õ2) èìååò äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ïóñòü ñëó÷àéíûå âåëè÷èíû Õ1 è Õ2 èìåþò ìàòåìàòè÷åñêèå îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ñîîòâåòñòâåííî m1, m2 è σ1, σ2. Êîýôôèöèåíò êîððåëÿöèè ìåæäó íèìè 1 r ïóñòü ðàâåí r. Òîãäà ìàòðèöà S èìååò âèä S = . 1 − r 2 0 Ñëó÷àéíûå âåëè÷èíû Y1 è Y2 â äàííîì ñëó÷àå áóäóò èìåòü ñòàíäàðòíûå íîðìàëüíûå ðàñïðåäåëåíèÿ. Çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Õ1 áóäóò âû÷èñëÿòüñÿ ïî ôîðìóëå õ1 = σ1ó1 + m1, à âåëè÷èíû Õ2 — ïî ôîðìóëå x2 = σ 2 (ry1 + 1 − r 2 y2 ) + m2 , ãäå ó1 è ó2 — çíà÷åíèÿ ñëó÷àéíûõ âåëè÷èí Y1 è Y2. Íà ðèñ. 7.17 ïîñëåäîâàòåëüíî ïîêàçàíû âû÷èñëåíèÿ ñëó÷àéíûõ ÷èñåë õ1 è õ2.  ñòîëáöå sY1 ïî ôîðìóëå ìàññèâà {=НОРМСТОБР(СЛЧИС())} âû÷èñëÿþòñÿ çíà÷åíèÿ ñëó÷àéíîé âåëè÷èíû Y1 (äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, íàçâàí sY1).  ñòîëáöå sY2 ñ èñïîëüçîâàíèåì ôîðìóëû ìàññèâà {=F1*sY1+КОРЕНЬ(1-F1*F1)*НОРМСТОБР(СЛЧИС())} âû÷èñëÿþòñÿ çíà÷åíèÿ ry1 + 1 − r 2 y2 (çíà÷åíèå êîýôôèöèåíòà êîððåëÿöèè çàïèñàíî â ÿ÷åéêå F1). Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ýòè çíà÷åíèÿ, íàçâàí sY2.  ñòîëáöàõ Х1 è Х2 âû÷èñëÿþòñÿ çíà÷åíèÿ âåëè÷èí Õ1 è Õ2 ïî ôîðìóëàì ìàññèâîâ {=F4*sY1+F2} è {=F5*sY2+F3} ñîîòâåòñòâåííî. Êîíå÷íî, ìîæíî îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé â ñòîëáöàõ À è Â, îäíàêî òàêèå âû÷èñëåíèÿ áîëåå Глава 7. Моделирование случайных величин 247 íàãëÿäíû è ïðîñòû. Êðîìå òîãî, îíè ïîçâîëÿþò ëåãêî ãåíåðèðîâàòü âûáîðêè ñ ðàçëè÷íûìè ïàðàìåòðàìè ðàñïðåäåëåíèÿ, äëÿ ÷åãî äîñòàòî÷íî èçìåíèòü çíà÷åíèÿ â ÿ÷åéêàõ F1:F5.  ÿ÷åéêå F8 âû÷èñëÿåòñÿ âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè. Êàê âèäíî íà ðèñ. 7.17, ïîäñ÷èòàííîå çíà÷åíèå âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè áëèçêî ê èñòèííîìó çíà÷åíèþ êîýôôèöèåíòà êîððåëÿöèè. Ðèñ. 7.17. Ìîäåëèðîâàíèå äâóìåðíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ 248 Часть II. Средства Excel для статистического анализа Часть III Анализ одномерных выборок В этой части... Ãëàâà 8. Ïðåäâàðèòåëüíûé àíàëèç Ãëàâà 9. Ïîäáîð ðàñïðåäåëåíèÿ Ãëàâà 10. Èíòåðâàëüíîå îöåíèâàíèå ïàðàìåòðîâ ðàñïðåäåëåíèÿ Ãëàâà 11. Ïðîâåðêà ãèïîòåç î ïàðàìåòðàõ ðàñïðåäåëåíèé Ãëàâà 12. Ñðàâíåíèå îäíîìåðíûõ âûáîðîê  ýòîé ÷àñòè ðå÷ü èäåò î ïðàêòè÷åñêîé ðåàëèçàöèè ìåòîäîâ ñòàòèñòè÷åñêîãî àíàëèçà îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê. Ãëàâà 8 ïîñâÿùåíà ïðåäâàðèòåëüíîé îáðàáîòêå äàííûõ, â ãëàâå 9 ðàññìîòðåíû âàæíûå äëÿ ïîñëåäóþùåãî àíàëèçà âîïðîñû ïîäáîðà ðàñïðåäåëåíèé ïî èìåþùèìñÿ âûáîðî÷íûì çíà÷åíèÿì.  ãëàâàõ 10 è 11 ïîêàçàíû ìåòîäû èíòåðâàëüíîãî îöåíèâàíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ ïàðàìåòðîâ. Ãëàâà 12 ïîñâÿùåíà ñðàâíåíèþ ðàñïðåäåëåíèé íåñêîëüêèõ îäíîìåðíûõ âûáîðîê. Глава 8 Предварительный анализ Ï ðåäâàðèòåëüíûé ýòàï íà ïðàêòèêå ïðèñóòñòâóåò â ëþáîì ñòàòèñòè÷åñêîì àíàëèçå è çàêëþ÷àåòñÿ, ïî êðàéíåé ìåðå, â ïîäãîòîâêå äàííûõ äëÿ ïðîâåäåíèÿ àíàëèçà. Íî, êîíå÷íî, äåéñòâèÿ, âûïîëíÿåìûå íà ýòîì ýòàïå, çàâèñÿò îò êîíêðåòíûõ çàäà÷, ðåøàåìûõ ñ ïîìîùüþ ñòàòèñòè÷åñêîãî àíàëèçà, è èñõîäíûõ äàííûõ. Òàê, åñëè âîçíèêëè ïîäîçðåíèÿ, ÷òî âûáîðêà èìååò çíà÷åíèÿ, êîòîðûå íå ÿâëÿþòñÿ ñëó÷àéíûìè èëè ðåçêî âûäåëÿþòñÿ íà ôîíå îñòàëüíûõ âûáîðî÷íûõ çíà÷åíèé, òî ñëåäóåò ïðîâåñòè öåíçóðèðîâàíèå âûáîðêè. Åñëè íåîáõîäèìà èíòåðâàëüíàÿ îöåíêà íåèçâåñòíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, òî ïðåäâàðèòåëüíûì ýòàïîì ìîæíî ñ÷èòàòü ïðîâåðêó ãèïîòåçû î íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ, ÷òîáû âïîñëåäñòâèè èñïîëüçîâàòü èíòåðâàëüíûå îöåíêè, ïîñòðîåííûå íà îñíîâå íîðìàëüíîãî ðàñïðåäåëåíèÿ.  äðóãèõ ñëó÷àÿõ öåëüþ ñòàòèñòè÷åñêîãî àíàëèçà ìîæåò áûòü óñòàíîâêà òèïà âûáîðî÷íîãî ðàñïðåäåëåíèÿ, à íà ïðåäâàðèòåëüíîì ýòàïå ñòðîÿòñÿ ãèñòîãðàììû âûáîðî÷íîãî ðàñïðåäåëåíèÿ è ïîäñ÷èòûâàþòñÿ ðàçëè÷íûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè, ÷òîáû ïîäîáðàòü òèï ðàñïðåäåëåíèÿ, íàèáîëåå ñîîòâåòñòâóþùèé èñõîäíûì äàííûì. Òàêèì îáðàçîì, ñ îäíîé ñòîðîíû, òðóäíî î÷åðòèòü êðóã òåõ äåéñòâèé, êîòîðûå ñëåäóåò âñåãäà âûïîëíÿòü â êà÷åñòâå ïðåäâàðèòåëüíîãî àíàëèçà; ñ äðóãîé ñòîðîíû, íåâîçìîæíî ÷åòêî îòäåëèòü ïðåäâàðèòåëüíûé ýòàï ñòàòèñòè÷åñêîãî àíàëèçà îò ñàìîãî àíàëèçà. Ïîýòîìó çäåñü ìû îñòàíîâèìñÿ ëèøü íà íåêîòîðûõ äåéñòâèÿõ, êîòîðûå îáû÷íî îòíîñÿò ê ïðåäâàðèòåëüíîìó ýòàïó ñòàòèñòè÷åñêîãî àíàëèçà. Ðàññìîòðèì öåíçóðèðîâàíèå è ïðåîáðàçîâàíèå âûáîðîê, ïîñòðîåíèå ãèñòîãðàìì, ïîëèãîíîâ è ýìïèðè÷åñêèõ ôóíêöèé ðàñïðåäåëåíèÿ, à òàêæå âû÷èñëåíèå òî÷å÷íûõ îöåíîê ïàðàìåòðîâ âûáîðî÷íûõ ðàñïðåäåëåíèé. Äðóãèìè ñëîâàìè, ðàññìîòðèì “òåõíè÷åñêóþ” ðàáîòó, ïðîâîäèìóþ ïåðåä ïðèìåíåíèåì ñòàòèñòè÷åñêèõ ìåòîäîâ. 8.1. Цензурирование Èíîãäà â äàííûõ ìîæíî íàáëþäàòü âûáðîñû — ñèëüíî îòêëîíÿþùèåñÿ çíà÷åíèÿ, ò.å. çíà÷åíèÿ, êîòîðûå, ïî-âèäèìîìó, íå ïðèíàäëåæàò äàííîìó ðàñïðåäåëåíèþ, ïîñêîëüêó îíè ëèáî ñëèøêîì âåëèêè, ëèáî ñëèøêîì ìàëû. Âûáðîñû çàòðóäíÿþò ïðîâîäèìûé ñòàòèñòè÷åñêèé àíàëèç è ìîãóò ïðèâåñòè ê íåâåðíî èíòåðïðåòèðóåìûì ðåçóëüòàòàì. Ïîýòîìó âûáðîñû ñëåäóåò âûÿâèòü è îáðàáîòàòü îòäåëüíî. Ïðîöåññ óäàëåíèÿ èç âûáîðêè âûáðîñîâ íàçûâàåòñÿ öåíçóðèðîâàíèåì âûáîðêè.  çàâèñèìîñòè îò ïðåäïîëîæåíèé î ïðèðîäå âûáðîñîâ (ýòî îøèáêè íàáëþäåíèé èëè àðòåôàêòû, ïðèâíåñåííûå ÷åëîâåêîì, ëèáî êîððåêòíûå, íî “îòëè÷àþùèåñÿ îò îñòàëüíûõ” çíà÷åíèÿ äàííûõ) ïðîáëåìó âûáðîñîâ ðåøàþò ïî-ðàçíîìó. Íî â ëþáîì ñëó÷àå ïðåäïðèíèìàåìûå äåéñòâèÿ ïî ðåøåíèþ ýòîé 250 Часть III. Анализ одномерных выборок ïðîáëåìû íåîáõîäèìî îáîñíîâûâàòü èñõîäÿ ëèáî èç ïðèðîäû âûáðîñîâ, ëèáî èç öåëåé êîíêðåòíîãî ñòàòèñòè÷åñêîãî àíàëèçà. Åñëè ýòî ýëåìåíòàðíàÿ îøèáêà íàáëþäåíèé, òî çíà÷åíèå ïî âîçìîæíîñòè íóæíî ïðîñòî îòêîððåêòèðîâàòü. Åñëè ýòî àðòåôàêò, íå ïîäëåæàùèé êîððåêòèðîâêå, òî åãî óäàëÿþò. Åñëè åñòü óáåäèòåëüíûå ïîäòâåðæäåíèÿ òîìó, ÷òî çíà÷åíèÿ-âûáðîñû íå ïðèíàäëåæàò ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé ïîëó÷åíà èññëåäóåìàÿ âûáîðêà, òî èõ òàêæå óäàëÿþò. Åñëè ïîñëåäíåå óòâåðæäåíèå îáîñíîâàòü òðóäíî, íî âñå-òàêè åñòü “ïîäîçðèòåëüíûå” âûáîðî÷íûå çíà÷åíèÿ, òî ìîæíî âûïîëíèòü äâà àíàëèçà — áåç óäàëåíèÿ âûáðîñîâ è ñ óäàëåíèåì âûáðîñîâ. Ñëåäóåò îòìåòèòü, ÷òî äëÿ öåíçóðèðîâàííûõ âûáîðîê èíîãäà ïðèìåíÿþò ñïåöèàëüíûå ôîðìóëû äëÿ âû÷èñëåíèÿ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèÿ [14]. ×àñòî ýòè âû÷èñëåíèÿ âûïîëíÿþòñÿ èòåðàöèîííî, ïîêà íå ñîéäóòñÿ ê îïðåäåëåííûì çíà÷åíèÿì. Ïðèìåíåíèå òàêèõ ôîðìóë îáû÷íî òðåáóåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ; “óíèâåðñàëüíûå” ôîðìóëû âåñüìà ñëîæíû [23] è íà ïðàêòèêå èñïîëüçóþòñÿ ðåäêî. Òàêèå ôîðìóëû ìû ðàññìàòðèâàòü íå áóäåì. 8.1.1. Цензурирования на основе построения доверительных интервалов Ñóùåñòâóåò íåñêîëüêî îñíîâíûõ ïîäõîäîâ ê èäåíòèôèêàöèè âûáðîñîâ, ñðåäè êîòîðûõ âûäåëèì ïîäõîä, îñíîâàííûé íà àïðèîðíîé èíôîðìàöèè î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, è íåïàðàìåòðè÷åñêèå ìåòîäû, íå èñïîëüçóþùèå èíôîðìàöèè î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Ðàññìîòðèì ñíà÷àëà ïåðâûé ïîäõîä ïðè ñàìûõ îáùèõ ïðåäïîëîæåíèÿõ. Èäåÿ âûäåëåíèÿ âûáðîñîâ ñðåäè âûáîðî÷íûõ çíà÷åíèé äîñòàòî÷íî ïðîñòà. Íà îñíîâå âûáîðêè êàêèì-ëèáî îáðàçîì ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë, ñîäåðæàùèé îñíîâíóþ ìàññó çíà÷åíèé ñ çàäàííîé âåðîÿòíîñòüþ. Çíà÷åíèÿ, âûõîäÿùèå çà ýòîò èíòåðâàë, ñ÷èòàþòñÿ âûáðîñàìè. Çàòåì íà îñíîâàíèè óæå öåíçóðèðîâàííîé âûáîðêè ñòðîèòñÿ íîâûé äîâåðèòåëüíûé èíòåðâàë è âûáîðêà ñíîâà ïðîâåðÿåòñÿ íà íàëè÷èå âûáðîñîâ. Åñëè òàêîâûå èìåþòñÿ, òî ïðîöåññ ïîâòîðÿåòñÿ äî òåõ ïîð, ïîêà îáúåì öåíçóðèðîâàííîé âûáîðêè íå ñòàáèëèçèðóåòñÿ, ò.å. äî òåõ ïîð, ïîêà áóäóò èäåíòèôèöèðîâàòüñÿ íîâûå âûáðîñû.  ýòîì ìåòîäå î÷åâèäíà ðîëü àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, ïîñêîëüêó íà îñíîâå ýòèõ ïðåäïîëîæåíèé ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë. Åùå îäíîé ïðîáëåìîé ÿâëÿåòñÿ íåèçâåñòíîñòü çíà÷åíèé ïàðàìåòðîâ ðàñïðåäåëåíèÿ, âìåñòî êîòîðûõ ïðèõîäèòñÿ áðàòü èõ âûáîðî÷íûå îöåíêè. Ýòî, â ñâîþ î÷åðåäü, ïðèâîäèò ê òðåáîâàíèþ äîñòàòî÷íî áîëüøîãî îáúåìà âûáîðêè. Îòìåòèì òàêæå, ÷òî âìåñòî ñòàíäàðòíîé îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ êàê êîðíÿ èç âûáîðî÷íîé äèñïåðñèè ðåêîìåíäóåòñÿ èñïîëüçîâàòü ñðåäíåå àáñîëþòíîå îòêëîíåíèå dn = 1 n ∑ | xi − x | , ãäå x — âûáîðî÷íîå ñðåäíåå [1, 23], îñîáåííî äëÿ ìàëûõ âûáîn i =1 ðîê è âûáîðîê, ðàñïðåäåëåíèå êîòîðûõ çíà÷èòåëüíî îòëè÷àåòñÿ îò íîðìàëüíîãî. Åñëè íå äåëàòü îãðàíè÷èòåëüíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ èñïîëüçîâàíèå íåðàâåíñòâà ×åáûøåâà èëè íåðàâåíñòâà Ãàóññà â ïðåäïîëîæåíèè, ÷òî ðàñïðåäåëåíèå îäíîìîäàëüíî (ýòè íåðàâåíñòâà ïðèâåäåíû â ðàçäåëå 1.2.4). ×òîáû ñîñòàâèòü ïðåäñòàâëåíèå î âèäå ðàñïðåäåëåíèÿ, ïåðåä íà÷àëîì öåíçóðèðîâàíèÿ ñëåäóåò ïîñòðîèòü ãèñòîãðàììó, êîòîðàÿ ïî êðàéíåé ìåðå ïîêàæåò, ìîæíî ëè Глава 8. Предварительный анализ 251 ñ÷èòàòü ðàñïðåäåëåíèå îäíîìîäàëüíûì. Îòìåòèì, ÷òî èñïîëüçîâàíèå íåðàâåíñòâà ×åáûøåâà — íàèáîëåå íàäåæíûé è áåçîïàñíûé ñïîñîá öåíçóðèðîâàíèÿ, ïîñêîëüêó â ýòîì ñëó÷àå âåðîÿòíîñòü îòáðîñèòü òå çíà÷åíèÿ, êîòîðûå äåéñòâèòåëüíî ïðèíàäëåæàò âûáîðêå, ìèíèìàëüíà (íî, ñ äðóãîé ñòîðîíû, ìàêñèìàëüíà âåðîÿòíîñòü îñòàâèòü âûáðîñû â âûáîðêå). Íà ðèñ. 8.1 â ñòîëáöå À ïîêàçàíà âûáîðêà îáúåìîì 50 çíà÷åíèé, èìåþùàÿ ëîãíîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = 0 è σ = 1, ê êîòîðîé äîáàâëåíû çíà÷åíèÿ –0,5, –1,2, 8, 9 è 10. (Âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû â ðåçóëüòàòå ïðèìåíåíèÿ ôîðìóëû ìàññèâà {=ЛОГНОРОБР(СЛЧИС();0;)} ê äèàïàçîíó À2:À51. Çàòåì ôîðìóëû áûëè çàìåíåíû çíà÷åíèÿìè, êàê îïèñàíî â ðàçäåëå 7.1.) Îòìåòèì, ÷òî çäåñü îòðèöàòåëüíûå çíà÷åíèÿ ÿâëÿþòñÿ î÷åâèäíûì àðòåôàêòîì, îäíàêî òîëüêî åñëè àïðèîðè èçâåñòíî, ÷òî âûáîðêà ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû, ïðèíèìàþùåé ïîëîæèòåëüíûå çíà÷åíèÿ ñ âåðîÿòíîñòüþ 1.  ïðîòèâíîì ñëó÷àå èñêëþ÷èòü îòðèöàòåëüíûå çíà÷åíèÿ èç âûáîðêè “çàêîííûì” ñïîñîáîì ïðàêòè÷åñêè íåâîçìîæíî.  ñòîëáöå  íà ðèñ. 8.1 ïðèâåäåíà òà æå âûáîðêà, îòñîðòèðîâàííàÿ â ïîðÿäêå âîçðàñòàíèÿ; ðåçóëüòàòû öåíçóðèðîâàíèÿ íå çàâèñÿò îò ïîðÿäêà âûáîðî÷íûõ çíà÷åíèé, íî äëÿ íàãëÿäíîñòè óäîáíåå èñïîëüçîâàòü îòñîðòèðîâàííóþ âûáîðêó. Ðèñ. 8.1. Èñõîäíûå äàííûå äëÿ öåíçóðèðîâàíèÿ Íà ýòîì æå ðèñóíêå ïîêàçàíà ãèñòîãðàììà ÷àñòîò. (Äëÿ ïîäñ÷åòà ÷àñòîò â äèàïàçîíå Å2:Å9 èñïîëüçîâàíà ôîðìóëà ìàññèâà {=ЧАСТОТА(Исходная_выборка;D2:D8)}; äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Исходная_выборка.) Çíà÷åíèÿ, ïðåâûøàþùèå 6, ñãðóïïèðîâàíû â èíòåðâàëå, ïîìå÷åííîì ÷èñëîì 7. Íà ãèñòîãðàììå âèäíî, ÷òî ðàñïðåäåëåíèå äàëåêî îò îäíîìîäàëüíîãî, ïîýòîìó èñïîëüçóåì íåðàâåíñòâî ×åáûøåâà. Íàïîìíèì, ÷òî íåðàâåíñòâî ×åáûøåâà (ñì. ðàçäåë 1.2.4) èìååò âèä P{|X – m| ≥ λσ} ≤ 1/λ2, 252 Часть III. Анализ одномерных выборок ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, m — åå ìàòåìàòè÷åñêîå îæèäàíèå, σ — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå, λ îïðåäåëÿåò ðàçìåð äîâåðèòåëüíîãî èíòåðâàëà è âû÷èñëÿåòñÿ íà îñíîâàíèè çàäàííîãî äîâåðèòåëüíîãî óðîâíÿ (âåðîÿòíîñòè) ð.  êà÷åñòâå îöåíêè ìàòåìàòè÷åñêîãî îæèäàíèÿ èñïîëüçóåì âûáîðî÷íîå ñðåäíåå, à âìåñòî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ — ñðåäíåå àáñîëþòíîå îòêëîíåíèå dn. Åñëè çàäàíà âåðîÿòíîñòü ð, ñ êîòîðîé äîâåðèòåëüíûé èíòåðâàë äîëæåí ñîäåðæàòü îñíîâíóþ ìàññó âûáîðî÷íûõ çíà÷åíèé, òî äàëåå çíà÷åíèå 1 – ð ïðèðàâíèâàåòñÿ ê 1/λ2 è èç ýòîãî ðàâåíñòâà îïðåäåëÿåòñÿ çíà÷åíèå λ. Òàêèì îáðàçîì, λ âû÷èñëÿåòñÿ ïî ôîðìóëå λ = 1/ 1 − p , íèæíÿÿ tí è âåðõíÿÿ tâ ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà âû÷èñëÿþòñÿ ïî ôîðìóëàì tí = x – λdn è tâ = x + λdn. Ðàáî÷èé ëèñò ñ ðåçóëüòàòàìè âû÷èñëåíèé ïî ýòèì ôîðìóëàì äëÿ ð = 0,9 ïîêàçàí íà ðèñ. 8.2. Òåïåðü îñòàëîñü îïðåäåëèòü, êàêèå âûáîðî÷íûå çíà÷åíèÿ âûõîäÿò çà ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë. Êîíå÷íî, äëÿ äàííîé îòíîñèòåëüíî ìàëîé âûáîðêè ýòî ñäåëàòü íåñëîæíî, òåì áîëåå ÷òî îíà îòñîðòèðîâàíà. È âñå-òàêè ïîêàæåì äâà ñïîñîáà àâòîìàòèçàöèè ïðîöåññà ïîèñêà âûáðîñîâ. Ðèñ. 8.2. Ðåçóëüòàòû âû÷èñëåíèé Ïåðâûé ñïîñîá ïðîñòî âûäåëÿåò íà îñíîâå çàðàíåå çàäàííîãî ôîðìàòà çíà÷åíèÿ, âûõîäÿùèå çà ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà. Äëÿ ýòîãî èñïîëüçóåòñÿ óñëîâíîå ôîðìàòèðîâàíèå. 1. Ñíà÷àëà íåîáõîäèìî âûäåëèòü äèàïàçîíû ÿ÷ååê, ê êîòîðûì áóäåò ïðèìåíåíî óñëîâíîå ôîðìàòèðîâàíèå; â äàííîì ïðèìåðå ýòî äèàïàçîí À1:Â56, ñîäåðæàùèé êàê èñõîäíóþ, òàê è îòñîðòèðîâàííóþ âûáîðêè. 2. Ïî êîìàíäå ФорматÖУсловное форматирование îòêðûâàåòñÿ îäíîèìåííîå äèàëîãîâîå îêíî (ðèñ. 8.3).  íåì íåîáõîäèìî çàäàòü óñëîâèå, êîòîðîìó äîëæíû Глава 8. Предварительный анализ 253 óäîâëåòâîðÿòü çíà÷åíèÿ, ÷òîáû ê ýòèì çíà÷åíèÿì áûë ïðèìåíåí îïðåäåëåííûé ôîðìàò, è ñàì ôîðìàò. Äëÿ çàäàíèÿ óñëîâèÿ â ïåðâîì ïîëå ñëåäóåò óêàçàòü, ÷òî óñëîâèå çàäàåòñÿ îòíîñèòåëüíî çíà÷åíèÿ (ìîæíî òàêæå çàäàòü óñëîâèå â âèäå ôîðìóëû), âî âòîðîì ïîëå èç ðàñêðûâàþùåãîñÿ ñïèñêà íåîáõîäèìî âûáðàòü çíàê ðàâåíñòâà èëè íåðàâåíñòâà.  òðåòüåì ïîëå íóæíî óêàçàòü çíà÷åíèå, ñ êîòîðûì ñðàâíèâàåòñÿ çíà÷åíèå â ÿ÷åéêå. Çäåñü ìîæíî ââåñòè íå òîëüêî êîíêðåòíîå ÷èñëî, íî è ññûëêó íà ÿ÷åéêó, ñîäåðæàùóþ ýòî ÷èñëî.  äàííîì ïðèìåðå ïåðâîå óñëîâèå çàäàåòñÿ äëÿ çíà÷åíèé, êîòîðûå ìåíüøå íèæíåé ãðàíèöû; ñàìî çíà÷åíèå íèæíåé ãðàíèöû âû÷èñëåíî â ÿ÷åéêå F15. 3. ×òîáû çàäàòü ôîðìàò, íàäî ùåëêíóòü íà êíîïêå Формат, ïîñëå ÷åãî îòêðîåòñÿ äèàëîãîâîå îêíî Формат ячеек.  íåì ìîæíî çàäàòü ëþáîé ôîðìàò êàê äëÿ çíà÷åíèé, òàê è äëÿ ÿ÷ååê, èõ ñîäåðæàùèõ. 4. Äëÿ çàäàíèÿ åùå îäíîãî óñëîâèÿ è ñîîòâåòñòâóþùåãî ôîðìàòà (íàïðèìåð, ÷òîáû ïî-ðàçíîìó ôîðìàòèðîâàòü íàèáîëüøèå è íàèìåíüøèå çíà÷åíèÿ) ñëåäóåò ùåëêíóòü íà êíîïêå А также. Îêíî ðàñøèðèòñÿ, è ìîæíî áóäåò çàäàòü íîâûå óñëîâèå è ôîðìàò.  äàííîì ïðèìåðå âòîðîå óñëîâèå çàäàåòñÿ äëÿ çíà÷åíèé, êîòîðûå áîëüøå âåðõíåé ãðàíèöû (ÿ÷åéêà F16). 5. Ïîñëå çàäàíèÿ âñåõ óñëîâèé è ôîðìàòîâ ñëåäóåò ùåëêíóòü íà êíîïêå ОК. Ôîðìàòû áóäóò íåìåäëåííî ïðèìåíåíû ê âûäåëåííîìó äèàïàçîíó ÿ÷ååê. Ðåçóëüòàò ïðèìåíåíèÿ óñëîâíîãî ôîðìàòà äëÿ îïèñûâàåìîãî ïðèìåðà ïîêàçàí íà ðèñ. 8.4. Âñåãî ìîæíî çàäàòü äî òðåõ óñëîâèé. ß÷åéêè, ñîäåðæèìîå êîòîðûõ íå óäîâëåòâîðÿåò íè îäíîìó óñëîâèþ, ñîõðàíÿþò ôîðìàò, êîòîðûé îíè èìåëè äî çàäàíèÿ óñëîâíîãî ôîðìàòà. Äîñòîèíñòâîì óñëîâíîãî ôîðìàòèðîâàíèÿ ÿâëÿåòñÿ òî, ÷òî ïðè èçìåíåíèè çíà÷åíèé â ÿ÷åéêàõ, ñîäåðæàùèõ êàê âûáîðî÷íûå, òàê è âû÷èñëÿåìûå çíà÷åíèÿ (íàïðèìåð, çíà÷åíèÿ íèæíåé è âåðõíåé ãðàíèö), óñëîâíîå ôîðìàòèðîâàíèå ñîõðàíÿåòñÿ è ïðèìåíÿåòñÿ ê íîâûì çíà÷åíèÿì. Ðèñ. 8.3. Çàäàíèå óñëîâíûõ ôîðìàòîâ 254 Часть III. Анализ одномерных выборок Ðèñ. 8.4. Ïðèìåíåíèå óñëîâíîãî ôîðìàòèðîâàíèÿ Âòîðîé ñïîñîá èñêëþ÷åíèÿ âûáðîñîâ áîëåå ðàäèêàëåí, ïîñêîëüêó îí ôîðìèðóåò íîâóþ âûáîðêó, íî óæå áåç ýòèõ âûáðîñîâ. ×òîáû ñîçäàòü òàêóþ âûáîðêó, âûïîëíèòå ñëåäóþùèå äåéñòâèÿ. 1. Âûäåëèòå äèàïàçîí ÿ÷ååê, ñîâïàäàþùèé ïî ðàçìåðó ñ äèàïàçîíîì, ñîäåðæàùèì èñõîäíóþ âûáîðêó. 2. Ââåäèòå ïðèâåäåííóþ íèæå ôîðìóëó è íàæìèòå êëàâèøè <Ctrl+Shift+Enter>. Òåì ñàìûì áóäåò ñîçäàíà ôîðìóëà ìàññèâà, ðàñïðîñòðàíÿþùàÿ ñâîå äåéñòâèå íà âåñü âûäåëåííûé äèàïàçîí. (Çäåñü äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðêó, íàçâàí Выборка.) =ЕСЛИ(Выборка<F15;"";ЕСЛИ(Выборка>F16;"";Выборка)) Êàê ïîêàçàíî íà ðèñ. 8.5, ýòà ôîðìóëà îñòàâëÿåò ÿ÷åéêè, êîòîðûå ñîîòâåòñòâóþò çíà÷åíèÿì, âûõîäÿùèì çà äîâåðèòåëüíûé èíòåðâàë, ïóñòûìè. (Íà ðèñ. 8.5 òàêæå ïîêàçàíà ãèñòîãðàììà äëÿ íîâîé âûáîðêè.) Ïîñëå ïðèíÿòèÿ îêîí÷àòåëüíîãî ðåøåíèÿ î òîì, ÷òîáû îñòàâèòü öåíçóðèðîâàííóþ âûáîðêó (ïðèíÿòîå, êîíå÷íî, ïîñëå äîïîëíèòåëüíûõ ýêñïåðèìåíòîâ ñî çíà÷åíèåì âåðîÿòíîñòè ð), ìîæíî óäàëèòü èç ýòîãî äèàïàçîíà ôîðìóëû è îñòàâèòü òîëüêî çíà÷åíèÿ. Åñëè çàäàòü çíà÷åíèå âåðîÿòíîñòè ð ðàâíûì 0,95 (÷òî áîëåå åñòåñòâåííî, ÷åì çíà÷åíèå 0,9), òî â ýòîì ñëó÷àå áóäåò èñêëþ÷åíî òîëüêî çíà÷åíèå 10, êàê ïîêàçàíî íà ðèñ. 8.6. Òàêèì îáðàçîì, íåðàâåíñòâî ×åáûøåâà ñëèøêîì “îñòîðîæíî” â îïðåäåëåíèè âûáðîñîâ. Äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ñîäåðæàùåãî îñíîâíóþ ìàññó âûáîðî÷íûõ çíà÷åíèé, ìîæíî òàêæå ïðèìåíèòü ýìïèðè÷åñêîå ïðàâèëî 3S, êîòîðîå óòâåðæäàåò, ÷òî âåðîÿòíîñòü P{|X – x | ≤ 3Sn} ñîñòàâëÿåò íå ìåíåå 0,95. Çäåñü x — âûáîðî÷íîå ñðåäíåå, à Sn — âûáîðî÷íàÿ îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ. Ðåçóëüòàòû öåíçóðèðîâàíèÿ íà îñíîâå ýòîãî íåðàâåíñòâà ïîêàçàíû íà ðèñ. 8.7.  äàííîì ñëó÷àå öåíçóðèðîâàííàÿ âûáîðêà ñîâïàäàåò ñ âûáîðêîé, Глава 8. Предварительный анализ 255 ïîëó÷åííîé ïðè èñïîëüçîâàíèè íåðàâåíñòâà ×åáûøåâà ñ âåðîÿòíîñòüþ ð = 0,9. Íî ñëåäóåò îòìåòèòü, ÷òî âìåñòî âûáîðî÷íîé îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ çäåñü ïî-ïðåæíåìó èñïîëüçîâàëîñü ñðåäíåå àáñîëþòíîå îòêëîíåíèå dn. Ðèñ. 8.5. Íîâàÿ öåíçóðèðîâàííàÿ âûáîðêà Ðèñ. 8.6. Öåíçóðèðîâàííàÿ âûáîðêà ïðè âåðîÿòíîñòè 0,95  çàêëþ÷åíèå îòìåòèì, ÷òî ïðè ïðîâåäåíèè öåíçóðèðîâàíèÿ íà îñíîâå íåðàâåíñòâ ×åáûøåâà, Ãàóññà èëè íà îñíîâå ïðàâèëà 3S èòåðàöèîííàÿ ïðîöåäóðà öåíçóðèðîâàíèÿ (ïîñëåäîâàòåëüíîãî ïðîâåäåíèÿ öåíçóðèðîâàíèÿ äî òåõ ïîð, ïîêà áóäóò îïðåäåëÿòüñÿ íîâûå âûáðîñû), êàê ïðàâèëî, íå ïðîâîäèòñÿ, ïîñêîëüêó 256 Часть III. Анализ одномерных выборок çäåñü íå ïðåäóñìîòðåíû “ñòàáèëèçèðóþùèå” ïîïðàâêè äëÿ âû÷èñëåíèÿ ñðåäíåãî è îöåíêè ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ, àíàëîãè÷íûå ïðèìåíÿåìûì ïðè öåíçóðèðîâàíèè âûáîðîê èç íîðìàëüíî ðàñïðåäåëåííûõ ñîâîêóïíîñòåé [23]. Ðèñ. 8.7. Öåíçóðèðîâàíèå íà îñíîâå ïðàâèëà 3S 8.1.2. Непараметрическое цензурирование  îïèñàííîì íèæå ìåòîäå öåíçóðèðîâàíèÿ íå òðåáóåòñÿ àïðèîðíûõ ïðåäïîëîæåíèé î ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, ïîñêîëüêó îí ïîñòðîåí íà îñíîâå ïîðÿäêîâûõ ñòàòèñòèê (î ïîðÿäêîâûõ ñòàòèñòèêàõ ðå÷ü èäåò â ðàçäåëå 2.3.9). Ñóùåñòâóåò íåñêîëüêî ïîäõîäîâ ê öåíçóðèðîâàíèþ âûáîðîê íà îñíîâå ïîðÿäêîâûõ ñòàòèñòèê. Ïîêàæåì ìåòîä öåíçóðèðîâàíèÿ, ïðåäëîæåííûé Äæ. Òüþêè (J.W. Tukey) [15]. Äëÿ èëëþñòðàöèè ìåòîäà èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì ðàçäåëå. 1. Âû÷èñëÿåòñÿ ðàíã r0,25 íèæíåãî êâàðòèëÿ ξ0,25 (î êâàðòèëÿõ ðå÷ü èäåò â ðàçäåëå 1.2.3) ïî ôîðìóëå r0,25 = (1 + [(1 + n)/2])/2, ãäå n — îáúåì âûáîðêè, [õ] îáîçíà÷àåò öåëóþ ÷àñòü ÷èñëà õ. Íà ðèñ. 8.8 ýòîò ðàíã âû÷èñëÿåòñÿ â ÿ÷åéêå Å2 ïî ôîðìóëå =(1+ЦЕЛОЕ((1+$D$2)/2))/2 (â ÿ÷åéêå D2 ïîäñ÷èòûâàåòñÿ îáúåì âûáîðêè ïî ôîðìóëå =СЧЁТ(Исходная_выборка)). 2. Âû÷èñëÿåòñÿ ðàíã r0,75 âåðõíåãî êâàðòèëÿ ξ0,75 ïî ôîðìóëå r0,75 = n + 1 – r0,25. Íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.8, äàííûé ðàíã âû÷èñëÿåòñÿ â ÿ÷åéêå F2 ïî ôîðìóëå =$D$2+1–E2. 3. Îïðåäåëÿþòñÿ çíà÷åíèÿ íèæíåãî êâàðòèëÿ ξ0,25 è âåðõíåãî êâàðòèëÿ ξ0,75: åñëè âû÷èñëåííûå ðàíãè ýòèõ êâàðòèëåé — öåëûå ÷èñëà, òî â êà÷åñòâå çíà÷åíèé ýòèõ êâàðòèëåé áåðóòñÿ âûáîðî÷íûå çíà÷åíèÿ ðàíãîâ, ñîâïàäàþùèõ ñ âû÷èñëåííûìè ðàíãàìè êâàðòèëåé. Åñëè æå âû÷èñëåííûå ðàíãè êâàðòèëåé äðîáíûå, òî â êà÷åñòâå çíà÷åíèé êâàðòèëåé áåðåòñÿ ñðåäíåå âûáîðî÷íûõ çíà÷åíèé ñ ðàíãàìè, áëèæàéøèõ ê âû÷èñëåííûì ðàíãàì êâàðòèëåé. Íàïðèìåð, åñëè ðàíã íèæíåãî êâàðòèëÿ ðàâåí 14,5 (êàê â íàøåì Глава 8. Предварительный анализ 257 ïðèìåðå), çà çíà÷åíèå ýòîãî êâàðòèëÿ ïðèíèìàåòñÿ ñðåäíåå âûáîðî÷íûõ çíà÷åíèé ñ ðàíãàìè 14 è 15. ×òîáû àâòîìàòèçèðîâàòü îïðåäåëåíèå çíà÷åíèé êâàðòèëåé è ðåàëèçîâàòü ýòè ïðîñòûå âû÷èñëåíèÿ, â ýëåêòðîííîé òàáëèöå ïðèõîäèòñÿ ïðèìåíÿòü äîñòàòî÷íî ñëîæíûå ôîðìóëû. Íà ðèñ. 8.8 â ÿ÷åéêå Å4 äëÿ âû÷èñëåíèÿ íèæíåãî êâàðòèëÿ èñïîëüçóåòñÿ ôîðìóëà =ЕСЛИ(E2–ЦЕЛОЕ(E2)=0;ИНДЕКС(B2:B56;E2;1); (ИНДЕКС(B2:B56;ЦЕЛОЕ(E2);1)+ИНДЕКС(B2:B56;ЦЕЛОЕ(E2)+1;1))/2). Àíàëîãè÷íàÿ ôîðìóëà èñïîëüçóåòñÿ â ÿ÷åéêå F4 äëÿ âû÷èñëåíèÿ âåðõíåãî êâàðòèëÿ: =ЕСЛИ(F2–ЦЕЛОЕ(F2)=0;ИНДЕКС(B2:B56;F2;1); (ИНДЕКС(B2:B56;ЦЕЛОЕ(F2);1)+ИНДЕКС(B2:B56;ЦЕЛОЕ(F2)+1;1))/2). ( ôîðìóëàõ ïðèìåíåíà ôóíêöèÿ ИНДЕКС â ôîðìå ìàññèâà. Ýòà ôóíêöèÿ â äàííîé ôîðìå âîçâðàùàåò ñîäåðæèìîå ÿ÷åéêè, ðàñïîëîæåííîé íà ïåðåñå÷åíèè óêàçàííîé ñòðîêè è óêàçàííîãî ñòîëáöà (âòîðîé è òðåòèé àðãóìåíòû ôóíêöèè) äèàïàçîíà ÿ÷ååê, çàäàâàåìîãî â ïåðâîì àðãóìåíòå ôóíêöèè.) 4. Âû÷èñëÿþòñÿ íèæíÿÿ tí è âåðõíÿÿ tâ ãðàíèöû, îòíîñèòåëüíî êîòîðûõ îïðåäåëÿþòñÿ âûáîðî÷íûå çíà÷åíèÿ, ïðèíèìàåìûå çà âûáðîñû; âûáðîñàìè ñ÷èòàþòñÿ çíà÷åíèÿ, êîòîðûå ìåíüøå tí è êîòîðûå áîëüøå tâ. Ýòè ãðàíèöû âû÷èñëÿþòñÿ ïî ôîðìóëàì1 tí = ξ0,25 – 1,5(ξ0,25 – ξ0,75) è tâ = ξ0,75 + 1,5(ξ0,25 – ξ0,75).  íàøåì ïðèìåðå äàííûå çíà÷åíèÿ âû÷èñëÿþòñÿ ñîîòâåòñòâåííî â ÿ÷åéêàõ Å6 è F6 ïî ôîðìóëàì =E4–1,5*($F$4–$E$4) è =F4+1,5*($F$4–$E$4). 5.  èñõîäíîé âûáîðêå âû÷èñëÿþòñÿ çíà÷åíèÿ, êîòîðûå âûõîäÿò çà íèæíþþ è âåðõíþþ ãðàíèöû. Ýòî ìîæíî ñäåëàòü ñïîñîáàìè, îïèñàííûìè â ïðåäûäóùåì ðàçäåëå. Íà ðèñ. 8.9 ïîêàçàíû âûáðîñû, âûäåëåííûå ñ ïîìîùüþ óñëîâíîãî ôîðìàòèðîâàíèÿ. Êàê âèäíî íà ðèñ. 8.9, â ðåçóëüòàòå öåíçóðèðîâàíèÿ â êà÷åñòâå âûáðîñîâ îïðåäåëåíû è äâà “ïðàâèëüíûõ” âûáîðî÷íûõ çíà÷åíèÿ. Ýòî åùå ðàç äîêàçûâàåò, ÷òî ê öåíçóðèðîâàíèþ íàäî îòíîñèòüñÿ îñòîðîæíî è ïðèìåíÿòü åãî ñëåäóåò òîëüêî òîãäà, êîãäà äëÿ ýòîãî åñòü âåñêèå îñíîâàíèÿ. 8.1.3. Винзоризация выборки Âèíçîðèçàöèÿ âûáîðêè, ÿâëÿÿñü ñâîåîáðàçíîé ðàçíîâèäíîñòüþ öåíçóðèðîâàíèÿ, îòëè÷àåòñÿ îò ïîñëåäíåé òåì, ÷òî èäåíòèôèöèðîâàííûå âûáðîñû íå óäàëÿþòñÿ èç âûáîðêè; èì ïðèñâàèâàþòñÿ çíà÷åíèÿ, ðàâíûå ñîîòâåòñòâåííî íèæíåé tí èëè âåðõíåé tâ ãðàíèöàì, îòíîñèòåëüíî êîòîðûõ èäåíòèôèöèðóþòñÿ âûáðîñû. ×àñòî âèíçîðèçàöèþ âûïîëíÿþò ïðè çàäàíèè òîëüêî îäíîé ãðàíèöû — âåðõíåé èëè íèæíåé. Ýòî íàçûâàåòñÿ îäíîñòîðîííåé âèíçîðèçàöèåé, â îòëè÷èå îò äâóõñòîðîííåé, êîãäà èñïîëüçóþòñÿ îáå ãðàíèöû. Ïðè çàäàíèè ãðàíèö ïðèìåíÿþòñÿ äâà ïîäõîäà. Ïðè ïåðâîì ïîäõîäå èñõîäÿ èç êàêèõ-ëèáî àïðèîðíûõ ïðåäïîëîæåíèé çàäàåòñÿ êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áóäóò âèíçîðèçèðóåìû (ò.å. ïðèðàâíåíû ê çíà÷åíèÿì ãðàíèö). Íàïðèìåð, ìîæíî çàäàòü, ÷òî âèíçîðèçèðóåòñÿ íå áîëåå 5% èëè 10% âûáîðî÷íûõ 1 Ðàçíîñòü ìåæäó êâàðòèëÿìè ξ0,75 – ξ0,25 íàçûâàåòñÿ èíòåðêâàðòèëüíûé ðàçìàõ è èíîãäà èñïîëüçóåòñÿ â êà÷åñòâå ìåðû ðàçáðîñà âûáîðî÷íûõ çíà÷åíèé. 258 Часть III. Анализ одномерных выборок çíà÷åíèé2. Òàêîé ñïîñîá çàäàíèÿ ãðàíèö ðåàëèçîâàí íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.10 è 8.11. (Íà ýòèõ ðèñóíêàõ ïîêàçàíû è ðàñ÷åòíûå ôîðìóëû.) Îòìåòèì, ÷òî çäåñü âû÷èñëÿþòñÿ íå ñàìè çíà÷åíèÿ ãðàíèö, à íèæíèé è âåðõíèé ðàíãè âûáîðî÷íûõ çíà÷åíèé, êîòîðûå îïðåäåëÿþò ãðàíèöû. Òàêîé ïîäõîä íåìíîãî óïðîùàåò âû÷èñëåíèÿ. Ðèñ. 8.8. Ïîäãîòîâêà ê öåíçóðèðîâàíèþ Äðóãîé ïîäõîä ê îïðåäåëåíèþ íèæíåé tí è âåðõíåé tâ ãðàíèö àíàëîãè÷åí ïîñòðîåíèþ äîâåðèòåëüíîãî èíòåðâàëà íà îñíîâå âûáîðî÷íûõ îöåíîê ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè (òîãäà tí è tâ áóäóò ãðàíèöàìè äàííîãî èíòåðâàëà). Íà ýòîé îñíîâå îðãàíèçîâàíà ñëåäóþùàÿ èòåðàöèîííàÿ ïðîöåäóðà âèíçîðèçàöèè âûáîðî÷íûõ çíà÷åíèé [23]. 1. Ïî âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íîå ñðåäíåå x = 1 n ∑ xi n i =1 è âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå sn êàê êîðåíü èç âûáîðî÷íîé äèñïåðñèè sn2 = 1 n ∑ ( xi − x )2 n − 1 i =1 (xi — âûáîðî÷íûå çíà÷åíèÿ, n — îáúåì âûáîðêè). Òàêæå âû÷èñëÿþòñÿ ãðàíèöû tí = x – csn è tâ = x + csn, ãäå êîíñòàíòà ñ îïðåäåëÿåò ñõîäèìîñòü ïðîöåäóðû (ïîñêîëüêó ýòî èòåðàöèîííàÿ ïðîöåäóðà) è îáû÷íî âûáèðàåòñÿ èç èíòåðâàëà îò 1 äî 2, íàïðèìåð 1,5. 2 Î÷åâèäíî, ÷òî òàêîé ïîäõîä (êîãäà çàäàåòñÿ ïðîöåíò âûáðîñîâ) ìîæíî ïðèìåíèòü è äëÿ îáû÷íîãî öåíçóðèðîâàíèÿ âûáîðêè. Èñõîäÿ èç òîãî ôàêòà, ÷òî âåðîÿòíîñòü, ñ êîòîðîé ñëó÷àéíàÿ âåëè÷èíà Õ (âûáîðêà ÿâëÿåòñÿ ðåàëèçàöèåé ýòîé ñëó÷àéíîé âåëè÷èíû) ïðèíèìàåò çíà÷åíèÿ èç èíòåðâàëà (õ(i–1), õ(i)) (õ(i–1) è õ(i) — ïîðÿäêîâûå ñòàòèñòèêè), íå çàâèñèò îò ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1) (n — îáúåì âûáîðêè), çàäàíèÿ ïðîöåíòà âûáðîñîâ, íàïðèìåð 5%, ìîæíî èíòåðïðåòèðîâàòü êàê ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà, ñîäåðæàùåãî ïðèìåðíî 95% îñíîâíîé ìàññû çíà÷åíèé ñëó÷àéíîé âåëè÷èíû Õ. Îäíàêî íà ïðàêòèêå òàêîé ïîäõîä èñïîëüçóåòñÿ îòíîñèòåëüíî ðåäêî. Глава 8. Предварительный анализ 259 Ðèñ. 8.9. Ðåçóëüòàòû öåíçóðèðîâàíèÿ Ðèñ. 8.10. 5% âèíçîðèçàöèè 2. Ñòðîèòñÿ âèíçîðèçèðîâàííàÿ âûáîðêà {xi*} ïî ñëåäóþùåé ñõåìå: xi* = xi, åñëè tí ≤ xi ≤ tâ; xi* = tí, åñëè xi ≤ tí; xi* = tâ, åñëè xi ≥ tâ. 3. Ïî âèíçîðèçèðîâàííîé âûáîðêå {xi*} âû÷èñëÿþòñÿ íîâûå çíà÷åíèÿ ñðåäíåãî x * (ïî îáû÷íîé ôîðìóëå) è âûáîðî÷íàÿ äèñïåðñèÿ sn2* ïî ôîðìóëå 2 n 1 n sn2* = ∑ ( xi − x )2 , ãäå m — êîëè÷åñòâî íåèçìåíåííûõ âûáîðî÷íûõ m n − 1 i =1 çíà÷åíèé. 4. Ïîâòîðÿåòñÿ ïðîöåññ âèíçîðèçàöèè äëÿ âûáîðêè {xi*}, îïèñàííûé â ï. 2. Åñëè íîâûõ âèíçîðèçèðîâàííûõ âûáîðî÷íûõ çíà÷åíèé íå ïîÿâèëîñü, òî íà ýòîì ïðîöåññ çàâåðøàåòñÿ.  ïðîòèâíîì ñëó÷àå ïîâòîðÿåòñÿ ï. 3 è ò.ä. 260 Часть III. Анализ одномерных выборок Ðèñ. 8.11. 10% âèíçîðèçàöèè Íà ïðàêòèêå, åñëè ïðîöåññ íå çàâåðøèëñÿ ïîñëå äâóõ-òðåõ èòåðàöèé, åãî îñòàíàâëèâàþò è óâåëè÷èâàþò çíà÷åíèå ñ, ïîñëå ÷åãî âèíçîðèçàöèÿ âûïîëíÿåòñÿ ñíà÷àëà. Ñóùåñòâóþò áîëåå ñëîæíûå ìîäèôèêàöèè îïèñàííîé ïðîöåäóðû, äëÿ êîòîðûõ äîêàçàíà ñõîäèìîñòü çà êîíå÷íîå ÷èñëî øàãîâ. Íà ðèñ. 8.12 ïîêàçàíà ðåàëèçàöèÿ ïåðâûõ äâóõ ýòàïîâ îïèñàííîé ïðîöåäóðû. Îáðàòèòå âíèìàíèå, ÷òî êîëè÷åñòâî íåèçìåíåííûõ çíà÷åíèé (ÿ÷åéêà F8) âû÷èñëÿåòñÿ êàê ôîðìóëà ìàññèâà. Âèíçîðèçèðîâàíî ïÿòü íàèáîëüøèõ çíà÷åíèé âûáîðêè. Ðèñ. 8.12. Ðåàëèçàöèÿ ïåðâûõ äâóõ ýòàïîâ âèíçîðèçàöèè âûáîðêè Глава 8. Предварительный анализ 261 Ïîñêîëüêó ïðåäïîëàãàåòñÿ, ÷òî ïðîöåäóðà âèíçîðèçàöèè áóäåò èìåòü íå áîëåå òðåõ èòåðàöèé, äëÿ åå ðåàëèçàöèè ìîæíî îáîéòèñü áåç öèêëè÷åñêèõ âû÷èñëåíèé, ñîçäàâ âû÷èñëåíèÿ äëÿ òðåõ èòåðàöèé ïóòåì ïðîñòîãî êîïèðîâàíèÿ ôîðìóë è èõ íåáîëüøîé ïîäãîíêè ïîä íîâûå äèàïàçîíû ÿ÷ååê, ñîäåðæàùèõ ïîñëåäîâàòåëüíûå âèíçîðèçèðîâàííûå âûáîðêè. Ðàáî÷èé ëèñò, ðàññ÷èòàííûé íà âûïîëíåíèå òðåõ èòåðàöèé, ïîêàçàí íà ðèñ. 8.13. Ôîðìóëû, ïî êîòîðûì ïðîâîäÿòñÿ âû÷èñëåíèÿ, àíàëîãè÷íû ïîêàçàííûì íà ðèñ. 8.12, çà èñêëþ÷åíèåì ñòàíäàðòíîãî îòêëîíåíèÿ, êîòîðîå ðàññ÷èòûâàåòñÿ ïî ôîðìóëå, ïðèâåäåííîé â ï. 3 îïèñàíèÿ ïðîöåäóðû. Êàê âèäíî íà ðèñ. 8.13, ïî ÷èñëó âèíçîðèçèðîâàííûõ çíà÷åíèé ïðîöåññ ñîøåëñÿ ïîñëå âòîðîé èòåðàöèè. Åñëè áû ýòîãî íå ïðîèçîøëî, ìîæíî áûëî áû èçìåíèòü çíà÷åíèå êîíñòàíòû ñ â ÿ÷åéêå G3. Ïîñëå ýòîãî òðè èòåðàöèè ïðîöåññà âèíçîðèçàöèè ïîâòîðèëèñü áû àâòîìàòè÷åñêè. Âèíçîðèçèðîâàííûå çíà÷åíèÿ âèçóàëüíî âûäåëÿþòñÿ ñ ïîìîùüþ óñëîâíîãî ôîðìàòèðîâàíèÿ. Ðèñ. 8.13. Òðè èòåðàöèè âèíçîðèçàöèè Îòìåòèì, ÷òî ïðîöåññ âèíçîðèçàöèè ñîøåëñÿ ïî ÷èñëó âèíçîðèçèðîâàííûõ çíà÷åíèé, íî íå ïî çíà÷åíèÿì ñðåäíåãî è âûáîðî÷íîé äèñïåðñèè (èëè, ÷òî òî æå ñàìîå, ïî çíà÷åíèÿì ãðàíèö tí è tâ). ×òîáû äîñòèãíóòü òàêîé ñõîäèìîñòè, ñëåäîâàëî áû ïðîäîëæèòü ïðîöåññ âèíçîðèçàöèè. Îäíàêî äëÿ îïèñàííîé ïðîöåäóðû òàêàÿ ñõîäèìîñòü íå ãàðàíòèðîâàíà. Ïîýòîìó íà ïðàêòèêå îãðàíè÷èâàþòñÿ ñõîäèìîñòüþ ïî ÷èñëó âèíçîðèçèðîâàííûõ çíà÷åíèé. Îòìåòèì, ÷òî âûáîðêè ñ “îáðåçàííûìè” ýêñòðåìàëüíûìè çíà÷åíèÿìè ìîãóò ïîÿâèòüñÿ íå òîëüêî â ðåçóëüòàòå âèíçîðèçèðîâàíèÿ, íî è “åñòåñòâåííûì” ïóòåì. Íàïðèìåð, åñëè âûáîðêó ñîñòàâëÿþò íàáëþäåíèÿ çà íåêîòîðîé ôèçè÷åñêîé ïåðåìåííîé, çíà÷åíèÿ êîòîðîé ôèêñèðóþòñÿ ñ ïîìîùüþ ïðèáîðà è ýòîò ïðèáîð èìååò îïðåäåëåííûå ïðåäåëû èçìåðåíèé, òî çíà÷åíèÿ ôèçè÷åñêîé ïåðåìåííîé, 262 Часть III. Анализ одномерных выборок âûõîäÿùèå çà ýòè ïðåäåëû, áóäóò çàôèêñèðîâàíû íà óðîâíå ïðåäåëà èçìåðåíèÿ ïðèáîðà. Äðóãîé ïðèìåð èç ýêîíîìåòðèêè: îáû÷íî ïðè èññëåäîâàíèè äîõîäîâ íàñåëåíèÿ ôèêñèðóþòñÿ òî÷íî òîëüêî äîõîäû, êîòîðûå ëåæàò â îïðåäåëåííûõ ãðàíèöàõ. Äëÿ äîõîäîâ, êîòîðûå ìåíüøå îïðåäåëåííîãî óðîâíÿ (íàïðèìåð, íèæå óðîâíÿ áåäíîñòè) ëèáî áîëüøå íåêîòîðîãî äðóãîãî ôèêñèðîâàííîãî óðîâíÿ, ïîäñ÷èòûâàåòñÿ òîëüêî èõ êîëè÷åñòâî, áåç çàïèñè êîíêðåòíîãî çíà÷åíèÿ. Òàêèå âûáîðêè ìîæíî ðàññìàòðèâàòü êàê âèíçîðèçèðîâàííûå. 8.2. Преобразование данных Ïåðåä âûïîëíåíèåì ñòàòèñòè÷åñêîãî àíàëèçà ÷àñòî ïðîâîäèòñÿ ïðåîáðàçîâàíèå äàííûõ. Äåëàåòñÿ ýòî ïî íåñêîëüêèì ïðè÷èíàì. Âî-ïåðâûõ, äëÿ òîãî, ÷òîáû ðàñïðåäåëåíèå ïðåîáðàçîâàííûõ âûáîðî÷íûõ çíà÷åíèé áûëî ñâîáîäíî îò ïàðàìåòðîâ ëèáî áûëî áëèçêî ê èçâåñòíîìó ðàñïðåäåëåíèþ (÷àùå âñåãî — ê íîðìàëüíîìó), ëèáî èìåëî ëåãêî ïðîâåðÿåìûå ñâîéñòâà. Íàïðèìåð, åñëè âûáîðî÷íîå ðàñïðåäåëåíèå ÿâíî àñèììåòðè÷íî, èìååò áîëüøîé “õâîñò” âïðàâî è âñå âûáîðî÷íûå çíà÷åíèÿ ïîëîæèòåëüíû, òî ïðèìåíåíèå ëîãàðèôìè÷åñêîãî ïðåîáðàçîâàíèÿ ïðèâåäåò ê áîëåå ñèììåòðè÷íîìó ðàñïðåäåëåíèþ, ïîñêîëüêó îíî ðàñòÿíåò øêàëó â îêðåñòíîñòè íóëÿ. Âî-âòîðûõ, íåîáõîäèìîñòü ïðåîáðàçîâàíèÿ âîçíèêàåò òîãäà, êîãäà ïàðàìåòðû ðàñïðåäåëåíèÿ çàâèñÿò îäèí îò äðóãîãî (îáû÷íî ïðåäïîëàãàåòñÿ, ÷òî ïî êðàéíåé ìåðå ïåðâûå ìîìåíòû — ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ — íå ñâÿçàíû ìåæäó ñîáîé). Íàïðèìåð, ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ïóàññîíîâñêîãî ðàñïðåäåëåíèÿ ñîâïàäàþò.  ïîäîáíîì ñëó÷àå íóæíî ïîäîáðàòü òàêîå ïðåîáðàçîâàíèå, ÷òîáû ïàðàìåòðû ðàñïðåäåëåíèÿ ïðåîáðàçîâàííûõ äàííûõ áûëè íåçàâèñèìû. Îòìåòèì, ÷òî ïðè òàêîì ïðåîáðàçîâàíèè ÷àñòî óëó÷øàþòñÿ ñâîéñòâà ðàñïðåäåëåíèÿ ïðåîáðàçîâàííûõ äàííûõ, íàïðèìåð îíî ïðèâîäèò ê ðàñïðåäåëåíèþ, áëèçêîìó ê íîðìàëüíîìó, èëè ñòàáèëèçèðóåò äèñïåðñèþ âûáîðêè (äåëàåò åå ìåíåå ÷óâñòâèòåëüíîé ê îáúåìó âûáîðêè è äðóãèì ïàðàìåòðàì âûáîðêè). Ðàññìîòðèì ÷àñòî èñïîëüçóåìûå ïðåîáðàçîâàíèÿ äàííûõ. 8.2.1. Преобразование квадратного корня Ýòî ïðåîáðàçîâàíèå ïðèìåíÿþò ê ðàñïðåäåëåíèÿì, äèñïåðñèÿ êîòîðûõ ñîâïàäàåò ñ ìàòåìàòè÷åñêèì îæèäàíèåì èëè ïðîïîðöèîíàëüíà åìó. Ó ïðåîáðàçîâàííîé ñëó÷àéíîé âåëè÷èíû ýòè ïàðàìåòðû ìîæíî ñ÷èòàòü íåçàâèñèìûìè, ïðè ýòîì åå äèñïåðñèÿ ïðèáëèçèòåëüíî ðàâíà 1/4 (èëè k/4, åñëè äèñïåðñèÿ ïðîïîðöèîíàëüíà ìàòåìàòè÷åñêîìó îæèäàíèþ ñ êîýôôèöèåíòîì ïðîïîðöèîíàëüíîñòè k). Êðîìå òîãî, äàííîå ïðåîáðàçîâàíèå ÷àñòî ïðèâîäèò ê ðàñïðåäåëåíèþ, êîòîðîå áëèæå ê íîðìàëüíîìó, ÷åì èñõîäíîå. Ïîêàæåì èñïîëüçîâàíèå ýòîãî ïðåîáðàçîâàíèÿ äëÿ ïóàññîíîâñêîãî è χ2 ðàñïðåäåëåíèé. Пуассоновское распределение Äèñïåðñèÿ ñëó÷àéíîé âåëè÷èíû Õ, ðàñïðåäåëåííîé ïî çàêîíó Ïóàññîíà, ðàâíà åå ìàòåìàòè÷åñêîìó îæèäàíèþ θ (ñì. ðàçäåë 1.4.4). Ïðîñòåéøèì ïðåîáðàçîâàíèåì ýòîé âåëè÷èíû áóäåò X+ X . Ïðè θ < 4 áîëåå ýôôåêòèâíûì ñ÷èòàåòñÿ ïðåîáðàçîâàíèå âèäà 3 . Ïðè ìàëûõ θ èíîãäà ðåêîìåíäóþò èñïîëüçîâàòü ïðåîáðàçîâàíèå 8 X + X +1 . Глава 8. Предварительный анализ 263 Íà ðèñ. 8.14 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà, èìåþùàÿ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì θ = 2 (100 âûáîðî÷íûõ çíà÷åíèé ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, äèàïàçîí âûáîðî÷íûõ çíà÷åíèé íàçâàí Выборка).  ñòîëáöàõ Â, Ñ è D çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, ïðåîáðàçîâàííûå ïî ôîðìóëàì X , X + 3 / 8 è X + X + 1 ñîîòâåòñòâåííî.  ñòîëáöå F âû÷èñëåíû ñðåäíèå è äèñïåðñèè (ïî ñòàíäàðòíûì ôîðìóëàì ñ èñïîëüçîâàíèåì ôóíêöèé СРЗНАЧ è ДИСП), â ñòîëáöå G — îöåíêè ïàðàìåòðà θ (ôîðìóëû äëÿ âû÷èñëåíèé ïîêàçàíû íà ðèñ. 8.14). Êàê âèäíî, íàèëó÷øèé ðåçóëüòàò ïî çíà÷åíèþ äèñïåðñèè (ïî áëèçîñòè ê çíà÷åíèþ 0,25) äàåò ïðåîáðàçîâàíèå X + 3 / 8 , ïî áëèçîñòè îöåíêè θ ê èñòèííîìó çíà÷åíèþ — ïðåîáðàçîâàíèå X + X + 1 . Íà ðèñ. 8.15 ïîêàçàíû ãèñòîãðàììû äëÿ ïåðâîíà÷àëüíîé âûáîðêè è äëÿ çíà÷åíèé, ïðåîáðàçîâàííûõ ïî ôîðìóëàì X è X + 3 / 8 (ïîñëåäíÿÿ ôîð- ìóëà ïðèâîäèò ê áîëåå ñèììåòðè÷íîìó ðàñïðåäåëåíèþ, ÷åì ôîðìóëà X ). Ðèñ. 8.14. Ïðåîáðàçîâàíèå êâàäðàòíîãî êîðíÿ Распределение χ2 Ïðåîáðàçîâàíèå êâàäðàòíîãî êîðíÿ äëÿ âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå χ2, íà ïðàêòèêå ïðèìåíÿåòñÿ îòíîñèòåëüíî ðåäêî. Ýòî ïðåîáðàçîâàíèå èìååò ñêîðåå òåîðåòè÷åñêîå çíà÷åíèå è èñïîëüçóåòñÿ äëÿ àïïðîêñèìàöèè ýòîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, íàïðèìåð, ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ. Êðîìå òîãî, ýòî ïðåîáðàçîâàíèå äàåò óäîâëåòâîðèòåëüíóþ àïïðîêñèìàöèþ òîëüêî ïðè äîñòàòî÷íî áîëüøîì çíà÷åíèè n ñòåïåíè ñâîáîäû ðàñïðåäåëåíèÿ χ2. 264 Часть III. Анализ одномерных выборок Ðèñ. 8.15. Ãèñòîãðàììû ïåðâîíà÷àëüíîé è ïðåîáðàçîâàííûõ âûáîðîê Åñëè n ≥ 30, òî ñëó÷àéíàÿ âåëè÷èíà Y = 3 X / n + 2 / 9n − 1 2 / 9n èìååò ïðèáëèæåííî íîðìàëüíîå ñòàíäàðòíîå ðàñïðåäåëåíèå, çäåñü Õ — ñëó÷àéíàÿ âåëè÷èíà, ðàñïðåäåëåííàÿ ïî çàêîíó χ2 ñ n ñòåïåíÿìè ñâîáîäû. Åñëè n ≥ 100, òî èñïîëüçóåòñÿ áîëåå ïðîñòîå ïðåîáðàçîâàíèå, êîòîðîå òàêæå ïðèâîäèò ê ïðèáëèæåííî íîðìàëüíîìó ñòàíäàðòíîìó ðàñïðåäåëåíèþ: Y = 2X − 2n − 1 . Íà ðèñ. 8.16 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñî çíà÷åíèåì ñòåïåíè ñâîáîäû n = 50 (200 âûáîðî÷íûõ çíà÷åíèé ïîëó÷åíû ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ХИ2ОБР(СЛЧИС();50)}).  ñòîëáöàõ  è Ñ çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, ïðåîáðàçîâàííûå ïî ôîðìóëàì Y = 2X − 2n − 1 è Y = 3 X / n + 2 / 9n − 1 2 / 9n ñîîòâåòñòâåííî (îáîçíà÷åíû êàê Формула 1 è Формула 2; äèàïàçîíàì ÿ÷ååê, ñîäåðæàùèì ýòè çíà÷åíèÿ, ïðèñâîåíû òàêèå æå èìåíà). Ôîðìóëû ïðåîáðàçîâàíèÿ ïîêàçàíû íà ðèñ. 8.16.  ñòîëáöå Å âû÷èñëåíû ñðåäíèå è äèñïåðñèè (ïî ñòàíäàðòíûì ôîðìóëàì ñ èñïîëüçîâàíèåì ôóíêöèé СРЗНАЧ è ДИСП). Íà ðèñ. 8.17 ïîêàçàíû ãèñòîãðàììû äëÿ ïåðâîíà÷àëüíîé âûáîðêè è ïðåîáðàçîâàííûõ âûáîðîê. Êàê âèäíî, îáå ôîðìóëû â äàííîì ñëó÷àå äàþò ïðèìåðíî îäèíàêîâûå ðåçóëüòàòû: ôîðìóëà 1 äàåò ÷óòü ëó÷øèå çíà÷åíèÿ ñðåäíåãî è âûáîðî÷íîé äèñïåðñèè, ôîðìóëà 2 — áîëåå ñèììåòðè÷íóþ ãèñòîãðàììó. 8.2.2. Логарифмическое преобразование Ýòî ïðåîáðàçîâàíèå, ïî-âèäèìîìó, ÷àùå âñåãî èñïîëüçóåòñÿ íà ïðàêòèêå, îñîáåííî ïðè àíàëèçå ýêîíîìè÷åñêèõ äàííûõ, êîòîðûå ÷àñòî èìåþò ëîãàðèôìè÷åñêè íîðìàëüíîå èëè ïðèáëèæåííî ëîãíîðìàëüíîå ðàñïðåäåëåíèå. Ëîãàðèôìè÷åñêîå Глава 8. Предварительный анализ 265 ïðåîáðàçîâàíèå òàêæå ïðèìåíÿþò, êîãäà â ðàñïðåäåëåíèè ñëó÷àéíîé âåëè÷èíû Õ ìàòåìàòè÷åñêîå îæèäàíèå è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå ïðîïîðöèîíàëüíû (íàïðèìåð, ñ êîýôôèöèåíòîì ïðîïîðöèîíàëüíîñòè k). Òîãäà ñëó÷àéíàÿ âåëè÷èíà Y = ln(X) áóäåò èìåòü äèñïåðñèþ, ïðèáëèæåííî ðàâíóþ k2, ò.å. ïðèõîäèì ê ðàñïðåäåëåíèþ ñ ïî÷òè íåçàâèñèìûìè ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé. Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ ìîæåò ïðèíèìàòü íóëåâûå çíà÷åíèÿ, òî èñïîëüçóåòñÿ ôîðìóëà Y = ln(X + 1). Ðèñ. 8.16. Ïðåîáðàçîâàíèå èñõîäíîé âûáîðêè Ðèñ. 8.17. Ãèñòîãðàììû ïåðâîíà÷àëüíîé è ïðåîáðàçîâàííûõ âûáîðîê 266 Часть III. Анализ одномерных выборок Íà ðèñ. 8.18 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæèòñÿ âûáîðêà, èìåþùàÿ ëîãíîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = 1 è σ2 = 4 (1200 âûáîðî÷íûõ çíà÷åíèé ïîëó÷åíû ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ЛОГНОРМОБР(СЛЧИС();1;2)}).  ñòîëáöå  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, ïðåîáðàçîâàííûå ïî ôîðìóëå Y = ln(X).  ñòîëáöå Ñ âû÷èñëåíû ñðåäíèå è ñòàíäàðòíîå îòêëîíåíèå ïðåîáðàçîâàííîé âûáîðêè. Íà ýòîì æå ðèñóíêå ïîêàçàíà ãèñòîãðàììà äëÿ ïðåîáðàçîâàííîé âûáîðêè. Ðèñ. 8.18. Ïðåîáðàçîâàíèå èñõîäíîé âûáîðêè 8.2.3. Стандартизирующее преобразование Åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò èçâåñòíîå ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèþ σ2, òî ñëó÷àéíàÿ âåëè÷èíà Y = X – m íàçûâàåòñÿ öåíòðèðîâàííîé, âåëè÷èíà Y = X/σ — íîðìèðîâàííîé, à Y = (X – m)/σ — ñòàíäàðòèçèðîâàííîé. Ïîñëåäíåå ïðåîáðàçîâàíèå íàçûâàåòñÿ ñòàíäàðòèçèðóþùèì è èñïîëüçóåòñÿ íà ïðàêòèêå äëÿ ïîëó÷åíèÿ ñòàíäàðòèçèðîâàííûõ âûáîðîê (â êà÷åñòâå çíà÷åíèé m è σ îáû÷íî áåðóòñÿ âûáîðî÷íûå ñðåäíåå è ñòàíäàðòíîå îòêëîíåíèå). Äëÿ âûïîëíåíèÿ ýòîãî ïðåîáðàçîâàíèÿ â Excel åñòü ñïåöèàëüíàÿ ôóíêöèÿ НОРМАЛИЗАЦИЯ (ñì. ðàçäåë 4.12.2). Îòìåòèì, ÷òî ñòàíäàðòèçèðóþùåå ïðåîáðàçîâàíèå íå èçìåíÿåò òèï ðàñïðåäåëåíèÿ, à èçìåíÿåò òîëüêî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è äèñïåðñèè. 8.3. Построение гистограмм, полигонов и эмпирических функций распределения Íà ïðåäâàðèòåëüíîì ýòàïå ñòàòèñòè÷åñêîãî àíàëèçà, êàê ïðàâèëî, ñòðîÿòñÿ ãèñòîãðàììû, ïîëèãîíû è ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ. Ýòî óäîáíûé Глава 8. Предварительный анализ 267 ñïîñîá âèçóàëüíîãî ïðåäñòàâëåíèÿ ñòàòèñòè÷åñêèõ äàííûõ, êîòîðûé ïîçâîëÿåò äåëàòü âûâîäû î ðàñïðåäåëåíèè íàáëþäàåìîé ñëó÷àéíîé âåëè÷èíû, ðåàëèçàöèåé êîòîðîé ÿâëÿåòñÿ èìåþùàÿñÿ âûáîðêà. 8.3.1. Построение гистограммы и эмпирической функции распределения для дискретных случайных величин Ñëó÷àéíàÿ âåëè÷èíà, ïîä÷èíÿþùàÿñÿ äèñêðåòíîìó ðàñïðåäåëåíèþ, ìîæåò ïðèíèìàòü êîíå÷íîå èëè ñ÷åòíîå ìíîæåñòâî çíà÷åíèé. Åñòåñòâåííî, â êîíå÷íîé âûáîðêå âñåãäà åñòü òîëüêî êîíå÷íîå êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé. Îáû÷íî ïîäîáíàÿ âûáîðêà èìååò âèä òàáëèöû, â êîòîðîé óêàçûâàåòñÿ, ñêîëüêî ðàç êàæäîå çíà÷åíèå âñòðå÷àåòñÿ â âûáîðêå. Òàêàÿ òàáëèöà íàçûâàåòñÿ ÷àñòîòíîé. Çäåñü íåîáõîäèìî ñäåëàòü íåáîëüøîå îòñòóïëåíèå îá èñïîëüçóåìûõ òåðìèíàõ. Åñëè äèñêðåòíàÿ ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò çíà÷åíèÿ õ1, õ2, ..., õm è äàííûå çíà÷åíèÿ âñòðå÷àþòñÿ â âûáîðêå ñîîòâåòñòâåííî f1, f2, ..., fm ðàç, òî ýòè ÷èñëà íàçûâàþòñÿ ÷àñòîòàìè çíà÷åíèé õi. Çíà÷åíèÿ ÷àñòîò, äåëåííûå íà îáúåì âûáîðêè è âûðàæåííûå â äîëÿõ åäèíèöû èëè â ïðîöåíòàõ, íàçûâàþòñÿ ÷àñòîñòÿìè, îòíîñèòåëüíûìè ÷àñòîòàìè èëè ñòàòèñòè÷åñêèìè âåðîÿòíîñòÿìè. Íàêîïëåííûìè ÷àñòîòàìè ñi íàçûâàþòñÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, íå ïðåâûøàþùèõ õi. Ýòè æå âåëè÷èíû, äåëåííûå íà îáúåì âûáîðêè, íàçûâàþòñÿ îòíîñèòåëüíûìè íàêîïëåííûìè ÷àñòîòàìè èëè íàêîïëåííûìè ÷àñòîñòÿìè. Âîçâðàùàåìñÿ ê âûáîðî÷íûì çíà÷åíèÿì äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû. Ïî ÷àñòîòíîé òàáëèöå ïîñòðîèòü ãèñòîãðàììó íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé (çà èñêëþ÷åíèåì òåõ ñëó÷àåâ, êîãäà çíà÷åíèÿ ðàñïðåäåëåíû íåðàâíîìåðíî íà îñè Õ; ñì. íèæå). Íî èíîãäà, åñëè âûáîðêà ñîñòîèò èç ïîñëåäîâàòåëüíûõ íàáëþäåíèé, äàííûå íå ñãðóïïèðîâàíû è íåîáõîäèìî ïîäñ÷èòàòü ÷àñòîòû ðàçíûõ çíà÷åíèé. Åñëè âûáîðêà íåáîëüøîãî îáúåìà è èçâåñòíû çíà÷åíèÿ, êîòîðûå ïðèíèìàåò ñëó÷àéíàÿ âåëè÷èíà, òî ñäåëàòü ýòî îòíîñèòåëüíî íåñëîæíî. Îäíàêî äëÿ áîëüøèõ âûáîðîê è îñîáåííî â ñëó÷àå, êîãäà íåèçâåñòíû âñå çíà÷åíèÿ, ïðèíèìàåìûå ñëó÷àéíîé âåëè÷èíîé, çàäà÷à óñëîæíÿåòñÿ. Ïîêàæåì, êàê åå ìîæíî âûïîëíèòü â Excel â ñàìîì îáùåì ñëó÷àå. Íà ðèñ. 8.19 ïîêàçàíà âûáîðêà èç 100 çíà÷åíèé, ñãåíåðèðîâàííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел èç ïàêåòà àíàëèçà ñ òèïîì ðàñïðåäåëåíèÿ Дискретное. Ðàñïðåäåëåíèå çàäàíî â èíòåðâàëå I2:J8 (çíà÷åíèÿ ýòîãî ðàñïðåäåëåíèÿ ïîëó÷åíû ñ ïîìîùüþ ôóíêöèè СЛЧИС). Àíàëèç âûáîðêè ñëåäóåò íà÷àòü ñ ïîäñ÷åòà êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, äëÿ ÷åãî ïðèìåíèòü ïðîñòóþ ôîðìóëó =СЧЁТ(Выборка) (çäåñü äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðêó, ïðèñâîåíî èìÿ Выборка). Äàëåå íàäî ïîäñ÷èòàòü êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé â âûáîðêå.  îáùåì ñëó÷àå ýòî íåòðèâèàëüíàÿ çàäà÷à. Äëÿ åå âûïîëíåíèÿ ìîæíî èñïîëüçîâàòü ôîðìóëó ìàññèâà {=СУММ(1/СЧЁТЕСЛИ(Выборка;Выборка))}. Äàííàÿ ôîðìóëà ñíà÷àëà ñîçäàåò âèðòóàëüíûé ìàññèâ, ñîäåðæàùèé äëÿ êàæäîãî âûáîðî÷íîãî çíà÷åíèÿ êîëè÷åñòâî òàêèõ çíà÷åíèé (ýòî äåëàåò ÷àñòü ôîðìóëû СЧЁТЕСЛИ(Выборка;Выборка)). Íàïðèìåð, ÷èñëî 4,56 âñòðå÷àåòñÿ â âûáîðêå 24 ðàçà. Òîãäà êàæäûé ýëåìåíò âèðòóàëüíîãî ìàññèâà, ñîîòâåòñòâóþùèé âûáîðî÷íîìó çíà÷åíèþ 4,56, áóäåò ðàâåí 24. ×àñòü ôîðìóëû 1/СЧЁТЕСЛИ(Выборка;Выборка)) ñîçäàåò íîâûé âèðòóàëüíûé ìàññèâ, ñîäåðæàùèé âåëè÷èíû, îáðàòíûå çíà÷åíèÿì ïåðâîãî âèðòóàëüíîãî ìàññèâà. Íàïðèìåð, 24 ýëåìåíòà ýòîãî ìàññèâà, ñîîòâåòñòâóþùèå âûáîðî÷íîìó çíà÷åíèþ 4,56, áóäóò ñîäåðæàòü ÷èñëî 0,041667 (=1/24). Ôóíêöèÿ СУММ ñóììèðóåò çíà÷åíèÿ âòîðîãî âèðòóàëüíîãî ìàññèâà (ñóììà çíà÷åíèé, 268 Часть III. Анализ одномерных выборок ñîîòâåòñòâóþùèõ âûáîðî÷íîìó çíà÷åíèþ 4,56, äàñò 1), è â ðåçóëüòàòå ïîëó÷àåòñÿ èñêîìîå êîëè÷åñòâî ðàçëè÷íûõ âûáîðî÷íûõ çíà÷åíèé.  ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.20, ýòà ôîðìóëà çàïèñàíà â ÿ÷åéêå Ñ2. Ðèñ. 8.19. Âûáîðêà è åå ðàñïðåäåëåíèå Ðèñ. 8.20. Ïîñòðîåíèå ãèñòîãðàììû äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ Глава 8. Предварительный анализ 269 Òåïåðü íåîáõîäèìî ñîçäàòü ìàññèâ, ñîäåðæàùèé âñå ðàçëè÷íûå âûáîðî÷íûå çíà÷åíèÿ. Ðàçìåð òàêîãî ìàññèâà ðàâåí ÷èñëó, ïîäñ÷èòàííîìó ïðåäûäóùåé ôîðìóëîé. Íà ðèñ. 8.20 ýòîò ìàññèâ ñîäåðæèòñÿ â äèàïàçîíå Å2:Å8 â ñòîëáöå Значения. Çíà÷åíèÿ ýòîãî äèàïàçîíà âû÷èñëåíû ñ ïîìîùüþ ñëåäóþùåé ôîðìóëû ìàññèâà: {=ИНДЕКС(Выборка;НАИМЕНЬШИЙ(ЕСЛИ(ПОИСКПОЗ(Выборка;Выборка;0)=СТРОК А(ДВССЫЛ("1:"&ЧСТРОК(Выборка)));ПОИСКПОЗ(Выборка;Выборка;0);"");СТРОКА(Д ВССЫЛ("1:"&ЧСТРОК(Выборка)))))}. Ýòà ôîðìóëà, êàê è ïðåäûäóùàÿ, âçÿòà èç êíèãè [20]. Ìû íå áóäåì îïèñûâàòü, êàê îíà ðàáîòàåò (ýòî çíà÷èòåëüíî óâåëî áû â ñòîðîíó îò íàøåé òåìû); îòìåòèì òîëüêî, ÷òî ðàáîòàåò îíà áåçóêîðèçíåííî íà ëþáûõ âûáîðêàõ. Åäèíñòâåííûé íåäîñòàòîê äàííîé ôîðìóëû ñîñòîèò â òîì, ÷òî ïîëó÷åííûé ìàññèâ íå óïîðÿäî÷åí. Îäíàêî îòìåòèì, ÷òî åñëè èñõîäíàÿ âûáîðêà îòñîðòèðîâàíà â ïîðÿäêå óáûâàíèÿ èëè âîçðàñòàíèÿ, òî äàííûé ìàññèâ òàêæå áóäåò óïîðÿäî÷åí. Îòñîðòèðîâàòü ýòîò ìàññèâ íà ìåñòå íå óäàñòñÿ, ïîñêîëüêó îí ïîëó÷åí ñ ïîìîùüþ ôîðìóëû ìàññèâà. Ïðîñòîé âûõîä èç òàêîé ñèòóàöèè çàêëþ÷àåòñÿ â òîì, ÷òîáû ñêîïèðîâàòü åãî â ñîñåäíèé äèàïàçîí ÿ÷ååê è çàìåíèòü ôîðìóëû çíà÷åíèÿìè (êîìàíäà ПравкаÖСпециальная вставка, îïöèÿ Значения). Òåïåðü ìîæíî ïðèìåíèòü ñòàíäàðòíóþ ñîðòèðîâêó, äëÿ ÷åãî ñëåäóåò âûäåëèòü äèàïàçîí è âûáðàòü êîìàíäó ДанныеÖСортировка. Åñëè ïîñëå ýòîãî ïîÿâëÿåòñÿ äèàëîãîâîå îêíî Обнаружены данные вне указанного диапазона, òî â ýòîì îêíå íåîáõîäèìî óñòàíîâèòü ïåðåêëþ÷àòåëü Сортировать в пределах указанного выделения è çàòåì ùåëêíóòü íà êíîïêå Сортировка. Óïîðÿäî÷åííûé ïî âîçðàñòàíèþ ìàññèâ óíèêàëüíûõ âûáîðî÷íûõ çíà÷åíèé íà ðèñ. 8.20 ïîêàçàí â ñòîëáöå F, îçàãëàâëåííîì Сортировка.  ñòîëáöå G âû÷èñëåíû ÷àñòîñòè âûáîðî÷íûõ çíà÷åíèé ñ ïðèìåíåíèåì ôîðìóëû ìàññèâà {=ЧАСТОТА(Выборка;F2:F8)/C4}. Íà îñíîâàíèè ýòèõ äàííûõ äàëåå ñòðîèòñÿ ãèñòîãðàììà. Îáû÷íî äëÿ ïîñòðîåíèÿ ãèñòîãðàìì â Excel èñïîëüçóåòñÿ òèï äèàãðàììû Гистограмма. Îäíàêî ýòîò òèï äèàãðàììû ðàñïîëàãàåò äàííûå ïî îñè Õ ðàâíîìåðíî, ÷òî âïîëíå ïîäõîäèò, åñëè ñëó÷àéíàÿ âåëè÷èíà ïðèíèìàåò ðàâíîîòñòîÿùèå çíà÷åíèÿ íà êàêîì-ëèáî èíòåðâàëå.  íàøåì ñëó÷àå çíà÷åíèÿ, ïðèíèìàåìûå ñëó÷àéíîé âåëè÷èíîé, ðàñïðåäåëåíû íå ðàâíîìåðíî.  òàêîé ñèòóàöèè ìîæíî ïðèìåíèòü òèï äèàãðàììû Точечная è â êà÷åñòâå ñòîëáöîâ ãèñòîãðàììû èñïîëüçîâàòü ïëàíêè ïîãðåøíîñòåé, êàê îïèñàíî â ðàçäåëå 6.2.3. Íàïîìíèì êðàòêî, êàê ïîñòðîèòü ãèñòîãðàììó â äàííîì ñëó÷àå. Ñíà÷àëà ñòðîèì äèàãðàììó òèïà Точечная áåç ëèíèé, ñîåäèíÿþùèõ òî÷êè äàííûõ. Çàòåì âûäåëÿåì ðÿä äàííûõ è âûáèðàåì êîìàíäó ФорматÖВыделенный ряд.  îòêðûâøåìñÿ äèàëîãîâîì îêíå Формат ряда данных íà âêëàäêå Y-погрешности çàäàåì ïëàíêó ïîãðåøíîñòè òèïà Минус.  êà÷åñòâå âåëè÷èíû ïîãðåøíîñòè çàäàåì Относительное значение 100% (ðèñ. 8.21). Íà ãðàôèêå ïîÿâëÿþòñÿ âåðòèêàëüíûå ñòîëáöû îò çíà÷åíèé äàííûõ äî îñè Õ. Òåïåðü îñòàåòñÿ îòôîðìàòèðîâàòü ïëàíêè ïîãðåøíîñòåé è çíà÷åíèÿ äàííûõ.  ðåçóëüòàòå ïîëó÷àåì ãèñòîãðàììó âûáîðêè, ïîêàçàííóþ íà ðèñ. 8.20. Ïðè ïîñòðîåíèè ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äëÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí òàêæå âîçíèêàþò íåêîòîðûå ñëîæíîñòè, ïîñêîëüêó òàêàÿ ôóíêöèÿ èìååò ñòóïåí÷àòûé âèä, íî íè ñðåäñòâî ïîñòðîåíèÿ äèàãðàìì Excel, íè ñðåäñòâî Гистограмма èç ïàêåòà àíàëèçà ïîäîáíûå ãðàôèêè ñòðîèòü íå ìîãóò.  ðàçäåëå 6.2.3 ïîêàçàíî, êàê âñå-òàêè â Excel ïîñòðîèòü òàêîé ãðàôèê. 270 Часть III. Анализ одномерных выборок Ðèñ. 8.21. Äèàëîãîâîå îêíî Формат ряда данных Ñíà÷àëà íàäî ïîäñ÷èòàòü íàêîïëåííûå ÷àñòîòû èëè îòíîñèòåëüíûå íàêîïëåííûå ÷àñòîòû (íàêîïëåííûå ÷àñòîñòè). Ýòî âûïîëíÿåòñÿ ïðîñòî, åñëè óæå ïîäñ÷èòàíû ÷àñòîòû èëè ÷àñòîñòè. Ïóñòü âû÷èñëåííûå ÷àñòîñòè ñîäåðæàòñÿ â ñòîëáöå G, à íàêîïëåííûå ÷àñòîñòè — â ñòîëáöå H, êàê íà ðàáî÷åì ëèñòå, ïîêàçàííîì íà ðèñ. 8.22.  ÿ÷åéêó Í2 çàïèñûâàåòñÿ ôîðìóëà =G2, â ÿ÷åéêó Í3 — =H2+G3. Çàòåì ýòà ôîðìóëà ðàñïðîñòðàíÿåòñÿ âíèç äî ÿ÷åéêè Í8. Òàêèì îáðàçîì áóäóò ïîäñ÷èòàíû íàêîïëåííûå ÷àñòîñòè. Ðèñ. 8.22. Âû÷èñëåíèå íàêîïëåííûõ ÷àñòîñòåé Îïèñàíèå ïðîöåññà ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ ïðèâåäåíî â ðàçäåëå 6.2.3. Êðàòêî íàïîìíèì åãî. Ñíà÷àëà íåîáõîäèìî âñòàâèòü ïóñòîé ñòîëáåö ïåðåä ñòîëáöîì, ñîäåðæàùèì íàêîïëåííûå ÷àñòîñòè, à çàòåì ñêîïèðîâàòü â íåãî îòñîðòèðîâàííûå óíèêàëüíûå âûáîðî÷íûå çíà÷åíèÿ èç ñòîëáöà F. Ïîñëå ýòîãî ïåðåä êàæäîé ñòðîêîé â ñòîëáöàõ Í è I (òåïåðü â ñòîëáöå I íàõîäÿòñÿ íàêîïëåííûå ÷àñòîñòè) ñëåäóåò âñòàâèòü ïî ïóñòîé ñòðîêå, ñäâèãàÿ ÿ÷åéêè âíèç. Глава 8. Предварительный анализ 271 Äàëåå â ïóñòóþ ÿ÷åéêó Í2 ââåäåì ôîðìóëó =H3-0,000009, à â ÿ÷åéêó I2 ÷èñëî 0. Ôîðìóëó èç ÿ÷åéêè Í2 ñêîïèðóåì â ÿ÷åéêó Í4, à â ÿ÷åéêó I2 ââåäåì ôîðìóëó =I3. Âûäåëèì ÿ÷åéêè Í4:I4 è ñêîïèðóåì èõ âî âñå ñâîáîäíûå ÿ÷åéêè âíèç äî ñòðîêè 14.  ÿ÷åéêó Í16 ìîæíî ââåñòè ÷èñëî 5, à â ÿ÷åéêó I5 — ÷èñëî 1 (íî ýòî íå îáÿçàòåëüíî). Ðàáî÷èé ëèñò íà äàííîì ýòàïå ïîêàçàí íà ðèñ. 8.23. Ðèñ. 8.23. Âñå ãîòîâî äëÿ ïîñòðîåíèÿ ãðàôèêà Òåïåðü äëÿ ïîñòðîåíèÿ ãðàôèêà ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ äîñòàòî÷íî ïîñòðîèòü ñðåäñòâàìè Excel äèàãðàììó òèïà Точечная ñ ñîåäèíèòåëüíûìè ëèíèÿìè áåç ìàðêåðîâ íà îñíîâå äàííûõ äèàïàçîíà Í2:I16. Ãîòîâàÿ îòôîðìàòèðîâàííàÿ äèàãðàììà ïîêàçàíà íà ðèñ. 8.24. Ðèñ. 8.24. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ 272 Часть III. Анализ одномерных выборок 8.3.2. Построение гистограммы и полигона для непрерывных распределений ×òîáû ïîñòðîèòü ãèñòîãðàììó äëÿ âûáîðêè, èìåþùåé íåïðåðûâíîå ðàñïðåäåëåíèå, íåîáõîäèìî ñîçäàòü äëÿ íåå ÷àñòîòíóþ òàáëèöó. Äëÿ ýòîãî ñíà÷àëà âñÿ îáëàñòü èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé ðàçáèâàåòñÿ íà ðÿä íåïåðåñåêàþùèõñÿ èíòåðâàëîâ è çàòåì ïîäñ÷èòûâàþòñÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â êàæäûé èíòåðâàë. Òàêèå èíòåðâàëû ÷àñòî íàçûâàþò êàðìàíàìè, ýòî æå íàçâàíèå èñïîëüçóþò ôóíêöèÿ Excel ЧАСТОТА è ñðåäñòâî Гистограмма. Ïåðâàÿ ïðîáëåìà âîçíèêàåò ïðè îïðåäåëåíèè êîëè÷åñòâà òàêèõ èíòåðâàëîâ, êîòîðîå, êîíå÷íî æå, äîëæíî âûáèðàòüñÿ â çàâèñèìîñòè îò îáúåìà âûáîðêè.  íàñòîÿùåå âðåìÿ íàèáîëåå “ïîïóëÿðíîé” ôîðìóëîé, ïî êîòîðîé îïðåäåëÿåòñÿ êîëè÷åñòâî k èíòåðâàëîâ â çàâèñèìîñòè îò ÷èñëà n âûáîðî÷íûõ çíà÷åíèé, ÿâëÿåòñÿ ôîðìóëà Ñòåðäæåññà: k = [1 + 3,22 ln(n)] ([õ] — öåëàÿ ÷àñòü ÷èñëà õ). Äëÿ ïîëíîòû êàðòèíû ïðèâåäåì äðóãèå ôîðìóëû, ðåêîìåíäóåìûå äëÿ âû÷èñëåíèÿ k (ñì., íàïðèìåð, [13]). k = 10 lg(n), ïðè ýòîì k íå äîëæíî âûõîäèòü çà èíòåðâàë [5, 30]. k = 5 lg(n) è k ∈ [6, 20]. k = [3,26 lg(n) + 0,5] + 1, åñëè n ≤ 100; è k = min([0,1n], 25) + 1, åñëè n > 100. k = [4(0,75(n – 1)2)1/5], åñëè n > 200; è k = [0,2n], åñëè n ≤ 200. ( ) k = min n , 30 . ( ýòèõ ôîðìóëàõ [õ] — öåëàÿ ÷àñòü ÷èñëà õ.) Êàêèå áû ôîðìóëû íå èñïîëüçîâàëèñü äëÿ âû÷èñëåíèÿ k, ñëåäóåò ïîìíèòü, ÷òî ïðè ñëèøêîì áîëüøîì çíà÷åíèè k âèä ðàñïðåäåëåíèÿ èñêàæàåòñÿ ñëó÷àéíûìè çíà÷åíèÿìè ÷àñòîò (ïîñêîëüêó èíòåðâàëû î÷åíü êîðîòêèå). À ïðè ìàëîì ÷èñëå èíòåðâàëîâ ñãëàæèâàþòñÿ è íèâåëèðóþòñÿ õàðàêòåðíûå îñîáåííîñòè ðàñïðåäåëåíèÿ (íàïðèìåð, íàëè÷èå äâóõ áëèçêîðàñïîëîæåííûõ ìîä). Ïîýòîìó äëÿ êà÷åñòâåííîãî àíàëèçà ñòðîÿò ãèñòîãðàììû ïðè íåñêîëüêèõ çíà÷åíèÿõ k. Ïîñëå âûáîðà êîëè÷åñòâà èíòåðâàëîâ îïðåäåëÿåòñÿ äëèíà èíòåðâàëîâ è èõ ãðàíèöû. Åñëè âñå èíòåðâàëû îäèíàêîâîé äëèíû, òî èõ äëèíà îïðåäåëÿåòñÿ ôîðìóëîé d = R/k, ãäå R = xmax – xmin — ðàçìàõ âûáîðêè, xmax è xmin — ìàêñèìàëüíîå è ìèíèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ. ×àñòî äëÿ òîãî, ÷òîáû ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ ëåæàëè âíóòðè èíòåðâàëîâ, à íå íà ãðàíèöå, d âû÷èñëÿþò ïî ôîðìóëå d = 1,02R/k. Åñëè d — äðîáíîå ÷èñëî, òî çà äëèíó èíòåðâàëà ïðèíèìàåòñÿ èëè áëèæàéøåå öåëîå ÷èñëî, ïðåâîñõîäÿùåå d, èëè áëèæàéøàÿ ïðîñòàÿ äðîáü, òàêæå íå ìåíüøàÿ d. Ãðàíèöû i-ãî èíòåðâàëà ∆i = [ai1, ai2) âû÷èñëÿþòñÿ ïî ôîðìóëàì ai1 = à11 + (i – 1)d è ai1 = à11 + id ( i = 1, k ), ãäå à11 — íèæíÿÿ ãðàíèöà èíòåðâàëà ∆1. Ãðàíèöà à11 ðàâíà xmin, åñëè d òî÷íî ðàâíî R/k ëèáî íåìíîãî ìåíüøå ìèíèìàëüíîãî âûáîðî÷íîãî çíà÷åíèÿ. ×àñòîòû fi âû÷èñëÿþòñÿ êàê êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â èíòåðâàë ∆i. Îáû÷íî â ýòî êîëè÷åñòâî çàñ÷èòûâàþòñÿ çíà÷åíèÿ, êîòîðûå áîëüøå íèæíåé ãðàíèöû èíòåðâàëà èëè ðàâíû åé è ìåíüøèå âåðõíåé ãðàíèöû. Ðàññìîòðèì, êàê îïèñàííûå âû÷èñëåíèÿ ðåàëèçóþòñÿ â Excel: ñíà÷àëà ñ ïîìîùüþ ôîðìóë ìàññèâîâ, à çàòåì ñ ïîìîùüþ ôóíêöèè ЧАСТОТА è ñðåäñòâà Гистограмма. Глава 8. Предварительный анализ 273 Использование формул массивов Íà ðèñ. 8.25 ïîêàçàí ðàáî÷èé ëèñò, â ñòîëáöå À êîòîðîãî ñîäåðæàòñÿ âûáîðî÷íûå çíà÷åíèÿ (ýòîò äèàïàçîí ÿ÷ååê íàçâàí Выборка) è âû÷èñëåíû ãðàíèöû èíòåðâàëîâ (ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, òàêæå ïîêàçàíû íà ðèñ. 8.25).  äàííîì ñëó÷àå âûáîðêà èìååò ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [–1, 1]. Êîëè÷åñòâî èíòåðâàëîâ âû÷èñëÿåòñÿ â ÿ÷åéêå Ñ8 ïî ôîðìóëå Ñòåðäæåññà. Íîìåðà èíòåðâàëîâ â ñòîëáöå D ââåäåíû êàê çíà÷åíèÿ àðèôìåòè÷åñêîé ïðîãðåññèè ñ øàãîì 1 (êîìàíäà ПравкаÖЗаполнитьÖПрогрессия). Ýòî ïðîñòåéøèé ñïîñîá ñîçäàíèÿ èíòåðâàëîâ, è îí òðåáóåò âûïîëíåíèÿ íåêîòîðûõ îïåðàöèé âðó÷íóþ, íàïðèìåð, êîïèðîâàíèÿ ôîðìóëû èç ÿ÷åéêè Å3 â äèàïàçîí Å4:Å9. Ðèñ. 8.25. Âû÷èñëåíèå ãðàíèö èíòåðâàëîâ Ïðèâåäåì ôîðìóëó ìàññèâà, êîòîðàÿ âû÷èñëÿåò ãðàíèöû èíòåðâàëîâ, ïðè÷åì íèæíÿÿ ãðàíèöà ïåðâîãî èíòåðâàëà ñîâïàäàåò ñ xmin, à âåðõíÿÿ ãðàíèöà ïîñëåäíåãî — ñ xmax: {=МИН(Выборка)+((СТРОКА(ДВССЫЛ("1:"&(C8+1)))-1)* (МАКС(Выборка)МИН(Выборка))/C8)} Çäåñü ÷àñòü ôîðìóëû СТРОКА(ДВССЫЛ("1:"&(C8+1)))-1 ôîðìèðóåò âèðòóàëüíûé ìàññèâ èç öåëûõ ÷èñåë îò 0 äî 7. Ýòè ÷èñëà çàòåì óìíîæàþòñÿ íà äëèíó èíòåðâàëà, êîòîðàÿ âû÷èñëÿåòñÿ ÷àñòüþ ôîðìóëû МАКС(Выборка)-МИН(Выборка))/C8. Êàê âèäíî, äëÿ ðàáîòû äàííîé ôîðìóëû íàäî ïðåäâàðèòåëüíî âû÷èñëèòü òîëüêî êîëè÷åñòâî èíòåðâàëîâ (ÿ÷åéêà Ñ8). Ðåçóëüòàò èñïîëüçîâàíèÿ ýòîé ôîðìóëû ïîêàçàí íà ðèñ. 8.26 â ñòîëáöå Карманы2. Íåáîëüøîå î÷åâèäíîå èçìåíåíèå ïîñëåäíåé ôîðìóëû {=ОКРУГЛ(МИН(Выборка)-0,02*Длина;2)+ (СТРОКА(ДВССЫЛ("1:"&(C8+1)))1)*ОКРУГЛ(1,04*Длина;2)} ïîçâîëÿåò ñîçäàâàòü èíòåðâàëû, â êîòîðûõ çíà÷åíèÿ xmax è xmin ëåæàò âíóòðè èíòåðâàëîâ, à òàêæå îêðóãëÿåò äðîáíûå çíà÷åíèÿ ãðàíèö èíòåðâàëîâ äî äâóõ äåñÿòè÷íûõ çíàêîâ. Çäåñü, äëÿ òîãî ÷òîáû óïðîñòèòü ôîðìóëó, äëèíà èíòåðâàëà ïî ôîðìóëå =МАКС(Выборка)-МИН(Выборка))/C8 âû÷èñëÿåòñÿ â ÿ÷åéêå, êîòîðîé ïðèñâîåíî èìÿ Длина (ÿ÷åéêà Ñ12 íà ðèñ. 8.26). Ìíîæèòåëè 0,02 è 1,04 ïåðåä çíà÷åíèåì Длина íàäî ïîäáèðàòü òàêèì îáðàçîì, ÷òîáû âû÷èñëåííîå çíà÷åíèå 274 Часть III. Анализ одномерных выборок ОКРУГЛ(МИН(Выборка)-0,02*Длина;2) áûëî ìåíüøå xmin. Íàïðèìåð, â äàííîì ïðèìåðå ïðè ìíîæèòåëå 0,01 çíà÷åíèå íèæíåé ãðàíèöû ïåðâîãî èíòåðâàëà áûëî áîëüøå xmin. Ýòî ðåçóëüòàò îêðóãëåíèÿ — åñëè íå èñïîëüçîâàòü ôóíêöèþ ОКРУГЛ, òî ëþáîé ïîëîæèòåëüíûé ìíîæèòåëü áóäåò äàâàòü çíà÷åíèå íèæíåé ãðàíèöû ïåðâîãî èíòåðâàëà, ìåíüøåå xmin. Ðåçóëüòàòû âû÷èñëåíèé ïî ïîñëåäíåé ôîðìóëå ïîêàçàíû íà ðèñ. 8.26 â ñòîëáöå Карманы3. Ðèñ. 8.26. Ôîðìóëû ìàññèâîâ äëÿ âû÷èñëåíèÿ ãðàíèö èíòåðâàëîâ Òåïåðü ïîäñ÷èòàåì êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàäàþùèõ â ñîîòâåòñòâóþùèå èíòåðâàëû, ò.å. ñîçäàäèì ÷àñòîòíóþ òàáëèöó. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôîðìóëó ìàññèâà (ãðàíèöû èíòåðâàëîâ çàïèñàíû â ñòîëáöå G íà÷èíàÿ ñî âòîðîé ñòðîêè) {=СУММ((Выборка>=G2)*(Выборка<G3))}, êîòîðàÿ çàïèñûâàåòñÿ â ïåðâóþ ÿ÷åéêó ÷àñòîòíîé òàáëèöû, à çàòåì êîïèðóåòñÿ âíèç. Çäåñü â çíà÷åíèÿ ÷àñòîò çàñ÷èòûâàþòñÿ âûáîðî÷íûå çíà÷åíèÿ, êîòîðûå áîëüøå íèæíåé ãðàíèöû èíòåðâàëà èëè ðàâíû åé è ìåíüøèå âåðõíåé ãðàíèöû. Íà ðèñ. 8.27 ïî ýòèì ôîðìóëàì â ñòîëáöå Í (îçàãëàâëåííîì Частота) ïîäñ÷èòàíû ÷àñòîòû äëÿ èíòåðâàëîâ Карманы3.  ñòîëáöå I (îçàãëàâëåííîì Частота2) ïî àíàëîãè÷íûì ôîðìóëàì ïîäñ÷èòàíû ÷àñòîòû äëÿ èíòåðâàëîâ Карманы2, ãäå â êà÷åñòâå íèæíåé ãðàíèöû ïåðâîãî èíòåðâàëà âçÿòî xmin, à âåðõíåé ãðàíèöåé ïîñëåäíåãî — xmax. Êàê âèäíî íà ðèñ. 8.27 â ñòðîêå ñîñòîÿíèÿ, â ýòîì ñëó÷àå ñóììà ÷àñòîò íå ðàâíà 100 (ò.å. îáúåìó âûáîðêè), ïîñêîëüêó â ïîñëåäíåì èíòåðâàëå íå çàñ÷èòàíî çíà÷åíèå xmax. Òàêèì îáðàçîì, ñëåäóåò ñîçäàâàòü òàêèå èíòåðâàëû, ÷òîáû çíà÷åíèÿ xmin è xmax íàõîäèëèñü âíóòðè èíòåðâàëîâ. Äëÿ âû÷èñëåíèÿ ÷àñòîñòåé çíà÷åíèÿ ÷àñòîò íåîáõîäèìî ðàçäåëèòü íà êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé. Åñëè âû÷èñëÿòü ÷àñòîñòè áåç ïðåäâàðèòåëüíîãî âû÷èñëåíèÿ ÷àñòîò, òî äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôîðìóëó {=СУММ((Выборка>=G2)*(Выборка<G3))/СЧЁТ(Выборка)}, êîòîðàÿ çàïèñûâàåòñÿ â ïåðâóþ ÿ÷åéêó òàáëèöû ÷àñòîñòåé, à çàòåì êîïèðóåòñÿ âíèç (çäåñü ïðåäïîëàãàåòñÿ, ÷òî ãðàíèöû èíòåðâàëîâ çàïèñàíû â ñòîëáöå G íà÷èíàÿ ñî âòîðîé ñòðîêè). Íà ðèñ. 8.28 çíà÷åíèÿ ÷àñòîñòåé âû÷èñëåíû ïî ïðèâåäåííûì âûøå ôîðìóëàì è çàïèñàíû â ñòîëáöå I, îçàãëàâëåííîì Частости. Глава 8. Предварительный анализ 275 Ðèñ. 8.27. Âû÷èñëåíèå ÷àñòîòíîé òàáëèöû Äëÿ âû÷èñëåíèÿ íàêîïëåííûõ ÷àñòîò èëè íàêîïëåííûõ ÷àñòîñòåé ìîæíî èñïîëüçîâàòü ðàíåå âû÷èñëåííûå çíà÷åíèÿ ÷àñòîò èëè ÷àñòîñòåé ëèáî íàéòè èõ “íàïðÿìóþ” áåç ïðîìåæóòî÷íîãî âû÷èñëåíèÿ ÷àñòîò (÷àñòîñòåé). Äëÿ âûïîëíåíèÿ ïåðâîãî âàðèàíòà âû÷èñëåíèé â ÿ÷åéêó J2 (ñì. ðèñ. 8.28) çàïèñûâàåòñÿ ôîðìóëà =I2, â ÿ÷åéêó J3 — ôîðìóëà =J2+I3. Ïîñëåäíÿÿ ôîðìóëà êîïèðóåòñÿ âíèç. Äëÿ âûïîëíåíèÿ âòîðîãî âàðèàíòà âû÷èñëåíèé â ïåðâóþ ÿ÷åéêó äèàïàçîíà ÿ÷ååê, ñîäåðæàùèõ çíà÷åíèÿ íàêîïëåííûõ ÷àñòîñòåé (ÿ÷åéêà Ê2 íà ðèñ. 8.28), çàïèñûâàåòñÿ ôîðìóëà ìàññèâà {=СУММ(1*(Выборка<G3))/СЧЁТ(Выборка)}, êîòîðàÿ çàòåì êîïèðóåòñÿ âíèç. Ðåçóëüòàò âû÷èñëåíèÿ íàêîïëåííûõ ÷àñòîñòåé îïèñàííûìè ñïîñîáàìè ïîêàçàí íà ðèñ. 8.28 â ñòîëáöàõ J è Ê. Ðèñ. 8.28. Âû÷èñëåíèå íàêîïëåííûõ ÷àñòîñòåé 276 Часть III. Анализ одномерных выборок Íà îñíîâå òàáëèö ÷àñòîò (èëè ÷àñòîñòåé) è íàêîïëåííûõ ÷àñòîò (íàêîïëåííûõ ÷àñòîñòåé) âèçóàëüíî ïðåäñòàâëÿþò ðàñïðåäåëåíèå âûáîðêè â âèäå ãèñòîãðàììû, ïîëèãîíà è ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ. Ïîëèãîí — ýòî ãðàôèê, ïîñòðîåííûé ïî çíà÷åíèÿì ÷àñòîò (÷àñòîñòåé), ïðè ýòîì çíà÷åíèÿ ñîåäèíÿþòñÿ îòðåçêàìè ïðÿìûõ. Ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé òàêæå ñòðîèòñÿ â âèäå êóñî÷íî-ëèíåéíîãî ãðàôèêà, à íå â âèäå ñòóïåí÷àòîé ôóíêöèè, êàê ýòî äåëàåòñÿ äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  Excel äëÿ ïîñòðîåíèÿ ãèñòîãðàììû èñïîëüçóåòñÿ òèï äèàãðàììû Гистограмма, äëÿ ïîëèãîíà — òèï График, à äëÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ — òèï Точечная. Ýòè òèïû ãðàôèêîâ ïîêàçàíû íà ðèñ. 8.29. Ðèñ. 8.29. Ãèñòîãðàììà, ïîëèãîí è ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ Использование функции ЧАСТОТА и средства Гистограмма Ôóíêöèÿ ЧАСТОТА îïèñàíà â ðàçäåëå 4.11.4. Íàïîìíèì åå ñèíòàêñèñ: ЧАСТОТА(Ìàññèâ_äàííûõ;Ìàññèâ_èíòåðâàëîâ) Àðãóìåíò Массив_данных — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ. Àðãóìåíò Массив_интервалов — ìàññèâ èëè ññûëêà íà äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ãðàíèö èíòåðâàëîâ {a0, a1, ..., ak–1, ak}. Ôóíêöèÿ ââîäèòñÿ êàê ôîðìóëà ìàññèâà è âîçâðàùàåò ìàññèâ çíà÷åíèé (ðèñ. 8.30). Ðàçìåðíîñòü ýòîãî ìàññèâà íà åäèíèöó áîëüøå ðàçìåðíîñòè ìàññèâà ãðàíèö èíòåðâàëîâ. ×àñòîòû ïîäñ÷èòûâàåòñÿ ñëåäóþùèì îáðàçîì. Ïåðâîå çíà÷åíèå ìàññèâà ÷àñòîò — ýòî êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ìåíüøèõ èëè ðàâíûõ a0, âòîðîå — ÷èñëî âûáîðî÷íûõ çíà÷åíèé, áîëüøèõ a0 è ìåíüøèõ èëè ðàâíûõ a1, è ò.ä. Ïîñëåäíåå çíà÷åíèå ìàññèâà ÷àñòîò ðàâíî êîëè÷åñòâó âûáîðî÷íûõ çíà÷åíèé, áîëüøèõ ak. Òàêèì îáðàçîì, â îòëè÷èå îò ôîðìóë ïðåäûäóùåãî ðàçäåëà, çäåñü â êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé, ïîïàâøèõ â òîò èëè èíîé èíòåðâàë, çàñ÷èòûâàþòñÿ çíà÷åíèÿ, êîòîðûå áîëüøå íèæíåé ãðàíèöû èíòåðâàëà è ìåíüøå âåðõíåé ãðàíèöû èëè ðàâíû åé. Êîíå÷íî, òàêîå ðàçëè÷èå íåñóùåñòâåííî Глава 8. Предварительный анализ 277 è èãðàåò ñâîþ ðîëü òîëüêî â òåõ ñëó÷àÿõ, êîãäà ãðàíèöû íåêîòîðûõ èíòåðâàëîâ ñîâïàäàþò ñ âûáîðî÷íûìè çíà÷åíèÿìè (íàïðèìåð, åñëè íèæíÿÿ ãðàíèöà ïåðâîãî èíòåðâàëà è âåðõíÿÿ ãðàíèöà ïîñëåäíåãî èíòåðâàëà ðàâíû ñîîòâåòñòâåííî xmin è xmax). Ðèñ. 8.30. Ïðèìåíåíèå ôóíêöèè ЧАСТОТА Ñðåäñòâî ïàêåòà àíàëèçà Гистограмма îïèñàíî â ðàçäåëå 5.2. Îòìåòèì, ÷òî åñëè íå çàäàíû èíòåðâàëû êàðìàíîâ, òî îíè âû÷èñëÿþòñÿ àâòîìàòè÷åñêè ñëåäóþùèì ñïîñîáîì. Âû÷èñëÿþòñÿ êîëè÷åñòâî èíòåðâàëîâ ïî ôîðìóëå Ñòåðäæåññà k = [1 + 3,22 ln(n)] (n — îáúåì âûáîðêè) è äëèíà èíòåðâàëîâ êàê d = R/(k – 1) (R — ðàçìàõ âûáîðêè). Çàòåì ïîñëåäîâàòåëüíî âû÷èñëÿþòñÿ ãðàíèöû èíòåðâàëîâ, ïðè÷åì çà íèæíþþ ãðàíèöó ïåðâîãî èíòåðâàëà áåðåòñÿ xmin. Îáðàùàåì âíèìàíèå, ÷òî ñðåäñòâî Гистограмма ñòðîèò íà îäèí èíòåðâàë áîëüøå, ÷åì âû÷èñëÿåò ôîðìóëà Ñòåðäæåññà. Ïîñëåäíèé èíòåðâàë Гистограмма îáîçíà÷àåò êàê Еще. Çíà÷åíèÿ ÷àñòîò ñðåäñòâî Гистограмма âû÷èñëÿåò òàê æå, êàê è ôóíêöèÿ ЧАСТОТА. Íà ðèñ. 8.31 ïîêàçàíû èíòåðâàëû êàðìàíîâ, âû÷èñëåííûå ñðåäñòâîì Гистограмма, è ïîñòðîåííàÿ èì ãèñòîãðàììà ÷àñòîò. Îòìåòèì, ÷òî â êà÷åñòâå ïîäïèñåé ê îñè Õ Гистограмма áåðåò çíà÷åíèÿ èç ìàññèâà Карман. Ïîýòîìó äëÿ òîãî, ÷òîáû èçìåíèòü ôîðìàò ïîäïèñåé íà äèàãðàììå, ñëåäóåò èçìåíèòü ôîðìàò ÷èñëîâûõ çíà÷åíèé â ìàññèâå Карман.  îñòàëüíîì ýòó äèàãðàììó ìîæíî ôîðìàòèðîâàòü òàê æå, êàê ëþáóþ äðóãóþ äèàãðàììó Excel. 8.4. Вычисление точечных оценок параметров распределения Âû÷èñëåíèå ðàçëè÷íûõ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèÿ ïðåäøåñòâóåò ëþáîìó áîëåå-ìåíåå ãëóáîêîìó ñòàòèñòè÷åñêîìó àíàëèçó èìåþùèõñÿ âûáîðî÷íûõ äàííûõ. Óæå íà ýòàïå ïðåäâàðèòåëüíîãî àíàëèçà èñïîëüçóþòñÿ ýòè îöåíêè, îñîáåííî ïåðâûõ ìîìåíòîâ, íàïðèìåð ïðè öåíçóðèðîâàíèè è ïðåîáðàçîâàíèè (íîðìàëèçàöèè) èñõîäíûõ äàííûõ (ñì. ðàçäåëû 8.1 è 8.2). Íî, ïðåæäå âñåãî, îöåíêè ïàðàìåòðîâ äàþò ïåðâîíà÷àëüíîå ïðåäñòàâëåíèå î òèïå è õàðàêòåðå ðàñïðåäåëåíèÿ âûáîðêè (êîíå÷íî, íàðÿäó ñ äðóãèìè ñðåäñòâàìè ïðåäâàðèòåëüíîãî àíàëèçà, íàïðèìåð ñ ãèñòîãðàììàìè è ýìïèðè÷åñêîé ôóíêöèåé ðàñïðåäåëåíèÿ). Ïàðàìåòðû ðàñïðåäåëåíèÿ ìîæíî ðàçáèòü íà íåñêîëüêî ãðóïï. 278 Часть III. Анализ одномерных выборок Ðèñ. 8.31. Ïðèìåíåíèå ñðåäñòâà Гистограмма 1. Ïàðàìåòðû ïîëîæåíèÿ. Õàðàêòåðèçóþò ïîëîæåíèå âûáîðî÷íûõ äàííûõ (òî÷íåå, ãåíåðàëüíîé ñîâîêóïíîñòè) íà ÷èñëîâîé îñè. Ê òàêèì ïàðàìåòðàì ìîæíî îòíåñòè ìèíèìàëüíîå è ìàêñèìàëüíîå âûáîðî÷íûå çíà÷åíèÿ è âûáîðî÷íûå êâàíòèëè. “Ñðåäíèå çíà÷åíèÿ” ìåñòîïîëîæåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè õàðàêòåðèçóþò âûáîðî÷íûå ñðåäíèå (àðèôìåòè÷åñêîå, ãåîìåòðè÷åñêîå èëè ãàðìîíè÷åñêîå), ìåäèàíà è ìîäà. 2. Ïàðàìåòðû ðàçáðîñà. Õàðàêòåðèçóþò ñòåïåíü ðàçáðîñà âûáîðî÷íûõ äàííûõ îòíîñèòåëüíî íåêîòîðîãî “ñðåäíåãî çíà÷åíèÿ”. Ê íèì, â ïåðâóþ î÷åðåäü, îòíîñÿòñÿ âûáîðî÷íûå äèñïåðñèÿ è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå, ðàçìàõ âûáîðêè è èíòåðêâàðòèëüíûé ðàçìàõ (ðàçíîñòü ìåæäó âûáîðî÷íûìè âåðõíèì è íèæíèì êâàðòèëÿìè), êîýôôèöèåíò âàðèàöèè (îòíîøåíèå âûáîðî÷íîãî ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ê ñðåäíåìó) è äð. 3. Ïàðàìåòðû ôîðìû ðàñïðåäåëåíèÿ. Îïðåäåëÿþò “ãåîìåòðè÷åñêèå” õàðàêòåðèñòèêè ðàñïðåäåëåíèÿ, íàïðèìåð ñèììåòðè÷íîñòü è “îñòðîòà” ôîðìû ïëîòíîñòè âåðîÿòíîñòè. Ê òàêèì ïàðàìåòðàì, ïðåæäå âñåãî, îòíîñÿòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà, à òàêæå êîëè÷åñòâî ìîä (åñëè ïî ãèñòîãðàììå ìîæíî ÷åòêî îïðåäåëèòü íàëè÷èå íåñêîëüêèõ ìîä), îòíîñèòåëüíîå ðàññòîÿíèå ìåæäó ìåäèàíîé è ñðåäíèì è ò.ï. Äëÿ âû÷èñëåíèÿ áîëüøèíñòâà ïåðå÷èñëåííûõ ïàðàìåòðîâ â Excel ïðåäóñìîòðåíû ñîîòâåòñòâóþùèå ôóíêöèè (ñì. ãëàâó 4), à òàêæå ñðåäñòâî Описательная статистика èç ïàêåòà àíàëèçà (ñì. ðàçäåë 5.1). Íàïðèìåð, äëÿ âûáîðêè, êîòîðàÿ èñïîëüçîâàëàñü â ïðèìåðàõ ïðåäûäóùåãî ðàçäåëà, ñðåäñòâî Описательная статистика ðàññ÷èòàëî ñòàòèñòè÷åñêèå ïîêàçàòåëè, ïîêàçàííûå íà ðèñ. 8.32. Ïðèâåäåì ñïèñîê îñíîâíûõ òî÷å÷íûõ îöåíîê ïàðàìåòðîâ ðàñïðåäåëåíèé ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè è íàçâàíèÿìè ôóíêöèé Excel, êîòîðûå âû÷èñëÿþò ýòè îöåíêè. ( ôîðìóëàõ xi — âûáîðî÷íûå çíà÷åíèÿ, n — îáúåì âûáîðêè, x(i) — ÷ëåíû âàðèàöèîííîãî ðÿäà, ïîñòðîåííîãî ïî èñõîäíîé âûáîðêå.) Òàêæå óêàæåì, âûïîëíÿþòñÿ ëè ýòè âû÷èñëåíèÿ ñðåäñòâîì Описательная статистика. Глава 8. Предварительный анализ 279 2 1 n −[αn ] / 2 1 ∑ xi n − [αn] i =1+[αn ] / 2 1 ∑ xi n i =1 хгарм = n Ôóíêöèÿ Excel i =1 n i 1 ∑x (Ñì. ðàçäåëû 1.2.3 è 4.2.1) (Ñì. ðàçäåë 8.4.2) m = õ(k+1), åñëè n = 2k + 1; m = (õ(k) + õ(k+1))/2, åñëè n = 2k xmax = max(õ1, õ2, ..., õn) Íåò Íåò СРГЕОМ СРГАМ Äà Íåò МОДА КВАРТИЛЬ Äà Äà 1 Äà Äà МЕДИАНА, КВАРТИЛЬ , ПЕРСЕНТИЛЬ2 НАИБОЛЬШИЙ МАКС, МАКСА, НАИБОЛЬШИЙ НАИМЕНЬШИЙ Äà Íåò УРЕЗСРЕДНЕЕ МИН, МИНА, НАИМЕНЬШИЙ Äà Îïèñàòåëüíàÿ ñòàòèñòèêà СРЗНАЧ, СРЗНАЧА Ïàðàìåòðû ïîëîæåíèÿ xгеом = n x1 x2 ⋅ ... ⋅ xn xα = x= n xmin = min(õ1, õ2, ..., õn) Ôîðìóëà Ýòà ôóíêöèÿ âû÷èñëÿåò ìåäèàíó ïðè çíà÷åíèè àðãóìåíòà Часть, ðàâíîì 2. Ýòà ôóíêöèÿ âû÷èñëÿåò ìåäèàíó ïðè çíà÷åíèè àðãóìåíòà k = 0,5. Êâàíòèëè Ìîäà Ìåäèàíà k-å íàèáîëüøåå çíà÷åíèå Ìàêñèìàëüíîå âûáîðî÷íîå çíà÷åíèå k-å íàèìåíüøåå çíà÷åíèå Ìèíèìàëüíîå âûáîðî÷íîå çíà÷åíèå Ñðåäíåå ãàðìîíè÷åñêîå Ñðåäíåå ãåîìåòðè÷åñêîå Óñå÷åííîå ñðåäíåå Ñðåäíåå Îöåíêà Ñðåäíåå àáñîëþòíîå îòêëîíåíèå Ñòàíäàðòíîå îòêëîíåíèå Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå Óñå÷åííàÿ âûáîðî÷íàÿ äèñïåðñèÿ Íåñìåùåííàÿ âûáîðî÷íàÿ äèñïåðñèÿ Âûáîðî÷íàÿ äèñïåðñèÿ k-é íà÷àëüíûé ìîìåíò Ïðîöåíòèëè Îöåíêà sα2 = Ôîðìóëà 1 n ∑ ( xi − x )2 n i =1 1 n ∑ ( xi − x )2 n − 1 i =1 1 n ∑ ( xi − x )2 n i =1 Íåò Äà Íåò СТАНДОТКЛОНП, СТАНДОТКЛОНПА СТАНДОТКЛОН, СТАНДОТКЛОНА СРОТКЛ 281 Íåò Äà ДИСП, ДИСПА Ïîñëå ïðåäâàðèòåëüíîãî öåíçóðèðîâàíèÿ âûáîðêè ìîæíî ïðèìåíèòü ôóíêöèè ДИСП è ДИСПА Íåò Íåò Íåò Îïèñàòåëüíàÿ ñòàòèñòèêà ДИСПР, ДИСПРА Глава 8. Предварительный анализ 1 n ∑ | xi − x | n i =1 1 n ∑ ( xi − x )2 n − 1 i =1 dn = sn = Sn = Ñïåöèàëüíîé ôóíêöèè íåò, íî ëåãêî âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèè СУММ èëè СРЗНАЧ ПЕРСЕНТИЛЬ Ïàðàìåòðû ðàçáðîñà 1 n k ∑ xi n i =1 n −[αn ] / 2 1 ∑ ( xi − xα )2 n − [αn] − 1 i =1+[αn ] / 2 sn2 = Sn2 = mk = (Ñì. ðàçäåë 1.2.3) Ïàðàìåòðû ïîëîæåíèÿ Ôóíêöèÿ Excel Ïðîäîëæåíèå òàáë. β̂ 2 = Âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèé СУММ è СРЗНАЧ 4 n xi − x n( n + 1) 3(n − 1) 2 − ∑ ( n − 1)( n − 2)(n − 3) i =1 sn ( n − 3)(n − 3) 2 ЭКСЦЕСС СКОС Ïàðàìåòðû ôîðìû ðàñïðåäåëåíèÿ 1 n ∑ ( xi − x )k n i =1 n xi − x n ∑ (n − 1)(n − 2) i =1 sn µk = 282 Часть III. Анализ одномерных выборок Êîýôôèöèåíò ýêñöåññà Êîýôôèöèåíò àñèììåòðèè k-é öåíòðàëüíûé ìîìåíò Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèè КВАРТИЛЬ R0,5 = ξ0,75 – ξ0,25 Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèé СТАНДОТКЛОН è СРЗНАЧ Èíòåðêâàðòèëüíûé ðàçìàõ s ⋅100% x Î÷åâèäíàÿ ôîðìóëà ñ èñïîëüçîâàíèåì ôóíêöèé МАКС è МИН v= Ïàðàìåòðû ðàçáðîñà Ôóíêöèÿ Excel R = xmax – xmin β̂1 = Ôîðìóëà Ðàçìàõ Êîýôôèöèåíò âàðèàöèè Îöåíêà Äà Äà Íåò Íåò Äà (íàçûâàåòñÿ Интервал) Íåò Îïèñàòåëüíàÿ ñòàòèñòèêà Îêîí÷àíèå òàáë. Ðèñ. 8.32. Ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè, ïîëó÷åííûå ñ ïîìîùüþ ñðåäñòâà Описательная статистика Ïðèâåäåííûå ôîðìóëû ïðèìåíèìû äëÿ ëþáûõ ðàñïðåäåëåíèé. Äëÿ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé ñóùåñòâóþò ñïåöèàëüíûå òî÷å÷íûå îöåíêè ïàðàìåòðîâ ðàñïðåäåëåíèÿ, êîòîðûå áóäóò ïîêàçàíû â ãëàâå 10. Îòäåëüíîãî ðàññìîòðåíèÿ òðåáóþò ôîðìóëû äëÿ âûáîðêè èç äèñêðåòíîé ãåíåðàëüíîé ñîâîêóïíîñòè, ïðåäñòàâëåííîé â âèäå ÷àñòîòíîé òàáëèöû, à òàêæå íåêîòîðûå ïîÿñíåíèÿ íåîáõîäèìû äëÿ îöåíêè ìîäû. 8.4.1. Точечные оценки дискретного распределения Ïóñòü âûáîðêà èç äèñêðåòíîé ãåíåðàëüíîé ñîâîêóïíîñòè ïðåäñòàâëåíà â âèäå ÷àñòîòíîé òàáëèöû, ãäå äëÿ êàæäîãî çíà÷åíèÿ õ1, õ2, ..., õm óêàçûâàþòñÿ ñîîòâåòñòâóþùèå ÷àñòîòû f1, f2, ..., fm. Îáîçíà÷èì êàê n ñóììó âñåõ ÷àñòîò, ò.å. m n = ∑ f i . Ïðèâåäåì ìàòåìàòè÷åñêèå ôîðìóëû è ôîðìóëû Excel äëÿ âû÷èñëåíèÿ i =1 îöåíîê ìîìåíòîâ ðàñïðåäåëåíèÿ.  ôîðìóëàõ Excel áóäåì ïðåäïîëàãàòü, ÷òî çíà÷åíèÿ õ1, õ2, ..., õm ðàñïîëàãàþòñÿ â äèàïàçîíå ÿ÷ååê ñ èìåíåì Значения, çíà÷åíèÿ ÷àñòîò f1, f2, ..., fm — â äèàïàçîíå ñ èìåíåì Частота, à çíà÷åíèå n — â ÿ÷åéêå ñ èìåíåì N (äëÿ íàõîæäåíèÿ n ìîæíî ïðèìåíèòü ôîðìóëó =СУММ(Частота)). Îöåíêà Âûáîðî÷íîå ñðåäíåå k-é íà÷àëüíûé ìîìåíò Ôîðìóëà x= mk = Ôîðìóëà Excel 1 n ∑ xi fi n i =1 =СУММПРОИЗВ(Значения;Частота)/N 1 n k ∑ xi fi n i =1 =СУММПРОИЗВ(Значения^К;Частота)/N (çíà÷åíèå k çàïèñàíî â ÿ÷åéêå ñ èìåíåì К) Глава 8. Предварительный анализ 283 Îêîí÷àíèå òàáë. Îöåíêà Âûáîðî÷íàÿ äèñïåðñèÿ Ôîðìóëà Sn2 = Ôîðìóëà Excel 1 ∑ ( xi − x )2 fi n i =1 =СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/N (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее)1 =СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/(N-1) (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее) n Íåñìåùåííàÿ âûáîðî÷íàÿ äèñïåðñèÿ sn2 = 1 n ( xi − x )2 f i ∑ n − 1 i =1 Ñðåäíåêâàäðàò è÷åñêîå îòêëîíåíèå Sn = 1 n ∑ ( xi − x )2 fi n i =1 =КОРЕНЬ(СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/N) (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее) 1 n ∑ ( xi − x )2 fi n − 1 i =1 =КОРЕНЬ(СУММПРОИЗВ((ЗначенияСреднее)^2;Частота)/(N-1)) (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее) Ñòàíäàðòíîå îòêëîíåíèå sn = Ñðåäíåå àáñîëþòíîå îòêëîíåíèå dn = 1 n ∑ | xi − x | fi n i =1 =СУММПРОИЗВ(ABS(ЗначенияСреднее);Частота)/N (çíà÷åíèå x çàïèñàíî â ÿ÷åéêå ñ èìåíåì Среднее) k-é öåíòðàëüíûé ìîìåíò µk = 1 n ∑ ( xi − x )k fi n i =1 =СУММПРОИЗВ((ЗначенияСреднее)^К;Частота)/N (çíà÷åíèå k çàïèñàíî â ÿ÷åéêå ñ èìåíåì К) Ìîäà Çíà÷åíèå, êîòîðîìó ñîîòâåòñòâóåò íàèáîëüøåå çíà÷åíèå ÷àñòîòû =ИНДЕКС(Значения;ПОИСКПОЗ(МАКС(Ча стота);Частота))2 Äëÿ âû÷èñëåíèÿ ìåäèàíû òàêæå ìîæíî ñîçäàòü ôîðìóëó Excel, îäíàêî îíà áóäåò î÷åíü ãðîìîçäêîé è íåóäîáíîé â èñïîëüçîâàíèè. Âû÷èñëåíèÿ çíà÷èòåëüíî ñîêðàòÿòñÿ è óïðîñòÿòñÿ, åñëè ïðåäâàðèòåëüíî îòñîðòèðîâàòü ÷àñòîòíóþ òàáëèöó ïî âîçðàñòàíèþ çíà÷åíèé è ïîäñ÷èòàòü íàêîïëåííûå ÷àñòîòû, à òàêæå íàéòè çíà÷åíèå õm, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm, ìåíüøàÿ n/2, è ñëåäóþùåå ïî âåëè÷èíå çíà÷åíèå õm+1, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm+1, áîëüøàÿ èëè ðàâíàÿ n/2. Òîãäà ìåäèàíà Ì âû÷èñëÿåòñÿ ïî ôîðìóëå M = xm + ( xm +1 − xm ) n / 2 − Fm . Fm +1 Íà ðèñ. 8.33 ïîêàçàíî âû÷èñëåíèå ìåäèàíû ïî ýòîé ôîðìóëå. Çíà÷åíèÿ õm è õm+1 è ñîîòâåòñòâóþùèå èì çíà÷åíèÿ ÷àñòîò è íàêîïëåííûõ ÷àñòîò âûäåëåíû ñåðûì öâåòîì. 1 Äëÿ ýòîé ôîðìóëû ñíà÷àëà íåîáõîäèìî âû÷èñëèòü ñðåäíåå. ×òîáû íàéòè òîëüêî îöåíêó äèñïåðñèè, áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé, â ïîñëåäíþþ ôîðìóëó âìåñòî Среднее ñëåäóåò âñòàâèòü âûøåïðèâåäåííóþ ôîðìóëó âû÷èñëåíèÿ ñðåäíåãî. Ýòî æå çàìå÷àíèå îòíîñèòñÿ è ê ïðèâåäåííûì íèæå ôîðìóëàì. 2 Åñëè åñòü ãðóïïà èç íåñêîëüêèõ çíà÷åíèé, êîòîðûì ñîîòâåòñòâóþò îäèíàêîâûå íàèáîëüøèå çíà÷åíèÿ ÷àñòîò, òî ýòà ôîðìóëà âîçâðàùàåò ïåðâîå âñòðå÷åííîå çíà÷åíèå èç äàííîé ãðóïïû. 284 Часть III. Анализ одномерных выборок Ðèñ. 8.33. Âû÷èñëåíèå ìåäèàíû 8.4.2. Вычисление моды для непрерывных распределений Êàê óêàçûâàëîñü ïðè îïèñàíèè ôóíêöèè МОДА (ñì. ðàçäåë 4.11.3), ýòà ôóíêöèÿ íà ñàìîì äåëå íå âû÷èñëÿåò ìîäó ðàñïðåäåëåíèÿ (âïðî÷åì, êàê è ñðåäñòâî Описательная статистика). Îíà ïðîñòî îïðåäåëÿåò âûáîðî÷íîå çíà÷åíèå, êîòîðîå âñòðå÷àåòñÿ â âûáîðêå íàèáîëåå ÷àñòî. Íî ïîñêîëüêó äëÿ íåïðåðûâíûõ ñëó÷àéíûõ âåëè÷èí âåðîÿòíîñòü ïðèíÿòèÿ îäèíàêîâûõ çíà÷åíèé ðàâíà íóëþ, òî â âûáîðêàõ, èìåþùèõ íåïðåðûâíîå ðàñïðåäåëåíèå, îäèíàêîâûå çíà÷åíèÿ ïðàêòè÷åñêè íå âñòðå÷àþòñÿ (à åñëè è âñòðå÷àþòñÿ, òî ýòî, ñêîðåå âñåãî, àðòåôàêò). Íà ïðàêòèêå ìîäà íåïðåðûâíûõ ðàñïðåäåëåíèé îïðåäåëÿåòñÿ ñëåäóþùèì îáðàçîì. 1. Ïî âûáîðî÷íûì çíà÷åíèÿì ñòðîèòñÿ ãèñòîãðàììà (èëè ïîëèãîí) (ñì. ðàçäåë 8.3.2), ïî âèäó êîòîðîé îïðåäåëÿåòñÿ èíòåðâàë, â êîòîðîì ìîæåò íàõîäèòüñÿ ìîäà (òàêîé èíòåðâàë íàçûâàåòñÿ ìîäàëüíûì). Ïóñòü ãðàíèöàìè ýòîãî èíòåðâàëà ñëóæàò ÷èñëà õm è õm+1. 2. Çíà÷åíèå ìîäû m âû÷èñëÿåòñÿ ïî ñëåäóþùåé ôîðìóëå: m = xm + ( xm +1 − xm ) f m − f m −1 , 2 f m − f m −1 − f m +1 ãäå fm, fm-1 è fm+1 — ÷àñòîòû ñîîòâåòñòâåííî ìîäàëüíîãî, ïðåäøåñòâóþùåãî ìîäàëüíîìó è ñëåäóþùåãî çà ìîäàëüíûì èíòåðâàëîâ.  ýòîé ôîðìóëå âìåñòî ÷àñòîò ìîæíî èñïîëüçîâàòü ÷àñòîñòè. Åñëè îïðåäåëåí ìîäàëüíûé èíòåðâàë, òî ðåàëèçàöèÿ òàêîé ôîðìóëû â Excel íå âûçûâàåò çàòðóäíåíèé. Глава 8. Предварительный анализ 285 Глава 9 Подбор распределения Î ïðåäåëåíèå âèäà ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ, ðåàëèçàöèåé êîòîðîé ÿâëÿþòñÿ èìåþùèåñÿ âûáîðî÷íûå çíà÷åíèÿ, — îäíà èç îñíîâíûõ öåëåé ëþáîãî ñòàòèñòè÷åñêîãî àíàëèçà. Ïî áîëüøîìó ñ÷åòó, åñëè èçâåñòíî ðàñïðåäåëåíèå âûáîðêè, íà ýòîì ìîæíî çàêàí÷èâàòü ñòàòèñòè÷åñêèé àíàëèç îäíîìåðíîé âûáîðêè, ïîñêîëüêó èçâåñòíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ìîæåò äàòü èñ÷åðïûâàþùóþ èíôîðìàöèþ î ñëó÷àéíîé âåëè÷èíå Õ. Íà ïðàêòèêå, êîíå÷íî, ðàñïðåäåëåíèå âûáîðêè íåèçâåñòíî, — â ëó÷øåì ñëó÷àå èñõîäÿ èç êàêèõ-ëèáî àïðèîðíûõ ñîîáðàæåíèé ìîæíî ïðåäïîëîæèòü, ÷òî ýòî ðàñïðåäåëåíèå ïðèíàäëåæèò êàêîìóíèáóäü èçâåñòíîìó êëàññó ðàñïðåäåëåíèé. Íî, ïîñêîëüêó ëþáîå êîíêðåòíîå ðàñïðåäåëåíèå îïðåäåëÿåòñÿ íåêîòîðûì íàáîðîì ïàðàìåòðîâ, âîçíèêàåò çàäà÷à, âîïåðâûõ, ïðîâåðèòü ãèïîòåçó î òîì, ÷òî ðàñïðåäåëåíèå äàííîé âûáîðêè äåéñòâèòåëüíî ïðèíàäëåæèò äàííîìó êëàññó ðàñïðåäåëåíèé, à âî-âòîðûõ, íàéòè ÷èñëîâûå çíà÷åíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèÿ. Âòîðàÿ çàäà÷à, íàõîæäåíèå ÷èñëîâûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ, ðàçðåøèìà, åñëè â êà÷åñòâå ÷èñëîâûõ çíà÷åíèé ýòèõ ïàðàìåòðîâ ïðèíÿòü èõ ñòàòèñòè÷åñêèå îöåíêè, ðàññ÷èòàííûå ïî âûáîðî÷íûì çíà÷åíèÿì. Êàê ïðàâèëî, äàííûå ïàðàìåòðû ìîæíî âûðàçèòü ÷åðåç ïåðâûå ìîìåíòû ðàñïðåäåëåíèÿ (åñëè ïàðàìåòðû, îïðåäåëÿþùèå ðàñïðåäåëåíèå, ñàìè íå ÿâëÿþòñÿ ýòèìè ìîìåíòàìè), ïîýòîìó è ñ âû÷èñëèòåëüíîé òî÷êè çðåíèÿ îöåíèâàíèå òàêèõ ïàðàìåòðîâ ÿâëÿåòñÿ îòíîñèòåëüíî ïðîñòîé çàäà÷åé. (Êîíå÷íî, ýòî óòâåðæäåíèå ñïðàâåäëèâî òîëüêî â òîì ñëó÷àå, åñëè íå âêëþ÷àòü â çàäà÷ó îöåíêè ïàðàìåòðîâ ïðîáëåìó íàäåæíîñòè è òî÷íîñòè ïîëó÷åííûõ îöåíîê.)  ëþáîì ñëó÷àå ñíà÷àëà íàäî îïðåäåëèòü êëàññ ðàñïðåäåëåíèé, ê êîòîðîìó ìîæåò îòíîñèòüñÿ ðàñïðåäåëåíèå èìåþùåéñÿ âûáîðêè. Åñëè íå ïðèâëåêàòü êàêèõëèáî àïðèîðíûõ ïðåäïîëîæåíèé î êëàññå ðàñïðåäåëåíèé, òî îñòàåòñÿ îïðåäåëèòü ýòîò êëàññ òîëüêî íà îñíîâàíèè âûáîðî÷íûõ çíà÷åíèé, íàïðèìåð ïî âèäó ãèñòîãðàììû èëè ïîëèãîíà, ëèáî íà îñíîâàíèè íåêîòîðûõ âûáîðî÷íûõ ñòàòèñòèê (÷àùå âñåãî äëÿ ýòîãî èñïîëüçóþòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà). Ïðåäâàðèòåëüíîìó îïðåäåëåíèþ êëàññà ðàñïðåäåëåíèé ïîñâÿùåí ñëåäóþùèé ðàçäåë ýòîé ãëàâû. Íî äàëåå íåîáõîäèìî ïðîâåðèòü âûäâèíóòóþ ãèïîòåçó î òîì, ÷òî âûáîðêà äåéñòâèòåëüíî èìååò ðàñïðåäåëåíèå èç äàííîãî êëàññà ðàñïðåäåëåíèé. Ïðîâåðêà òàêîé ãèïîòåçû ðàññìîòðåíà â ïîñëåäóþùèõ äâóõ ðàçäåëàõ ãëàâû. 9.1. Предварительное определение класса распределения Îñíîâíûì “îðóäèåì” äëÿ ïðåäâàðèòåëüíîãî îïðåäåëåíèÿ êëàññà ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè ñëóæèò ãèñòîãðàììà èëè ïîëèãîí ÷àñòîò. Îäíàêî äëÿ ýòîãî íåîáõîäèì “âîñïðèèì÷èâûé ãëàç” îïûòíîãî ñòàòèñòèêà, ïîñêîëüêó ãèñòîãðàììû î÷åíü ÷óâñòâèòåëüíû ê ñòàòèñòè÷åñêîé ïðèðîäå âûáîðîê, ÷òî õîðîøî âèäíî íà ïðèìåðàõ ãèñòîãðàìì, ïîñòðîåííûõ íà îñíîâå îäíîé è òîé æå âûáîðêè, íî ñ ðàçíûìè êîëè÷åñòâàìè êàðìàíîâ. Íà ðèñ. 9.1 è 9.2 ïîêàçàíû ãèñòîãðàììû òðåõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ (ñòàíäàðòíîå íîðìàëüíîå), îäèíàêîâûå îáúåìû (ïî 100 çíà÷åíèé), íî ïîñòðîåííûõ äëÿ ðàçíûõ êîëè÷åñòâ ðàçáèåíèÿ èíòåðâàëà èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé (íà ðèñ. 9.1 èñïîëüçîâàíî 8 êàðìàíîâ, à íà ðèñ. 9.2 — 12 êàðìàíîâ). Ðèñ. 9.1. Ãèñòîãðàììû òðåõ âûáîðîê, èìåþùèõ îäèíàêîâûå ðàñïðåäåëåíèÿ Ðèñ. 9.2. Ãèñòîãðàììû òåõ æå âûáîðîê ïðè äðóãîì êîëè÷åñòâå êàðìàíîâ Глава 9. Подбор распределения 287 Îáðàùàåì âíèìàíèå íà íåñèììåòðè÷íîñòü ãèñòîãðàìì — äëÿ ëþáîé âûáîðêè, èìåþùåé ñèììåòðè÷íîå ðàñïðåäåëåíèå, ãèñòîãðàììà áóäåò èìåòü îïðåäåëåííûé ñêîñ â òó èëè èíóþ ñòîðîíó. Ýòîò ôàêò òåîðåòè÷åñêè îáîñíîâàí, íî äëÿ ïðàêòè÷åñêîãî àíàëèçà îò ýòîãî íå ëåã÷å. Åñëè âûáîðêà äîñòàòî÷íî áîëüøîãî ðàçìåðà, ìîæíî ïîïðîáîâàòü ðàçáèòü åå íà äâå è äëÿ êàæäîé ïîëîâèíû ïîñòðîèòü ñâîþ ãèñòîãðàììó. Åñëè ãèñòîãðàììû áóäóò èìåòü ñêîñ â ðàçíûå ñòîðîíû, òî ýòî ìîæåò ñëóæèòü “íàìåêîì” íà ñèììåòðè÷íîñòü ðàñïðåäåëåíèÿ. Íà îñíîâå ãèñòîãðàìì, ïîêàçàííûõ íà ðèñ. 9.1, åäèíñòâåííîå, ÷òî ìîæíî óòâåðæäàòü ñ áîëüøîé äîëåé óâåðåííîñòè, — ÷òî ðàñïðåäåëåíèå âûáîðêè îäíîìîäàëüíî. Èòàê, íóæåí “îïûòíûé ãëàç”, ÷òîáû íà îñíîâàíèè ãèñòîãðàìì (èëè ïîëèãîíîâ) ñäåëàòü âûâîäû î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè òîìó èëè èíîìó êëàññó ðàñïðåäåëåíèé. ×òîáû ñäåëàòü àíàëîãè÷íûå âûâîäû íà îñíîâå ïðîáèòãðàôèêîâ, êîòîðûå ìû ñåé÷àñ ðàññìîòðèì, òàêæå íåîáõîäèì îïûò ñòàòèñòè÷åñêèõ èññëåäîâàíèé, íî çäåñü óæå âîçìîæíû è íåêîòîðûå ÷èñëîâûå îöåíêè áëèçîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ ê íåêîòîðîìó êëàññó ðàñïðåäåëåíèé. 9.1.1. Построение пробитграфиков Ïðîáèò-ãðàôèê — ýòî ãðàôèê çàâèñèìîñòè y = Ô–1(Fn(x)), ãäå Fn — ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ, Ô–1 — ôóíêöèÿ, îáðàòíàÿ ê íåêîé ôóíêöèè ðàñïðåäåëåíèÿ. Åñëè ðàñïðåäåëåíèå âûáîðêè ñîâïàäàåò ñ ðàñïðåäåëåíèåì Ô, òî ïðîáèò-ãðàôèêîì äëÿ òàêîé âûáîðêè áóäåò ïðÿìàÿ ëèíèÿ. Ïî ñòåïåíè îòêëîíåíèÿ ïðîáèò-ãðàôèêà îò ïðÿìîé ëèíèè ñóäÿò î áëèçîñòè ðàñïðåäåëåíèÿ âûáîðêè ê ðàñïðåäåëåíèþ Ô. Òàêèì îáðàçîì, äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêà íåîáõîäèìî èìåòü ïðåäïîëîæåíèå î òîì, êàêîìó êëàññó ðàñïðåäåëåíèé ìîæåò ïðèíàäëåæàòü ðàñïðåäåëåíèå âûáîðêè. Ïðîñòîòà ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ, à òàêæå ÷èñëîâûå ïîêàçàòåëè îòêëîíåíèÿ ïðîáèò-ãðàôèêà îò ïðÿìîé ëèíèè, ïîçâîëÿþò ïðîñìîòðåòü íåñêîëüêî âàðèàíòîâ ïðåäïîëàãàåìûõ ôóíêöèé ðàñïðåäåëåíèé è âûáðàòü èç íèõ íàèáîëåå ïîäõîäÿùèé. Ñóùåñòâóåò íåñêîëüêî ñïîñîáîâ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ1. Ïåðâûé ñïîñîá ïðåäïîëàãàåò âûáîðêó áîëüøîãî îáúåìà è ïðåäíàçíà÷åí èìåííî äëÿ ïîäáîðà òèïà ðàñïðåäåëåíèÿ. Âòîðîé ñïîñîá ïðèìåíÿåòñÿ ê ìàëûì âûáîðêàì è ÷àñòî èñïîëüçóåòñÿ äëÿ îïðåäåëåíèÿ âûáðîñîâ (ñì. ðàçäåë 8.1). Ðàññìîòðèì ïåðâûé ñïîñîá. Íà ðèñ. 9.3 ïîêàçàíû âûáîðêà (èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå è ïîñòðîåííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел), à òàêæå òàáëèöà ÷àñòîñòåé è íàêîïëåííûõ ÷àñòîñòåé, ðàññ÷èòàííàÿ ïî ýòîé âûáîðêå. (Î ñîçäàíèè òàêîé òàáëèöû ðå÷ü èäåò â ðàçäåëå 8.3.2.) Íàêîïëåííûå ÷àñòîñòè — ýòî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ, ãðàôèê êîòîðîé òàêæå ïîêàçàí íà ðèñ. 9.3.  êà÷åñòâå àðãóìåíòîâ õ äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêà âîçüìåì ñåðåäèíû èíòåðâàëîâ-êàðìàíîâ. Íà ðèñ. 9.4 ýòè çíà÷åíèÿ çàïèñàíû â ñòîëáöå Значения х. Òåïåðü îñòàëîñü ïîäñ÷èòàòü çíà÷åíèÿ y, âû÷èñëÿåìûå ïî ôîðìóëå y = Ô–1(Fn(x)). Çíà÷åíèÿ Fn(x) — ýòî çíà÷åíèÿ íàêîïëåííûõ ÷àñòîñòåé, çàïèñàííûå â ñòîëáöå Накопленные частости. Ïîñòðîèì ïðîáèò-ãðàôèêè äëÿ íîðìàëüíîãî ðàñïðåäåëåíèÿ è ðàâíîìåðíîãî, ñîñðåäîòî÷åííîãî íà èíòåðâàëå [–3, 3].  ïåðâîì ñëó÷àå èñïîëüçóåì ôóíêöèþ НОРМСТОБР (ñì. ðàçäåë 4.7.6). Âî âòîðîì ñëó÷àå, êàê íå1 Ðàíåå, â äîêîìïüþòåðíóþ ýïîõó, äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ ñóùåñòâîâàëà îñîáàÿ âåðîÿòíîñòíàÿ áóìàãà ñî ñïåöèàëüíîé øêàëîé, ðàññ÷èòàííîé äëÿ ðàçíûõ ðàñïðåäåëåíèé, â ÷àñòíîñòè äëÿ íîðìàëüíîãî è ëîãíîðìàëüíîãî. 288 Часть III. Анализ одномерных выборок òðóäíî ïðîâåðèòü, ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ, èìååò âèä Ô–1(õ) = 6(ó – 0,5). Ïîäñ÷èòàííûå çíà÷åíèÿ y äëÿ ïåðâîãî è âòîðîãî ñëó÷àåâ ïîêàçàíû íà ðèñ. 9.4 â ñòîëáöàõ Нормальное у è Равномерное у. Îòìåòèì, ÷òî êðàéíèå çíà÷åíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ (ò.å. çíà÷åíèÿ 0 è 1) äëÿ âû÷èñëåíèé íå èñïîëüçóþòñÿ. Ïðè÷èíû ýòîãî î÷åâèäíû — åñëè ðàñïðåäåëåíèå Ô îïðåäåëåíî íà áåñêîíå÷íîì èíòåðâàëå, òî ôóíêöèÿ Ô–1(õ) òàêæå äîëæíà ïðèíèìàòü áåñêîíå÷íûå çíà÷åíèÿ ïðè õ = 0 è õ = 1. Ðèñ. 9.3. Âûáîðêà è åå ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ Ðèñ. 9.4. Ïîñòðîåíèå ïðîáèò-ãðàôèêîâ Глава 9. Подбор распределения 289 Äëÿ ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ ñíà÷àëà ïðèìåíÿåòñÿ òèï äèàãðàììû Точечная, à çàòåì ïðîâîäèòñÿ ïðÿìàÿ ëèíåéíîãî òðåíäà (ñì. ðàçäåë 6.2.1). Ïðîáèò-ãðàôèêè äëÿ íàøåãî ïðèìåðà ïîêàçàíû íà ðèñ. 9.4. Äàæå “íà ãëàç” âèäíî, ÷òî â äàííîì ñëó÷àå ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ áëèæå ê íîðìàëüíîìó ðàñïðåäåëåíèþ, ÷åì ê ðàâíîìåðíîìó. Íî ÷òîáû ïîäòâåðäèòü ýòî, ìîæíî ïîäñ÷èòàòü ñòàíäàðòíóþ îøèáêó ïðèáëèæåíèÿ, ò.å. êâàäðàòíûé êîðåíü èç ñðåäíåé ñóììû îñòàòêîâ (ñì. ðàçäåë 3.4.3). Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôóíêöèþ Excel СТОШYX (ñì. ðàçäåë 4.9.3). Çíà÷åíèÿ ñòàíäàðòíîé îøèáêè ïðèáëèæåíèÿ ê íîðìàëüíîìó è ðàâíîìåðíîìó ðàñïðåäåëåíèÿì íà ðèñ. 9.4 ïîêàçàíû â ÿ÷åéêàõ F10 è G10 ñîîòâåòñòâåííî. Ýòè çíà÷åíèÿ òàêæå ïîêàçûâàþò, ÷òî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ áëèæå ê íîðìàëüíîìó ðàñïðåäåëåíèþ, ÷åì ê ðàâíîìåðíîìó. Âòîðîé ñïîñîá ïîñòðîåíèÿ ïðîáèò-ãðàôèêîâ îòëè÷àåòñÿ îò îïèñàííîãî âûøå òîëüêî ñïîñîáîì ïîñòðîåíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ. Íà ðèñ. 9.5 ïîêàçàíû âûáîðêà îáúåìîì 19 çíà÷åíèé, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, è âàðèàöèîííûé ðÿä, ïîñòðîåííûé ïî ýòîé âûáîðêå. (Âàðèàöèîííûé ðÿä ïîñòðîåí ñ ïîìîùüþ ñîðòèðîâêè âûáîðî÷íûõ çíà÷åíèé; êîìàíäà ДанныеÖСортировка.) Ïîñêîëüêó âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà Õ ïðèìåò çíà÷åíèå èç èíòåðâàëà (õ(i–1), õ(i)), îáðàçîâàííîãî ïîñëåäîâàòåëüíûìè ïîðÿäêîâûìè ñòàòèñòèêàÐèñ. 9.5. Âû÷èñëåíèå çíà÷åíèé ýì- ìè õ(i–1) è õ(i), íå çàâèñèò îò ðàñïðåäåëåíèÿ ïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ è âñåãäà ðàâíà 1/(n + 1) (ñì. ðàçäåë 2.3.9), çíà÷åíèå ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ Fn(x) ïðè õ = x(i) ðàâíî i/(n + 1). Ïî ýòîé ôîðìóëå ïîäñ÷èòàíû çíà÷åíèÿ ýìïèðè÷åñêîé ôóíêöèè ðàñïðåäåëåíèÿ íà ðèñ. 9.5 â ñòîëáöå Функция распределения. Çíà÷åíèÿ y âû÷èñëÿþòñÿ òàêèì æå îáðàçîì, êàê ïðè ïåðâîì ñïîñîáå ïîñòðîåíèÿ ïðîáèò-ãðàôèêà äëÿ ïðîâåðÿåìûõ ðàñïðåäåëåíèé. Çàòåì ñòðîÿòñÿ ïðîáèò-ãðàôèêè, ïðÿìûå ëèíåéíîãî òðåíäà, à òàêæå ðàññ÷èòûâàþòñÿ ñòàíäàðòíûå îøèáêè ïðèáëèæåíèÿ. Ïðîáèò-ãðàôèêè äëÿ äàííîãî ïðèìåðà ïîêàçàíû íà ðèñ. 9.6. Çäåñü âèçóàëüíî ñëîæíî îïðåäåëèòü, ê êàêîìó ðàñïðåäåëåíèþ áëèæå ýìïèðè÷åñêîå ðàñïðåäåëåíèå. Îäíàêî çíà÷åíèÿ ñòàíäàðòíûõ îøèáîê ïðèáëèæåíèÿ ïî-ïðåæíåìó ïîêàçûâàþò, ÷òî ýìïèðè÷åñêóþ ôóíêöèþ ðàñïðåäåëåíèÿ ëó÷øå ïðèáëèæàåò íîðìàëüíîå ðàñïðåäåëåíèå. Ïîñòðîåííûå òàêèì ñïîñîáîì ïðîáèò-ãðàôèêè ÷àñòî èñïîëüçóþòñÿ äëÿ îïðåäåëåíèÿ âûáðîñîâ, — âûáîðî÷íûå çíà÷åíèÿ, êîòîðûå ïîðîæäàþò òî÷êè, äàëåêî îòñòîÿùèå îò ëèíèè òðåíäà, ïîäîçðèòåëüíû êàê àðòåôàêòû. Ñóùåñòâåííî, ÷òî çäåñü ìîæíî îïðåäåëèòü íå òîëüêî ýêñòðåìàëüíûå âûáðîñû, íî è âûáðîñû, êîòîðûå ëåæàò âíóòðè èíòåðâàëà èçìåíåíèÿ âûáîðî÷íûõ çíà÷åíèé. 290 Часть III. Анализ одномерных выборок 9.2. Подбор функции распределения на основе числовых характеристик выборки Âèçóàëüíûå ìåòîäû ïîäáîðà ôóíêöèè ðàñïðåäåëåíèÿ íà îñíîâå ãèñòîãðàìì è ïðîáèò-ãðàôèêîâ íå ñëèøêîì íàäåæíû è ìîãóò äàòü òîëüêî ïåðâîíà÷àëüíûå ïðåäïîëîæåíèÿ î êëàññå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Áîëåå íàäåæíû âûâîäû íà îñíîâå ÷èñëîâûõ õàðàêòåðèñòèê âûáîðêè. Ðèñ. 9.6. Ïîñòðîåííûå ïðîáèò-ãðàôèêè Åñëè âû÷èñëåíû ïåðâûå ÷åòûðå âûáîðî÷íûõ ìîìåíòà, òî ìîæíî ïîäîáðàòü ðàñïðåäåëåíèå èç ñèñòåìû ðàñïðåäåëåíèé Ïèðñîíà (ñì. ðàçäåë 1.5.12).  Excel äîñòàòî÷íî ñëîæíî ïîëíîñòüþ àâòîìàòèçèðîâàòü ïîäáîð ðàñïðåäåëåíèÿ èç ýòîé ñèñòåìû áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé âðó÷íóþ, êîòîðûå â çíà÷èòåëüíîé ñòåïåíè çàâèñÿò îò òèïà ðàñïðåäåëåíèÿ. Îãðàíè÷åííûé îáúåì êíèãè, ê ñîæàëåíèþ, íå ïîçâîëÿåò ïîäðîáíî ïîêàçàòü ýòîò ïðîöåññ. Îãðàíè÷èìñÿ îáùèì çàìå÷àíèåì: ëþáîå ïðåäïîëîæåíèå î òîì, ÷òî ýìïèðè÷åñêàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ ïðèíàäëåæèò êàêîìó-ëèáî êëàññó ðàñïðåäåëåíèé, òðåáóåò ïîäòâåðæäåíèÿ íà îñíîâå êðèòåðèåâ ïðîâåðêè ãèïîòåç, îïèñàííûõ â ïîñëåäóþùèõ ðàçäåëàõ ãëàâû. Ê äðóãèì ÷èñëîâûì õàðàêòåðèñòèêàì ðàñïðåäåëåíèÿ, íà îñíîâå êîòîðûõ ìîæíî äåëàòü íåêîòîðûå ïðåäïîëîæåíèÿ î òèïå ðàñïðåäåëåíèÿ, îòíîñÿòñÿ êîýôôèöèåíò àñèììåòðèè è êîýôôèöèåíò ýêñöåññà (ñì. ðàçäåëû 1.2.3 è 2.3.4). Íàïîìíèì, ÷òî ýòè êîýôôèöèåíòû ðàññ÷èòûâàþòñÿ ïî ôîðìóëàì β1 = µ3 µ 3 2 , β2 = µ4 −3, µ 22 Глава 9. Подбор распределения 291 ãäå µ k = 1 n ∑ ( xi − x )k (k = 2, 3, 4) — âûáîðî÷íûå öåíòðàëüíûå ìîìåíòû (î âûn i =1 ÷èñëåíèè òàêèõ ìîìåíòîâ ðå÷ü èäåò â ðàçäåëå 8.4). Åñëè ðàñïðåäåëåíèå âûáîðêè áëèçêî ê íîðìàëüíîìó, òî âûáîðî÷íûå ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ýòèõ êîýôôèöèåíòîâ âû÷èñëÿþòñÿ ñîîòâåòñòâåííî ïî ôîðìóëàì s1 = 6(n − 2) 24n(n − 2)(n − 3) è s2 = . (n + 1)(n + 3) (n + 1)2 (n + 3)(n + 5) Èíîãäà ðåêîìåíäóåòñÿ âûáîðî÷íûå êîýôôèöèåíòû àñèììåòðèè è ýêñöåññà âû÷èñëÿòü ïî ôîðìóëàì β1 = k3 k 3 2 , k3 = β2 = k4 µ µ3 − 3 , ãäå k2 = 2 , k3 = , 1 1 2 k22 1− 1 − 1 − n n n µ4 3µ 22 . − 2 2 3 2 3 1 − 1 − 1 − 1 − 1 − n + 1 n n n n Åñëè âûáîðî÷íîå ðàñïðåäåëåíèå íîðìàëüíî èëè áëèçêî ê íîðìàëüíîìó, òî âû÷èñëåííûå ïî ïîñëåäíèì ôîðìóëàì β1 è β2 èìåþò àñèìïòîòè÷åñêè íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è ñðåäíåêâàäðàòè÷åñêèìè îòêëîíåíèÿìè ñîîòâåòñòâåííî s1 = 6n(n − 1) 24n(n − 1) 2 è s2 = . (n − 2)(n + 1)(n + 3) (n − 3)(n − 2)(n + 3)(n + 5) Ñ÷èòàåòñÿ, ÷òî åñëè âûïîëíÿåòñÿ íåðàâåíñòâî | β1 | ≤ 3s1, òî ðàñïðåäåëåíèå ñèììåòðè÷íî. Åñëè, êðîìå òîãî, äëÿ êîýôôèöèåíòà ýêñöåññà âûïîëíÿåòñÿ íåðàâåíñòâî | β2 | ≤ 5s2, ðàñïðåäåëåíèå ìîæíî ñ÷èòàòü íîðìàëüíûì. Ðåàëèçîâàòü ïðèâåäåííûå ôîðìóëû â Excel íå ïðåäñòàâëÿåò òðóäà. Åñëè ãîâîðèòü î íîðìàëüíîì ðàñïðåäåëåíèè, òî äëÿ îïðåäåëåíèÿ ïðèíàäëåæíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ êëàññó íîðìàëüíûõ çàêîíîâ èñïîëüçóåòñÿ åùå îäíà ÷èñëîâàÿ õàðàêòåðèñòèêà — òàê íàçûâàåìîå íîðìèðîâàííîå ñðåäíåå àáñîëþòíîå îòêëîíåíèå, îïðåäåëÿåìîå ôîðìóëîé δ = M | X − MX | . Ýòà âåëè÷èíà äëÿ σ 2 / π = 0,79788. Âûáîðî÷íîå çíà÷åíèå 1 n äàííîãî ïîêàçàòåëÿ âû÷èñëÿåòñÿ ïî ôîðìóëå δ = ∑ | xi − x | , ãäå s — âûáîðî÷ns i =1 íîðìàëüíîãî ðàñïðåäåëåíèÿ ðàâíà íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå. Åñëè âûáîðî÷íîå ðàñïðåäåëåíèå íîðìàëüíî èëè áëèçêî ê íîðìàëüíîìó, òî ðàñïðåäåëåíèå δ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè 292 Часть III. Анализ одномерных выборок Mδ = n +1 Γ 2 2 = π(n − 1) Γ n 2 2 2 1 + O 2 , 1 + π 8n − 9 n 2 n +1 Γ 1 2 1 n − 1 2 1 1 1 = 0, 04507 − 0,0796 + O 2 , − Dδ = 1 + n(n − 1) + arcsin n π n − 1 n n π n n Γ 2 ãäå Ã(õ) — ãàììà-ôóíêöèÿ Ýéëåðà. Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |δ – 2 / π | ≤ 0,7/ n , òî âûáîðî÷íîå ðàñïðåäåëåíèå ìîæíî ñ÷èòàòü íîðìàëüíûì èëè áëèçêèì ê íîðìàëüíîìó. Î÷åâèäíî, ÷òî çíà÷åíèÿ β1 = 0, β2 = 0 è δ = 2 / π ìîãóò èìåòü ðàñïðåäåëåíèÿ, îòëè÷íûå îò íîðìàëüíîãî, è áëèçîñòü ê ýòèì çíà÷åíèÿì âûáîðî÷íûõ êîýôôèöèåíòîâ àñèììåòðèè, ýêñöåññà è íîðìèðîâàííîãî ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ íå ãàðàíòèðóåò íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Îïèñûâàåìûé íèæå êðèòåðèé, îñíîâàííûé íà âûáîðî÷íûõ çíà÷åíèÿõ ýòèõ ïîêàçàòåëåé, ñëóæèò, ãëàâíûì îáðàçîì, íå äëÿ ïðîâåðêè íîðìàëüíîñòè âûáîðî÷íîãî ðàñïðåäåëåíèÿ, à äëÿ âûÿâëåíèÿ îòêëîíåíèé âûáîðî÷íîãî ðàñïðåäåëåíèÿ îò íîðìàëüíîãî, òî÷íåå — äëÿ ïðîâåðêè ãèïîòåç β1 ≠ 0, β2 ≠ 0 è δ ≠ 2/ π . 9.2.1. Критерии отклонения распределения от нормального Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûìè ïàðàìåòðàìè m è σ. Äëÿ ïðîâåðêè çíà÷åíèé êîýôôèöèåíòîâ β1, β2 è δ ìîæíî ñôîðìóëèðîâàòü íåñêîëüêî ãèïîòåç, ïðîâåðÿÿ èõ çíà÷åíèÿ ïîîäèíî÷êå, ïîïàðíî èëè ñîâìåñòíî äëÿ âñåõ òðåõ êîýôôèöèåíòîâ. Ïîêàæåì òðè êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ êîýôôèöèåíòîâ ïî îòäåëüíîñòè. Íî, ïîñêîëüêó âû÷èñëåíèÿ äëÿ âñåõ òðåõ êðèòåðèåâ îäíîòèïíû, îïèñàíèå èõ ïðîâåäåì ïàðàëëåëüíî, îáîçíà÷àÿ êðèòåðèè êàê à, á è â. Ãèïîòåçû Í0: à) β1 = 0; á) β2 = 0; â) δ = Í1: à) β1 ≠ 0; á) β2 ≠ 0; â) δ ≠ 2/ π 2/ π Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ ïåðâûå ÷åòûðå âûáîðî÷íûõ ìîìåíòà è âûáîðî÷íîå ñðåäíåå àáñîëþòíîãî îòêëîíåíèÿ ïî ôîðìóëàì Глава 9. Подбор распределения 293 x= 1 n ∑ xi , n i =1 dn = sn2 = 1 n ∑ ( xi − x )2 , n − 1 i =1 µ3 = 1 n ∑ ( xi − x )3 , n i =1 µ4 = 1 n ∑ ( xi − x )4 , n i =1 1 n ∑ | xi − x | . n i =1 2. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè: à) âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè β1 = á) âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà β2 = â) âûáîðî÷íîå δ= íîðìèðîâàííîå µ3 sn3 ; µ4 −3; sn2 ñðåäíåå àáñîëþòíîãî îòêëîíåíèÿ dn 2 − . sn π 3. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ ïîäñ÷èòàííûõ â ïðåäûäóùåì ïóíêòå âåëè÷èí à) âûáîðî÷íîãî êîýôôèöèåíòà àñèììåòðèè s1 = á) âûáîðî÷íîãî êîýôôèöèåíòà ýêñöåññà s2 = â) âûáîðî÷íîãî s3 = íîðìèðîâàííîãî 6(n − 2) ; (n + 1)(n + 3) 24n(n − 1) 2 ; (n − 3)(n − 2)(n + 3)(n + 5) ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ 1 1 0, 04507 − 0, 0796 . n n Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 âñå âûáîðî÷íûå êîýôôèöèåíòû èìåþò àñèìïòîòè÷åñêè íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è ñîîòâåòñòâóþùèìè äèñïåðñèÿìè. Íàõîäèòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ: äëÿ ãèïîòåçû à) — têð = ts1; äëÿ ãèïîòåçû á) — têð = ts2; äëÿ ãèïîòåçû â) — têð = ts3. Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè |T| ≤ têð (Ò — îäíà èç ïîäñ÷èòàííûõ â ï. 2 êðèòåðèàëüíûõ ñòàòèñòèê).  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ. Êîììåíòàðèè 1. Âñå òðè êðèòåðèÿ ÿâëÿþòñÿ ïðèáëèæåííûìè. Èõ òî÷íîñòü çàâèñèò îò áëèçîñòè ðàñïðåäåëåíèÿ êðèòåðèàëüíûõ ñòàòèñòèê ê íîðìàëüíîìó äëÿ äàííîãî îáúåìà âûáîðêè n. Ðàñïðåäåëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà àñèììåòðèè è âûáîðî÷íîãî ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ ñõîäÿòñÿ ê íîðìàëüíîìó äîñòàòî÷íî áûñòðî. Ñ÷èòàåòñÿ, ÷òî äëÿ ýòèõ âåëè÷èí äîñòàòî÷íàÿ òî÷íîñòü äîñòèãàåòñÿ ïðè n > 50. Ðàñïðåäåëåíèå âûáîðî÷íîãî êîýôôèöèåíòà ýêñöåñ- 294 Часть III. Анализ одномерных выборок ñà ñõîäèòñÿ ê íîðìàëüíîìó î÷åíü ìåäëåííî — ïðèåìëåìàÿ òî÷íîñòü äîñòèãàåòñÿ òîëüêî äëÿ âûáîðîê, èìåþùèõ íåñêîëüêî òûñÿ÷ çíà÷åíèé. Äëÿ ìàëûõ âûáîðîê ñóùåñòâóþò òàáëèöû îïðåäåëåíèÿ êðèòè÷åñêèõ çíà÷åíèé [4]. 2. Åñëè âû÷èñëÿþòñÿ âñå òðè êðèòåðèÿ, ãèïîòåçó î íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëåäóåò îòâåðãíóòü, êîãäà õîòÿ áû ïî îäíîìó êðèòåðèþ îòâåðãàåòñÿ íóëåâàÿ ãèïîòåçà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 9.7 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàíû âñå òðè îïèñàííûõ êðèòåðèÿ. Íà ýòîì æå ëèñòå ïðåäñòàâëåíû ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ. (Íå ïîêàçàíû ôîðìóëû äëÿ âû÷èñëåíèÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, ñðåäíåãî, äèñïåðñèè è ñòàíäàðòíîãî îòêëîíåíèÿ — îíè âû÷èñëÿþòñÿ ïî ñòàíäàðòíûì ôîðìóëàì.)  êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà âûáîðêà èç 100 çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû 2; çíà÷åíèå ñòåïåíè ñâîáîäû çàäàåòñÿ â ÿ÷åéêå G1 (î òîì, êàê ìîäåëèðîâàòü ðàñïðåäåëåíèå Ñòüþäåíòà, ðå÷ü èäåò â ðàçäåëå 7.2). Âûáîðî÷íûé êîýôôèöèåíò àñèììåòðèè íàçâàí Бета 1, âûáîðî÷íûé êîýôôèöèåíò ýêñöåññà — Бета 2, âûáîðî÷íîå ñðåäíåå àáñîëþòíîãî îòêëîíåíèÿ — Дельта. Ðèñ. 9.7. Ôîðìóëû äëÿ êðèòåðèåâ Êàê âèäíî íà ðèñ. 9.7, êðèòåðèè ïî êîýôôèöèåíòó ýêñöåññà è âûáîðî÷íîìó ñðåäíåìó àáñîëþòíîãî îòêëîíåíèÿ îòêëîíÿþò ãèïîòåçó î íîðìàëüíîñòè ðàñïðåäåëåíèÿ âûáîðêè. Åñëè âûáîðêà áóäåò èìåòü ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû 6 (÷òîáû èçìåíèòü âûáîðêó, äîñòàòî÷íî èçìåíèòü çíà÷åíèå â ÿ÷åéêå G1), òî, êàê ïîêàçàíî íà ðèñ. 9.8, ãèïîòåçó î íîðìàëüíîñòè ñëåäóåò îòâåðãíóòü òîëüêî ïî êðèòåðèþ ñðåäíåãî àáñîëþòíîãî îòêëîíåíèÿ. Òàêèì îáðàçîì, êðèòåðèé ïî êîýôôèöèåíòó àñèììåòðèè â äàííîì ñëó÷àå ïðàêòè÷åñêè íå ðàáîòàåò, ïîñêîëüêó ðàñïðåäåëåíèå Ñòüþäåíòà ñèììåòðè÷íî, íî äðóãèå êðèòåðèè ìîãóò âûÿâèòü îòêëîíåíèå îò íîðìàëüíîñòè. Глава 9. Подбор распределения 295 9.2.2. Критерий отклонения от распределения Пуассона Åñëè ïàðàìåòðû ãèïîòåòè÷åñêîãî ðàñïðåäåëåíèÿ ñâÿçàíû êàêèì-ëèáî ñîîòíîøåíèåì (íàïðèìåð, äèñïåðñèÿ ðàñïðåäåëåíèÿ χ2 ïðè ëþáîì ÷èñëå ñòåïåíåé ñâîáîäû ðîâíî â äâà ðàçà áîëüøå ìàòåìàòè÷åñêîãî îæèäàíèÿ; ñì. ðàçäåë 1.5.5), òî âûïîëíåíèå ýòîãî ñîîòíîøåíèÿ äëÿ ÷èñëîâûõ õàðàêòåðèñòèê äàííîé âûáîðêè ìîæíî èñïîëüçîâàòü êàê ïîêàçàòåëü òîãî, ÷òî âûáîðî÷íîå ðàñïðåäåëåíèå ñîâïàäàåò ñ ãèïîòåòè÷åñêèì ðàñïðåäåëåíèåì. Íî ïîñêîëüêó òàêîå ñîîòíîøåíèå ìîæåò èìåòü è ðàñïðåäåëåíèå äðóãîãî òèïà (êàê íóëåâûå çíà÷åíèÿ êîýôôèöèåíòîâ àñèììåòðèè è ýêñöåññà â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ èç ïðåäûäóùåãî ðàçäåëà), òî ÷àùå íåâûïîëíåíèå ýòîãî ñîîòíîøåíèÿ èñïîëüçóþò êàê êðèòåðèé îòêëîíåíèÿ îò äàííîãî ãèïîòåòè÷åñêîãî ðàñïðåäåëåíèÿ. Íà òàêîé îñíîâå ïîñòðîåí êðèòåðèé îòêëîíåíèÿ îò ðàñïðåäåëåíèÿ Ïóàññîíà, ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèè êîòîðîãî, êàê èçâåñòíî, ñîâïàäàþò (ñì. ðàçäåë 1.4.4). Ðèñ. 9.8. Êðèòåðèè äëÿ íîâîé âûáîðêè Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ÿâëÿåòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Õ, èìåþùåé ðàñïðåäåëåíèå Ïóàññîíà ñ íåèçâåñòíûì ïàðàìåòðîì λ. Ãèïîòåçû Í0: DX = MX Í1: DX ≠ MX Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî âûáîðî÷íûì çíà÷åíèÿì âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíåå è äèñïåðñèÿ x= 1 n 1 n xi , sn2 = ∑ ∑ ( xi − x )2 . n i =1 n − 1 i =1 296 Часть III. Анализ одномерных выборок 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = (n − 1) sn2 . x Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 êðèòåðèàëüíàÿ ñòàòèñòèêà àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (n – 2) ñòåïåíüþ ñâîáîäû. Íàõîäÿòñÿ äâóõñòîðîííèå êðèòè÷åñêèå çíà÷åíèÿ tí è tâ êàê êâàíòèëè ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Îí ïðèìåíÿåòñÿ, åñëè nx ≥ 10 . 2. Ïî ñóòè, ýòî êðèòåðèé ïðîâåðêè ãèïîòåçû î çíà÷åíèè äèñïåðñèè íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 2.4.1), ãäå òî÷íîå çíà÷åíèå äèñïåðñèè çàìåíåíî âûáîðî÷íûì ñðåäíèì. Îòñþäà òðåáîâàíèå, ÷òîáû nx áûëî äîñòàòî÷íî áîëüøèì, — òîãäà ðàñïðåäåëåíèå Ïóàññîíà ìîæíî àïïðîêñèìèðîâàòü íîðìàëüíûì ðàñïðåäåëåíèåì. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ î÷åâèäíà è íå âûçûâàåò çàòðóäíåíèé. Äàëåå ðàññìîòðèì êðèòåðèé ñîãëàñèÿ χ2 (êðèòåðèé Ïèðñîíà) è êðèòåðèé Êîëìîãîðîâà. 9.3. Критерий χ 2 Òåîðåòè÷åñêîå îïèñàíèå ýòîãî êðèòåðèÿ äàíî â ðàçäåëå 2.4.3. Çäåñü ïðèâåäåì åãî ïðàêòè÷åñêóþ ðåàëèçàöèþ äëÿ äâóõ ñëó÷àåâ: äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé è äëÿ äèñêðåòíûõ. Ñíà÷àëà ðàññìîòðèì ñëó÷àé äèñêðåòíûõ ðàñïðåäåëåíèé. 9.3.1. Критерий χ2 для дискретных распределений Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà èç äèñêðåòíîé ãåíåðàëüíîé ñîâîêóïíîñòè ïðåäñòàâëåíà â âèäå ÷àñòîòíîé òàáëèöû, â êîòîðîé äëÿ êàæäîãî çíà÷åíèÿ õ1, õ2, k ..., õk óêàçûâàþòñÿ ñîîòâåòñòâóþùèå ÷àñòîòû f1, f2, ..., fk, ïðè ýòîì ∑f i = n. i =1 Ôóíêöèÿ ðàñïðåäåëåíèÿ F(u) ãåíåðàëüíîé ñîâîêóïíîñòè çàâèñèò îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ íåèçâåñòíû. (Íàïðèìåð, F(u) — ôóíêöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p, ïðè ýòîì n èçâåñòíî, à çíà÷åíèå p íåèçâåñòíî. Òîãäà m = 2, à m1 = 1.) Ãèïîòåçû Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì2. Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. 2 Çäåñü íå óêàçûâàåòñÿ, êàê çàäàåòñÿ ðàñïðåäåëåíèå: ñ ïîìîùüþ ôóíêöèè ðàñïðåäåëåíèÿ èëè ôóíêöèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.2.1). Çäåñü ãîâîðèòñÿ ëèøü î òîì, ÷òî ðàñïðåäåëåíèå èçâåñòíî, ñïîñîá åãî çàäàíèÿ âëèÿåò òîëüêî íà äàëüíåéøèå âû÷èñëåíèÿ. Глава 9. Подбор распределения 297 Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1.  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò νi äëÿ âñåõ çíà÷åíèé õi. Åñëè ðàñïðåäåëåíèå çàäàåòñÿ ñ ïîìîùüþ ôóíêöèè âåðîÿòíîñòåé (ñì. ðàçäåë 1.2.1), òî νi = nði = nÐ(Õ = õi). Åñëè èçâåñòíà ôóíêöèÿ ðàñïðåäåëåíèÿ F(u) = Ð(Õ < u), òî νi = n[F(xi) – F(xi–1)].  ïîñëåäíåì ñëó÷àå äëÿ i = 1 ν1 = nF(x1). k 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ i =1 ( fi − ν i ) 2 . νi Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Íàõîäèòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ.  ñòàòèñòè÷åñêîé ëèòåðàòóðå ïðèâîäÿòñÿ ñïåöèàëüíûå òàáëèöû, ïî êîòîðûì íà îñíîâå çíà÷åíèé Ò è èçâåñòíîãî ÷èñëà ñòåïåíåé ïîäñ÷èòàíû âåðîÿòíîñòè αêð = Ð(Õ > Ò) (Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2). Òîãäà, åñëè αêð áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, ãèïîòåçà Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå îòêëîíÿåòñÿ. Ýòî æå çíà÷åíèå αêð ïîäñ÷èòûâàåò ôóíêöèÿ Excel ХИ2ТЕСТ (ñì. ðàçäåë 4.8.4). Êîììåíòàðèé. Ñóùåñòâóþò ðàçëè÷íûå ìíåíèÿ î òîì, êàêèìè äîëæíû áûòü âåëè÷èíû îæèäàåìûõ ÷àñòîò νi = nði (ñì., íàïðèìåð, [13]). “Ñðåäíåå” ìíåíèå òàêîâî, ÷òî áîëüøèíñòâî νi äîëæíî áûòü áîëüøå 5 è íå áîëåå 20% ýòèõ çíà÷åíèé ìîæåò áûòü ìåíüøå 5. Åñëè ìàëûõ çíà÷åíèé ÷àñòîò ñëèøêîì ìíîãî, òî èõ ìîæíî îáúåäèíèòü. Òàêæå îòìåòèì, ÷òî åñëè îáúåì âûáîðêè äîñòàòî÷íî áîëüøîé, íàïðèìåð n ≥ 50, è ïðè ýòîì k ≥ 10, òîãäà âîïðîñ î çíà÷åíèÿõ îæèäàåìûõ ÷àñòîò ñíèìàåòñÿ. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ. Íà ðèñ. 9.9 ïðèâåäåí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîêàçàíû âñå ýòàïû âûïîëíåíèÿ êðèòåðèÿ χ2.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà èç 100 çíà÷åíèé (ïîëó÷åííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел), èìåþùàÿ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 1. Äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка.  ñòîëáöå  ïîäñ÷èòàíû îáúåì âûáîðêè (ôîðìóëà =СЧЁТ(Выборка)), ñðåäíåå, ò.å. îöåíêà λ (ôîðìóëà =СРЗНАЧ(Выборка)), è êîëè÷åñòâî ðàçëè÷íûõ çíà÷åíèé â âûáîðêå (ôîðìóëà ìàññèâà {=СУММ(1/СЧЁТЕСЛИ(Выборка;Выборка))}).  ñòîëáöå Ñ çàïèñàíû âñå ðàçëè÷íûå âûáîðî÷íûå çíà÷åíèÿ, äëÿ ÷åãî èñïîëüçîâàíà ôîðìóëà, ïðèâåäåííàÿ â ðàçäåëå 8.3.1 (â ýòîì ðàçäåëå ïîäðîáíî ðàññìîòðåí ïðîöåññ ñîçäàíèÿ ÷àñòîòíûõ òàáëèö). ×àñòîòû (ñòîëáåö D) ïîäñ÷èòûâàþòñÿ ñ ïîìîùüþ ôóíêöèè ЧАСТОТА. Îæèäàåìûå ÷àñòîòû âû÷èñëÿþòñÿ ñ ïîìîùüþ ôóíêöèè ПУАССОН (ñì. ðàçäåë 4.6.11).  ÿ÷åéêå Å2 çàïèñàíà ôîðìóëà =ПУАССОН(C2;$B$6;0)*$В$4, êîòîðàÿ çàòåì ñêîïèðîâàíà â ÿ÷åéêè Å3:Å7. Äëÿ âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè Ò ìîæíî ïðèìåíèòü ôîðìóëó ìàññèâà {=СУММ(((Частоты-Ожидаемые_частоты)^2)/Ожидаемые_частоты)}, 298 Часть III. Анализ одномерных выборок åñëè èíòåðâàëó D2:D7, ñîäåðæàùåìó çíà÷åíèÿ ÷àñòîò, ïðèñâîèòü èìÿ Частоты, à èíòåðâàëó E2:E7, ñîäåðæàùåìó çíà÷åíèÿ îæèäàåìûõ ÷àñòîò, — èìÿ Ожидаемые_частоты.  ñòîëáöå G çàäàíî çíà÷åíèå óðîâíÿ çíà÷èìîñòè, ïîäñ÷èòàíû çíà÷åíèå ñòåïåíè ñâîáîäû (ôîðìóëà =B2-2) è têð, çíà÷åíèå êâàíòèëÿ ðàñïðåäåëåíèÿ χ2 (ôîðìóëà =ХИ2ОБР(G2;G4); îïèñàíèå ôóíêöèè ХИ2ОБР ïðèâåäåíî â ðàçäåëå 4.7.8). Êàê âèäíî, â äàííîì ñëó÷àå âûáîðî÷íûå äàííûå íå ïðîòèâîðå÷àò ãèïîòåçå, ÷òî èõ ðàñïðåäåëåíèå ÿâëÿåòñÿ ðàñïðåäåëåíèåì Ïóàññîíà ñ ïàðàìåòðîì λ = 1,12.  ÿ÷åéêå G8 âû÷èñëåíî êðèòè÷åñêîå çíà÷åíèå αêð (ôîðìóëà =ХИ2ТЕСТ(Частоты;Ожидаемые_частоты)). Ïîñêîëüêó αêð, ðàâíîå 0,78725, çíà÷èòåëüíî áîëüøå óðîâíÿ çíà÷èìîñòè 0,05, íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ. 9.3.2. Критерий χ2 для непрерывных распределений Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ôóíêöèþ ðàñïðåäåëåíèÿ F(u). Ôóíêöèÿ F(u) çàâèñèò îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ íåèçâåñòíî. Ðèñ. 9.9. Êðèòåðèé χ2 äëÿ äèñêðåòíîãî ðàñïðåäåëåíèÿ Ãèïîòåçû Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u), çàâèñÿùåé îò m ïàðàìåòðîâ, èç êîòîðûõ m1 ïàðàìåòðîâ îïðåäåëÿþòñÿ ïî âûáîðî÷íûì çíà÷åíèÿì. Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé ðàçáèâàåòñÿ íà k íåïåðåñåêàþùèõñÿ èíòåðâàëîâ ∆1 = (õ(1), õ(2)), ∆2 = (õ(2), õ(3)), ..., ∆k = (õ(k), õ(k+1)). (Îïðåäåëåíèå òàêèõ èíòåðâàëîâ ðàññìîòðåíî íèæå.) Глава 9. Подбор распределения 299 2. Ïîäñ÷èòûâàåòñÿ, ñêîëüêî âûáîðî÷íûõ çíà÷åíèé ïîïàëî â êàæäûé èíòåðâàë ∆i. Ïîëó÷àåì ðÿä ÷àñòîò n1, n2, ..., nk (ïðè ýòîì äîëæíî âûïîëíÿòüñÿ ðàâåíñòâî n1 + n2 +...+ nk = n, ãäå n — îáúåì âûáîðêè). 3.  ïðåäïîëîæåíèè, ÷òî ñïðàâåäëèâà ãèïîòåçà Í0, ïî ôîðìóëå νi = n[F(x(i+1)) – F(x(i))] âû÷èñëÿþòñÿ îæèäàåìûå çíà÷åíèÿ ÷àñòîò, ò.å. êîëè÷åñòâà ïîïàäàíèé âûáîðî÷íûõ çíà÷åíèé â êàæäûé èç èíòåðâàëîâ ∆i, ãäå x(i) è x(i+1) — ãðàíèöû èíòåðâàëà ∆i. k 4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ i =1 (ni − ν i ) 2 . νi Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû. Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êðèòåðèÿ têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – m1 – 1) ñòåïåíüþ ñâîáîäû (äëÿ íàõîæäåíèÿ êâàíòèëÿ ìîæíî èñïîëüçîâàòü ôóíêöèþ ХИ2ОБР). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Íà îñíîâå çíà÷åíèÿ Ò ìîæíî òàêæå âû÷èñëèòü âåðîÿòíîñòü αêð = Ð(Õ > Ò) (Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ ðàñïðåäåëåíèå χ2 ñ ÷èñëîì ñòåïåíåé ñâîáîäû k – m1 – 1). Òîãäà, åñëè αêð áîëüøå çàäàííîãî óðîâíÿ çíà÷èìîñòè α, ãèïîòåçà Í0 ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå îíà îòêëîíÿåòñÿ. Çíà÷åíèå αêð ïîäñ÷èòûâàåò ôóíêöèÿ Excel ХИ2ТЕСТ (ñì. ðàçäåë 4.8.4). Êîììåíòàðèè 1. Ðàçáèåíèå îáëàñòè âûáîðî÷íûõ çíà÷åíèé íà èíòåðâàëû ∆k = (õ(k), õ(k+1)) ìîæíî âûïîëíèòü ìíîãèìè ñïîñîáàìè. Âîò äâà îñíîâíûõ ïîäõîäà. Èíòåðâàëû ∆k ïîäáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû âñå îæèäàåìûå ÷àñòîòû νk áûëè ðàâíûìè (äðóãèìè ñëîâàìè, ÷òîáû áûëè ðàâíû âåðîÿòíîñòè ïîïàäàíèÿ âûáîðî÷íûõ çíà÷åíèé â ýòè èíòåðâàëû), ëèáî èíòåðâàëû ∆k ñòðîÿòñÿ ðàâíîé äëèíû. Ïåðâûé ïîäõîä èìååò îïðåäåëåííûå ïðåèìóùåñòâà, ïîñêîëüêó ìîæíî çàðàíåå çàäàòü çíà÷åíèÿ νk, íàïðèìåð, ðàâíûìè 5 èëè 6. Îäíàêî â òàêîì ñëó÷àå èíòåðâàëû ∆k èìåþò ðàçíûå äëèíû (êðîìå ñëó÷àÿ ðàâíîìåðíîãî ðàñïðåäåëåíèÿ) è ïðè èõ ïîñòðîåíèè ìîãóò âîçíèêíóòü îïðåäåëåííûå ñëîæíîñòè. Íà ïðàêòèêå ÷àùå èñïîëüçóåòñÿ âòîðîé ïîäõîä, ïðè êîòîðîì èíòåðâàëû ∆k ïðåäïîëàãàþòñÿ ðàâíîé äëèíû. Çäåñü ñóùåñòâóåò ñâîÿ ïðîáëåìà îïðåäåëåíèÿ êîëè÷åñòâà òàêèõ èíòåðâàëîâ. Ïðàêòè÷åñêîå ïðàâèëî ðåêîìåíäóåò ïåðâîíà÷àëüíî âûáèðàòü äëèíó èíòåðâàëîâ ðàâíîé ïðèìåðíî 0,4s, ãäå s — ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå âûáîðêè. Ïîñëå âû÷èñëåíèÿ îæèäàåìûõ ÷àñòîò êîëè÷åñòâî èíòåðâàëîâ (è, ñîîòâåòñòâåííî, äëèíà èíòåðâàëîâ) ìîæåò áûòü èçìåíåíî òàêèì îáðàçîì, ÷òîáû ðàññ÷èòàííûå âåëè÷èíû îæèäàåìûõ ÷àñòîò áûëè íå ìåíüøå íåêîòîðîé çàðàíåå çàäàííîé âåëè÷èíû (â êà÷åñòâå òàêîé âåëè÷èíû ÷àùå âñåãî îïÿòü âûñòóïàåò “ìàãè÷åñêîå” ÷èñëî 5). Ïîâòîðèì ðåêîìåíäàöèþ èç êîììåíòàðèÿ ê ýòîìó êðèòåðèþ äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé: áîëüøèíñòâî νi äîëæíî áûòü íå ìåíüøå 5 è íå áîëåå 20% ýòèõ çíà÷åíèé ìîæåò áûòü ìåíüøå 5 (íî îáÿçàòåëüíî íå ìåíüøå 1). 300 Часть III. Анализ одномерных выборок 2. Íåîáõîäèìî ïîìíèòü, ÷òî êðèòåðèé χ2 ÿâëÿåòñÿ âñå-òàêè ïðèáëèæåííûì. Ïîýòîìó íàäî ïðîÿâëÿòü “áäèòåëüíîñòü” è îñòîðîæíîñòü, êîãäà çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè Ò áëèçêî ê êðèòè÷åñêîìó çíà÷åíèþ têð. Êðîìå òîãî, ýòîò êðèòåðèé íå ó÷èòûâàåò ïîðÿäîê âûáîðî÷íûõ çíà÷åíèé (êðèòåðèé íå ïî÷óâñòâóåò íååñòåñòâåííîñòü âûáîðêè, åñëè, íàïðèìåð, âñå ìàëûå âûáîðî÷íûå çíà÷åíèÿ ñîñðåäîòî÷åíû â íà÷àëå âûáîðêè, à áîëüøèå — â êîíöå). Ïîýòîìó, åñëè åñòü âîçìîæíîñòü, äëÿ ïðîâåðêè ãèïîòåçû î ïðèíàäëåæíîñòè ðàñïðåäåëåíèÿ âûáîðêè çàäàííîìó êëàññó ðàñïðåäåëåíèé ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé è áîëåå ÷óâñòâèòåëüíûé êðèòåðèé Êîëìîãîðîâà (ñì. ñëåäóþùèé ðàçäåë). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Êàê óêàçûâàëîñü âûøå â êîììåíòàðèÿõ, ñóùåñòâóþò äâà ïîäõîäà ê îïðåäåëåíèþ èíòåðâàëîâ. Ïðè ïåðâîì ïîäõîäå èíòåðâàëû ñòðîÿòñÿ òàêèì îáðàçîì, ÷òîáû îæèäàåìûå ÷àñòîòû äëÿ âñåõ èíòåðâàëîâ áûëè ðàâíûìè (ñëó÷àé ðàâíîâåðîÿòíûõ èíòåðâàëîâ). Ïðè âòîðîì ïîäõîäå âñå èíòåðâàëû èìåþò ðàâíûå äëèíû. Ïîêàæåì ðåàëèçàöèþ êðèòåðèÿ ñ èñïîëüçîâàíèåì ýòèõ äâóõ ïîäõîäîâ ê îïðåäåëåíèþ è ïîñòðîåíèþ èíòåðâàëîâ. Ðàññìîòðèì ñíà÷àëà ïåðâûé ïîäõîä. Íà ðèñ. 9.10 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè äëÿ ðåàëèçàöèè êðèòåðèÿ.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà îáúåìîì 100 çíà÷åíèé, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå (ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел). Äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка.  ñòîëáöå  ñ ïîìîùüþ ñòàíäàðòíûõ ôîðìóë ïîäñ÷èòàíû îñíîâíûå õàðàêòåðèñòèêè âûáîðêè: ñðåäíåå, ñòàíäàðòíîå îòêëîíåíèå, ìèíèìàëüíîå è ìàêñèìàëüíîå çíà÷åíèÿ, êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé. Çàäàåì âåëè÷èíó îæèäàåìîé ÷àñòîòû. Ïóñòü ýòî çíà÷åíèå ðàâíî 5 (ÿ÷åéêà Â12). Ïîäñ÷èòûâàåì îæèäàåìóþ ÷àñòîñòü (ôîðìóëà =B12/B10 â ÿ÷åéêå Â14) è êîëè÷åñòâî èíòåðâàëîâ (ôîðìóëà =B10/B12 â ÿ÷åéêå Â16). Ïóñòü íóëåâàÿ ãèïîòåçà ñîñòîèò â òîì, ÷òî ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. (Îáðàùàåì âíèìàíèå íà òî, ÷òî çäåñü ïàðàìåòðû ãèïîòåòè÷åñêîãî (ñòàíäàðòíîãî íîðìàëüíîãî) ðàñïðåäåëåíèÿ íå îïðåäåëÿþòñÿ íà îñíîâå âûáîðî÷íûõ çíà÷åíèé, ïîýòîìó êîëè÷åñòâî ñòåïåíåé ñâîáîäû áóäåò íà åäèíèöó ìåíüøå êîëè÷åñòâà èíòåðâàëîâ.) Äàëåå íåîáõîäèìî îïðåäåëèòü ãðàíèöû èíòåðâàëîâ. Ýòî ìîæíî ñäåëàòü ñ ïîìîùüþ îäíîé ôîðìóëû ìàññèâà, èñïîëüçóþùåé ôóíêöèè СТРОКА è ДВССЫЛ (êàê â ðàçäåëå 8.3.2 äëÿ îïðåäåëåíèÿ èíòåðâàëîâ ïðè ñîçäàíèè ãèñòîãðàìì). Çäåñü (äëÿ ðàçíîîáðàçèÿ) èñïîëüçóåì ïðîñòûå è “ïðîçðà÷íûå” ôîðìóëû, íî çà ýòó ïðîñòîòó çàïëàòèì äîïîëíèòåëüíûì ñòîëáöîì çíà÷åíèé — â ñòîëáöå Ñ ââåäåíû íîìåðà èíòåðâàëîâ îò 1 äî 20. Òîãäà ãðàíèöó ïåðâîãî èíòåðâàëà (ÿ÷åéêà D2) âû÷èñëÿåò ôîðìóëà =НОРМСТОБР(C2*$B$14), êîòîðàÿ çàòåì ðàñïðîñòðàíÿåòñÿ âíèç äî ÿ÷åéêè D20. Îáðàùàåì âíèìàíèå, ÷òî äëÿ èíòåðâàëà 20 ýòà ôîðìóëà íå èñïîëüçóåòñÿ; äëÿ ýòîãî èíòåðâàëà áóäåò ïîäñ÷èòàíî ÷èñëî âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïðåâûøàþò âåðõíþþ ãðàíèöó 19-ãî èíòåðâàëà. Äëÿ âû÷èñëåíèÿ ÷àñòîò ïðèìåíÿåòñÿ ôîðìóëà ìàññèâà {=ЧАСТОТА(Выборка;Интервалы)} (çäåñü äèàïàçîí ÿ÷ååê D2:D20 íàçâàí Интервалы). Ïîä÷åðêíåì, ÷òî ïðè ââîäå ýòîé ôîðìóëû íåîáõîäèìî âûäåëèòü äèàïàçîí Å2:Å21, à íå Å2:Å20. Ïîñêîëüêó â äàííîì ñëó÷àå ôîðìàëüíî íåò ìàññèâà îæèäàåìûõ ÷àñòîò, ôóíêöèÿ ХИ2ТЕСТ íå ïðèìåíèìà. Ïîýòîìó âû÷èñëèì êðèòåðèàëüíóþ ñòàòèñòèêó Ò Глава 9. Подбор распределения 301 è êðèòè÷åñêîå çíà÷åíèå têð, ïî êîòîðûì áóäåì ñóäèòü î çíà÷èìîñòè íóëåâîé ãèïîòåçû. Ñòàòèñòèêà Ò âû÷èñëåíà â ÿ÷åéêå F2 ñ èñïîëüçîâàíèåì ôîðìóëû ìàññèâà {=СУММ(((Частота-$B$12)^2)/$B$12)}. Çäåñü äèàïàçîíó ÷àñòîò Å2:Å21 ïðèñâîåíî èìÿ Частота è â ÿ÷åéêå Â12 ñîäåðæèòñÿ çàäàííîå çíà÷åíèå îæèäàåìûõ ÷àñòîò.  ÿ÷åéêå F4 çàäàíî çíà÷åíèå óðîâíÿ çíà÷èìîñòè, â ÿ÷åéêå F6 âû÷èñëåíî êîëè÷åñòâî ñòåïåíåé ñâîáîäû (íà åäèíèöó ìåíüøå êîëè÷åñòâà èíòåðâàëîâ). Êðèòè÷åñêîå çíà÷åíèå têð çàïèñàíî â ÿ÷åéêå F8; îíî âû÷èñëÿåòñÿ ïî ôîðìóëå =ХИ2ОБР(F4;F6). Ñðàâíèâ çíà÷åíèÿ â ÿ÷åéêàõ F2 è F8, ïðèõîäèì ê âûâîäó, ÷òî ïðè çàäàííîì óðîâíå çíà÷èìîñòè íåò îñíîâàíèé îòâåðãàòü íóëåâóþ ãèïîòåçó. Êðèòè÷åñêîå çíà÷åíèå âåðîÿòíîñòè αêð, êîòîðîå îáû÷íî âû÷èñëÿåò ôóíêöèÿ ХИ2ТЕСТ, ìîæíî âû÷èñëèòü ïî ôîðìóëå =ХИ2РАСП(F2;F6) (ÿ÷åéêà F10). Ýòî çíà÷åíèå òàêæå ïîêàçûâàåò, ÷òî ñëåäóåò ïðèíÿòü íóëåâóþ ãèïîòåçó. Ðèñ. 9.10. Êðèòåðèé χ2 äëÿ ðàâíîâåðîÿòíûõ èíòåðâàëîâ Òåïåðü ðàññìîòðèì äàííûé êðèòåðèé äëÿ ñëó÷àÿ ðàâíûõ èíòåðâàëîâ. Íà ðèñ. 9.11 ïðåäñòàâëåí ðàáî÷èé ëèñò, ñîäåðæàùèé òó æå âûáîðêó, ÷òî è íà ðèñ. 9.10. Äëèíó èíòåðâàëà âûáèðàåì ðàâíîé 0,4 ñòàíäàðòíîãî îòêëîíåíèÿ, ò.å. ðàâíîé 0,4 (ÿ÷åéêà Â12). Äàëåå îïðåäåëÿåì íèæíþþ ãðàíèöó èíòåðâàëîâ; îíà äîëæíà áûòü áîëüøå ìèíèìàëüíîãî âûáîðî÷íîãî çíà÷åíèÿ. Çäåñü ýòà íèæíÿÿ ãðàíèöà âûáðàíà ðàâíîé –2 (ÿ÷åéêà Â14). Âåðõíÿÿ ãðàíèöà èíòåðâàëîâ äîëæíà áûòü ìåíüøå ìàêñèìàëüíîãî çíà÷åíèÿ; ïðèíèìàåì âåðõíþþ ãðàíèöó ðàâíîé 2 (ÿ÷åéêà Â16). Âû÷èñëÿåì êîëè÷åñòâî èíòåðâàëîâ (ôîðìóëà =(B16-B14)/B12 â ÿ÷åéêå Â18). Çíà÷åíèÿ íèæíåé è âåðõíåé ãðàíèö âûáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû âû÷èñëåííîå êîëè÷åñòâî èíòåðâàëîâ áûëî öåëûì ÷èñëîì. Îòìåòèì, ÷òî îáùåå ÷èñëî èíòåðâàëîâ áóäåò íå 10, à 12, ïîñêîëüêó 302 Часть III. Анализ одномерных выборок èìåþòñÿ åùå äâà èíòåðâàëà: îäèí, ñîäåðæàùèé çíà÷åíèÿ, ìåíüøèå íèæíåé ãðàíèöû, è âòîðîé, ñîäåðæàùèé çíà÷åíèÿ, áîëüøèå âåðõíåé ãðàíèöû.  ñòîëáöå D âû÷èñëÿþòñÿ ãðàíèöû èíòåðâàëîâ.  ÿ÷åéêå D2 çàïèñàíà ôîðìóëà =$B$14+(C2-1)*$B$12, êîòîðàÿ çàòåì êîïèðóåòñÿ â äèàïàçîí D3:D12. Äèàïàçîíó D2:D12 ïðèñâîåíî èìÿ Границы. Òåïåðü ïîäñ÷èòûâàþòñÿ çíà÷åíèÿ âûáîðî÷íûõ ÷àñòîò (ñòîëáåö Å, ôîðìóëà ìàññèâà {=ЧАСТОТА(Выборка;Границы)}) è îæèäàåìûõ ÷àñòîò (ñòîëáåö F). Äëÿ âû÷èñëåíèÿ îæèäàåìûõ ÷àñòîò èñïîëüçóþòñÿ òàêèå ôîðìóëû: â ÿ÷åéêå F2 — =НОРМСТРАСП(D2)*$B$10, â ÿ÷åéêå F3 — =(НОРМСТРАСП(D3)-НОРМСТРАСП (D2))*$B$10, êîòîðàÿ êîïèðóåòñÿ â äèàïàçîí F4:F12.  ÿ÷åéêå F13 çàïèñàíà ôîðìóëà =(1-НОРМСТРАСП(D12))*$B$10. Äàëåå âû÷èñëÿåòñÿ çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè Ò ïî ôîðìóëå ìàññèâà (ÿ÷åéêà G2) {=СУММ(((Частота-Ожидаемые_частоты)^2)/Ожидаемые_частоты)}.  ÿ÷åéêå G8 âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð ïî ôîðìóëå =ХИ2ОБР(G4;G6), à â ÿ÷åéêå G10 — êðèòè÷åñêîå çíà÷åíèå âåðîÿòíîñòè αêð ïî ôîðìóëå =ХИ2ТЕСТ(Частота;Ожидаемые_частоты). Ñðàâíåíèå âû÷èñëåííûõ çíà÷åíèé Ò è têð , à òàêæå çíà÷åíèÿ óðîâíÿ çíà÷èìîñòè ñî çíà÷åíèåì αêð ïîêàçûâàþò, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò íóëåâîé ãèïîòåçå. Îòìåòèì òàêæå, ÷òî çíà÷åíèå αêð çäåñü íàìíîãî ìåíüøå, ÷åì â ïðåäûäóùåì ïðèìåðå. Ýòî ãîâîðèò î òîì, ÷òî äàííûé êðèòåðèé â ñëó÷àå ðàâíîâåðîÿòíûõ èíòåðâàëîâ áîëåå òî÷åí, ÷åì â ñëó÷àå ðàâíûõ èíòåðâàëîâ. Ðèñ. 9.11. Êðèòåðèé χ2 äëÿ ðàâíûõ èíòåðâàëîâ Глава 9. Подбор распределения 303 9.4. Критерий Колмогорова Äàííûé êðèòåðèé áîëåå ìîùíûé, ÷åì êðèòåðèé χ2. Îí ïðåäïîëàãàåò íåïðåðûâíîñòü ðàñïðåäåëåíèé. Îäíàêî íà ïðàêòèêå êðèòåðèé ÷àñòî èñïîëüçóåòñÿ äëÿ ñãðóïïèðîâàííûõ äàííûõ (ò.å. äàííûõ, ïðåäñòàâëåííûõ â âèäå ÷àñòîòíîé òàáëèöû) è äàæå äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé. Îáùåå îïèñàíèå ýòîãî êðèòåðèÿ äàíî â ðàçäåëå 2.4.3. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà, ñîñòîÿùàÿ èç íåçàâèñèìûõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., õn, ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, ðàñïðåäåëåíèå êîòîðîé ïðåäïîëàãàåòñÿ íåïðåðûâíûì. Ãèïîòåçû Í0: âûáîðî÷íûå çíà÷åíèÿ ïîëó÷åíû èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ ôóíêöèåé ðàñïðåäåëåíèÿ F(u). Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàåòñÿ óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî âûáîðêå õ1, õ2, ..., õn ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). 2. Âû÷èñëÿþòñÿ êóìóëÿòèâíûå ðàçíîñòè: Dm+ = m m −1 − F ( x( m ) ) è Dm− = F ( x( m ) ) − , n n m = 1, 2, ..., n. 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Dn = max( Dm+ , Dm− ) . 1≤ m ≤ n Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Êîëìîãîðîâà–Ñìèðíîâà. Íàõîäèòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Äëÿ íàõîæäåíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ Êîëìîãîðîâà–Ñìèðíîâà ñóùåñòâóþò ñïåöèàëüíûå òàáëèöû, êîòîðûå ïðèâåäåíû âî ìíîãèõ êíèãàõ ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå. Ïðè n ≥ 10 è 0,01 ≤ α ≤ 0,2 ìîæíî âîñïîëüçîâàòüñÿ ïðèáëèæåííîé ôîðìóëîé äëÿ âû÷èñëåíèÿ têð: tкр ≈ − ln(0,5α) 1 − [4]. 2n 6n 2.  ëèòåðàòóðå ïî ìàòåìàòè÷åñêîé ñòàòèñòèêå ìîæíî âñòðåòèòü óïðîùåííûé ïîäõîä ê âû÷èñëåíèþ êðèòåðèàëüíîé ñòàòèñòèêè Dn , êîòîðóþ ðåêîìåíäóþò âû÷èñëÿòü ëèáî êàê Dn = max( Dm+ ) , ëèáî êàê Dn = max( Dm− ) . Êàê óêàçà1≤ m ≤ n 1≤ m ≤ n íî â [4], ýòî íåïðàâèëüíûé ïîäõîä, êîòîðûé ìîæåò ïðèâåñòè ê íåâåðíûì ðåçóëüòàòàì, îñîáåííî ïðè ìàëûõ îáúåìàõ âûáîðêè. 3.  ýòîì êðèòåðèè ïðåäïîëàãàåòñÿ, ÷òî ãèïîòåòè÷åñêîå ðàñïðåäåëåíèå èçâåñòíî òî÷íî. Åñëè æå ïàðàìåòðû äàííîãî ðàñïðåäåëåíèÿ îïðåäåëÿþòñÿ íà îñíîâå âûáîðî÷íûõ çíà÷åíèé, òî íåîáõîäèìà îñòîðîæíîñòü â ïðèìåíåíèè êðèòåðèÿ, îñîáåííî â ñëó÷àå, êîãäà çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè áëèçêî ê êðèòè÷åñêîìó çíà÷åíèþ. 304 Часть III. Анализ одномерных выборок Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Äëÿ èëëþñòðàöèè ïðèìåíåíèÿ îïèñûâàåìîãî êðèòåðèÿ èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì ðàçäåëå. Çäåñü òàêæå ïðîâåðèì ãèïîòåçó, ÷òî ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âûáîðêà, èìåþùàÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, ïîêàçàíà íà ðèñ. 9.12 â ñòîëáöå À. Äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка. Ýòîò äèàïàçîí ñêîïèðîâàí â ñòîëáåö Â, â êîòîðîì ïðîâåäåíà åãî ñîðòèðîâêà â ïîðÿäêå âîçðàñòàíèÿ.  ðåçóëüòàòå ïîëó÷åí âàðèàöèîííûé ðÿä.  ñòîëáöå Ñ çàïèñàíû ðàíãè âûáîðî÷íûõ çíà÷åíèé. Ïîñêîëüêó äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé âåðîÿòíîñòü ïîÿâëåíèÿ îäèíàêîâûõ çíà÷åíèé â âûáîðêå ðàâíà íóëþ, ðàíãè â äàííîì ñëó÷àå ïðîñòî ñîâïàäàþò ñ íîìåðàìè ïîðÿäêîâûõ ñòàòèñòèê. Ïîýòîìó èõ ìîæíî íå âû÷èñëÿòü, à ââîäèòü êàê ÷ëåíû àðèôìåòè÷åñêîé ïðîãðåññèè ñ øàãîì 1 è íà÷àëüíûì çíà÷åíèåì 1 (òàêàÿ ïðîãðåññèÿ ââîäèòñÿ ñ ïîìîùüþ êîìàíäû ПравкаÖЗаполнитьÖПрогрессия). Äàëåå âû÷èñëÿþòñÿ êóìóëÿòèâíûå ðàçíîñòè Dm+ è Dm− (çàïèñàíû â ñòîëáöå D è Å; ñîîòâåòñòâóþùèì äèàïàçîíàì ïðèñâîåíû èìåíà D_плюс è D_минус). Äëÿ âû÷èñëåíèÿ Dm+ â ÿ÷åéêå D2 ââåäåíà ôîðìóëà =C2/СЧЁТ(Выборка)-НОРМСТРАСП(B2), êîòîðàÿ çàòåì ñêîïèðîâàíà â îñòàëüíûå ÿ÷åéêè äèàïàçîíà D_плюс. Àíàëîãè÷íî äëÿ âû÷èñëåíèÿ Dm− â ÿ÷åéêó Å2 çàïèñàíà ôîðìóëà =НОРМСТРАСП(B2)-(C21)/СЧЁТ(Выборка), êîòîðàÿ êîïèðóåòñÿ âíèç íà âåñü äèàïàçîí D_минус. Ðèñ. 9.12. Ðåàëèçàöèÿ êðèòåðèÿ Êîëìîãîðîâà Глава 9. Подбор распределения 305 Çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè Dn âû÷èñëÿåòñÿ â ÿ÷åéêå F2 ïî ôîðìóëå =МАКС(D_плюс;D_минус), à êðèòè÷åñêîå çíà÷åíèå têð — â ÿ÷åéêå F2 ïî ôîðìóëå =КОРЕНЬ(-LN(0,5*F4)/(2*СЧЁТ(Выборка)))-1/(6*СЧЁТ(Выборка)). Êàê âèäíî èç ðåçóëüòàòîâ ðàñ÷åòà, ïðè çàäàííîì óðîâíå çíà÷èìîñòè ñëåäóåò ïðèíÿòü ãèïîòåçó î ñòàíäàðòíîì íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. 306 Часть III. Анализ одномерных выборок Глава 10 Интервальное оценивание параметров распределения  ãëàâå 8 â êà÷åñòâå îäíîãî èç ýòàïîâ ïðåäâàðèòåëüíîãî àíàëèçà îïèñàíî âû÷èñëåíèå òî÷å÷íûõ îöåíîê ïàðàìåòðîâ âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Íî äëÿ “ïîëíîöåííîé” îöåíêè íåèçâåñòíûõ ïàðàìåòðîâ òîëüêî òî÷å÷íûõ îöåíîê íåäîñòàòî÷íî — íåîáõîäèìà êàêàÿ-íèáóäü ìåðà òî÷íîñòè ýòèõ îöåíîê. Êàê óêàçûâàëîñü â ãëàâå 2, òàêîé ìåðîé òî÷íîñòè ìîãóò ñëóæèòü äîâåðèòåëüíûå èíòåðâàëû.  ðàçäåëå 2.2 ãëàâû 2 äàíû îáùèå îïðåäåëåíèÿ, îòíîñÿùèåñÿ ê ïîñòðîåíèþ äîâåðèòåëüíûõ èíòåðâàëîâ.  äàííîé ãëàâå ðàññìîòðèì êîíêðåòíûå ìåòîäû ïîñòðîåíèÿ òàêèõ èíòåðâàëîâ. Íàèáîëåå òî÷íûå äîâåðèòåëüíûå èíòåðâàëû ñòðîÿòñÿ íà îñíîâå àïðèîðíûõ ïðåäïîëîæåíèé î êëàññå ðàñïðåäåëåíèé, êîòîðîìó, âîçìîæíî, ïðèíàäëåæèò ðàñïðåäåëåíèå äàííîé âûáîðêè. (Òàêèå ïðåäïîëîæåíèÿ äîëæíû ïîäòâåðæäàòüñÿ íà îñíîâå êðèòåðèåâ ïðîâåðêè ãèïîòåç î ðàñïðåäåëåíèÿõ, îïèñàííûõ â ãëàâå 9.) Äîâåðèòåëüíûå èíòåðâàëû, ïîñòðîåííûå áåç ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ âûáîðêè (èëè ñ ìèíèìàëüíûìè ïðåäïîëîæåíèÿìè, íàïðèìåð ñ ïðåäïîëîæåíèåì òîëüêî î ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ), êàê ïðàâèëî, îñíîâàíû íà àñèìïòîòè÷åñêèõ ñâîéñòâàõ âûáîðî÷íûõ ñòàòèñòèê è èìåþò ïðèåìëåìóþ òî÷íîñòü òîëüêî äëÿ äîñòàòî÷íî áîëüøèõ âûáîðîê. Íèæå ïðèâåäåì íåñêîëüêî ñïîñîáîâ ïîñòðîåíèÿ òàêèõ èíòåðâàëîâ. Íî áîëüøèíñòâî ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ âñå-òàêè ðàçðàáîòàíî äëÿ êîíêðåòíûõ ðàñïðåäåëåíèé. Äàëåå â ýòîé ãëàâå ïðåäïîëàãàåòñÿ, ÷òî íåîáõîäèìûå òî÷å÷íûå îöåíêè ïàðàìåòðîâ óæå ïîäñ÷èòàíû (ñì. ðàçäåë 8.4), çà èñêëþ÷åíèåì îöåíîê äëÿ íåêîòîðûõ êîíêðåòíûõ ðàñïðåäåëåíèé. Òàêèå îöåíêè (â ÷àñòíîñòè, äëÿ ïàðàìåòðîâ ðàâíîìåðíîãî ðàñïðåäåëåíèÿ) áóäóò ïîêàçàíû â ýòîé ãëàâå. 10.1. Общие доверительные интервалы для математического ожидания Îáùèå ïîëîæåíèÿ, íà îñíîâå êîòîðûõ ïîñòðîåíû îïèñûâàåìûå íèæå ìåòîäû, ïðèâåäåíû â ðàçäåëå 2.3.1. 10.1.1. Общая модель при известной дисперсии Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íîé èçâåñòíîé äèñïåðñèåé σ2. Äîâåðèòåëüíûé èíòåðâàë äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 2. Èç ðàâåíñòâà α = 1 – 1/k2 îïðåäåëÿåòñÿ çíà÷åíèå k: k = σ n 3. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k ,x +k 1 1− α . σ . n Êîììåíòàðèè 1.  ðàìêàõ òàêîé ìîäåëè äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî ìàòåìàòè÷åñêîãî îæèäàíèÿ ìîæíî ïîñòðîèòü òîëüêî íà îñíîâàíèè íåðàâåíñòâà ×åáûøåâà (ñì. ðàçäåë 1.2.4), êîòîðîå â äàííîì ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k σ n ) ≤ 1− 1 . k2 2.  òàêîì ñëó÷àå íå ðåêîìåíäóåòñÿ áðàòü áîëüøîå çíà÷åíèå α, ïîñêîëüêó ýòî çíà÷èòåëüíî ñíèæàåò òî÷íîñòü èíòåðâàëüíîé îöåíêè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel çäåñü òðèâèàëüíà è ïîýòîìó íå ïðèâîäèòñÿ. 10.1.2. Одномодальное симметричное распределение при известной дисперсии Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ñèììåòðè÷íîå îäíîìîäàëüíîå ðàñïðåäåëåíèå ñ èçâåñòíîé êîíå÷íîé äèñïåðñèåé σ2. Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 2. Îïðåäåëÿåòñÿ çíà÷åíèå k: k = 3 2 1− α . σ n 3. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k ,x +k σ . n Êîììåíòàðèè 1.  ýòîé ñòàòèñòè÷åñêîé ìîäåëè ðàñïðåäåëåíèå ñòàòèñòèêè x òàêæå áóäåò ñèììåòðè÷íûì è îäíîìîäàëüíûì. Ïîýòîìó äëÿ ïîñòðîåíèÿ èíòåðâàëüíûõ îöåíîê ìîæíî âîñïîëüçîâàòüñÿ íåðàâåíñòâîì Ãàóññà, êîòîðîå â äàííîì ñëó÷àå áóäåò èìåòü âèä P(| x − MX | ≤ k σ n ) ≤ 1− 4 . 9k 2 2.  ýòîé ìîäåëè ñóùåñòâåííî óñëîâèå ñèììåòðè÷íîñòè ðàñïðåäåëåíèÿ, îò êîòîðîãî íåëüçÿ îñâîáîäèòüñÿ (ñì. ðàçäåë 2.3.1). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel òðèâèàëüíà. 10.1.3. Общая модель с неизвестной дисперсией Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì è íåèçâåñòíîé äèñïåðñèåé. Îáúåì âûáîðêè n áîëüøå 30. Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 308 Часть III. Анализ одномерных выборок 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x è Sn2 = 1 n ∑ ( xi − x )2 . n i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ- 1+ α , 2 äåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà. Sn n −1 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k ,x +k . n −1 Sn Êîììåíòàðèè 1.  äàííîé ìîäåëè èíòåðâàëüíûå îöåíêè ïîñòðîåíû íà îñíîâå àñèìïòîòè÷åñêèõ ñâîéñòâ ñòàòèñòèêè x (ñì. ðàçäåë 2.2). 2.  ïðèíöèïå, ýòî òîò æå ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ íîðìàëüíîé ñîâîêóïíîñòè íà îñíîâå ðàñïðåäåëåíèÿ Ñòüþäåíòà (ñì. ðàçäåë 10.3.2), íî çäåñü â ñòàòèñòè÷åñêîé ìîäåëè òðåáóåòñÿ äîñòàòî÷íî áîëüøîé îáúåì âûáîðêè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ïðàêòè÷åñêîå ïîñòðîåíèå ýòîãî äîâåðèòåëüíîãî èíòåðâàëà â Excel íå âûçûâàåò îñîáûõ çàòðóäíåíèé. Íà ðèñ. 10.1 ïîêàçàí ðàáî÷èé ëèñò, ñîäåðæàùèé âñå íåîáõîäèìûå ôîðìóëû äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  ñòîëáöå À ñîäåðæèòñÿ âûáîðêà, ðàâíîìåðíî ðàñïðåäåëåííàÿ íà èíòåðâàëå [0, 10]. (Ýòà âûáîðêà ñîçäàíà ñðåäñòâîì Генерация случайных чисел.) Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка. Ðèñ. 10.1. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà Глава 10. Интервальное оценивание параметров распределения 309 Äëÿ âûáîðêè ïîäñ÷èòàíû êîëè÷åñòâî çíà÷åíèé (ÿ÷åéêà Â2, ôîðìóëà =СЧЁТ(Выборка)), âûáîðî÷íîå ñðåäíåå (ÿ÷åéêà Â4, ôîðìóëà =СРЗНАЧ(Выборка)) è âûáîðî÷íîå ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå (ÿ÷åéêà Â6, ôîðìóëà =СТАНДОТКЛОН(Выборка)).  ñòîëáöå D çàäàí äîâåðèòåëüíûé óðîâåíü (ÿ÷åéêà D2), â ÿ÷åéêå D4 ïîäñ÷èòàí êîýôôèöèåíò k ïî ôîðìóëå =ÑÒÜÞÄÐÀÑÏÎÁÐ((1-D2)/2;B2-1).  ÿ÷åéêå D6 âû÷èñëÿåòñÿ âåëè÷èíà k Sn n −1 ïî ôîðìóëå =D4*B6/КОРЕНЬ(B2-1). Íàêîíåö, âû÷èñëÿþòñÿ ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà: íèæíÿÿ ãðàíèöà — ïî ôîðìóëå =B4-D6 (ÿ÷åéêà Â9) è âåðõíÿÿ — ïî ôîðìóëå =B4+D6 (ÿ÷åéêà D9). Êîíå÷íî, ìîæíî èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé, âûïîëíåííûõ â ÿ÷åéêàõ D4 è D6, è íàéòè ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà ñ ïîìîùüþ îäíîé ôîðìóëû. Îäíàêî ýòè äîïîëíèòåëüíûå âû÷èñëåííûå çíà÷åíèÿ ìîãóò èñïîëüçîâàòüñÿ â àíàëèçå ïîëó÷åííîãî ðåçóëüòàòà. 10.2. Общий доверительный интервал для дисперсии Åñëè íåò àïðèîðíûõ ïðåäïîëîæåíèé î òèïå ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè, òî åäèíñòâåííûì ñïîñîáîì ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ íåèçâåñòíîé äèñïåðñèè ÿâëÿåòñÿ èñïîëüçîâàíèå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèê äëÿ âû÷èñëåíèÿ ìîìåíòîâ ãåíåðàëüíîé ñîâîêóïíîñòè (ñì. ðàçäåë 2.3.2). Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïðîèçâîëüíîå ðàñïðåäåëåíèå ãåíåðàëüíîé ñîâîêóïíîñòè ñ êîíå÷íûì ÷åòâåðòûì ìîìåíòîì. Îáúåì âûáîðêè — íå ìåíåå 50. Äîâåðèòåëüíûé èíòåðâàë â äàííîé ñòàòèñòè÷åñêîé ìîäåëè ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè µ4 = x , Sn2 è 4-ãî öåíòðàëüíîãî ìîìåíòà 1 n ∑ ( xi − x )4 . n i =1 2. Âû÷èñëÿåòñÿ îöåíêà ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ñòàòèñòèêè S n2 ïî ôîðìóëå σ(S n2 ) = µ 4 − S 22 . n 3. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíê 2 íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. ( ) 5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: S n2 − kσ( S n2 ), S n2 + kσ( S n2 ) . 310 Часть III. Анализ одномерных выборок Êîììåíòàðèé. Ýòîò ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì è äàåò óäîâëåòâîðèòåëüíûå ðåçóëüòàòû òîëüêî äëÿ äîñòàòî÷íî áîëüøèõ âûáîðîê. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.2 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë äëÿ äèñïåðñèè âûáîðêè, ðàâíîìåðíî ðàñïðåäåëåííîé íà èíòåðâàëå [0, 10]. Ýòà âûáîðêà, çàïèñàííàÿ â ñòîëáöå À, ñîçäàíà ñðåäñòâîì Генерация случайных чисел. Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Выборка. Ðèñ. 10.2. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ äèñïåðñèè  ñòîëáöå  ïîäñ÷èòàíû íåîáõîäèìûå ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè âûáîðêè: îáúåì âûáîðêè, ñðåäíåå, ñòàíäàðòíîå îòêëîíåíèå, âûáîðî÷íàÿ äèñïåðñèÿ (ÿ÷åéêà Â8, ôîðìóëà =ДИСПР(Выборка)), âûáîðî÷íûé 4-é öåíòðàëüíûé ìîìåíò (ÿ÷åéêà Â10, ôîðìóëà ìàññèâà {=СУММ((Выборка-B4)^4)/B2}) è ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå äèñïåðñèè (ÿ÷åéêà Â12, ôîðìóëà =КОРЕНЬ((B10-B8*B8)/B2)).  ñòîëáöå D çàïèñàíî çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ (ÿ÷åéêà D2), ïîäñ÷èòàíû çíà÷åíèå êîýôôèöèåíòà k (ÿ÷åéêà D4, ôîðìóëà =НОРМСТОБР((1+D2)/2)) è çíà÷åíèå âåëè÷èíû kσ( S n2 ) (ÿ÷åéêà D6, ôîðìóëà =D4*B12). Ïîñëå ïðîâåäåííûõ âû÷èñëåíèé ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà (ÿ÷åéêè D9 è Å9) âû÷èñëÿþòñÿ ïî ïðîñòûì ôîðìóëàì: =B8-D6 — äëÿ íèæíåé ãðàíèöû è =B8+D6 — äëÿ âåðõíåé ãðàíèöû.  ÿ÷åéêå Å12 ïðèâåäåíî èñòèííîå çíà÷åíèå äèñïåðñèè. Êàê âèäíî, òî÷å÷íàÿ îöåíêà äèñïåðñèè çíà÷èòåëüíî äàëåêà îò èñòèííîãî çíà÷åíèÿ äèñïåðñèè, íî äîâåðèòåëüíûé èíòåðâàë ïîêðûâàåò ýòî çíà÷åíèå äàæå ñ âåðîÿòíîñòüþ 0,9 (ðèñ. 10.3). Îòìåòèì, ÷òî ïðè íåîáõîäèìîñòè ëþáóþ ãðàíèöó äîâåðèòåëüíîãî èíòåðâàëà ìîæíî âû÷èñëèòü ñ ïîìîùüþ îäíîé ôîðìóëû Excel áåç ïîêàçàííûõ çäåñü ïðîìåæóòî÷íûõ âû÷èñëåíèé. Äðóãèå èíòåðâàëüíûå îöåíêè äëÿ äèñïåðñèé êîíêðåòíûõ ðàñïðåäåëåíèé áóäóò ïîêàçàíû íèæå. Глава 10. Интервальное оценивание параметров распределения 311 Ðèñ. 10.3. Äîâåðèòåëüíûé èíòåðâàë ñ äîâåðèòåëüíûì óðîâíåì 0,9 10.3. Интервальные оценки параметров нормального распределения Îáùèå òåîðåòè÷åñêèå ïîëîæåíèÿ, íà îñíîâå êîòîðûõ ñòðîÿòñÿ îïèñûâàåìûå íèæå äîâåðèòåëüíûå èíòåðâàëû, ïðèâåäåíû â ðàçäåëå 2.3.6. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2. 10.3.1. Интервальные оценки для неизвестного математического ожидания при известной дисперсии Ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíî, íî èçâåñòíà åå äèñïåðñèÿ σ2. Äîâåðèòåëüíûé èíòåðâàë äëÿ m ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x = 1 n ∑ xi . n i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíêöèÿ, 2 íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. σ n 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k ,x +k σ . n Êîììåíòàðèè 1. Ýòîò ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè. 312 Часть III. Анализ одномерных выборок 2. Ïîñêîëüêó ðàñïðåäåëåíèå âûáîðî÷íîãî ñðåäíåãî àñèìïòîòè÷åñêè íîðìàëüíî, ýòîò ìåòîä ìîæíî ïðèìåíÿòü äëÿ ëþáûõ âûáîðîê, åñëè èõ îáúåì äîñòàòî÷íî áîëüøîé (ïî êðàéíåé ìåðå, áîëüøå 30) è èçâåñòíà äèñïåðñèÿ. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà ðèñ. 10.4.  äàííîì ïðèìåðå âûáîðêà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è äèñïåðñèåé σ2 = 4. Îòìåòèì, ÷òî â Excel äëÿ âû÷èñëåíèÿ çíà÷åíèÿ k σ n ïðåäóñìîòðåíà ôóíêöèÿ ДОВЕРИТ (ñì. ðàçäåë 4.11.2), êîòîðàÿ èñïîëüçîâàíà çäåñü â ÿ÷åéêå Ñ10. Ðèñ. 10.4. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ ïðè èçâåñòíîé äèñïåðñèè 10.3.2. Интервальные оценки для неизвестного математического ожидания при неизвестной дисперсии Çäåñü ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû. Äîâåðèòåëüíûé èíòåðâàë äëÿ m ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x = 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 . ∑ n i =1 n i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. Глава 10. Интервальное оценивание параметров распределения 313 3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ- 1+ α , 2 äåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà. Sn n −1 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k ,x +k . n −1 Sn Êîììåíòàðèè 1. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè. 2. Ïîñêîëüêó ðàñïðåäåëåíèå âûáîðî÷íîãî ñðåäíåãî àñèìïòîòè÷åñêè íîðìàëüíî, ýòîò ìåòîä ìîæíî ïðèìåíÿòü äëÿ ëþáûõ ðàñïðåäåëåíèé, åñëè îáúåì âûáîðêè äîñòàòî÷íî áîëüøîé (ïî êðàéíåé ìåðå, áîëüøå 30) è ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ ðàñïðåäåëåíèÿ íåçàâèñèìû. 3. Åñëè äèñïåðñèÿ èçâåñòíà èëè îöåíèâàåòñÿ íà îñíîâàíèè êàêèõ-ëèáî èíûõ äàííûõ, êðîìå âûáîðî÷íûõ çíà÷åíèé, òî ñëåäóåò ïðèìåíÿòü ìåòîä, îïèñàííûé â ïðåäûäóùåì ðàçäåëå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Äëÿ èëëþñòðàöèè ìåòîäà èñïîëüçóåì òó æå âûáîðêó, ÷òî è â ïðåäûäóùåì ïðèìåðå (îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è äèñïåðñèåé σ2 = 4). Ðåàëèçàöèÿ ìåòîäà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà ðèñ. 10.5. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ êîýôôèöèåíòà k èñïîëüçóåòñÿ ôóíêöèÿ СТЬЮДРАСПОБР (ñì. ðàçäåë 4.7.7). Ðèñ. 10.5. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ ïðè èçâåñòíîé äèñïåðñèè 314 Часть III. Анализ одномерных выборок 10.3.3. Интервальные оценки для неизвестной дисперсии при известном математическом ожидании Ïðåäïîëàãàåòñÿ, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå m ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè èçâåñòíî, íî íåèçâåñòíà åå äèñïåðñèÿ σ2. Äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ âûáîðî÷íîå ñðåäíåå x = âû÷èñëÿåòñÿ ïî ôîðìóëå Sn2 = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + α)/2. 1 n ∑ xi ; òî÷å÷íàÿ îöåíêà äèñïåðñèè n i =1 1 n 2 ∑ xi − m(2 x − m) . n i =1 óðîâåíü α è âû÷èñëÿþòñÿ βí = (1 – α)/2 3. Îïðåäåëÿþòñÿ tн = Fn−1 ( β н ) è tв = Fn−1 ( β в ) , ãäå Fn−1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ n ñòåïåíÿìè ñâîáîäû. n 2 n 2 S n , Sn . tн tв 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèè 1. Ìåòîä íå óñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè. 2. Åñëè ìàòåìàòè÷åñêîå îæèäàíèå íåèçâåñòíî, ïðèìåíÿåòñÿ ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ èç ñëåäóþùåãî ðàçäåëà. 3. Çíàíèå òî÷íîãî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ â îáùåì ñëó÷àå íåñóùåñòâåííî óìåíüøàåò äëèíó äîâåðèòåëüíîãî èíòåðâàëà (ïî ñðàâíåíèþ, íàïðèìåð, ñ äîâåðèòåëüíûì èíòåðâàëîì, ïîñòðîåííûì áåç èñïîëüçîâàíèÿ òî÷íîãî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ). Ïîýòîìó, åñëè åñòü ñîìíåíèÿ â òî÷íîì çíà÷åíèè ìàòåìàòè÷åñêîãî îæèäàíèÿ, ñëåäóåò èñïîëüçîâàòü ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ èç ðàçäåëà 10.3.4. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.6 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  êà÷åñòâå “ïîäîïûòíîé” âûáîðêè èñïîëüçóåòñÿ âûáîðêà èç ïðåäûäóùèõ ðàçäåëîâ. Íàïîìíèì, ÷òî òî÷íîå çíà÷åíèå äèñïåðñèè ðàâíî 4. Î òî÷íîñòè äîâåðèòåëüíîãî èíòåðâàëà ÷èòàòåëü ìîæåò ñóäèòü ñàìîñòîÿòåëüíî. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8). 10.3.4. Интервальные оценки для неизвестной дисперсии при неизвестном математическом ожидании Ìàòåìàòè÷åñêîå îæèäàíèå m è äèñïåðñèÿ σ2 ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè íåèçâåñòíû. Äîâåðèòåëüíûé èíòåðâàë äëÿ σ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì. Глава 10. Интервальное оценивание параметров распределения 315 Ðèñ. 10.6. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ äèñïåðñèè ïðè èçâåñòíîì ìàòåìàòè÷åñêîì îæèäàíèè 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè x = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + α)/2. 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 . ∑ n i =1 n i =1 óðîâåíü α è âû÷èñëÿþòñÿ βí = (1 – α)/2 3. Îïðåäåëÿþòñÿ tн = Fn−−11 ( β н ) è tв = Fn−−11 ( β в ) , ãäå Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíÿìè ñâîáîäû. n −1 2 n −1 2 Sn , Sn . tн tв 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèè 1. Ìåòîä íå óñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè. 2. Åñëè èçâåñòíî òî÷íîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ, ìîæíî èñïîëüçîâàòü ìåòîä èç ïðåäûäóùåãî ðàçäåëà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.7 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà. Äëÿ ïðèìåðà èñïîëüçóåòñÿ âûáîðêà èç ïðåäûäóùèõ ðàçäåëîâ. Íàïîìíèì, ÷òî òî÷íîå çíà÷åíèå äèñïåðñèè ðàâíî 4. Äëÿ âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8). 316 Часть III. Анализ одномерных выборок Ðèñ. 10.7. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ äèñïåðñèè ïðè èçâåñòíîì ìàòåìàòè÷åñêîì îæèäàíèè 10.4. Оценка параметров логарифмически нормального распределения Íàïîìíèì, ÷òî åñëè ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ëîãíîðìàëüíîå ðàñïðåäåëåíèå, òî åå ëîãàðèôì Y = lnX ðàñïðåäåëåí ïî íîðìàëüíîìó çàêîíó ñ ìàòåìàòè÷åñêèì îæèäàíèåì m è äèñïåðñèåé σ2. Ïîýòîìó îöåíèâàíèå ïàðàìåòðîâ m è σ2 ìîæíî ïðîâîäèòü òî÷íî òàê, êàê îöåíèâàíèå ïàðàìåòðîâ m è σ2 íîðìàëüíîãî ðàñïðåäåëåíèÿ (ñì. ðàçäåë 10.3), åñëè âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn çàìåíèòü çíà÷åíèÿìè lnõ1, lnõ2, ..., lnxn. Íàïðèìåð, ïîñòðîèì äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà m, ïðåäïîëàãàÿ, ÷òî çíà÷åíèå ïàðàìåòðà σ2 íåèçâåñòíî. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ëîãàðèôìè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m è σ2 (ñì. ðàçäåë 1.5.8). 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè m = 1 n 1 n ln xi è Sn2 = ∑ (ln xi − m) . ∑ n i =1 n i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþ- 1+ α , 2 äåíòà ñ (n – 1) ñòåïåíÿìè ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà. Sn n −1 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: m − k ,m + k . n −1 Sn Глава 10. Интервальное оценивание параметров распределения 317 Êîììåíòàðèé.  ñóùíîñòè, çäåñü ïîâòîðÿåòñÿ ìåòîä èç ðàçäåëà 10.3.2. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.8 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ëîãàðèôìè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè m = –1 è σ2 = 4. Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ЛОГНОРМОБР(СЛЧИС();–1;2)}, çàòåì ðåçóëüòàòû âû÷èñëåíèÿ ïî ýòîé ôîðìóëå ïðåîáðàçîâàíû â çíà÷åíèÿ (ïîñëå êîïèðîâàíèÿ äèàïàçîíà, ñîäåðæàùåãî âû÷èñëåíèÿ, âûïîëíÿåòñÿ êîìàíäà ПравкаÖ Специальная вставкаÖЗначения).  Excel ìîæíî ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë, íå âû÷èñëÿÿ ñïåöèàëüíî ïî âûáîðî÷íûì çíà÷åíèÿì õ1, õ2, ..., xn çíà÷åíèÿ lnõ1, lnõ2, ..., lnxn. Äëÿ ýòîãî îïÿòü íàäî âîñïîëüçîâàòüñÿ ôîðìóëàìè ìàññèâà. Äëÿ îïðåäåëåíèÿ âûáîðî÷íîãî çíà÷åíèÿ ïàðàìåòðà m = 1 n ∑ ln xi â ÿ÷åéêå Â4 èñïîëüçîâàíà ôîðìóëà n i =1 ìàññèâà äëÿ Sn2 = {=СРЗНАЧ(LN(Выборка))}, âû÷èñëåíèÿ êîðíÿ èç âåëè÷èíû n 1 ∑ (ln xi − m) â ÿ÷åéêå Â6 ïðèìåíåíà ôîðìóëà {=СТАНДОТКЛОН(LN(Выборка))}. n i =1 Ïîä÷åðêíåì íåîáõîäèìîñòü èñïîëüçîâàíèÿ èìåííî ôîðìóë ìàññèâîâ — èõ èñïîëüçîâàíèå â êà÷åñòâå “îáû÷íûõ” ôîðìóë ïðèâåäåò ê íåâåðíûì ðåçóëüòàòàì. Îñòàëüíûå ðàñ÷åòíûå ôîðìóëû â ñòîëáöå D íè÷åì íå îòëè÷àþòñÿ îò àíàëîãè÷íûõ ôîðìóë äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà èç ðàçäåëà 10.3.2. Ðèñ. 10.8. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà m ëîãíîðìàëüíîãî ðàñïðåäåëåíèÿ 10.5. Оценка параметра показательного распределения Íàïîìíèì, ÷òî ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå îïðåäåëÿåòñÿ îäíèì ïàðàìåòðîì λ (ñì. ðàçäåë 1.5.3), ïðè ýòîì äëÿ ñëó÷àéíîé âåëè÷èíû Õ, ïîä÷èíÿþùåéñÿ ýòîìó ðàñïðåäåëåíèþ, ÌÕ = 1/λ, DX = 1/λ2. Äëÿ ýòîãî ðàñïðå- 318 Часть III. Анализ одномерных выборок äåëåíèÿ îáû÷íî îöåíèâàåòñÿ íå ïàðàìåòð λ, à îáðàòíàÿ ê íåìó âåëè÷èíà θ = 1/λ (÷òî åñòåñòâåííî ñ ó÷åòîì ðàâåíñòâà ÌÕ = θ). Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðn âàëà äëÿ ïàðàìåòðà θ îñíîâàíî íà òîì, ÷òî ñëó÷àéíàÿ âåëè÷èíà 2 ∑ xi /θ, ãäå xi — i =1 âûáîðî÷íûå çíà÷åíèÿ, èìåþùèå ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ, íå çàâèñèò îò θ è èìååò ðàñïðåäåëåíèå χ2 ñ 2n ñòåïåíÿìè ñâîáîäû. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ. Äîâåðèòåëüíûé èíòåðâàë äëÿ θ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + α)/2. 1 n ∑ xi . n i =1 óðîâåíü α è âû÷èñëÿþòñÿ βí = (1 – α)/2 3. Îïðåäåëÿþòñÿ tн = F2−n1 ( β н ) è tв = F2−n1 ( β в ) , ãäå F2n−1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíÿìè ñâîáîäû. 2n 2n x, x . tн tв 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèè 1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ îöåíêó äèñïåðñèè. 2. Ïî òîé æå ïðè÷èíå èíòåðâàë ñòðîèòñÿ íà îñíîâå âûáîðî÷íîãî ñðåäíåãî, à íå âûáîðî÷íîé äèñïåðñèè, êîòîðàÿ ñ íåîáõîäèìîñòüþ áóäåò èñïîëüçîâàòü çíà÷åíèå ñðåäíåãî. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.9 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();1;2)}.  Excel íåò ñïåöèàëüíîé ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà (åñòü ôóíêöèÿ ЭКСПРАСП, âû÷èñëÿþùàÿ çíà÷åíèÿ ïëîòíîñòè âåðîÿòíîñòè è ôóíêöèè ðàñïðåäåëåíèÿ), íî, ïîñêîëüêó ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì ãàììàðàñïðåäåëåíèÿ ïðè α = 1, ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé ГАММАОБР (ñì. ðàçäåë 4.7.3), åñëè ïîëîæèòü â íåé âòîðîé àðãóìåíò ðàâíûì 1. Ïîïóòíî îòìåòèì, ÷òî òðåòèé àðãóìåíò â ýòîé ôóíêöèè çàäàåò ïàðàìåòð θ, à íå λ. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.9. 10.6. Оценка параметров гаммараспределения Íàïîìíèì, ÷òî ãàììà-ðàñïðåäåëåíèå çàâèñèò îò ïàðàìåòðîâ α è λ (α > 0, λ > 0), ïðè ýòîì ÌÕ = α/λ, DX = α/λ2 (ñì. ðàçäåë 1.5.10). Åñëè α = 1, òî ãàììàðàñïðåäåëåíèå ñîâïàäàåò ñ ïîêàçàòåëüíûì, îöåíêè äëÿ êîòîðîãî ðàññìîòðåíû Глава 10. Интервальное оценивание параметров распределения 319 â ïðåäûäóùåì ðàçäåëå. Òàê æå, êàê è â ñëó÷àå ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ, çäåñü âìåñòî ïàðàìåòðà λ îöåíèâàåòñÿ îáðàòíûé ïàðàìåòð θ = 1/λ. Ðàññìîòðèì ñíà÷àëà âàðèàíò, êîãäà èçâåñòåí ïàðàìåòð α. Ðèñ. 10.9. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ 10.6.1. Оценка параметра λ при известном параметре α Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ (ñì. ðàçäåë 1.5.10). Ïàðàìåòð α ïðåäïîëàãàåòñÿ èçâåñòíûì. Äîâåðèòåëüíûé èíòåðâàë äëÿ θ = 1/λ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà θ = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + ð)/2. 1 n ∑ xi . nα i =1 óðîâåíü ð è âû÷èñëÿþòñÿ βí = (1 – ð)/2 3. Îïðåäåëÿþòñÿ tн = F −1 ( β н ) è tв = F −1 ( β в ) , ãäå F–1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α1 = nα, λ = 1. nαθ nαθ , . tн tв 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèè 1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ îöåíêó äèñïåðñèè. 320 Часть III. Анализ одномерных выборок 2. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî ñëó÷àéíàÿ âåëè÷èíà nαθ θ òàêæå èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α1 = nα è λ = 1, ò.å. íå çàâèñèò îò íåèçâåñòíîãî ïàðàìåòðà θ. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.10 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α = 3 è λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();3;2)}. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.10. Ðèñ. 10.10. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà θ ãàììà-ðàñïðåäåëåíèÿ 10.6.2. Оценка параметра α при известном параметре λ Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α è λ. Ïàðàìåòð λ ïðåäïîëàãàåòñÿ èçâåñòíûì. Äîâåðèòåëüíûé èíòåðâàë äëÿ α ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà α = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + ð)/2. λ n ∑ xi . n i =1 óðîâåíü ð è âû÷èñëÿþòñÿ βí = (1 – ð)/2 3. Îïðåäåëÿþòñÿ tн = F −1 ( β н ) è tв = F −1 ( β в ) , ãäå F–1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ãàììà-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè α = n/λ è λ = 1. Глава 10. Интервальное оценивание параметров распределения 321 nα nα , . λtв λtн 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèè 1. Ïîñêîëüêó çäåñü ìàòåìàòè÷åñêîå îæèäàíèå è äèñïåðñèÿ çàâèñèìû, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íåëüçÿ èñïîëüçîâàòü âûáîðî÷íóþ îöåíêó äèñïåðñèè. 2. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî ñëó÷àéíàÿ âåëè÷èíà nα òàêæå èìååò ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α1 = n/λ αλ è λ = 1, ò.å. íå çàâèñèò îò íåèçâåñòíîãî ïàðàìåòðà α. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.11 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ãàììà-ðàñïðåäåëåíèå ñ ïàðàìåòðàìè α = 3 è λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();3;2)}. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.11. Ðèñ. 10.11. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà α ãàììà-ðàñïðåäåëåíèÿ 10.6.3. Совместная оценка параметров α и λ Åñëè íåèçâåñòíû îáà ïàðàìåòðà (α è λ), òî ïðîñòûõ ìåòîäîâ ïîëó÷åíèÿ èõ îöåíîê íå ñóùåñòâóåò. Ïîñêîëüêó äëÿ äàííîãî ðàñïðåäåëåíèÿ ÌÕ = α/λ è DX = α/λ2, íà îñíîâå çíà÷åíèé âûáîðî÷íîãî ñðåäíåãî x è âûáîðî÷íîé äèñïåðñèè sn2 ìîæíî ïîëó÷èòü îöåíêè ýòèõ ïàðàìåòðîâ: λ = 322 Часть III. Анализ одномерных выборок x è α = λ x . Îäíàêî “òåîðèÿ” ñîâåòóåò sn2 èñïîëüçîâàòü ñîîòíîøåíèÿ ÌÕ = α/λ è ÌÕ2 = α(1 + α)/λ2. Íà îñíîâå çíà÷åíèé âûáîðî÷íîãî ñðåäíåãî x è âûáîðî÷íîãî âòîðîãî ìîìåíòà m2 = α= 1 n 2 ∑ xi íàõîäèì n i =1 x2 x 1 , λ= . 2 m2 − x m2 − x 2 Ïîñòðîèòü ñîâìåñòíóþ äîâåðèòåëüíóþ îáëàñòü äëÿ ýòèõ îöåíîê âåñüìà ñëîæíî [17, ðàçäåë 6.4]. Ìîæíî, êîíå÷íî, çíà÷åíèå λ ïðèíÿòü çà òî÷íîå çíà÷åíèå ïàðàìåòðà λ è ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ α, êàê ïîêàçàíî âûøå. Îäíàêî òî÷íîñòü òàêîãî èíòåðâàëà îöåíèòü íåâîçìîæíî. 10.7. Оценка параметров равномерного распределения  îáùåì ñëó÷àå ðàâíîìåðíîå ðàñïðåäåëåíèå çàäàåòñÿ ãðàíèöàìè êîíå÷íîãî èíòåðâàëà [a, b], íà êîòîðîì ñîñðåäîòî÷åíî ýòî ðàñïðåäåëåíèå (ñì. ðàçäåë 1.5.1). Åñëè ãðàíèöû íå èçâåñòíû, òî âîçíèêàåò ñëåäóþùàÿ çàäà÷à: ïî âûáîðî÷íûì çíà÷åíèÿì, èìåþùèì ðàâíîìåðíîå ðàñïðåäåëåíèå, îöåíèòü çíà÷åíèÿ ãðàíèö. Ñíà÷àëà ðàññìîòðèì ñëó÷àé, êîãäà íåèçâåñòíà òîëüêî îäíà ãðàíèöà. 10.7.1. Оценка границы равномерного распределения  ýòîì ñëó÷àå ñ ïîìîùüþ ëèíåéíîé çàìåíû èñõîäíîå ðàñïðåäåëåíèå ìîæíî ïðèâåñòè ê ðàñïðåäåëåíèþ, ñîñðåäîòî÷åííîìó íà èíòåðâàëå [0, θ], ãäå θ — íåèçâåñòíûé ïàðàìåòð. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, θ]. Ïàðàìåòð θ ïðåäïîëàãàåòñÿ íåèçâåñòíûì. Äîâåðèòåëüíûé èíòåðâàë äëÿ θ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ ìàêñèìàëüíîå âûáîðî÷íîå çíà÷åíèå xn* = max xi . 1≤ i ≤ n 2. Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ ïàðàìåòðà θ áóäåò ñòàòèñòèêà θ= n +1 * xn . (Äèñïåðñèÿ ýòîé ñòàòèñòèêè ðàâíà Dθ = θ 2 /n(n + 2) .) n 3. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α è âû÷èñëÿåòñÿ 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: xn* , n n 1− α . . 1− α xn* Êîììåíòàðèé. Äîâåðèòåëüíûé èíòåðâàë ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî ñëó÷àéíàÿ âåëè÷èíà θ/θ èìååò ðàñïðåäåëåíèå, íå çàâèñÿùåå îò ïàðàìåòðà θ. Åå ôóíêöèÿ ðàñïðåäåëåíèÿ çàäàåòñÿ ôîðìóëîé [8] 1 Ýòè îöåíêè ñîîòâåòñòâóþò îöåíêàì ìåòîäà ìîìåíòîâ. Èõ èñïîëüçóþò êàê íà÷àëüíîå ïðèáëèæåíèå äëÿ èòåðàöèîííîãî ïðîöåññà íàõîæäåíèÿ îöåíîê ïî ìåòîäó ìàêñèìàëüíîãî ïðàâäîïîäîáèÿ [17, ðàçäåë 6.4]. Глава 10. Интервальное оценивание параметров распределения 323 если u ≤ 0, 0, 2 1 un F (u ) = , если u ∈ 0, 1 + , n n + 1 1 если u > 1 + . 1, n Íåñëîæíî íàéòè â ÿâíîì âèäå êîðåíü óðàâíåíèÿ Ð( θ/θ > u) = 1 – F(u) = α: u= n +1 n 1 − α . Îòñþäà ïîëó÷àåì ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà. n Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ïîñòðîåíèÿ â Excel äîâåðèòåëüíîãî èíòåðâàëà íå ïðåäñòàâëÿåò òðóäíîñòåé. Åñëè âûáîðî÷íûå çíà÷åíèÿ çàïèñàíû â äèàïàçîíå ÿ÷ååê ñ èìåíåì Выборка, à çíà÷åíèÿ äîâåðèòåëüíîãî óðîâíÿ α — â ÿ÷åéêå ñ èìåíåì Альфа, òî îöåíêà θ âû÷èñëÿåòñÿ ïî ôîðìóëå =МАКС(Выборка)*(СЧЁТ(Выборка)+1)/СЧЁТ(Выборка), íèæíÿÿ ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà: =МАКС(Выборка), âåðõíÿÿ ãðàíèöà äîâåðèòåëüíîãî èíòåðâàëà: =МАКС(Выборка)/СТЕПЕНЬ(1-Альфа;1/СЧЁТ(Выборка)). 10.7.2. Оценка обеих границ равномерного распределения Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [à, b] ñ íåèçâåñòíûìè ïàðàìåòðàìè à è b. Ïðåäïîëàãàåòñÿ, ÷òî 0 < a < b. Íåñìåùåííûìè è ýôôåêòèâíûìè îöåíêàìè äëÿ ïàðàìåòðîâ à è b áóäóò ñîîòâåòñòâåííî îöåíêè a= x* nx* nx1* x* − n , b= n − 1 , n −1 n −1 n −1 n −1 ãäå x1* = min xi , xn* = max xi . Ñîâìåñòíóþ äîâåðèòåëüíóþ îáëàñòü äëÿ ýòèõ îöåíîê 1≤ i ≤ n 1≤ i ≤ n ïîñòðîèòü ñëîæíî. Ïðèâåäåì åùå íåñìåùåííóþ è ýôôåêòèâíóþ îöåíêó äëÿ ðàçìàõà R = b – a: R= n +1 * ( xn − x1* ) . n −1 Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ïðèâåäåííûõ ôîðìóë íåñëîæíà è î÷åâèäíà. 10.8. Оценки параметра распределения Бернулли Íàïîìíèì, ÷òî ðàñïðåäåëåíèå Áåðíóëëè îáû÷íî ðàññìàòðèâàåòñÿ êàê ìîäåëü ñëó÷àéíîãî ýêñïåðèìåíòà, â ðåçóëüòàòå êîòîðîãî ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0” (ñì. ðàçäåë 1.4.2). Êàê ïðàâèëî, öåëüþ ñòàòèñòè÷åñêîãî àíàëèçà âûáîðî÷íûõ çíà÷åíèé ÿâëÿåòñÿ îïðåäåëåíèå çíà÷åíèÿ áèíîìèàëüíîé âåðîÿòíîñòè ð. Îáùèå òåîðåòè÷åñêèå ïîëîæåíèÿ, íà îñíîâå êîòîðûõ ñòðîÿòñÿ îïèñûâàåìûå íèæå äîâåðèòåëüíûå èíòåðâàëû, ïðèâåäåíû â ðàçäåëå 2.3.7. 324 Часть III. Анализ одномерных выборок Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð íåñêîëüêî îòëè÷àåòñÿ äëÿ ñëó÷àåâ, êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì è êîãäà âûáîðêà ñîäåðæèò ðåçóëüòàòû íåñêîëüêèõ íåçàâèñèìûõ ýêñïåðèìåíòîâ. Ðàññìîòðèì ýòè ñëó÷àè îòäåëüíî. 10.8.1. Оценивание вероятности р по одному эксперименту Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä “1”, è 0 â ïðîòèâíîì ñëó÷àå. Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà pˆ = r / n , ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p (ñì. ðàçäåë 1.4.3). Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n. Äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîÿòñÿ èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ . Использование биномиального распределения Äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n , òî÷íåå, äëÿ äàëüíåéøèõ âû÷èñëåíèé íåîáõîäèìà âåëè÷èíà r — êîëè÷åñòâî èñõîäîâ “1”. 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + α)/2. óðîâåíü α è âû÷èñëÿþòñÿ βí = (1 – α)/2 3. Îïðåäåëÿþòñÿ tн = Fk−1,1k 2 ( β н ) è tв = Fk−3,1k 4 ( β в ) , ãäå Fm−1,1 m 2 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè F-ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè m1 è m2 (ñì. ðàçäåë 1.5.9), k1 = r, k2 = n – r + 1, k3 = r + 1, k4 = n – r. 4. Äîâåðèòåëüíûì èíòåðâàëîì áóäåò èíòåðâàë ( tн , tв ) . Êîììåíòàðèé. Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó áèíîìèàëüíûì ðàñïðåäåëåíèåì è F-ðàñïðåäåëåíèåì. Ïóñòü Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Òîãäà Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Fn–k,k+1 — ôóíêöèÿ F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.12 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 100 íàáëþäåíèé çà ýêñïåðèìåíòîì, ãäå ñ âåðîÿòíîñòüþ 0,4 ïðîèñõîäèò ñîáûòèå “1”. Ýòà âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà ïàêåòà àíàëèçà Генерация случайных чисел. Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, òàêæå ïîêàçàíû íà ðèñ. 10.12. Ìîæíî îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé, ïðèìåíèâ äëÿ âû÷èñëåíèÿ íèæíåé ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà ôîðìóëó =FРАСПОБР((1-C2)/2;СУММ(Выборка);СЧЁТ(Выборка)-СУММ(Выборка)+1), Глава 10. Интервальное оценивание параметров распределения 325 à äëÿ âåðõíåé — ôîðìóëó =FРАСПОБР((1+C2)/2;СУММ(Выборка)+1;СЧЁТ(Выборка)-СУММ(Выборка)). Ýòè ôîðìóëû èñïîëüçóþò òîëüêî âûáîðî÷íûå çíà÷åíèÿ (äèàïàçîí Выборка) è çíà÷åíèå äîâåðèòåëüíîãî óðîâíÿ (ÿ÷åéêà Ñ2). Ðèñ. 10.12. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ð Асимптотические оценки Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ òàêèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = r / n . 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíê2 íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + k pˆ − k . n n Êîììåíòàðèé. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà áèíîìèàëüíîå ðàñïðåäåëåíèå àïïðîêñèìèðóåòñÿ íîðìàëüíûì, íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ = p (1 − p) / n çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / n . Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ 326 Часть III. Анализ одномерных выборок Íà ðèñ. 10.13 ïîêàçàíû ôîðìóëû Excel, ïîçâîëÿþùèå ïîñòðîèòü àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë. Çäåñü èñïîëüçîâàíà òà æå âûáîðêà, ÷òî è â ïðåäûäóùåì ïðèìåðå, è îñòàâëåíû âû÷èñëåíèÿ òî÷íîãî äîâåðèòåëüíîãî èíòåðâàëà. Êàê âèäíî íà ðèñ. 10.13, àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë (ÿ÷åéêè Í13 è ²13), íà ïåðâûé âçãëÿä, êàæåòñÿ áîëåå òî÷íûì, ÷åì èíòåðâàë, ïîñòðîåííûé ïî òî÷íûì ôîðìóëàì. Îäíàêî íåîáõîäèìî ïîìíèòü, ÷òî ýòîò èíòåðâàë ïðèáëèæåííûé è îí ìîæåò áûòü êàê ìåíüøå, òàê è áîëüøå òî÷íîãî èíòåðâàëà. Ðèñ. 10.13. Àñèìïòîòè÷åñêèé äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà ð 10.8.2. Оценивание вероятности р по нескольким экспериментам Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ñîñòîèò èç ðåçóëüòàòîâ n ýêñïåðèìåíòîâ, â êàæäîì èç êîòîðûõ ïðîâîäèëîñü N èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî ÷èñëó èñõîäîâ “1” â i-ì ýêñïåðèìåíòå. Íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà pˆ = 1 nN n ∑x i . Äèñïåðñèÿ ñòàòèñòèêè p̂ : Dpˆ = p (1 − p) / nN . Ðàñïðåäåëåíèå ñòàòè- i =1 ñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/nN. Ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, áîëüøå 30, íàèáîëåå ïðîñòîé äîâåðèòåëüíûé èíòåðâàë äëÿ íåèçâåñòíîãî çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ . 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà pˆ = 1 nN n ∑x i . i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. Глава 10. Интервальное оценивание параметров распределения 327 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî- 1+ α –1 , Ô — ôóíê 2 ãî íîðìàëüíîãî çàêîíà, íàõîäèòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë pˆ − k pˆ (1 − pˆ ) pˆ (1 − pˆ ) , pˆ + k . nN nN Êîììåíòàðèè 1. Ïðè íåîáõîäèìîñòè ìîæíî ïîñòðîèòü òî÷íûé äîâåðèòåëüíûé èíòåðâàë, àíàëîãè÷íûé òî÷íîìó èíòåðâàëó èç ïðåäûäóùåãî ðàçäåëà. Íî ïîñêîëüêó çíà÷åíèå âåëè÷èíû nN, êàê ïðàâèëî, âåëèêî, íà ïðàêòèêå îáû÷íî èñïîëüçóþò àñèìïòîòè÷åñêèå èíòåðâàëû êàê íàèáîëåå ïðîñòûå â âû÷èñëèòåëüíîì îòíîøåíèè è âìåñòå ñ òåì äîñòàòî÷íî íàäåæíûå. 2. Çäåñü ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì, à íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dpˆ çàìåíÿåòñÿ âåëè÷èíîé pˆ (1 − pˆ ) / nN . 3.  ñëó÷àå, êîãäà â ýêñïåðèìåíòàõ ïðîâîäèòñÿ ðàçíîå êîëè÷åñòâî èñïûòàíèé N1, N2, ..., Nn, âñå âûøåïðèâåäåííûå ôîðìóëû ñîõðàíÿþò ñâîþ ñèëó, åñëè â íèõ âåëè÷èíó nN çàìåíèòü ñóììîé N1 + N2 +...+ Nn. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ñ íåáîëüøèìè î÷åâèäíûìè èçìåíåíèÿìè ïîâòîðÿåò ðåàëèçàöèþ ìåòîäà ïîñòðîåíèÿ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà èç ïðåäûäóùåãî ðàçäåëà. 10.8.3. Применение преобразования арксинуса  ðàçäåëå 2.3.7 îïèñàíû ïðåîáðàçîâàíèÿ îöåíêè è y = 2 n arcsin p̂ âèäà z = arcsin pˆ pˆ , ïðè ýòîì ðàñïðåäåëåíèÿ âåëè÷èí z è y áëèæå ê íîðìàëüíî- ìó, ÷åì ðàñïðåäåëåíèå îöåíêè p̂ . Íàïîìíèì, ÷òî ìàòåìàòè÷åñêîå îæèäàíèå ñëó÷àéíîé âåëè÷èíû z ïðèáëèæåííî ðàâíî arcsin p , à äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1/4n. Äëÿ âåëè÷èíû y ìàòåìàòè÷åñêîå îæèäàíèå ïðèáëèæåííî ðàâíî 2 n arcsin p , äèñïåðñèÿ ïðèáëèæåííî ðàâíà 1. Ýòè ïðåîáðàçîâàíèÿ ìîæíî èñïîëüçîâàòü äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð. Ïðåäâàðèòåëüíî îòìåòèì, ÷òî åñëè äèñïåðñèþ âåëè÷èíû z ïðèíÿòü ðàâíîé â òî÷íîñòè 1/4n, à âåëè÷èíû y — òî÷íî ðàâíîé 1, òî, êàê íåòðóäíî ïðîâåðèòü, äîâåðèòåëüíûå èíòåðâàëû, ïîñòðîåííûå íà îñíîâàíèè ýòèõ ïðåîáðàçîâàíèé, áóäóò ñîâïàäàòü. Ïîýòîìó íå èìååò çíà÷åíèÿ, êàêîå ïðåîáðàçîâàíèå èñïîëüçîâàòü. Ïîêàæåì ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà ñ ïîìîùüþ ïðåîáðàçîâàíèÿ àðêñèíóñà z = arcsin pˆ . Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà âûïîëíÿþòñÿ ñëåäóþùèå äåéñòâèÿ. 1. Âû÷èñëÿþòñÿ òî÷å÷íàÿ îöåíêà p̂ è åå ïðåîáðàçîâàíèå z = arcsin 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 328 Часть III. Анализ одномерных выборок pˆ . 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíê 2 íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: sin 2 z − k k 2 , sin z + . 2 n 2 n Êîììåíòàðèé. Íåîáõîäèìî ïîìíèòü, ÷òî, âî-ïåðâûõ, õîòÿ ðàñïðåäåëåíèå âåëè÷èíû z áëèæå ê íîðìàëüíîìó, ÷åì ðàñïðåäåëåíèå p̂ , îíî âñå-òàêè íå ñîâïàäàåò ñ íèì. Âî-âòîðûõ, äèñïåðñèÿ ýòîé âåëè÷èíû òîëüêî ïðèáëèæåííî ðàâíà 1/4n. Ïîýòîìó äàííûé ìåòîä ÿâëÿåòñÿ ïðèáëèæåííûì. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 10.14 ïîêàçàíû ôîðìóëû Excel, ïîçâîëÿþùèå ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë íà îñíîâàíèè ïðåîáðàçîâàíèÿ z = arcsin pˆ . Çäåñü èñïîëüçîâàíà òà æå âûáîðêà, ÷òî è â ðàçäåëå 10.8.1. Êàê âèäíî íà ðèñ. 10.14, ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë (ÿ÷åéêè F6 è G6) áëèçîê àñèìïòîòè÷åñêîìó äîâåðèòåëüíîìó èíòåðâàëó, ïîñòðîåííîìó â ðàçäåëå 10.8.1. Ðèñ. 10.14. Äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà ð íà îñíîâå ïðåîáðàçîâàíèÿ àðêñèíóñà 10.9. Оценка параметра распределения Пуассона Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ (ñì. ðàçäåë 1.4.4). 1 n ∑ xi áóäåò íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé n i =1 äëÿ íåèçâåñòíîãî ïàðàìåòðà λ. Äèñïåðñèÿ ýòîé îöåíêè ðàâíà D x = λ/n. Ñëó÷àéÂûáîðî÷íîå ñðåäíåå x = n íàÿ âåëè÷èíà ∑x i èìååò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì nλ, à ñëó÷àéíàÿ i =1 âåëè÷èíà n ( x − λ ) àñèìïòîòè÷åñêè íîðìàëüíà ñ ïàðàìåòðàìè (0, 1). λ Глава 10. Интервальное оценивание параметров распределения 329 Äîâåðèòåëüíûå èíòåðâàëû äëÿ ïàðàìåòðà λ ñòðîÿòñÿ èëè íà îñíîâå ðàñïðåäån ëåíèÿ Ïóàññîíà, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà ∑x i , èëè íà îñíîâå àñèì- i =1 ïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû n ( x − λ) . λ Использование распределения Пуассона Äîâåðèòåëüíûé èíòåðâàë äëÿ ïàðàìåòðà λ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x = 2. Çàäàåòñÿ äîâåðèòåëüíûé è βâ = (1 + α)/2. 1 n ∑ xi . n i =1 óðîâåíü α è âû÷èñëÿþòñÿ βí = (1 – α)/2 3. Îïðåäåëÿþòñÿ tн = Fk−1 ( β н ) è tв = Fk−1 ( β в ) , ãäå Fk−1 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè χ2-ðàñïðåäåëåíèÿ ñ k = 2(n x + 1) ñòåïåíüþ ñâîáîäû. tн tв , . 2n 2n 4. Äîâåðèòåëüíûì èíòåðâàëîì áóäåò èíòåðâàë Êîììåíòàðèé. Çäåñü èñïîëüçîâàíû èçâåñòíûå ñîîòíîøåíèÿ ìåæäó ðàñïðåäåëåíèåì Ïóàññîíà è ðàñïðåäåëåíèåì χ2, ïðèâåäåííûå â ðàçäåëå 1.4.4. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ðåàëèçàöèÿ ýòîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ñ ñîîòâåòñòâóþùèìè ôîðìóëàìè ïîêàçàíà íà ðèñ. 10.15.  ñòîëáöå À ñîäåðæàòñÿ 100 âûáîðî÷íûõ çíà÷åíèé, èìåþùèõ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 2. Âûáîðêà ñîçäàíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел; äèàïàçîíó ÿ÷ååê, ñîäåðæàùåìó âûáîðî÷íûå çíà÷åíèÿ, ïðèñâîåíî èìÿ Выборка. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ tн è tв çäåñü èñïîëüçîâàíà ôóíêöèÿ ХИ2ОБР (ñì. ðàçäåë 4.7.8). Асимптотические оценки Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ λ ñòðîèòñÿ òàêèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà x = 1 n ∑ xi . n i =1 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíê 2 íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë: x − k 330 Часть III. Анализ одномерных выборок x x , x +k . n n Ðèñ. 10.15. Ïîñòðîåíèå òî÷íîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà λ ðàñïðåäåëåíèÿ Ïóàññîíà Êîììåíòàðèè 1. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì, ïðè ýòîì íåèçâåñòíîå çíà÷åíèå äèñïåðñèè Dx = λ / n çàìåíÿåòñÿ âåëè÷èíîé x / n . 2. Ìîæíî ñòðîèòü äîâåðèòåëüíûé èíòåðâàë âèäà k2 k k2 k − k 2 + 4nx , x + + k 2 + 4nx , x + 2 n 2 n 2 n 2 n ãäå èñïîëüçóåòñÿ òîëüêî àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ Ïóàññîíà íîðìàëüíûì. 3. Ýòîò ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì; ïî âîçìîæíîñòè ñëåäóåò èñïîëüçîâàòü òî÷íûé ìåòîä. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà, ïîêàçàíû íà ðèñ. 10.16 â ñòîëáöàõ G è H. Äëÿ ïðèìåðà èñïîëüçóåòñÿ òà æå âûáîðêà, ÷òî è â ïðåäûäóùåì ïðèìåðå. 10.10. Оценки параметра геометрического распределения Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ãåîìåòðè÷åñêîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì ð (0 < p < 1) (ñì. ðàçäåë 1.4.5). Ïðè n > 10 äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ ð ñòðîèòñÿ òàêèì îáðàçîì. 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ îöåíêà p = 1 1 n , ãäå x = ∑ xi . 1+ x n i =1 Глава 10. Интервальное оценивание параметров распределения 331 Ðèñ. 10.16. Ïîñòðîåíèå àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà ðàñïðåäåëåíèÿ Ïóàññîíà 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî- 1+ α –1 , Ô — 2 ãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 1 k x 1− 1 + x n 1+ x 4. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë: 1 k x , 1 + n 1+ x 1+ x . Êîììåíòàðèè 1. Ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà èñïîëüçóåòñÿ òîò ôàêò, ÷òî ñëó÷àéíàÿ âåëè÷èíà T = n ( px − 1 + p) 1− p èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîð- ìàëüíîå ðàñïðåäåëåíèå. Åñëè ïðèðàâíÿòü Ò ê êâàíòèëÿì tí è tâ ñîîòâåòñòâåííî ïîðÿäêà α/2 è ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ, òî ïîëó÷èì äâà óðàâíåíèÿ îòíîñèòåëüíî ð. Êîðíè ýòèõ óðàâíåíèé ñîñòàâëÿþò ãðàíèöû äîâåðèòåëüíîãî èíòåðâàëà. Îòìåòèì, ÷òî ïðèâåäåííûå âûøå ãðàíèöû ïîëó÷åíû ïðè çàìåíå â ôîðìóëå Ò âûðàæåíèÿ âûðàæåíèåì 1− p x /(1 + x ) . Áåç ïîñëåäíåé çàìåíû ìîæíî ïîëó÷èòü áîëåå òî÷íûå ãðàíèöû, îäíàêî ôîðìóëû äëÿ íèõ ñòàíîâÿòñÿ âåñüìà ãðîìîçäêèìè. 2. Ýòîò ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì, íî óæå ïðè n > 10 äàåò óäîâëåòâîðèòåëüíóþ òî÷íîñòü. Äëÿ ìàëûõ âûáîðîê ìîæíî ïðèìåíèòü òî÷íûé ìåòîä, èñïîëüçóþùèé äëÿ âû÷èñëåíèÿ ãðàíèö äîâåðèòåëüíîãî èíòåðâàëà îòðèöàòåëüíîå áèíîìèàëüíîå ðàñïðåäåëåíèå [14]. 332 Часть III. Анализ одномерных выборок Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî ìåòîäà ïîäîáíà ïîñòðîåíèþ àñèìïòîòè÷åñêîãî äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà λ ðàñïðåäåëåíèÿ Ïóàññîíà èç ïðåäûäóùåãî ðàçäåëà è íå äîëæíà âûçûâàòü çàòðóäíåíèé. 10.11. Доверительные интервалы для квантилей  ýòîì ðàçäåëå ðàññìîòðèì äîâåðèòåëüíûå èíòåðâàëû äëÿ êâàíòèëåé. Ýòè èíòåðâàëû õàðàêòåðíû òåì, ÷òî íå çàâèñÿò îò âûáîðî÷íîãî ðàñïðåäåëåíèÿ. Íàïîìíèì, ÷òî êâàíòèëüþ ïîðÿäêà ð ñëó÷àéíîé âåëè÷èíû Õ íàçûâàåòñÿ òàêîå ÷èñëî ξð, ÷òî Ð(Õ < ξð) = F(ξð) = ð, ãäå F — ôóíêöèÿ ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Õ (ñì. ðàçäåë 1.2.3). Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè, èìåþùåé íåïðåðûâíîå ðàñïðåäåëåíèå. Ñîñòîÿòåëüíîé îöåíêîé äëÿ êâàíòèëè ξð ÿâëÿåòñÿ ïîðÿäêîâàÿ ñòàòèñòèêà (÷ëåí âàðèàöèîííîãî ðÿäà) x(k(p)) ñ ðàíãîì k(p); k(p) = nð, åñëè nð — öåëîå ÷èñëî è k(p) = [nð] + 1 â ïðîòèâíîì ñëó÷àå ([nð] — öåëàÿ ÷àñòü ÷èñëà nð). Äîâåðèòåëüíûé èíòåðâàë äëÿ çíà÷åíèÿ ξð ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Äëÿ âñåõ âûáîðî÷íûõ çíà÷åíèé õ1, õ2, ..., xn âû÷èñëÿþòñÿ ðàíãè r1, r2, ..., rn. 2. Âû÷èñëÿåòñÿ k(p): k(p) = nð, åñëè nð — öåëîå ÷èñëî; k(p) = [nð] + 1 â ïðîòèâíîì ñëó÷àå. 3. Îïðåäåëÿåòñÿ âûáîðî÷íîå çíà÷åíèå x(k(p)) ñ ðàíãîì, ðàâíûì k(p). Ýòî çíà÷åíèå ïðèíèìàåòñÿ çà òî÷å÷íóþ îöåíêó êâàíòèëè ξð. 4.  êà÷åñòâå äîâåðèòåëüíîãî èíòåðâàëà áåðåòñÿ èíòåðâàë (x(s), x(t)), ãðàíèöû êîòîðîãî ñîñòàâëÿþò ïîðÿäêîâûå ñòàòèñòèêè x(s) è x(t) è êîòîðûé ñîäåðæèò çíà÷åíèå x(k(p)). Âû÷èñëÿåòñÿ äîâåðèòåëüíûé óðîâåíü ýòîãî èíòåðâàëà ïî ôîðìóëå β = F(t) – F(s), ãäå F — ôóíêöèÿ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è p. Ïîðÿäêîâûå ñòàòèñòèêè x(s) è x(t) âûáèðàþòñÿ òàêèì îáðàçîì, ÷òîáû âåðîÿòíîñòü β áûëà íå ìåíüøå çàäàííîãî äîâåðèòåëüíîãî óðîâíÿ α. Êîììåíòàðèè 1. Ìåòîä ïîñòðîåí íà îñíîâå ñâîéñòâ ïîðÿäêîâûõ ñòàòèñòèê (ñì. íàïðèìåð, [17]). 2. Îáû÷íî èíòåðâàë (x(s), x(t)) áåðóò ñèììåòðè÷íûì ïî ðàíãàì s è t îòíîñèòåëüíî x(k(p)), ò.å. êîãäà t – k(p) = k(p) – s. Îäíàêî òàêîé èíòåðâàë íå âñåãäà èìååò ìèíèìàëüíóþ äëèíó. 3.  ñëó÷àå ð = 0,5 ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë äëÿ ìåäèàíû. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Âñå ôîðìóëû Excel, èñïîëüçóåìûå ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ êâàíòèëè ξð, ïîêàçàíû íà ðèñ. 10.17. Äëÿ ïðèìåðà èñïîëüçóåòñÿ âûáîðêà, ñîñòîÿùàÿ èç ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 10] ñëó÷àéíûõ ÷èñåë (â ýòîì ñëó÷àå èñòèííîå çíà÷åíèå êâàíòèëè ξð ðàâíî 10ð).  äàííîì ñëó÷àå äëÿ òîãî, ÷òîáû â äàëüíåéøåì ìîæíî áûëî ïðèìåíèòü ôóíêöèþ ВПР, âûáîðêà çàïèñàíà â ñòîëáöå Â, à â ñòîëáöå À âû÷èñëåíû ðàíãè âûáîðî÷íûõ çíà÷åíèé ïî ôîðìóëå ìàññèâà {=РАНГ(Выборка;Выборка;1)}. (Ôóíêöèÿ РАНГ îïèñàíà â ðàçäåëå 4.2.5; äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âûáî- Глава 10. Интервальное оценивание параметров распределения 333 ðî÷íûå çíà÷åíèÿ, íàçâàí Выборка.)  ÿ÷åéêå Å3 âû÷èñëÿåòñÿ ðàíã âûáîðî÷íîãî çíà÷åíèÿ, êîòîðîå ïðèíèìàåòñÿ çà îöåíêó êâàíòèëè, à â ÿ÷åéêå Å4 ïðèâîäèòñÿ ñàìî ýòî çíà÷åíèå. Ðèñ. 10.17. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êâàíòèëè  äèàïàçîíå Ñ6:F18 ïîñòðîåíû èíòåðâàëû äëÿ êâàíòèëè è ïîäñ÷èòàíû âåðîÿòíîñòè, ñ êîòîðîé îíè ñîäåðæàò íåèçâåñòíîå çíà÷åíèå êâàíòèëè.  ïåðâîé ñòðîêå ýòîãî äèàïàçîíà çàïèñàíû òàêèå ôîðìóëû.  ÿ÷åéêå D7: =ВПР($E$3-C7;$A$2:$B$51;2;0).  ÿ÷åéêå Å7: =ВПР($E$3+C7;$A$2:$B$51;2;0).  ÿ÷åéêå F7: =БИНОМРАСП($E$3+C7;$E$2;$E$1;1)-БИНОМРАСП($E$3C7;$E$2;$E$1;1). Ýòè ôîðìóëû çàòåì ñêîïèðîâàíû âíèç äî êîíöà äèàïàçîíà D7:F18. Èíòåðâàëû ñèììåòðè÷íû îòíîñèòåëüíî îöåíêè êâàíòèëè (ñèììåòðè÷íîñòü èíòåðâàëîâ îïðåäåëåíà â êîììåíòàðèÿõ). Ñòîëáåö Номер èñïîëüçóåòñÿ òîëüêî äëÿ óäîáñòâà âû÷èñëåíèÿ ðàíãîâ s è t; ïóòåì óñëîæíåíèÿ ôîðìóë îò íåãî ìîæíî îòêàçàòüñÿ. Ïðè çàäàííîì äîâåðèòåëüíîì óðîâíå âûáèðàåòñÿ òîò èíòåðâàë, äëÿ êîòîðîãî âåðîÿòíîñòü íå ìåíüøå äîâåðèòåëüíîãî óðîâíÿ. Íàïðèìåð, åñëè äîâåðèòåëüíûé óðîâåíü çàäàí êàê 0,95, òî â êà÷åñòâå èñêîìîãî èíòåðâàëà ñëåäóåò âçÿòü èíòåðâàë ïîä íîìåðîì 7 (ñì. ðèñ. 10.17). 334 Часть III. Анализ одномерных выборок Глава 11 Проверка гипотез о параметрах распределений Î äíîé èç çàäà÷ ñòàòèñòè÷åñêîãî àíàëèçà ÿâëÿåòñÿ ïðîâåðêà àäåêâàòíîñòè èìåþùèõñÿ âûáîðî÷íûõ çíà÷åíèé, ÿâëÿþùèõñÿ ðåàëèçàöèåé íåêîòîðîé ñëó÷àéíîé âåëè÷èíû, âûäâèíóòûì ãèïîòåçàì î ðàñïðåäåëåíèè ýòîé ñëó÷àéíîé âåëè÷èíû, ò.å. ïðîâåðêà ãèïîòåç î ïàðàìåòðàõ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðîâåðÿåìûå ãèïîòåçû îáû÷íî ôîðìóëèðóþòñÿ íà îñíîâàíèè íåêîòîðûõ àïðèîðíûõ èëè òåîðåòè÷åñêèõ ïðåäïîëîæåíèé ëèáî íà ðåçóëüòàòàõ ïðåäâàðèòåëüíîãî àíàëèçà äàííûõ. Òåîðåòè÷åñêèå îñíîâû ïðîâåðêè ñòàòèñòè÷åñêèõ ãèïîòåç äàíû â ãëàâå 2, ðàçäåë 2.4. Çäåñü ìû ïðèâåäåì êîíêðåòíûå êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Êðèòåðèè ïðîâåðêè ãèïîòåç î òèïå çàêîíà ðàñïðåäåëåíèÿ îïèñàíû â ãëàâå 9. Îòìåòèì, ÷òî áîëüøèíñòâî ìåòîäîâ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ïàðàìåòðîâ ðàñïðåäåëåíèé, ïðèâåäåííûõ â ãëàâå 10, ìîæíî ïåðåôîðìóëèðîâàòü êàê êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ýòèõ ïàðàìåòðîâ (ñì. ðàçäåë 2.4.1). Íà òàêîé îñíîâå ïîñòðîåíû îïèñàííûå â ýòîé ãëàâå êðèòåðèè ïðîâåðêè ãèïîòåç î ïàðàìåòðàõ íîðìàëüíîãî ðàñïðåäåëåíèÿ è êðèòåðèé ïðîâåðêè ãèïîòåçû î çíà÷åíèè ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ. Êðîìå ýòèõ êðèòåðèåâ, ðàññìîòðåíû äâà íåïàðàìåòðè÷åñêèõ êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû, êîòîðûå íå çàâèñÿò îò ðàñïðåäåëåíèé. Ïîä÷åðêíåì åùå ðàç (ñì. ðàçäåë 2.4), ÷òî ñòàòèñòè÷åñêèå êðèòåðèè íà îñíîâàíèè âûáîðî÷íûõ íàáëþäåíèé íå äîêàçûâàþò òó èëè èíóþ ãèïîòåçó. Îíè ïîçâîëÿþò òîëüêî óòâåðæäàòü, ÷òî âûáîðî÷íûå çíà÷åíèÿ íå ïðîòèâîðå÷àò ïðèíÿòîé ãèïîòåçå. Êðîìå òîãî, åñëè èìååòñÿ âîçìîæíîñòü ê îäíèì è òåì æå äàííûì ïðèìåíèòü äâà ðàçëè÷íûõ êðèòåðèÿ äëÿ ïðîâåðêè îäíîé è òîé æå ãèïîòåçû, òî â ýòîì ñëó÷àå ñëåäóåò âîñïîëüçîâàòüñÿ ëèøü îäíèì êðèòåðèåì, êîòîðûé ÿâëÿåòñÿ áîëåå ìîùíûì. 11.1. Критерии проверки гипотез о параметрах нормального распределения Ïîñêîëüêó íà ïðàêòèêå î÷åíü ÷àñòî ïðåäïîëàãàåòñÿ, ÷òî âûáîðêà èìååò íîðìàëüíîå ðàñïðåäåëåíèå (îáîñíîâàíî èëè íåò — îòäåëüíûé âîïðîñ), ïðèâåäåííûå íèæå êðèòåðèè, ïî-âèäèìîìó, ÿâëÿþòñÿ íàèáîëåå âîñòðåáîâàííûìè êðèòåðèÿìè ïðîâåðêè ãèïîòåç. 11.1.1. Критерий проверки значения математического ожидания нормальной совокупности Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèì îæèäàíèåì µ è äèñïåðñèåé σ2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: µ = m0 Í0: µ ≤ m0 Í0: µ ≥ m0 Í1: µ ≠ m0 Í1: µ > m0 Í1: µ < m0 Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = x= n ( x − m0 ) , ãäå Sn 1 n 1 n xi è Sn2 = ∑ ( xi − x ) 2 . ∑ n i =1 n i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü t ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tâ ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tí ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò. Êîììåíòàðèè 1. Èíîãäà èçâåñòíà äèñïåðñèÿ ãåíåðàëüíîé ñîâîêóïíîñòè σ2. Òîãäà âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóþò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ ñòàòèñòèêè Ò çàìåíÿþò Sn íà σ.  ýòîì ñëó÷àå äëÿ ïîñòðîåíèÿ êðèòåðèÿ ìîæíî èñïîëüçîâàòü ôóíêöèþ Excel ZТЕСТ. 2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.1 ïîêàçàí ðàáî÷èé ëèñò Excel ñ ôîðìóëàìè, íåîáõîäèìûìè äëÿ ðåàëèçàöèè êðèòåðèÿ.  êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà âûáîðêà îáúåìîì 50 çíà÷åíèé, èìåþùàÿ íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì –1 è äèñïåðñèåé σ2 = 4, ïîëó÷åííàÿ ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Çíà÷åíèå m0 çàäàåòñÿ â ÿ÷åéêå Ñ1, à óðîâåíü çíà÷èìîñòè êðèòåðèÿ — â ÿ÷åéêå Ñ2. Îáúåì âûáîðêè, âûáîðî÷íûå ñðåäíåå è ñòàíäàðòíîå îòêëîíåíèå âû÷èñëÿþòñÿ ñ ïîìîùüþ ôóíêöèé СЧЁТ, СРЗНАЧ è СТАНДОТКЛОН.  ñòîëáöàõ Å:G âûïîëíÿþòñÿ âû÷èñëåíèÿ äëÿ êðèòåðèÿ: â ÿ÷åéêå F2 âû÷èñëÿåòñÿ çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè ïî ôîðìóëå =КОРЕНЬ(C3)*(C4-C1)/C5, â ÿ÷åéêàõ Å5:G5 — êðèòè÷åñêèå çíà÷åíèÿ ïî ôîðìóëàì ñîîòâåòñòâåííî =СТЬЮДРАСПОБР($C$2/2;$C$3-1) äëÿ ñëó÷àÿ ðàâåíñòâà è =СТЬЮДРАСПОБР($C$2;$C$3-1) äëÿ ñëó÷àÿ íåðàâåíñòâ (â ÿ÷åéêàõ F5 è G5 îäèíàêîâûå ôîðìóëû).  ÿ÷åéêàõ Å7:G7 ïðîâåðÿþòñÿ óñëîâèÿ âûïîëíåíèÿ êðèòåðèÿ (ôîðìóëû ïîêàçàíû íà ðèñ. 11.1). 336 Часть III. Анализ одномерных выборок Ðèñ. 11.1. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ Êàê âèäíî íà ðèñ. 11.1, äëÿ m0 = –0,5 íóëåâûå ãèïîòåçû â ñëó÷àå ðàâåíñòâà è íåðàâåíñòâà á) ïðèíèìàþòñÿ (íàïîìíèì, ÷òî èñòèííîå çíà÷åíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ ðàâíî –1), à íóëåâàÿ ãèïîòåçà äëÿ íåðàâåíñòâà â) îòêëîíÿåòñÿ. Ïîñìîòðèì, êàê ñðåàãèðóåò êðèòåðèé, åñëè ïîëîæèòü m0 = 0. Ðåçóëüòàò ïðèìåíåíèÿ êðèòåðèÿ äëÿ ýòîãî ñëó÷àÿ ïîêàçàí íà ðèñ. 11.2. Çäåñü ãèïîòåçà î ðàâåíñòâå îòâåðãàåòñÿ. Ðèñ. 11.2. Ñðàâíåíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ ñ íóëåâûì çíà÷åíèåì 11.1.2. Критерий проверки значения дисперсии нормальной совокупности Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., õn ïîëó÷åíà èç ãåíåðàëüíîé ñîâîêóïíîñòè ñ íîðìàëüíûì çàêîíîì ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè ìàòåìàòè÷åñêèì îæèäàíèåì µ è äèñïåðñèåé σ2. Ãèïîòåçû à) Ðàâåíñòâî 2 2 á) Íåðàâåíñòâî 2 â) Íåðàâåíñòâî Í0: σ = σ0 Í0: σ ≤ σ0 2 Í0: σ2 ≥ σ02 Í1: σ2 ≠ σ02 Í1: σ2 > σ02 Í1: σ2 < σ02 Çäåñü σ02 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Глава 11. Проверка гипотез о параметрах распределений 337 Âû÷èñëåíèÿ. Sn2 = Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T= (n − 1) S n2 , σ 20 ãäå 1 n ∑ ( xi − x )2 . n i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ êàê êâàíòèëè tí ïîðÿäêà α/2 è tâ ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tâ ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå êàê êâàíòèëü tí ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò. Êîììåíòàðèé. Êðèòåðèé íå óñòîé÷èâ, åñëè íå âûïîëíÿåòñÿ óñëîâèå íîðìàëüíîñòè ðàñïðåäåëåíèÿ ãåíåðàëüíîé ñîâîêóïíîñòè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.3 ïîêàçàí ðàáî÷èé ëèñò Excel ñî âñåìè ôîðìóëàìè, íåîáõîäèìûìè äëÿ ðåàëèçàöèè êðèòåðèÿ. Âûáîðêà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì 1 è äèñïåðñèåé 4. Çíà÷åíèå σ02 çàäàíî â ÿ÷åéêå Ñ1, à óðîâåíü çíà÷èìîñòè — â ÿ÷åéêå Ñ2. Îòìåòèì, ÷òî âûáîðî÷íàÿ äèñïåðñèÿ â ÿ÷åéêå Ñ5 âû÷èñëÿåòñÿ ñ ïîìîùüþ ôóíêöèè ДИСПР (ñì. ðàçäåë 4.5.2). Ðèñ. 11.3. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ äèñïåðñèè Êàê âèäíî íà ðèñ. 11.3, äëÿ ñëó÷àÿ σ02 = 4 ïðèíèìàþòñÿ âñå òðè íóëåâûå ãèïîòåçû. Íà ðèñ. 11.4 ïîêàçàíû ðåçóëüòàòû âû÷èñëåíèÿ êðèòåðèÿ äëÿ σ02 = 2. Çäåñü íóëåâûå ãèïîòåçû ðàâåíñòâà è íåðàâåíñòâà á) îòêëîíÿþòñÿ, à ãèïîòåçà Í0: σ2 ≥ σ02 ïðèíèìàåòñÿ. Âûïîëíåíèå êðèòåðèÿ äëÿ ñëó÷àÿ σ02 = 7 ïîêàçàíî íà ðèñ. 11.5. 338 Часть III. Анализ одномерных выборок Ðèñ. 11.4. Ïðîâåðêà çíà÷åíèÿ äèñïåðñèè äëÿ σ02 = 2 Ðèñ. 11.5. Ïðîâåðêà çíà÷åíèÿ äèñïåðñèè äëÿ σ02 = 7 11.2. Проверка гипотезы о значении параметра показательного распределения Ïîêàçàòåëüíîå (ýêñïîíåíöèàëüíîå) ðàñïðåäåëåíèå îïðåäåëÿåòñÿ ïàðàìåòðîì λ (ñì. ðàçäåë 1.5.3), ïðè ýòîì äëÿ ñëó÷àéíîé âåëè÷èíû Õ, ïîä÷èíÿþùåéñÿ ýòîìó ðàñïðåäåëåíèþ, ÌÕ = 1/λ, DX = 1/λ2. Äëÿ ýòîãî ðàñïðåäåëåíèÿ îáû÷íî ñòðîÿòñÿ êðèòåðèè îöåíêè íå ïàðàìåòðà λ, à îáðàòíàÿ ê íåìó âåëè÷èíà θ = 1/λ, ïîñêîëüêó ÌÕ = θ. Ïîñòðîåíèå êðèòåðèåâ äëÿ ïàðàìåòðà θ îñíîâàíî íà òîì, ÷òî ñëó÷àén íàÿ âåëè÷èíà 2 ∑ xi /θ, ãäå xi — âûáîðî÷íûå çíà÷åíèÿ, èìåþùèå ïîêàçàòåëüíîå i =1 ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ, íå çàâèñèò îò ïàðàìåòðà θ è èìååò ðàñïðåäåëåíèå χ2 ñ 2n ñòåïåíÿìè ñâîáîäû. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ãåíåðàëüíàÿ ñîâîêóïíîñòü èìååò ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì θ. Глава 11. Проверка гипотез о параметрах распределений 339 Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: θ = θ0 Í0: θ ≤ θ0 Í0: θ ≥ θ0 Í1: θ ≠ θ0 Í1: θ > θ0 Í1: θ < θ0 Çäåñü θ0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 2nx 1 n , ãäå x = ∑ xi . θ0 n i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ 2n ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ tí êàê êâàíòèëü ïîðÿäêà α/2 ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû è tâ êàê êâàíòèëü ïîðÿäêà 1 – α/2 òîãî æå ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü tâ ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ tâ. Ñëó÷àé â). Âû÷èñëÿåòñÿ êâàíòèëü tí ïîðÿäêà α ðàñïðåäåëåíèÿ χ2 ñ 2n ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Ò. Êîììåíòàðèé. Êðèòåðèé ïðàêòè÷åñêè òîæäåñòâåí ìåòîäó ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ïàðàìåòðà θ (ñì. ðàçäåë 10.5). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.6 ïîêàçàíà âûáîðêà (ñòîëáåö À), èìåþùàÿ ïîêàçàòåëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðîì λ = 0,5 (èëè θ = 2). Âûáîðêà ïîñòðîåíà ñ ïîìîùüþ ôîðìóëû ìàññèâà {=ГАММАОБР(СЛЧИС();1;2)}.  Excel íåò ôóíêöèè, îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ ïîêàçàòåëüíîãî çàêîíà, íî ïîñêîëüêó ýòî ðàñïðåäåëåíèå ÿâëÿåòñÿ ÷àñòíûì ñëó÷àåì ãàììà-ðàñïðåäåëåíèÿ ïðè α = 1, ìîæíî âîñïîëüçîâàòüñÿ ôóíêöèåé ГАММАОБР (ñì. ðàçäåë 4.7.3), åñëè ïîëîæèòü â íåé âòîðîé àðãóìåíò ðàâíûì 1. Îòìåòèì, ÷òî òðåòèé àðãóìåíò â ýòîé ôóíêöèè çàäàåò ïàðàìåòð θ, à íå λ. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 11.6. Ðèñ. 11.6. Êðèòåðèè ïðîâåðêè çíà÷åíèÿ ïàðàìåòðà ïîêàçàòåëüíîãî ðàñïðåäåëåíèÿ 340 Часть III. Анализ одномерных выборок 11.3. Проверка гипотезы о значении параметра биномиального распределения Ïîñòðîåíèå êðèòåðèÿ ïðîâåðêè ãèïîòåçû î çíà÷åíèè ïàðàìåòðà áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êàê è ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ áèíîìèàëüíîé âåðîÿòíîñòè (ñì. ðàçäåë 10.8), ìîæíî ðàññìîòðåòü îòäåëüíî äëÿ ñëó÷àåâ, êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì è êîãäà âûáîðêà ñîäåðæèò ðåçóëüòàòû íåñêîëüêèõ íåçàâèñèìûõ ýêñïåðèìåíòîâ. Îäíàêî, ïîñêîëüêó êðèòåðèè â îáîèõ ñëó÷àÿõ ñ âû÷èñëèòåëüíîé òî÷êè çðåíèÿ ïðàêòè÷åñêè íå îòëè÷àþòñÿ, ðàññìîòðèì òîëüêî ñëó÷àé, êîãäà âûáîðêà ñîäåðæèò íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêà õ1, õ2, ..., xn ÿâëÿåòñÿ ðåçóëüòàòîì íàáëþäåíèÿ çà îäíèì ýêñïåðèìåíòîì, ñîñòîÿùèì èç n îäèíàêîâûõ èñïûòàíèé, â êàæäîì èç êîòîðûõ ñ âåðîÿòíîñòüþ p ìîæåò ïðîèçîéòè èñõîä “1” è ñ âåðîÿòíîñòüþ (1 – p) — èñõîä “0”. Çäåñü xi ðàâíî 1, åñëè â i-ì èñïûòàíèè ïðîèçîøåë èñõîä “1”, è 0 â ïðîòèâíîì ñëó÷àå. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: ð = ð0 Í0: ð ≤ ð0 Í0: ð ≥ ð0 Í1: ð ≠ ð0 Í1: ð > ð0 Í1: ð < ð0 Çäåñü ð0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Êàê óêàçûâàëîñü â ðàçäåëå 10.8, íåñìåùåííîé è ýôôåêòèâíîé îöåíêîé äëÿ âåðîÿòíîñòè ð áóäåò ñòàòèñòèêà pˆ = r / n , ãäå r — êîëè÷åñòâî èñõîäîâ “1”. Ñëó÷àéíàÿ âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Ðàñïðåäåëåíèå ñòàòèñòèêè p̂ àñèìïòîòè÷åñêè íîðìàëüíî ñ ïàðàìåòðàìè m = p è σ2 = p(1 – p)/n. Òàê æå, êàê è äîâåðèòåëüíûå èíòåðâàëû äëÿ âåðîÿòíîñòè ð, êðèòåðèè ïðîâåðêè çíà÷åíèÿ ýòîé âåðîÿòíîñòè ñòðîÿòñÿ èëè íà îñíîâå áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìååò ñëó÷àéíàÿ âåëè÷èíà r, èëè íà îñíîâå àñèìïòîòè÷åñêîé íîðìàëüíîñòè ðàñïðåäåëåíèÿ ñòàòèñòèêè p̂ . 11.3.1. Использование биномиального распределения Ñðàçó îòìåòèì, ÷òî çäåñü áèíîìèàëüíîå ðàñïðåäåëåíèå çàìåíÿåòñÿ Fðàñïðåäåëåíèåì ïî èçâåñòíîìó ñîîòíîøåíèþ Ð(Õ ≤ k) = Fn–k,k+1(1 – p), ãäå Õ — ñëó÷àéíàÿ âåëè÷èíà, èìåþùàÿ áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p, à Fn–k,k+1 — ôóíêöèÿ F-ðàñïðåäåëåíèÿ ñ ñîîòâåòñòâóþùèìè ïàðàìåòðàìè. Ýòî æå ñîîòíîøåíèå èñïîëüçîâàëîñü â ðàçäåëå 10.8.1 ïðè ïîñòðîåíèè äîâåðèòåëüíîãî èíòåðâàëà äëÿ âåðîÿòíîñòè ð. Âû÷èñëåíèÿ. Z= Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè Y= 1 − p0 r , n + 1 − r p0 n − r p0 . Îáå ñòàòèñòèêè ïðèìåíÿþòñÿ äëÿ êðèòåðèÿ ðàâåíñòâà; äëÿ êðèr + 1 1 − p0 òåðèÿ íåðàâåíñòâà á) èñïîëüçóåòñÿ ñòàòèñòèêà Y, äëÿ êðèòåðèÿ íåðàâåíñòâà â) — ñòàòèñòèêà Z. Глава 11. Проверка гипотез о параметрах распределений 341 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç âåëè÷èíà r èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è p. Äëÿ âû÷èñëåíèÿ êâàíòèëåé ýòîãî ðàñïðåäåëåíèÿ, êîòîðûå íåîáõîäèìû äëÿ ïîñòðîåíèÿ êðèòè÷åñêîé îáëàñòè, èñïîëüçóåòñÿ F-ðàñïðåäåëåíèå ñ ñîîòâåòñòâóþùèìè çíà÷åíèÿìè ñòåïåíåé ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t1 êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – r) è 2r ñòåïåíÿìè ñâîáîäû è t2 êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(r + 1) è 2(n – r) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿþòñÿ íåðàâåíñòâà Y ≤ t1 è Z ≤ t2. Åñëè õîòÿ áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – r) è 2r ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Y ≤ tâ. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α Fðàñïðåäåëåíèÿ ñ 2(r + 1) è 2(n – r) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Z. Êîììåíòàðèé. Äàííûé êðèòåðèé, â îñíîâíîì, ïðèìåíÿåòñÿ ê âûáîðêàì ìàëîãî îáúåìà. Äëÿ âûáîðîê áîëüøîãî îáúåìà ÷àùå ïðèìåíÿåòñÿ àñèìïòîòè÷åñêèé êðèòåðèé, îñíîâàííûé íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì (ñì. ñëåäóþùèé ðàçäåë). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.7 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 30 íàáëþäåíèé çà ýêñïåðèìåíòîì, ãäå ñ âåðîÿòíîñòüþ 0,4 ïðîèñõîäèò ñîáûòèå “1”. Ýòà âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà ïàêåòà àíàëèçà Генерация случайных чисел. Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, òàêæå ïîêàçàíû íà ðèñ. 11.7.  ÿ÷åéêàõ Ñ4:Ñ7 äëÿ óïðîùåíèÿ ôîðìóë, âû÷èñëÿþùèõ êâàíòèëè, ïîäñ÷èòàíû ñîîòâåòñòâóþùèå çíà÷åíèÿ ñòåïåíåé ñâîáîäû: 2(n + 1 – r), 2r, 2(r + 1) è 2(n – r). Ðèñ. 11.7. Êðèòåðèé ïðîâåðêè çíà÷åíèÿ âåðîÿòíîñòè ð 342 Часть III. Анализ одномерных выборок 11.3.2. Асимптотический критерий Ïðè äîñòàòî÷íî áîëüøîì n (n ≥ 30) ïðèáëèæåííûé êðèòåðèé äëÿ ïðîâåðêè çíà÷åíèÿ âåðîÿòíîñòè ð ñòðîèòñÿ òàêèì îáðàçîì. Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = r − np0 np0 (1 − p0 ) . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Êîììåíòàðèé. Äàííûé êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è ïðèìåíÿåòñÿ, â îñíîâíîì, ê âûáîðêàì áîëüøîãî îáúåìà. Äëÿ ìàëûõ âûáîðîê ïðèìåíÿåòñÿ êðèòåðèé, îïèñàííûé â ïðåäûäóùåì ðàçäåëå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.8 â ñòîëáöå À ïîêàçàíà âûáîðêà, êîòîðàÿ èñïîëüçîâàëàñü â ïðåäûäóùåì ïðèìåðå. Âåðîÿòíîñòü ñîáûòèÿ “1” çäåñü ðàâíà 0,4. Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, òàêæå ïîêàçàíû íà ðèñ. 11.8. Ðèñ. 11.8. Àñèìïòîòè÷åñêèé êðèòåðèé ïðîâåðêè çíà÷åíèÿ âåðîÿòíîñòè ð 11.4. Критерии проверки гипотез о значении медианы Ðàññìîòðèì äâà êðèòåðèÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû, êîòîðûå â ñòàòèñòè÷åñêîì àíàëèçå èñïîëüçóþòñÿ íå òîëüêî äëÿ íåïîñðåäñòâåííîé ïðîâåð- Глава 11. Проверка гипотез о параметрах распределений 343 êè çíà÷åíèÿ ìåäèàíû, íî è äëÿ äðóãèõ öåëåé, íàïðèìåð êàê îöåíêà öåíòðà ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèÿ, åñëè ïî êàêèì-ëèáî ïðè÷èíàì íåëüçÿ äëÿ ýòèõ öåëåé èñïîëüçîâàòü ìàòåìàòè÷åñêîå îæèäàíèå. (Äëÿ íåêîòîðûõ ðàñïðåäåëåíèé ìàòåìàòè÷åñêîå îæèäàíèå ìîæåò ïðîñòî íå ñóùåñòâîâàòü, êàê, íàïðèìåð, ó ðàñïðåäåëåíèè Êîøè.) Êðîìå òîãî, îïèñàííûå íèæå êðèòåðèè ÿâëÿþòñÿ ñâîáîäíûìè îò ðàñïðåäåëåíèÿ, ò.å. íåïàðàìåòðè÷åñêèìè. Ïîýòîìó èõ ìîæíî èñïîëüçîâàòü “áåç îãëÿäêè” íà èñõîäíîå ðàñïðåäåëåíèå âûáîðêè, òèï êîòîðîãî ÷àñòî òðóäíî îïðåäåëèòü. Äëÿ ñèììåòðè÷íûõ ðàñïðåäåëåíèé ìåäèàíà è ìàòåìàòè÷åñêîå îæèäàíèå ñîâïàäàþò, ïîýòîìó äàííûå êðèòåðèè òàêæå ìîæíî èñïîëüçîâàòü äëÿ ïðîâåðêè çíà÷åíèé ìàòåìàòè÷åñêèõ îæèäàíèé òàêèõ ðàñïðåäåëåíèé. Íî åñëè âñåòàêè èçâåñòåí òèï ðàñïðåäåëåíèÿ, òî â ïîñëåäíåì ñëó÷àå íàäåæíåå ïðèìåíÿòü êðèòåðèè, èñïîëüçóþùèå èíôîðìàöèþ î òèïå ðàñïðåäåëåíèÿ. 11.4.1. Критерий знаков Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn íåçàâèñèìû è âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Çíà÷åíèå ìåäèàíû m íåèçâåñòíî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: m = m0 Í0: m ≤ m0 Í0: m ≥ m0 Í1: m ≠ m0 Í1: m > m0 Í1: m < m0 Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α.  ýòîì êðèòåðèè â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñïîëüçóåòñÿ ïîäñ÷èòàííîå ÷èñëî R âûáîðî÷íûõ çíà÷åíèé, êîòîðûå áîëüøå m0. Åñëè ñïðàâåäëèâû íóëåâûå ãèïîòåçû, òî ñëó÷àéíàÿ âåëè÷èíà R èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è ð = 0,5. Êàê è â êðèòåðèÿõ ïðîâåðêè áèíîìèàëüíûõ âåðîÿòíîñòåé, çäåñü ìîæíî ïîñòðîèòü èëè òî÷íûé êðèòåðèé, îñíîâàííûé íà áèíîìèàëüíîì ðàñïðåäåëåíèè âåëè÷èíû R, ëèáî àñèìïòîòè÷åñêèé, èñïîëüçóþùèé àïïðîêñèìàöèþ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Ðàññìîòðèì ñíà÷àëà òî÷íûé êðèòåðèé. Точный критерий знаков Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà R, ðàâíàÿ êîëè÷åñòâó âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïî âåëè÷èíå áîëüøå m0. Äîïîëíèòåëüíî âû÷èñëÿþòñÿ ñòàòèñòèêè Y = n−R R , Z= . Îáå ñòàòèñòèêè ïðèìåíÿþòñÿ äëÿ R +1 n +1− R êðèòåðèÿ ðàâåíñòâà; äëÿ êðèòåðèÿ íåðàâåíñòâà á) èñïîëüçóåòñÿ ñòàòèñòèêà Y, äëÿ êðèòåðèÿ íåðàâåíñòâà â) — ñòàòèñòèêà Z. Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà R èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è 0,5. Îäíàêî äëÿ ïîëó÷åíèÿ êðèòè÷åñêèõ çíà÷åíèé, êîòîðûå îñíîâàíû íà êâàíòèëÿõ áèíîìèàëüíîãî ðàñïðåäåëåíèÿ, êàê è â êðèòåðèè î çíà÷åíèè áèíîìèàëüíîé âåðîÿòíîñòè (ðàçäåë 11.3.1), èñïîëüçóåòñÿ F-ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t1 êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – R) è 2R ñòåïåíÿìè ñâîáîäû è t2 êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñ 2(R + 1) è 2(n – R) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿþòñÿ íåðàâåíñòâà Y ≤ t1 è Z ≤ t2. Åñëè õîòÿ áû îäíî èç ýòèõ íåðàâåíñòâ íå âûïîëíÿåòñÿ, ãèïîòåçà Í0 îòêëîíÿåòñÿ. 344 Часть III. Анализ одномерных выборок Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tâ êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñ 2(n + 1 – R) è 2R ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Y ≤ tâ. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå tí êàê êâàíòèëü ïîðÿäêà α Fðàñïðåäåëåíèÿ ñ 2(R + 1) è 2(n – R) ñòåïåíÿìè ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ Z. Êîììåíòàðèè 1. Åñëè êàêîå-ëèáî âûáîðî÷íîå çíà÷åíèå ðàâíî m0, òî îíî íå ó÷èòûâàåòñÿ, à çíà÷åíèå n óìåíüøàåòñÿ íà 1. 2. Äàííûé êðèòåðèé, â îñíîâíîì, ïðèìåíÿåòñÿ ê âûáîðêàì ìàëîãî îáúåìà. Äëÿ âûáîðîê áîëüøîãî îáúåìà ÷àùå ïðèìåíÿåòñÿ àñèìïòîòè÷åñêèé êðèòåðèé, îñíîâàííûé íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì (ñì. ñëåäóþùèé ðàçäåë). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.9 â ñòîëáöå À ïîêàçàíà âûáîðêà, ñîäåðæàùàÿ 30 çíà÷åíèé, ðàâíîìåðíî ðàñïðåäåëåííûõ íà èíòåðâàëå [0, 10] (òàêèì îáðàçîì, èñòèííîå çíà÷åíèå ìåäèàíû ðàâíî 5). Âñå ôîðìóëû Excel, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ êðèòåðèÿ, òàêæå ïîêàçàíû íà ðèñ. 11.9. Çíà÷åíèå ñòàòèñòèêè R âû÷èñëÿåòñÿ ñ ïîìîùüþ ôîðìóëû ìàññèâà {=СЧЁТ(ЕСЛИ(Выборка>E1;Выборка;""))}. Ðàáîòà ïîäîáíûõ ôîðìóë îïèñàíà â ðàçäåëå 6.1.4. Ïîñêîëüêó äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé âåðîÿòíîñòü òîãî, ÷òî ñëó÷àéíàÿ âåëè÷èíà ïðèìåò êàêîå-ëèáî êîíêðåòíîå çíà÷åíèå, ðàâíà íóëþ, òî çäåñü ïðîâåðêà íà ñîâïàäåíèå âûáîðî÷íîãî çíà÷åíèÿ è m0 íå âûïîëíÿåòñÿ. Äîáàâèòü ïîäîáíóþ ïðîâåðêó â ðàñ÷åòíûå ôîðìóëû íåñëîæíî, íî âîçíèêàåò íåîáõîäèìîñòü â íåêîòîðûõ ïðîìåæóòî÷íûõ âû÷èñëåíèÿõ.  ÿ÷åéêàõ Ñ4:Ñ7 äëÿ óïðîùåíèÿ ôîðìóë, âû÷èñëÿþùèõ êâàíòèëè, îòäåëüíî ïîäñ÷èòàíû ñîîòâåòñòâóþùèå çíà÷åíèÿ ñòåïåíåé ñâîáîäû: 2(n + 1 – r), 2r, 2(r + 1) è 2(n – r). Ðèñ. 11.9. Òî÷íûé êðèòåðèé çíàêîâ Глава 11. Проверка гипотез о параметрах распределений 345 Асимптотический критерий знаков Âû÷èñëåíèÿ. Âû÷èñëÿåòñÿ ñòàòèñòèêà R, ðàâíàÿ êîëè÷åñòâó âûáîðî÷íûõ çíà÷åíèé, êîòîðûå ïî âåëè÷èíå áîëüøå m0. Äàëåå âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 2R − n n . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Êîììåíòàðèè 1. Åñëè êàêîå-ëèáî âûáîðî÷íîå çíà÷åíèå ðàâíî m0, òî îíî íå ó÷èòûâàåòñÿ, à çíà÷åíèå n óìåíüøàåòñÿ íà 1. 2. Äàííûé êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è ïðèìåíÿåòñÿ, â îñíîâíîì, ê âûáîðêàì áîëüøîãî îáúåìà (n > 50). Åñëè n ≤ 50, ðåêîìåíäóåòñÿ èñïîëüçîâàòü “èñïðàâëåííóþ” ñòàòèñòèêó Ò âèäà T = 2R − n + 1 n , êîòîðàÿ òàêæå èìå- åò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äëÿ ìàëûõ âûáîðîê (n ≤ 20) ïðèìåíÿåòñÿ êðèòåðèé, îïèñàííûé â ïðåäûäóùåì ðàçäåëå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ äàííîãî êðèòåðèÿ, åñëè ïîäñ÷èòàíî çíà÷åíèå R, íå âûçûâàåò òðóäíîñòåé. Ôîðìóëà äëÿ âû÷èñëåíèÿ çíà÷åíèÿ R ïîêàçàíà â ïðåäûäóùåì ðàçäåëå. 11.4.2. Критерий знаковых рангов Уилкоксона Ñ÷èòàåòñÿ, ÷òî êðèòåðèé çíàêîâ, îïèñàííûé â ïðåäûäóùåì ðàçäåëå, íå ó÷èòûâàåò çíà÷èòåëüíóþ ÷àñòü èíôîðìàöèè, ñîäåðæàùåéñÿ â âûáîðêå. Êðèòåðèé çíàêîâûõ ðàíãîâ Óèëêîêñîíà íå òîëüêî ñ÷èòàåò êîëè÷åñòâî îòðèöàòåëüíûõ èëè ïîëîæèòåëüíûõ ðàçíîñòåé xi – m0, íî è ó÷èòûâàåò ÷åðåç çíà÷åíèÿ ðàíãîâ îòíîñèòåëüíûå ðàçìåðû ýòèõ ðàçíîñòåé. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ õ1, õ2, ..., xn íåçàâèñèìû è âçÿòû èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè. Çíà÷åíèå ìåäèàíû m íåèçâåñòíî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: m = m0 Í0: m ≤ m0 Í0: m ≥ m0 Í1: m ≠ m0 Í1: m > m0 Í1: m < m0 Çäåñü m0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. 346 Часть III. Анализ одномерных выборок Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ ðàíãè ri âåëè÷èí |xi – m0|. Çíà÷åíèÿ, äëÿ êîòîðûõ xi – m0 = 0, èãíîðèðóþòñÿ. 2. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè V+ è V–, ðàâíûå ñóììå ðàíãîâ ri ïîëîæèòåëüíûõ ðàçíîñòåé xi – m0 è ñóììå ðàíãîâ îòðèöàòåëüíûõ ðàçíîñòåé xi – m0 ñîîòâåòñòâåííî. Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêè V+ è V– ðàñïðåäåëåíû îäèíàêîâî. Äëÿ âû÷èñëåíèÿ êðèòè÷åñêèõ çíà÷åíèé èñïîëüçóþòñÿ êâàíòèëè ñïåöèàëüíîãî ðàñïðåäåëåíèÿ, êîòîðîå èìåþò âåëè÷èíû V+ è V– [9]. Ýòè âåëè÷èíû òàêæå èìååò àñèìïòîòè÷åñêè íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì n(n + 1)/2 è äèñïåðñèåé n(n + 1)(2n + 1)/24. Ïîñêîëüêó ñòàòèñòèêè V+ è V– èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ, òî äëÿ ïðîâåðêè ãèïîòåç èñïîëüçóåòñÿ îäíà èç ýòèõ ñòàòèñòèê. Âîçüìåì â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè âåëè÷èíó V+ è èñïîëüçóåì åå àñèìïòîòè÷åñêóþ íîðìàëüíîñòü. Äëÿ óäîáñòâà âû÷èñëèì âåëè÷èíó T = V+ − n(n + 1) / 4 n(n + 1)(2n + 1) / 24 , êîòîðàÿ èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Êîììåíòàðèè 1. Îïèñàííûé êðèòåðèé ñ èñïîëüçîâàíèåì íîðìàëüíîãî ðàñïðåäåëåíèÿ ïðèìåíÿåòñÿ äëÿ âûáîðîê, îáúåì êîòîðûõ áîëüøå 20. Äëÿ ìàëûõ âûáîðîê íåîáõîäèìî èñïîëüçîâàòü òî÷íîå ðàñïðåäåëåíèå ñòàòèñòèê V+ è V–. 2.  [18, ñ. 124] ïðèâîäèòñÿ äðóãàÿ àïïðîêñèìàöèÿ ðàñïðåäåëåíèÿ âåëè÷èí V+ è V–, ïîñòðîåííàÿ íà îñíîâå ðàñïðåäåëåíèÿ Ñòüþäåíòà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 11.10 â ñòîëáöå À ïîêàçàíà âûáîðêà èç 30 çíà÷åíèé, èìåþùèõ ðàâíîìåðíîå ðàñïðåäåëåíèå íà èíòåðâàëå [0, 10], è îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ ðåàëèçàöèè êðèòåðèÿ. Ê ñîæàëåíèþ, â Excel íå óäàåòñÿ ïîäñ÷èòàòü çíà÷åíèå V+ ñ ïîìîùüþ îäíîé ôîðìóëû òîëüêî ïî âûáîðî÷íûì çíà÷åíèÿì. Äëÿ âû÷èñëåíèÿ ýòîãî çíà÷åíèÿ ïðèøëîñü îòäåëüíî ïîäñ÷èòàòü àáñîëþòíûå âåëè÷èíû ðàçíîñòåé xi – m0 (ñòîëáåö Â, ôîðìóëà ìàññèâà {=ABS(Выборка-G1)}, äèàïàçîí ÿ÷ååê ñ âûáîðî÷íûìè çíà÷åíèÿìè íàçâàí Выборка).  ñòîëáöå Ñ ïîäñ÷èòàíû ðàíãè àáñîëþòíûõ âåëè÷èí ðàçíîñòåé xi – m0 ïî ôîðìóëå ìàññèâà {=РАНГ(Разности;Разности;1)} (çäåñü äèàïàçîí ÿ÷ååê ñî çíà÷åíèÿìè â ñòîëáöå  íàçâàí Разности, ôóíêöèÿ РАНГ îïèñàíà â ðàçäåëå 4.2.5). Ïîñëå ýòèõ ïðåäâàðèòåëüíûõ âû÷èñëåíèé çíà÷åíèå V+ âû÷èñëÿåòñÿ â ÿ÷åéêå Å2 ñ ïîìîùüþ ôîðìóëû ìàññèâà {=СУММ(ЕСЛИ(Выборка>G1;Ранги;""))} (â ÿ÷åéêå G1 ñîäåðæèòñÿ çíà÷åíèå m0, äèàïàçîí ÿ÷ååê, ñîäåðæàùèé ðàíãè, íàçâàí Ранги). Îñòàëüíûå ôîðìóëû ïîêàçàíû íà ðèñ. 11.10. Глава 11. Проверка гипотез о параметрах распределений 347 Ðèñ. 11.10. Ðåàëèçàöèÿ êðèòåðèÿ çíàêîâûõ ðàíãîâ Óèëêîêñîíà 348 Часть III. Анализ одномерных выборок Глава 12 Сравнение одномерных выборок Å ñëè èìååòñÿ íåñêîëüêî îäíîìåðíûõ âûáîðîê, òî, ïðåæäå ÷åì ïðèñòóïèòü ê èõ ñòàòèñòè÷åñêîìó àíàëèçó, îáû÷íî ñòàâÿò äâà ñëåäóþùèõ îáùèõ âîïðîñà. • Èìåþò ëè ýòè âûáîðêè îäèíàêîâûå ðàñïðåäåëåíèÿ, èëè, äðóãèìè ñëîâàìè, ïîëó÷åíû ëè îíè èç îäíîé ãåíåðàëüíîé ñîâîêóïíîñòè? • Èìåþò ëè çíà÷åíèÿ âûáîðî÷íûõ ïàðàìåòðîâ çíà÷èìûå ðàçëè÷èÿ èëè èõ ìîæíî ñ÷èòàòü ðàâíûìè? Íà ïåðâûé âîïðîñ ïîìîãàþò îòâåòèòü ìåòîäû ñðàâíåíèÿ âûáîðî÷íûõ ðàñïðåäåëåíèé, îïèñàííûå â ðàçäåëå 12.1. Íà âòîðîé âîïðîñ ìîæíî îòâåòèòü äâóìÿ ñïîñîáàìè: ïóòåì ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé èëè îòíîøåíèé ñðàâíèâàåìûõ ïàðàìåòðîâ ëèáî ñ ïîìîùüþ êðèòåðèåâ ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ðàçíîñòåé èëè îòíîøåíèé ýòèõ ïàðàìåòðîâ. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ ïîêàçàíî â ðàçäåëå 12.2, à êðèòåðèè ïðîâåðêè ãèïîòåç — â ðàçäåëå 12.3. 12.1. Сравнение выборочных распределений Äëÿ ñðàâíåíèÿ âûáîðî÷íûõ ðàñïðåäåëåíèé ðàçðàáîòàíî ìíîãî êðèòåðèåâ (èõ ÷àñòî íàçûâàþò êðèòåðèÿìè îäíîðîäíîñòè), èìåþùèõ ðàçëè÷íûå òåîðåòè÷åñêèå îñíîâû. Ýòè êðèòåðèè, êàê ïðàâèëî, íåïàðàìåòðè÷åñêèå, ïîñêîëüêó, åñëè èçâåñòåí êëàññ ðàñïðåäåëåíèé, êîòîðîìó ïîä÷èíÿþòñÿ âûáîðî÷íûå çíà÷åíèÿ, â ýòîì ñëó÷àå ñòàâèòñÿ çàäà÷à ñðàâíåíèÿ íå ñàìèõ ðàñïðåäåëåíèé, à èõ ïàðàìåòðîâ, è ýòà çàäà÷à ðåøàåòñÿ èíûìè ìåòîäàìè.  ïðèíöèïå, îïèñàííûå íèæå êðèòåðèè ìîæíî ïðèìåíÿòü è äëÿ ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé, åñëè àïðèîðè ïðåäïîëîæèòü, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ïðèíàäëåæàò îäíîìó êëàññó ðàñïðåäåëåíèé è íåîáõîäèìî ñðàâíèòü çíà÷åíèÿ îäíîãî ïàðàìåòðà ðàñïðåäåëåíèÿ.  ýòîì ñëó÷àå îòêëîíåíèå íóëåâîé ãèïîòåçû, ñîñòîÿùåé â òîì, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ñîâïàäàþò, ãîâîðèò î òîì, ÷òî çíà÷åíèÿ äàííîãî ïàðàìåòðà ðàçëè÷íû. Îäíàêî ñ ïîìîùüþ ýòèõ êðèòåðèåâ íåâîçìîæíî îöåíèòü ñòåïåíü ðàçëè÷èÿ çíà÷åíèé ïàðàìåòðîâ. Ðàññìîòðèì íåñêîëüêî êðèòåðèåâ, íà÷èíàÿ ñ íàèáîëåå ïðîñòûõ (è ìåíåå òî÷íûõ). Îáðàùàåì âíèìàíèå, ÷òî áîëüøèíñòâî îïèñàííûõ êðèòåðèåâ ðàññ÷èòàíî íà íåïðåðûâíûå ðàñïðåäåëåíèÿ ëèáî òðåáóþò íåêîòîðûõ ìîäèôèêàöèé äëÿ ðàáîòû ñ äèñêðåòíûìè ðàñïðåäåëåíèÿìè. Äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé ðåêîìåíäóåì ñðàçó îáðàòèòüñÿ ê êðèòåðèþ õè-êâàäðàò (ðàçäåë 12.5), åñëè íåò êàêèõ-ëèáî “ïðîòèâîïîêàçàíèé” èëè åñëè ñ ïîìîùüþ ýòèõ êðèòåðèåâ âû íå ïðîâåðÿåòå ðàçëè÷èå â çíà÷åíèÿõ ïàðàìåòðîâ ðàñïðåäåëåíèé, êàê ñêàçàíî âûøå. 12.1.1. Непараметрический критерий медианы Ýòîò êðèòåðèé ÿâëÿåòñÿ ìîäèôèêàöèåé êðèòåðèÿ çíàêîâ äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû (ñì. ðàçäåë 11.4.1), îáîáùåííûé äëÿ ñëó÷àÿ íåñêîëüêèõ âûáîðîê. Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk. Ãèïîòåçû Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âñå k âûáîðîê îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå k âû÷èñëÿåòñÿ âûáîðî÷íàÿ ìåäèàíà m ñëåäóþùèì îáðàçîì (äàëåå n = ∑ ni ). i =1 a) Äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n). Âûáîðî÷íàÿ ìåäèàíà m = õ(k+1), åñëè n = 2k + 1, è m = (õ(k) + õ(k+1))/2, åñëè n = 2k. b) Äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé ïî îáúåäèíåííîé âûáîðêå ðàññ÷èòûâàåòñÿ ÷àñòîòíàÿ òàáëèöà, êîòîðàÿ ñîðòèðóåòñÿ ïî âîçðàñòàíèþ çíà÷åíèé. Âû÷èñëÿåòñÿ çíà÷åíèå õm, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm, ìåíüøàÿ n/2, è ñëåäóþùåå ïî âåëè÷èíå çíà÷åíèå õm+1, êîòîðîìó ñîîòâåòñòâóåò íàêîïëåííàÿ ÷àñòîòà Fm+1, áîëüøàÿ èëè ðàâíàÿ n/2. Òîãäà ìåäèàíà m âû÷èñëÿåòñÿ ïî ôîðìóëå M = xm + ( xm +1 − xm ) n / 2 − Fm . Fm +1 2. Äëÿ êàæäîé i-é âûáîðêè ïîäñ÷èòûâàåòñÿ ÷èñëî çíà÷åíèé Ri, ïðåâîñõîäÿùèõ m. Åñëè åñòü îäèíî÷íûå âûáîðî÷íûå çíà÷åíèÿ, ñîâïàäàþùèå ñî çíà÷åíèåì m, òî ýòè çíà÷åíèÿ èñêëþ÷àþòñÿ èç ïîäñ÷åòîâ, à çíà÷åíèå îáúåìà ñîîòâåòñòâóþùåé âûáîðêè óìåíüøàåòñÿ íà åäèíèöó. Äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé âåðîÿòíî ñîâïàäåíèå ñ âûáîðî÷íîé ìåäèàíîé m ñðàçó íåñêîëüêèõ çíà÷åíèé â îäíîé âûáîðêå.  ýòîì ñëó÷àå, åñëè òàêèõ çíà÷åíèé ÷åòíîå ÷èñëî, ïîëîâèíà èç íèõ ñ÷èòàåòñÿ ìåíüøèìè m, à ïîëîâèíà áîëüøèìè m. Åñëè æå òàêèõ çíà÷åíèé íå÷åòíîå ÷èñëî, òî îòáðàñûâàåòñÿ îäíî çíà÷åíèå (îáúåì âûáîðêè òàêæå óìåíüøàåòñÿ íà åäèíèöó), à îñòàëüíûå äåëÿòñÿ ïîïîëàì è ñ÷èòàåòñÿ, ÷òî îäíà ïîëîâèíà áîëüøå m, à äðóãàÿ — ìåíüøå m. Îáû÷íî äëÿ óäîáñòâà âû÷èñëåíèé ñîñòàâëÿåòñÿ òàáëèöà ñëåäóþùåãî âèäà. ×èñëî çíà÷åíèé, áîëüøèõ m ×èñëî çíà÷åíèé, ìåíüøèõ m Âñåãî Âûáîðêà 1 R1 n1 – R 1 n1 Âûáîðêà 2 ... R2 ... n2 – R 2 ... n2 ... Rk nk – R k nk k n = ∑ ni Âûáîðêà k Âñåãî k ∑R i i =1 350 Часть III. Анализ одномерных выборок n − ∑ Ri i =1 k i =1 k 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ i =1 Ri2 + (ni − Ri ) 2 −n. ni / 2 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ tí êàê êâàíòèëü ïîðÿäêà α/2 ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû è tâ êàê êâàíòèëü ïîðÿäêà 1 – α/2 òîãî æå ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî tí ≤ Ò ≤ tâ, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèé. Êàê è êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè (ñì. ñëåäóþùèé ðàçäåë), ýòîò êðèòåðèé ñêîðåå “óëàâëèâàåò” ðàçëè÷èÿ â ïîëîæåíèè ìåäèàí âûáîðîê, à íå ðàçëè÷èÿ â ôîðìå ðàñïðåäåëåíèé. Ïîýòîìó, ñ îäíîé ñòîðîíû, åìó ñëåäóåò, ïî âîçìîæíîñòè, ïðåäïî÷åñòü áîëåå íàäåæíûå êðèòåðèè, à ñ äðóãîé ñòîðîíû, åãî ìîæíî èñïîëüçîâàòü êàê êðèòåðèé ñîâïàäåíèÿ “ñðåäíèõ çíà÷åíèé” âûáîðîê. Ïðàêòè÷åñêóþ ðåàëèçàöèþ ïîêàæåì îòäåëüíî äëÿ íåïðåðûâíûõ è äèñêðåòíûõ ðàñïðåäåëåíèé. Реализация критерия для непрерывных распределений Ñíà÷àëà ïîêàæåì, êàê ïîäñ÷èòàòü çíà÷åíèå âûáîðî÷íîé ìåäèàíû. Íà ðèñ. 12.1 ïîêàçàíû òðè âûáîðêè îáúåìîì ñîîòâåòñòâåííî 20, 30 è 40 çíà÷åíèé. Âñå âûáîðêè èìåþò íîðìàëüíûå ðàñïðåäåëåíèÿ, ïðè÷åì ïåðâûå äâå âûáîðêè — ñòàíäàðòíîå, à òðåòüÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íîé äèñïåðñèåé è ìàòåìàòè÷åñêèì îæèäàíèåì, ðàâíûì 1. Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ôîðìóë ìàññèâîâ {=НОРМСТОБР(СЛЧИС())} и {=НОРМОБР(СЛЧИС();1;1)}. Ðèñ. 12.1. Âû÷èñëåíèå âûáîðî÷íîé ìåäèàíû Ê ñîæàëåíèþ, íàéòè çíà÷åíèå âûáîðî÷íîé ìåäèàíû íå óäàåòñÿ áåç ÿâíîãî âû÷èñëåíèÿ ðàíãîâ çíà÷åíèé îáúåäèíåííîé âûáîðêè. Ýòè ðàíãè âû÷èñëÿþòñÿ â ñòîëáöàõ Глава 12. Сравнение одномерных выборок 351 D:F ñ ïîìîùüþ ôîðìóëû ìàññèâîâ {=РАНГ(A2:C41;A2:C41;1)}, îõâàòûâàþùåé äèàïàçîí D2:F41. Çäåñü A2:C41 — äèàïàçîí ÿ÷ååê, ñîäåðæàùèé âñå âûáîðî÷íûå çíà÷åíèÿ. Ïîñêîëüêó âûáîðêè èìåþò ðàçíûå îáúåìû, ÷àñòü ÿ÷ååê äèàïàçîíà D2:F41 áóäåò ñîäåðæàòü çíà÷åíèå îøèáêè #Н/Д (â òåõ ÿ÷åéêàõ, êîòîðûå ñîîòâåòñòâóþò ïóñòûì ÿ÷åéêàì äèàïàçîíà A2:C41), îäíàêî ýòî íå ïîâëèÿåò íà ïîñëåäóþùèå âû÷èñëåíèÿ.  ÿ÷åéêàõ Í2:Í4 âû÷èñëÿþòñÿ îáúåìû âûáîðîê, à â ÿ÷åéêå Í5 — îáúåì îáúåäèíåííîé âûáîðêè (ôîðìóëû ïðèâåäåíû íà ðèñ. 12.1).  ÿ÷åéêàõ Í6 è Í7 â çàâèñèìîñòè îò ÷åòíîñòè èëè íå÷åòíîñòè çíà÷åíèÿ îáúåìà îáúåäèíåííîé âûáîðêè îïðåäåëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé, ïî êîòîðûì áóäåò âû÷èñëÿòüñÿ âûáîðî÷íàÿ ìåäèàíà. Åñëè çíà÷åíèå îáúåìà îáúåäèíåííîé âûáîðêè íå÷åòíî, òî ðàíãè áóäóò ñîâïàäàòü. Äàëåå ïî ýòèì çíà÷åíèÿì ðàíãîâ íàäî íàéòè ñîîòâåòñòâóþùèå èì âûáîðî÷íûå çíà÷åíèÿ. Äëÿ îäíîé âûáîðêè ñäåëàòü ýòî íåñëîæíî ñ ïîìîùüþ ôóíêöèè ВПР (ïîäîáíûå âû÷èñëåíèÿ îïèñàíû â ðàçäåëå 10.11).  äàííîì ñëó÷àå ïðèìåíåíèå ôóíêöèè ВПР çàòðóäíåíî (ïîñêîëüêó ïîèñê íåîáõîäèìî âåñòè íå ïî îäíîìó ñòîëáöó, à ïî íåñêîëüêèì), íî òàêæå âîçìîæíî. Îäíàêî ïðèìåíèì ôóíêöèþ БИЗВЛЕЧЬ (ýòî ôóíêöèÿ èç êàòåãîðèè ôóíêöèé áàç äàííûõ). Ñèíòàêñèñ äàííîé ôóíêöèè: БИЗВЛЕЧЬ(Áàçà_äàííûõ;Ïîëå;Êðèòåðèé) Ýòà ôóíêöèÿ â áàçå äàííûõ (äèàïàçîí ÿ÷ååê, ñîäåðæàùèé áàçó äàííûõ, çàäàåòñÿ ïåðâûì àðãóìåíòîì ôóíêöèè) èçâëåêàåò çíà÷åíèå èç óêàçàííîãî ïîëÿ (âòîðîé àðãóìåíò) òîé çàïèñè, êîòîðàÿ óäîâëåòâîðÿåò êðèòåðèÿì ïîèñêà (äèàïàçîí ÿ÷ååê, ñîäåðæàùèé êðèòåðèé ïîèñêà, çàäàåòñÿ â êà÷åñòâå òðåòüåãî àðãóìåíòà).  äàííîì ñëó÷àå ñëîæíîñòü ïðèìåíåíèÿ ýòîé ôóíêöèè ñîñòîèò â òîì, ÷òî çàðàíåå íåèçâåñòíî, èç êàêîãî ïîëÿ (ò.å. âûáîðêè) èçâëåêàòü çíà÷åíèå. Èç ýòîãî ïîëîæåíèÿ ìîæíî âûéòè ñ ïîìîùüþ ôîðìóëû (îíà çàïèñàíà â ÿ÷åéêå Í8; ôîðìóëà â ÿ÷åéêå Í9 ïðàêòè÷åñêè ñîâïàäàåò ñ äàííîé) =БИЗВЛЕЧЬ(A1:F41;ЕСЛИ(ЕНД(ПОИСКПОЗ(H6;Ранги1;0)); ЕСЛИ(ЕНД(ПОИСКПОЗ(H6;Ранги2;0));3;2);1);J1:L4). Çäåñü äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âû÷èñëåííûå ðàíãè, íàçâàíû ñîîòâåòñòâåííî Ранги1, Ранги2 è Ранги3. ×òîáû ðàçîáðàòüñÿ, êàê ðàáîòàåò ýòà ôîðìóëà, ðàçîáüåì åå íà îòäåëüíûå ÷àñòè. Íà ðèñ. 12.2 òàêèå ÷àñòè-ôîðìóëû âûïîëíÿþòñÿ â ÿ÷åéêàõ Í12:Í16 (ôîðìóëà èç ÿ÷åéêè Í14 íå èñïîëüçóåòñÿ â êîíå÷íîé ôîðìóëå — îíà ïðèâåäåíà äëÿ ïîëíîòû êàðòèíû). Ôîðìóëû â ÿ÷åéêàõ Í12:Í14 îïðåäåëÿþò, êàêîé âûáîðêå ïðèíàäëåæèò âûáîðî÷íîå çíà÷åíèå ñ ðàíãîì, çíà÷åíèå êîòîðîãî çàïèñàíî â ÿ÷åéêå Í6. Îíè âîçâðàùàþò ÷èñëî, ðàâíîå ïîçèöèè âûáîðî÷íîãî çíà÷åíèÿ â âûáîðêå, åñëè ýòîò ðàíã ïðèíàäëåæèò äàííîé âûáîðêå.  ïðîòèâíîì ñëó÷àå ôîðìóëà âîçâðàùàåò çíà÷åíèå îøèáêè #Н/Д. (Äëÿ ïîÿñíåíèÿ â ñîñåäíèõ ÿ÷åéêàõ G12:G14 çàïèñàíû ÷èñëà (íå ôîðìóëû), ñîîòâåòñòâóþùèå íîìåðó âûáîðêè.) Òàêèì îáðàçîì, èìååì “èíäèêàòîð”, óêàçûâàþùèé íîìåð âûáîðêè, — âûáîðî÷íîå çíà÷åíèå ñ äàííûì ðàíãîì ïðèíàäëåæèò òîé âûáîðêå, äëÿ êîòîðîé ôîðìóëà âîçâðàùàåò ÷èñëî, à íå çíà÷åíèå îøèáêè. Íà îñíîâàíèè ýòîãî “èíäèêàòîðà” ïîñòðîåíà ôîðìóëà â ÿ÷åéêå Í15, êîòîðàÿ è âû÷èñëÿåò íîìåð âûáîðêè (ñðàâíèòå çíà÷åíèÿ â ýòîé ÿ÷åéêå è â ÿ÷åéêàõ G12:G14). Çäåñü èñïîëüçîâàíà ôóíêöèÿ ЕНД, êîòîðàÿ âîçâðàùàåò çíà÷åíèå ИСТИНА, åñëè åå àðãóìåíò èìååò çíà÷åíèå îøèáêè #Н/Д. Íàêîíåö, ôîðìóëà â ÿ÷åéêå Í16, àíàëîãè÷íàÿ ôîðìóëå â ÿ÷åéêå Í8, âîçâðàùàåò âûáîðî÷íîå çíà÷åíèå, ñîîòâåòñòâóþùåå óêàçàííîìó ðàíãó. Íîìåð âûáîðêè 352 Часть III. Анализ одномерных выборок îïðåäåëåí â ÿ÷åéêå Í15, êðèòåðèé îòáîðà çàäàí â äèàïàçîíå J1:L4. Êðèòåðèé ñîñòîèò èç óñëîâèé ðàâåíñòâà çíà÷åíèé ðàíãîâ â ïîëÿõ Ранги1, Ранги2 è Ранги3 çíà÷åíèþ ðàíãà â ÿ÷åéêå Í6. Óñëîâèÿ çàïèñàíû â îòäåëüíûõ ñòðîêàõ — ýòî îçíà÷àåò, ÷òî äëÿ îòáîðà çàïèñè äîëæíî âûïîëíÿòüñÿ õîòÿ áû îäíî èç ýòèõ óñëîâèé. Åñëè áû óñëîâèÿ áûëè çàïèñàíû â îäíó ñòðîêó, ýòî îçíà÷àëî áû, ÷òî äëÿ îòáîðà çàïèñè íåîáõîäèìî îäíîâðåìåííîå âûïîëíåíèå âñåõ óñëîâèé. Ðèñ. 12.2. Èçâëå÷åíèå çíà÷åíèÿ èç âûáîðîê Èòàê, çíà÷åíèå âûáîðî÷íîé ìåäèàíû ïîäñ÷èòàíî â ÿ÷åéêå Í10. Î÷åâèäíî, ÷òî âû÷èñëåíèÿ â ÿ÷åéêàõ Í8 è Í9 ÿâëÿþòñÿ ïðîìåæóòî÷íûìè è îò íèõ ìîæíî îñâîáîäèòüñÿ, ñîçäàâ îäíó áîëüøóþ ôîðìóëó äëÿ âû÷èñëåíèÿ ìåäèàíû. Îäíàêî òàêàÿ ôîðìóëà áóäåò ïðàêòè÷åñêè íå ÷èòàåìîé è ñòàíåò èñòî÷íèêîì ïîòåíöèàëüíûõ îøèáîê (õîòÿ áû ïðè ââîäå òàêîé ôîðìóëû). ×òîáû íåìíîãî îñâîáîäèòü ðàáî÷èé ëèñò, ñòîëáöû D:F, ñîäåðæàùèå ðàíãè, ìîæíî ñêðûòü, à ÿ÷åéêè ñ êðèòåðèÿìè äëÿ ôóíêöèè БИЗВЛЕЧЬ ïåðåìåñòèòü “çà ýêðàí” (íà âû÷èñëåíèÿ ýòî íå ïîâëèÿåò). Ïîñëå âû÷èñëåíèÿ çíà÷åíèÿ ìåäèàíû íåòðóäíî ïîäñ÷èòàòü çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè è êðèòè÷åñêèå çíà÷åíèÿ. Íà ðèñ. 12.3 ïîêàçàí çàêîí÷åííûé ðàáî÷èé ëèñò è ôîðìóëû äëÿ âû÷èñëåíèé. Îòìåòèì, ÷òî òàáëèöà (äèàïàçîí I2:L6), ñîäåðæàùàÿ êîëè÷åñòâà âûáîðî÷íûõ çíà÷åíèé, áîëüøèõ è ìåíüøèõ âûáîðî÷íîé ìåäèàíû, íå îáÿçàòåëüíà äëÿ âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè — ìîæíî ñîçäàòü îäíó óíèâåðñàëüíóþ ôîðìóëó. Îäíàêî çíà÷åíèÿ â ýòîé òàáëèöå óïðîùàþò äàëüíåéøèå âû÷èñëåíèÿ è, êðîìå òîãî, ïîçâîëÿþò êîíòðîëèðîâàòü ïðàâèëüíîñòü âû÷èñëåíèÿ, ïîñêîëüêó ñóììû â ÿ÷åéêàõ J6 è K6 âñåãäà äîëæíû áûòü ðàâíûìè [n/2]. Äëÿ ýòèõ æå öåëåé â ÿ÷åéêå Í11 âû÷èñëÿåòñÿ íîìåð âûáîðêè, êîòîðîé ïðèíàäëåæèò ìåäèàííîå çíà÷åíèå (åñëè ñóììàðíûé îáúåì îáúåäèíåííîé âûáîðêè âûðàæàåòñÿ ÷åòíûì ÷èñëîì, òî ýòî çíà÷åíèå íå èñïîëüçóåòñÿ).  ÿ÷åéêàõ L3:L5 âû÷èñëÿþòñÿ îáúåìû âûáîðîê ñ ó÷åòîì òîãî, ÷òî åñëè ìåäèàííîå çíà÷åíèå ñîâïàäàåò ñ âûáîðî÷íûì çíà÷åíèåì äàííîé âûáîðêè, òî îáúåì ýòîé âûáîðêè óìåíüøàåòñÿ íà 1. Ïîñêîëüêó äëÿ íåïðåðûâíûõ ðàñïðåäåëåíèé âåðîÿòíîñòü ñîâïàäàþùèõ çíà÷åíèé ðàâíà íóëþ, çäåñü íå ïðåäóñìîòðåíà ïðîâåðêà íàëè÷èÿ äðóãèõ ñîâïàäåíèé âûáîðî÷íûõ çíà÷åíèé ñ ìåäèàíîé. Глава 12. Сравнение одномерных выборок 353 Íà ðèñ. 12.4 ïîêàçàí òîò æå ðàáî÷èé ëèñò äëÿ íîâûõ âûáîðîê, èìåþùèõ îäèíàêîâûå ñòàíäàðòíûå íîðìàëüíûå ðàñïðåäåëåíèÿ è íå÷åòíîå ÷èñëî çíà÷åíèé â îáúåäèíåííîé âûáîðêå. Ðèñ. 12.3. Ðàáî÷èé ëèñò äëÿ êðèòåðèÿ ìåäèàíû Ðèñ. 12.4. Êðèòåðèé ìåäèàíû äëÿ íîâûõ äàííûõ Реализация критерия для дискретных распределений Çäåñü òàêæå ñíà÷àëà ïîäñ÷èòàåì çíà÷åíèå âûáîðî÷íîé ìåäèàíû. Íà ðèñ. 12.5 ïîêàçàíû äâå âûáîðêè îáúåìîì ñîîòâåòñòâåííî 30 è 50 çíà÷åíèé, ïðåäñòàâëåííûõ â âèäå ÷àñòîòíûõ òàáëèö è èìåþùèõ ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 2. Âûáîðêè ïîëó÷åíû ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел, çàòåì äëÿ íèõ ïîäñ÷èòàíû ÷àñòîòíûå òàáëèöû òàê, êàê ïîêàçàíî â ðàçäåëå 8.3.1. Ïî ýòèì ÷àñòîòíûì òàáëèöàì ïîäñ÷èòûâàþòñÿ ÷àñòîòû è íàêîïëåííûå ÷àñòîòû îáúåäèíåííîé âûáîðêè: ÷àñòîòû ïðîñòî ñêëàäûâàþòñÿ äëÿ îäèíàêîâûõ çíà÷åíèé, à íàêîïëåííûå ÷àñòîòû âû÷èñëÿþòñÿ òàê, êàê îïèñàíî â ðàçäåëå 8.3.1. Ñïîñîá 354 Часть III. Анализ одномерных выборок âû÷èñëåíèÿ ìåäèàíû îïèñàí âûøå, â ðàçäåëå Вычисления â ï. 1, b. Ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ ìåäèàíû, ïîêàçàíû íà ðèñ. 12.5. Çäåñü èíòåðâàë G3:G10, ñîäåðæàùèé çíà÷åíèÿ íàêîïëåííûõ ÷àñòîò, íàçâàí Нч. Òàêæå îòìåòèì ôîðìóëû â ÿ÷åéêàõ I3 è I4, â äàííîì ñëó÷àå âûïîëíÿþùèå ðîëü ôóíêöèè ВПР, êîòîðóþ íåëüçÿ ïðèìåíèòü íåïîñðåäñòâåííî áåç ïåðåñòàíîâêè ñòîëáöîâ òàê, ÷òîáû ñòîëáåö ñ íàêîïëåííûìè ÷àñòîòàìè ïðåäøåñòâîâàë ñòîëáöó ñî çíà÷åíèÿìè. Ðèñ. 12.5. Âû÷èñëåíèå ìåäèàíû äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé Íà ðèñ. 12.6 ïîêàçàí çàêîí÷åííûé ðàáî÷èé ëèñò è ôîðìóëû äëÿ âû÷èñëåíèé. Îòìåòèì, ÷òî ñóììû çíà÷åíèé ïî ñòîëáöàì â òàáëèöå K3:L5, â îòëè÷èå îò ñëó÷àÿ íåïðåðûâíûõ ðàñïðåäåëåíèé, íå îáÿçàíû ðàâíÿòüñÿ [n/2], ïîñêîëüêó çäåñü âûáîðî÷íàÿ ìåäèàíà âû÷èñëÿåòñÿ áåç ïðèâëå÷åíèÿ ïîðÿäêîâûõ ñòàòèñòèê. Ïî ýòîé æå ïðè÷èíå çíà÷åíèå âûáîðî÷íîé ìåäèàíû òîëüêî â èñêëþ÷èòåëüíûõ ñëó÷àÿõ (êîãäà íàêîïëåííàÿ ÷àñòîòà äëÿ ïåðâîãî çíà÷åíèÿ ðàâíà n/2) áóäåò ñîâïàäàòü ñ âûáîðî÷íûìè çíà÷åíèÿìè. Äàííîå îáñòîÿòåëüñòâî çíà÷èòåëüíî îáëåã÷àåò âû÷èñëåíèå Ri. Åñëè çíà÷åíèå âûáîðî÷íîé ìåäèàíû âñå-òàêè ñîâïàäàåò ñ êàêèìëèáî âûáîðî÷íûì çíà÷åíèåì, ìîæíî íåìíîãî óâåëè÷èòü çíà÷åíèå âûáîðî÷íîé ìåäèàíû (ýòî íå ïîâëèÿåò íà ðåçóëüòàò âû÷èñëåíèÿ êðèòåðèÿ). 12.1.2. Критерий Уилкоксона–Манна–Уитни Ýòîò êðèòåðèé ÿâëÿåòñÿ ìîäèôèêàöèåé êðèòåðèÿ çíàêîâûõ ðàíãîâ Óèëêîêñîíà äëÿ ïðîâåðêè ãèïîòåç î çíà÷åíèè ìåäèàíû (ñì. ðàçäåë 11.4.2), îáîáùåííîãî äëÿ ñëó÷àÿ äâóõ âûáîðîê1. Êðàòêî êðèòåðèé îïèñàí â ðàçäåëå 2.4.2. 1 Ýòîò êðèòåðèé è åãî ìîäèôèêàöèè òàêæå íàçûâàþò êðèòåðèåì Óèëêîêñîíà è êðèòåðèåì Ìàííà–Óèòíè. Ïåðâîíà÷àëüíî îí áûë ðàçðàáîòàí Óèëêîêñîíîì (Wilcoxon, 1945 ã.) äëÿ âûáîðîê îäèíàêîâûõ îáúåìîâ, à çàòåì îáîáùåí äëÿ ñëó÷àÿ âûáîðîê ïðîèçâîëüíûõ îáúåìîâ Ìàííîì è Óèòíè (Mann, Whitney, 1947 ã.). Глава 12. Сравнение одномерных выборок 355 Ðèñ. 12.6. Ðàáî÷èé ëèñò êðèòåðèÿ ìåäèàíû äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè îáúåìîì ñîîòâåòñòâåííî n1 è n2, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ. Ãèïîòåçû Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè. Çäåñü è äàëåå n = n1 + n2. 2. Äëÿ îäíîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ R, êîòîðûå ïîëó÷èëè åå âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå. Åñëè îáîçíà÷èòü ÷åðåç R1 ñóììó ðàíãîâ ïåðâîé âûáîðêè, à ÷åðåç R2 — ñóììó ðàíãîâ âòîðîé âûáîðêè, òî ýòè ñóììû áóäóò ñâÿçàíû ñîîòíîøåíèåì R1 + R2 = n(n + 1)/2. Ïîýòîìó äîñòàòî÷íî âû÷èñëèòü ñóììó ðàíãîâ òîëüêî îäíîé âûáîðêè. Îáû÷íî âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðêè, èìåþùåé ìåíüøèé îáúåì, à ñóììà ðàíãîâ äðóãîé âûáîðêè âû÷èñëÿåòñÿ íà îñíîâàíèè ïðèâåäåííîãî ñîîòíîøåíèÿ. 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà. a) Äëÿ ìàëûõ âûáîðîê: 1 1 U1 = n1 n2 + n1 (n1 + 1) − R1 , U 2 = n1n2 + n2 (n2 + 1) − R2 , U = max(U1, U2). 2 2 á) Äëÿ áîëüøèõ âûáîðîê: 1 U − n1n2 2 T= . n1n2 (n + 1) 12 356 Часть III. Анализ одномерных выборок Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà U èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Ìàííà–Óèòíè, à ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. a) Äëÿ ìàëûõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ìàííà–Óèòíè. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî U ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. á) Äëÿ áîëüøèõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Äëÿ ìàëûõ âûáîðîê, íåñìîòðÿ íà òî ÷òî âû÷èñëÿåòñÿ òîëüêî îäíî êðèòè÷åñêîå çíà÷åíèå, êðèòåðèé ÿâëÿåòñÿ äâóõñòîðîííèì ñ óðîâíåì çíà÷èìîñòè α. 2. Êðèòåðèé ñ÷èòàåòñÿ áîëåå òî÷íûì, ÷åì êðèòåðèé ìåäèàíû. 3. Ñóùåñòâóþò ðàçëè÷íûå ìíåíèÿ î òîì, êàêîãî îáúåìà âûáîðîê äîñòàòî÷íî äëÿ òîãî, ÷òîáû ïðèìåíÿòü íîðìàëüíóþ àïïðîêñèìàöèþ. “Ñðåäíÿÿ” îöåíêà — îáúåì êàæäîé âûáîðêè äîëæåí áûòü íå ìåíåå 20. 4. Òàáëèöû ñî çíà÷åíèÿìè êâàíòèëåé ðàñïðåäåëåíèÿ Ìàííà–Óèòíè ïðèâîäÿòñÿ âî ìíîãèõ èñòî÷íèêàõ, íàïðèìåð [4, 9, 14].  [18] ïîêàçàí ñïîñîá âû÷èñëåíèÿ ýòèõ êâàíòèëåé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ïîêàæåì ðåàëèçàöèþ êðèòåðèÿ ñ èñïîëüçîâàíèåì êðèòåðèàëüíîé ñòàòèñòèêè Ò, ò.å. ñ èñïîëüçîâàíèåì íîðìàëüíîé àïïðîêñèìàöèè. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïîêàçàíû íà ðèñ. 12.7.  êà÷åñòâå òåñòîâûõ âçÿòû äâå âûáîðêè, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå: îäíà — ñòàíäàðòíîå, âòîðàÿ — ñ åäèíè÷íûìè ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1 è Выборка2.  ñòîëáöàõ Ñ è D âû÷èñëåíû ðàíãè çíà÷åíèé îáúåäèíåííîé âûáîðêè ñ ïîìîùüþ ôîðìóëû ìàññèâà {=РАНГ(A2:B41;A2:B41;1)} (â äèàïàçîíå A2:B41 ñîäåðæàòñÿ çíà÷åíèÿ îáåèõ âûáîðîê). Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå ðàíãè äëÿ ïåðâîé è âòîðîé âûáîðîê, íàçâàíû ñîîòâåòñòâåííî Ранг1 è Ранг2. Êàê âèäíî íà ðèñ. 12.7, íóëåâàÿ ãèïîòåçà î ñîâïàäåíèè ðàñïðåäåëåíèé â äàííîì ñëó÷àå îòâåðãàåòñÿ. 12.1.3. Критерий Краскала–Уоллиса Ýòîò êðèòåðèé ÿâëÿåòñÿ îáîáùåíèåì êðèòåðèÿ Óèëêîêñîíà–Ìàííà–Óèòíè äëÿ ñëó÷àÿ íåñêîëüêèõ (áîëåå äâóõ) âûáîðîê. Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íåïðåðûâíûå ðàñïðåäåëåíèÿ. Ãèïîòåçû Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Глава 12. Сравнение одномерных выборок 357 Ðèñ. 12.7. Êðèòåðèé Óèëêîêñîíà–Ìàííà–Óèòíè Âû÷èñëåíèÿ 1. Âñå k âûáîðîê îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è íàõîäÿòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì k ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè. Çäåñü è äàëåå n = ∑ ni . i =1 2. Äëÿ êàæäîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ Ri, êîòîðûå ïîëó÷èëè åå âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå. 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = k Ri2 12 ∑ − 3(n + 1) . n(n + 1) i =1 ni Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Êðàñêàëà–Óîëëèñà. Àñèìïòîòè÷åñêè ýòà ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. a) Äëÿ ìàëûõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Êðàñêàëà–Óîëëèñà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. á) Äëÿ áîëüøèõ âûáîðîê âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Òàáëèöû ñî çíà÷åíèÿìè êâàíòèëåé ðàñïðåäåëåíèÿ Êðàñêàëà–Óîëëèñà ïðèâîäÿòñÿ â [9, 14]. 2.  [22] ïîêàçàíà áîëåå òî÷íàÿ àïïðîêñèìàöèÿ, îñíîâàííàÿ íà ïðåîáðàçîâàíèè ñòàòèñòèêè Ò ñ èñïîëüçîâàíèåì F-ðàñïðåäåëåíèÿ. 358 Часть III. Анализ одномерных выборок 3. Êðèòåðèé ñ÷èòàåòñÿ áîëåå òî÷íûì, ÷åì êðèòåðèé ìåäèàíû. 4. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, òî êðèòåðèé íå ïîçâîëÿåò îïðåäåëèòü, êàêèå ñîâîêóïíîñòè èìåþò ðàçëè÷íûå ðàñïðåäåëåíèÿ. Îäíàêî ïðèìåíåíèå äëÿ îïðåäåëåíèÿ ðàçëè÷íûõ ðàñïðåäåëåíèé ïîïàðíûõ ñðàâíåíèé âûáîðîê ìåòîäîì Óèëêîêñîíà–Ìàííà–Óèòíè íåæåëàòåëüíî, ïîñêîëüêó ïðè ìíîãîêðàòíîì ïðèìåíåíèè îäíîãî êðèòåðèÿ ðåçêî âîçðàñòàåò âåðîÿòíîñòü îøèáêè ïåðâîãî ðîäà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ ýòîãî êðèòåðèÿ ïî÷òè ïîëíîñòüþ ñîâïàäàåò ñ ðåàëèçàöèåé ìåòîäà Óèëêîêñîíà–Ìàííà–Óèòíè (çà èñêëþ÷åíèåì âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè è êðèòè÷åñêîãî çíà÷åíèÿ). 12.1.4. Критерий серий Вальда–Вольфовица Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè îáúåìîì ñîîòâåòñòâåííî n1 è n2, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ. Ãèïîòåçû Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(n) (n = n1 + n2). 2. Ïî âàðèàöèîííîìó ðÿäó ïîäñ÷èòûâàåòñÿ êîëè÷åñòâî ñåðèé U — êîëè÷åñòâî ó÷àñòêîâ âàðèàöèîííîãî ðÿäà, â êîòîðûõ ïðèñóòñòâóþò çíà÷åíèÿ òîëüêî îäíîé âûáîðêè. 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 2n1n2 −1 n . 2n1n2 (2n1n2 − n) n 2 (n + 1) U− Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò èìååò àñèìïòîòè÷åñêè ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé íå òàê ÷óâñòâèòåëåí ê ôîðìå ðàñïðåäåëåíèé, êàê ê ïàðàìåòðàì ïîëîæåíèÿ ðàñïðåäåëåíèé. Ïîýòîìó åãî ÷àñòî èñïîëüçóþò êàê íåïàðàìåòðè÷åñêèé êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê. 2. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì. Îí ïðèìåíÿåòñÿ, åñëè êàæäàÿ èç âûáîðîê èìååò áîëüøå 20 çíà÷åíèé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.8 ïîêàçàí ðàáî÷èé ëèñò, ðåàëèçóþùèé êðèòåðèé ñåðèé.  ñòîëáöàõ À è  ñîäåðæàòñÿ äâå âûáîðêè îáúåìîì ñîîòâåòñòâåííî 20 è 30 çíà÷åíèé.  ñòîëáöàõ C è D, êàê è â êðèòåðèè Óèëêîêñîíà–Ìàííà–Óèòíè, ïîäñ÷èòàíû ðàíãè Глава 12. Сравнение одномерных выборок 359 çíà÷åíèé îáúåäèíåííîé âûáîðêè. Çàòåì ýòè ðàíãè îòñîðòèðîâàíû ïî âîçðàñòàíèþ, ïðè÷åì êàæäûé ñòîëáåö â îòäåëüíîñòè (ìîæíî ñîðòèðîâàòü ïî óáûâàíèþ — ýòî íå ñóùåñòâåííî). Çíà÷åíèÿ ðàíãîâ, èäóùèå â íàòóðàëüíîì ïîðÿäêå, îáðàçóþò ñåðèè. Ýòè ñåðèè íà ðèñ. 12.8 ïîêàçàíû ðàçíûìè öâåòàìè. Òåïåðü íàäî ïîäñ÷èòàòü êîëè÷åñòâî ñåðèé. Äëÿ ýòîãî â ñîñåäíèõ ñòîëáöàõ â ÿ÷åéêå Å2 è F2 ââåäåíû çíà÷åíèÿ 1. Äàëåå â ÿ÷åéêàõ Å3 è F3 ââåäåíû ôîðìóëû =ЕСЛИ(C3=C2+1;0;1) è =ЕСЛИ(D3=D2+1;0;1) ñîîòâåòñòâåííî, êîòîðûå çàòåì ñêîïèðîâàíû âíèç. Òàêèì îáðàçîì ñòàâèòñÿ åäèíèöà â íà÷àëå ñåðèè, à îñòàëüíûì ýëåìåíòàì ñåðèè ñòàâèòñÿ â ñîîòâåòñòâèå íóëü. Êîëè÷åñòâî ñåðèé ïîäñ÷èòûâàåòñÿ â ÿ÷åéêå Í5 êàê ñóììà åäèíèö â äèàïàçîíàõ Серии1 è Серии2. Îñòàëüíûå ôîðìóëû êðèòåðèÿ, âû÷èñëÿþùèå êðèòåðèàëüíóþ ñòàòèñòèêó è êðèòè÷åñêîå çíà÷åíèå, ïîêàçàíû íà ðèñ. 12.8. Ðèñ. 12.8. Êðèòåðèé ñåðèé 12.1.5. Критерий χ2 Äàííûé êðèòåðèé ÿâëÿåòñÿ îáîáùåíèåì äëÿ ñëó÷àÿ íåñêîëüêèõ âûáîðîê îäíîèìåííîãî êðèòåðèÿ, îïèñàííîãî â ðàçäåëàõ 2.4.3 è 9.3. Êðèòåðèé ìîæíî ïðèìåíÿòü äëÿ ñðàâíåíèÿ êàê íåïðåðûâíûõ, òàê è äèñêðåòíûõ ðàñïðåäåëåíèé. Îäíàêî ÷àùå åãî ïðèìåíÿþò äëÿ ñðàâíåíèÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  ñëó÷àå íåïðåðûâíûõ ðàñïðåäåëåíèé, åñëè îïðåäåëåíû èíòåðâàëû, íà êîòîðûå ðàçáèâàåòñÿ îáëàñòü âîçìîæíûõ âûáîðî÷íûõ çíà÷åíèé, è ïîäñ÷èòàíû ÷àñòîòû ïîïàäàíèÿ âûáîðî÷íûõ çíà÷åíèé â ýòè èíòåðâàëû (ñì. ðàçäåë 9.3), êðèòåðèàëüíûå âû÷èñëåíèÿ ñîâïàäàþò ñ àíàëîãè÷íûìè âû÷èñëåíèÿìè äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé. Ïîýòîìó îïèøåì äàííûé êðèòåðèé äëÿ ñëó÷àÿ äèñêðåòíûõ ðàñïðåäåëåíèé. Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ äèñêðåòíûå ðàñïðåäåëåíèÿ. Ïðåäïîëàãàåòñÿ, ÷òî âûáîðêè çàäàíû ó âèäå ÷àñòîòíûõ òàáëèö. (Î âû÷èñëåíèè ÷àñòîòíûõ òàáëèö ðå÷ü èäåò â ðàçäåëå 8.3.1.) 360 Часть III. Анализ одномерных выборок Ãèïîòåçû Í0: âñå k âûáîðîê èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âñå k ÷àñòîòíûõ òàáëèö îáúåäèíÿþòñÿ â åäèíóþ òàáëèöó ñëåäóþùåãî âèäà. Çíà÷åíèÿ ×àñòîòû âûáîðêè 1 õ1 f11 õm ... õ2 f12 ... Âñåãî f1m m n1 = ∑ f1 j j =1 ×àñòîòû âûáîðêè 2 f21 f22 ... f2m m n2 = ∑ f 2 j j =1 ... ... ... ... ... ... ×àñòîòû âûáîðêè k fk1 fk2 ... fkm nk = ∑ f kj m j =1 Âñåãî k f1 = ∑ f i1 i =1 k k f 2 = ∑ fi 2 f m = ∑ f im i =1 i =1 m j =1 i =1 k 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = n ∑∑ k n = ∑ ni i =1 − 1 . ni f j f ji2 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (m – 1)(k – 1) ñòåïåíüþ ñâîáîäû. Âû÷èñëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ têð êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (m – 1)(k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèé. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì. Ñ÷èòàåòñÿ, ÷òî åãî ìîæíî ïðèìåíÿòü, åñëè îáúåì êàæäîé âûáîðêè — íå ìåíåå 15. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.9 ïîêàçàí ðàáî÷èé ëèñò ñ äâóìÿ âûáîðêàìè, ïðåäñòàâëåííûìè â âèäå ÷àñòîòíûõ òàáëèö, êîòîðûå èñïîëüçîâàëèñü â ïðèìåðå êðèòåðèÿ ìåäèàíû äëÿ äèñêðåòíûõ ðàñïðåäåëåíèé.  ñòîëáöå Å âû÷èñëÿþòñÿ ñóììû ÷àñòîò äëÿ êàæäîãî çíà÷åíèÿ (ñîîòâåòñòâóþò ñòðîêå Всего â ïðèâåäåííîé âûøå òàáëèöå).  ÿ÷åéêå G4 âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà ñ ïîìîùüþ ôîðìóëû ìàññèâà, ïîêàçàííîé íà ðèñ. 12.9.  ñëó÷àå áîëüøåãî êîëè÷åñòâà âûáîðîê ýòó ôîðìóëó, ïî-âèäèìîìó, ñëåäóåò ðàçáèòü íà íåñêîëüêî (ïî êîëè÷åñòâó âûáîðîê), ÷òîáû ñäåëàòü åå áîëåå ÷èòàåìîé è ïðîñòîé. Глава 12. Сравнение одномерных выборок 361 Ðèñ. 12.9. Êðèòåðèé χ2 12.1.6. Критерий Смирнова Ýòîò êðèòåðèé, êàê è êðèòåðèé Êîëìîãîðîâà (ñì. ðàçäåë 9.3), ïîñòðîåí íà ñðàâíåíèè íå îòäåëüíûõ ïàðàìåòðîâ ðàñïðåäåëåíèÿ (ïðèâåäåííûå âûøå êðèòåðèè îñíîâàíû íà ñðàâíåíèè ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé), à ôóíêöèé ðàñïðåäåëåíèÿ.  äàííîì êðèòåðèè ñðàâíèâàþòñÿ ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ. Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íåïðåðûâíûå ðàñïðåäåëåíèÿ. Ãèïîòåçû Í0: âûáîðêè èìåþò îäèíàêîâûå ðàñïðåäåëåíèÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî êàæäîé âûáîðêå â îòäåëüíîñòè ñòðîÿòñÿ âàðèàöèîííûå ðÿäû õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(m). 2. Âû÷èñëÿþòñÿ è Dm− , r = Fx ( y( r ) ) − ðàçíîñòè Dm+ , r = r − Fx ( y( r ) ) m (èëè Dn+, s = Fy ( x( s ) ) − s −1 ) n r −1 s (èëè Dn−, s = − Fy ( x( s ) ) ), r = 1, 2, ..., n, s = 1, 2, ..., m. Çäåñü m n Fx è Fy — ýìïèðè÷åñêèå ôóíêöèè ðàñïðåäåëåíèÿ ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê. Ìîæíî âû÷èñëÿòü ðàçíîñòè Dm+ , r è Dm− , r ëèáî ðàçíîñòè Dn+, s è Dn−, s . 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà ïî ôîðìóëå Dn, m = max( Dm+ , r , Dm− , r ) 1≤ r ≤ m ëèáî Dn, m = max( Dn+, s , Dn−, s ) . 1≤ s ≤ n Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Dn,m èìååò òàê íàçûâàåìîå ðàñïðåäåëåíèå Ñìèðíîâà. 362 Часть III. Анализ одномерных выборок Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñìèðíîâà. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Dn,m ≤ têð.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Äëÿ âû÷èñëåíèÿ êâàíòèëåé ðàñïðåäåëåíèÿ Ñìèðíîâà ñóùåñòâóþò ñïåöèàëüíûå òàáëèöû, êîòîðûå ïðèâåäåíû âî ìíîãèõ êíèãàõ ïî ìàòåìàòè÷åñêîé nm Dn , m àñèìïòîòè÷åñêè n+m èìååò ðàñïðåäåëåíèå Êîëìîãîðîâà, ïðè n, m ≥ 40 è 0,01 ≤ α ≤ 0,2 ìîæíî âîñïîëüçîâàòüñÿ ïðèáëèæåííîé ôîðìóëîé äëÿ âû÷èñëåíèÿ têð: ñòàòèñòèêå. Ïîñêîëüêó ñëó÷àéíàÿ âåëè÷èíà tкр ≈ − ln(0,5α) 1 nm − , ãäå N = [4]. 2N 6N n+m 2. Ñóùåñòâóåò ìíîãî ïðåîáðàçîâàíèé âåëè÷èíû Dn,m è àïïðîêñèìàöèé ðàñïðåäåëåíèÿ Ñìèðíîâà, êîòîðûå ïîçâîëÿþò íå îáðàùàòüñÿ íåïîñðåäñòâåííî ê ðàñïðåäåëåíèþ Ñìèðíîâà äëÿ íàõîæäåíèÿ êðèòè÷åñêèõ çíà÷åíèé. Ïîäðîáíîå îïèñàíèå êðèòåðèÿ Ñìèðíîâà è åãî âàðèàíòîâ ìîæíî íàéòè â [22]. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.10 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé êðèòåðèé Ñìèðíîâà.  êà÷åñòâå òåñòîâûõ âûáîðîê âçÿòû äâå âûáîðêè, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Êðèòåðèàëüíûå âû÷èñëåíèÿ çíà÷èòåëüíî óïðîùàþòñÿ, åñëè âûáîðêè ïðåäâàðèòåëüíî îòñîðòèðîâàíû ïî âîçðàñòàíèþ, êàê è ñäåëàíî íà ïðåäëàãàåìîì ðàáî÷åì ëèñòå.  ñòîëáöàõ Ñ è D ïîäñ÷èòàíû ðàíãè âûáîðî÷íûõ çíà÷åíèé. Äëÿ ýòîãî ìîæíî èñïîëüçîâàòü ôóíêöèþ РАНГ èëè, ïðåäïîëàãàÿ, ÷òî íåò ñîâïàäàþùèõ çíà÷åíèé, ìîæíî ïðîñòî ââåñòè ïîñëåäîâàòåëüíîñòü íàòóðàëüíûõ ÷èñåë. Ðèñ. 12.10. Êðèòåðèé Ñìèðíîâà  ñòîëáöàõ Å è F âû÷èñëÿþòñÿ çíà÷åíèÿ ðàçíîñòåé Dn−, s è Dn+, s . Îïèøåì, êàê âû÷èñëÿþòñÿ ðàçíîñòè Dn−, s . Ñíà÷àëà â ÿ÷åéêó Å2 ââîäèòñÿ ôîðìóëà =C2/$H$2-ЕСЛИ(A2<=МИН(Выборка2);0;ВПР(A2;$B$2:$D$31;3;1)/$H$3). Глава 12. Сравнение одномерных выборок 363 Çäåñü ðåàëèçîâàíà ôîðìóëà Dn−, s = s − Fy ( x( s ) ) . ×àñòü ôîðìóëû C2/$H$2 âû÷èñëÿåò n s/n (s — ðàíã âûáîðî÷íîãî çíà÷åíèÿ, n — îáúåì âûáîðêè). Ôîðìóëà ВПР(A2;$B$2:$D$31;3;1)/$H$3 ïîäñ÷èòûâàåò Fy ( x( s ) ) . Ôóíêöèÿ ВПР íàõîäèò ðàíã t íàèáîëüøåãî âûáîðî÷íîãî çíà÷åíèÿ âòîðîé âûáîðêè, êîòîðîå íå ïðåâîñõîäèò âûáîðî÷íîãî çíà÷åíèÿ ïåðâîé âûáîðêè ñ ðàíãîì s (çäåñü íåîáõîäèìà óïîðÿäî÷åííîñòü âûáîðîê). Çíà÷åíèå Fy ( x( s ) ) âû÷èñëÿåòñÿ êàê t/m (m — îáúåì âòîðîé âûáîðêè). Ôóíêöèÿ ЕСЛИ ñ óñëîâèåì A2<=МИН(Выборка2) èñïîëüçóåòñÿ äëÿ òîãî, ÷òîáû ïðåäîòâðàòèòü ïîÿâëåíèå çíà÷åíèÿ îøèáêè #Н/Д, ïîðîæäàåìîãî ôóíêöèåé ВПР â ñëó÷àå, åñëè âî âòîðîé âûáîðêå íåò çíà÷åíèé, ìåíüøèõ x(s). Ôîðìóëà, ââåäåííàÿ â ÿ÷åéêó Å2, çàòåì êîïèðóåòñÿ âíèç äî êîíöà äèàïàçîíà, ñîäåðæàùåãî ñòîëüêî ÿ÷ååê, êàêîâ îáúåì ïåðâîé âûáîðêè. Àíàëîãè÷íî âû÷èñëÿþòñÿ ðàçíîñòè Dn+, s . Ôîðìóëû, ïî êîòîðûì âû÷èñëÿþòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà è êðèòè÷åñêîå çíà÷åíèå â ñòîëáöå Í, ïîêàçàíû íà ðèñ. 12.10. 12.2. Доверительные интервалы для параметров распределений  ýòîì ðàçäåëå ðàññìîòðåíû ìåòîäû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé èëè îòíîøåíèé îäíîòèïíûõ ïàðàìåòðîâ (íàïðèìåð, ìàòåìàòè÷åñêèõ îæèäàíèé èëè äèñïåðñèé) ðàçëè÷íûõ âûáîðîê. Ïî âåëè÷èíå ýòèõ ðàçíîñòåé (îòíîøåíèé) òàêæå ìîæíî ñóäèòü î òîì, ñîâïàäàþò ëè âûáîðî÷íûå ðàñïðåäåëåíèÿ, åñëè ïðåäïîëîæèòü, ÷òî âûáîðî÷íûå ðàñïðåäåëåíèÿ ïðèíàäëåæàò îäíîìó êëàññó ðàñïðåäåëåíèé è îñòàëüíûå ïàðàìåòðû ðàñïðåäåëåíèé ñîâïàäàþò. Êàê âñåãäà ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ, áîëüøóþ ðîëü èãðàþò àïðèîðíûå ïðåäïîëîæåíèÿ î òîì, êàêîìó êëàññó ïðèíàäëåæàò âûáîðî÷íûå ðàñïðåäåëåíèÿ. Ïðîâåðêó òàêèõ ïðåäïîëîæåíèé ìîæíî îñóùåñòâèòü ìåòîäàìè, îïèñàííûìè â ãëàâå 9. Íèæå áóäåò ïîêàçàíî ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ïàðàìåòðîâ íîðìàëüíûõ ðàñïðåäåëåíèé è áèíîìèàëüíûõ âåðîÿòíîñòåé. 12.2.1. Доверительный интервал для разности средних нормальных совокупностей (равные дисперсии) Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå. Ïðåäïîëàãàåòñÿ ðàâåíñòâî äèñïåðñèé îáåèõ âûáîðîê. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = µ1 – µ2 ìàòåìàòè÷åñêèõ îæèäàíèé µ1 è µ2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ìàòåìàòè÷åñêèõ îæèäàíèé è äèñïåðñèé n m i =1 i =1 x = ∑ xi , y = ∑ yi , S x2 = δ̂ = x − y è An , m = 1 n 1 m ( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 è äîïîëíèòåëüíî ∑ n i =1 m i =1 (n + m)(nS x2 + mS y2 ) nm(n + m − 2) 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 364 Часть III. Анализ одномерных выборок . 3. Èç óðàâíåíèÿ α = 2Fn–1(k) – 1, ãäå Fn–1 — ôóíêöèÿ ðàñïðåäåëåíèÿ Ñòüþäåíòà 1+ α , 2 ñ (n + m – 2) ñòåïåíüþ ñâîáîäû, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Fn−−11 Fn−−11 — ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà. ( ) 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m . Êîììåíòàðèè 1. Åñëè èçâåñòíî çíà÷åíèå îáùåé äèñïåðñèè σ2, òî âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóåòñÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ An,m S x2 è S y2 çàìåíÿþòñÿ çíà÷åíèåì σ2. 2. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè, åñëè âûïîëíÿþòñÿ òðåáîâàíèÿ ðàâåíñòâà äèñïåðñèé è îáúåìû âûáîðîê ïðèìåðíî ðàâíû. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé (îáðàòèòå âíèìàíèå íà ïðàêòè÷åñêóþ ðåàëèçàöèþ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà, ïðèâåäåííóþ â ñëåäóþùåì ðàçäåëå, êîòîðàÿ â çíà÷èòåëüíîé ñòåïåíè ñîâïàäàåò ñ ðåàëèçàöèåé äàííîãî ìåòîäà). 12.2.2. Доверительный интервал для разности средних нормальных совокупностей (разные дисперсии) Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå. Ðàâåíñòâî äèñïåðñèé íå ïðåäïîëàãàåòñÿ. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = µ1 – µ2 ìàòåìàòè÷åñêèõ îæèäàíèé µ1 è µ2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè ìàòåìàòè÷åñêèõ îæèäàíèé è äèñïåðñèé n m i =1 i =1 x = ∑ xi , y = ∑ yi , S x2 = δ̂ = x − y , An , m = 1 n 1 m ( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 è äîïîëíèòåëüíî ∑ n i =1 m i =1 2 S x2 S y è + n m ν= S x2 S y2 + m n 2 2 1 S x2 1 Sy + n − 1 n m − 1 m 2 2 −2. 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Âû÷èñëÿåòñÿ çíà÷åíèå k êàê êâàíòèëü ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû, ðàâíîé ν. ( ) 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m . Глава 12. Сравнение одномерных выборок 365 Êîììåíòàðèè 1. Ïîñòðîåííûé äîâåðèòåëüíûé èíòåðâàë ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé îòâåðãàòü ïðåäïîëîæåíèå î ðàâåíñòâå äèñïåðñèé, òî ïðåäïî÷òèòåëüíåå èñïîëüçîâàòü òî÷íûé äîâåðèòåëüíûé èíòåðâàë èç ïðåäûäóùåãî ðàçäåëà. 2. Åñëè èçâåñòíû çíà÷åíèÿ äèñïåðñèé σõ2 è σó2, òî âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóåòñÿ ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ An,m S x2 è S y2 çàìåíÿþòñÿ çíà÷åíèÿìè σõ2 è σó2. 3. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè. 4. Äëÿ äîñòàòî÷íî áîëüøèõ îáúåìîâ âûáîðîê, íàïðèìåð ïðè n + m > 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî èñïîëüçîâàòü ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.11 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé. Âñå ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, ïîêàçàíû íà ýòîì ðèñóíêå. Îòìåòèì, ÷òî ïåðâàÿ âûáîðêà èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à âòîðàÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé, ðàâíîé 4. Òàêèì îáðàçîì, çäåñü δ = –1. Òàêæå îáðàùàåì âíèìàíèå íà ïåðâûé àðãóìåíò ôóíêöèè СТЬЮДРАСПОБР — ýòà ôóíêöèÿ íå ÿâëÿåòñÿ îáðàòíîé ê ôóíêöèè ðàñïðåäåëåíèÿ Ñòüþäåíòà, à íàõîäèò êîðåíü óðàâíåíèÿ Ð(Õ ≥ u) = p (ñì. ðàçäåë 4.7.7). Ðèñ. 12.11. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ âûáîðîê 12.2.3. Доверительный интервал для отношения дисперсий нормальных совокупностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíû äâå îäíîìåðíûå íåçàâèñèìûå âûáîðêè õ1, õ2, ..., õn è ó1, ó2, ..., óm îáúåìîì ñîîòâåòñòâåííî n è m, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå. 366 Часть III. Анализ одномерных выборок Äîâåðèòåëüíûé èíòåðâàë äëÿ îòíîøåíèÿ γ = σõ2/σó2 äèñïåðñèé σõ2 è σó2 ñîîòâåòñòâåííî ïåðâîé è âòîðîé âûáîðîê ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ è S y2 = òî÷å÷íûå îöåíêè äèñïåðñèé S x2 = 1 n ( xi − x ) 2 ∑ n i =1 (m − 1)nS x2 1 m ( yi − y ) 2 è äîïîëíèòåëüíî Bn , m = . ∑ m i =1 (n − 1)mS y2 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Âû÷èñëÿþòñÿ êâàíòèëè t1 è t2 ïîðÿäêà ñîîòâåòñòâåííî (1 – α)/2 è (1 + α)/2 F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû n – 1 è m – 1. Bn , m Bn , m , . t1 t2 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: Êîììåíòàðèé. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà íå óñòîé÷èâ ïðè îòêëîíåíèÿõ îò íîðìàëüíîñòè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.12 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ îòíîøåíèÿ äèñïåðñèé. Âñå ôîðìóëû, ïî êîòîðûì âûïîëíÿþòñÿ âû÷èñëåíèÿ, ïîêàçàíû íà ýòîì ðèñóíêå. Îòìåòèì, ÷òî ïåðâàÿ âûáîðêà èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à âòîðàÿ — íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è äèñïåðñèåé, ðàâíîé 4. Òàêèì îáðàçîì, çäåñü γ = 0,25. Ðèñ. 12.12. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ îòíîøåíèÿ äèñïåðñèé äâóõ âûáîðîê 12.2.4. Доверительный интервал для разности двух биномиальных вероятностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ äâå ñåðèè íàáëþäåíèé çà ýêñïåðèìåíòîì.  ïåðâîé ñåðèè â êàæäîì ýêñïåðèìåíòå ñ âåðîÿòíîñòüþ ð1 ïðîèñõîäèò ñîáûòèå “1” (“óñïåõ”), âî âòîðîé ñåðèè ýòî ñîáûòèå ïðîèñõîäèò ñ âåðîÿòíîñòüþ ð2. Ïóñòü Глава 12. Сравнение одномерных выборок 367 â ïåðâîé ñåðèè çàôèêñèðîâàíî n ýêñïåðèìåíòîâ, èç íèõ â r1 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Âî âòîðîé ñåðèè çàôèêñèðîâàíî m ýêñïåðèìåíòîâ, èç íèõ â r2 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Ðàçìåðû ñåðèé áîëüøå 20. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè δ = ð1 – ð2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè âåðîÿòíîñòåé ð1 è ð2: pˆ1 = r1 / n , pˆ 2 = r2 / m è äîïîëíèòåëüíî δˆ = pˆ1 − pˆ 2 , An , m = pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) + . n m 2. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 3. Âû÷èñëÿåòñÿ çíà÷åíèå k êàê êâàíòèëü ïîðÿäêà (1 + α)/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. ( ) 4. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë: δˆ − kAn , m , δˆ + kAn , m . Êîììåíòàðèé. Îïèñàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ÿâëÿåòñÿ ïðèáëèæåííûì è îñíîâûâàåòñÿ íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåìû âûáîðîê áûëè íå ìåíüøå 20. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé. 12.3. Проверка гипотез о параметрах распределений  äàííîì ðàçäåëå ñðàâíèâàþòñÿ âûáîðêè â âèäå êðèòåðèåâ ïðîâåðêè ãèïîòåç î ðàâåíñòâå èëè ðàçëè÷èè ïàðàìåòðîâ ðàñïðåäåëåíèé îòäåëüíûõ îäíîìåðíûõ âûáîðîê.  ýòîì ñëó÷àå, êàê è ïðè ïîñòðîåíèè äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé èëè îòíîøåíèé ïàðàìåòðîâ ðàñïðåäåëåíèé, áîëüøóþ ðîëü èãðàþò ïðåäïîëîæåíèÿ î òèïå âûáîðî÷íûõ ðàñïðåäåëåíèé. Áîëüøèíñòâî êðèòåðèåâ, îïèñàííûõ íèæå, îòíîñèòñÿ ê íîðìàëüíûì ñîâîêóïíîñòÿì è ïðîâåðÿåò ñîâïàäåíèå èëè ìàòåìàòè÷åñêèõ îæèäàíèé, èëè äèñïåðñèé. 12.3.1. Проверка гипотез о математических ожиданиях нормальных распределений  ýòîì ðàçäåëå áóäóò ïðèâåäåíû êðèòåðèè äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé äâóõ èëè áîëåå âûáîðîê, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå. Критерий проверки гипотезы о равенстве математических ожиданий при известных дисперсиях Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.6, ïîñâÿùåííîì ñðåäñòâó Двухвыборочный z-тест для средних. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ èçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî 368 Часть III. Анализ одномерных выборок Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Í1: µ1 > µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî y= êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x= 1 n ∑ xi , n i =1 1 m ∑ yi . m i =1 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà z = (x − y) σ / n + σ 22 / m 2 1 . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà z èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |z| ≤ zêð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå zêð êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t. Êîììåíòàðèé. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Двухвыборочный z-тест для средних, êîòîðîå îïèñàíî â ðàçäåëå 5.6. Òàì æå ïðèâåäåí ïðèìåð ðåàëèçàöèè êðèòåðèÿ. Критерий Стьюдента проверки гипотезы о равенстве математических ожиданий (случай равных дисперсий) Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.7, ïîñâÿùåííîì ñðåäñòâó ïàêåòà àíàëèçà Двухвыборочный t-тест с одинаковыми дисперсиями. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè, íî ðàâíûìè äèñïåðñèÿìè σ2 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ Í1: µ1 > µ2 1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x = 1 n 1 n 1 m 1 m xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 . ∑ n i =1 n i =1 m i =1 m i =1 Глава 12. Сравнение одномерных выборок 369 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = n + m − 2( x − y ) n+m (n − 1) S x2 + (m − 1) S y2 nm . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n + m – 2) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t. Êîììåíòàðèè 1. Åñëè èçâåñòíà äèñïåðñèÿ ñîâîêóïíîñòåé σ2, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà èñïîëüçóþò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå, à â ôîðìóëå âû÷èñëåíèÿ ñòàòèñòèêè Ò çàìåíÿþò çíà÷åíèÿ âûáîðî÷íûõ äèñïåðñèé íà σ2. 2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. 3. Êðèòåðèé òàêæå óñòîé÷èâ, åñëè äèñïåðñèè ãåíåðàëüíûõ ñîâîêóïíîñòåé íåçíà÷èòåëüíî îòëè÷àþòñÿ, à çíà÷åíèÿ n è m ïðèáëèçèòåëüíî ðàâíû. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Двухвыборочный z-тест с одинаковыми дисперсиями, êîòîðîå îïèñàíî â ðàçäåëå 5.7. Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèÿ. Критерий Беренса–Фишера проверки гипотезы о равенстве математических ожиданий (случай неравных дисперсий) Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.8, ïîñâÿùåííîì ñðåäñòâó Двухвыборочный t-тест с различными дисперсиями. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè ñîîòâåòñòâåííî µ1 è µ2. Ðàâåíñòâî äèñïåðñèé íå ïðåäïîëàãàåòñÿ. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: µ1 = µ2 Í0: µ1 ≤ µ2 Í1: µ1 ≠ µ2 Í1: µ1 > µ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè: x = 1 n 1 n 1 m 1 m xi , S x2 = ∑ ( xi − x ) 2 , y = ∑ yi , S y2 = ∑ ( yi − y ) 2 . ∑ n i =1 n i =1 m i =1 m i =1 370 Часть III. Анализ одномерных выборок 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = íî çíà÷åíèå k = ( S x2 / n + S y2 / m)2 2 2 ( S x2 / n) 2 ( S y / m) + n −1 m −1 x−y S / n + S y2 / m 2 x è äîïîëíèòåëü- . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ k ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ k ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì. Åñëè íåò îñíîâàíèé ïðåäïîëàãàòü, ÷òî äèñïåðñèè íå ðàâíû (êðèòåðèé ïðîâåðêè ðàâåíñòâà äèñïåðñèé îïèñàí íèæå), ñëåäóåò ïðèìåíèòü òî÷íûé êðèòåðèé ïðîâåðêè ñðåäíèõ ïðè ðàâíûõ äèñïåðñèÿõ. Åñëè ñóììà îáúåìîâ âûáîðîê áîëüøå 30, âìåñòî ðàñïðåäåëåíèÿ Ñòüþäåíòà ìîæíî èñïîëüçîâàòü íîðìàëüíîå ðàñïðåäåëåíèå. 2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî. 3. Åñëè óñëîâèÿ ïðèìåíèìîñòè êðèòåðèÿ ÿâíî íå âûïîëíÿþòñÿ, ñëåäóåò îáðàòèòü âíèìàíèå íà íåïàðàìåòðè÷åñêèå êðèòåðèè, îïèñàííûå â ðàçäåëå 12.1, êîòîðûå ìîæíî èñïîëüçîâàòü êàê êðèòåðèè ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Двухвыборочный t-тест с различными дисперсиями, êîòîðîå îïèñàíî â ðàçäåëå 5.8. Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèè. Критерий проверки гипотезы о равенстве нескольких математических ожиданий (случай равных дисперсий) Äàííûé êðèòåðèé ÿâëÿåòñÿ ìåòîäîì îäíîôàêòîðíîãî äèñïåðñèîííîãî àíàëèçà (ñì. ðàçäåë 3.5.2). Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûk ìè, íî ðàâíûìè äèñïåðñèÿìè. Îáîçíà÷èì n = ∑ ni . i =1 Ãèïîòåçû Í0: µ1 = µ2 = ... = µk; Í1: ìàòåìàòè÷åñêèå îæèäàíèÿ µ1, µ2, ..., µk ðàçëè÷íû. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 . Глава 12. Сравнение одномерных выборок 371 2. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x = s2 = 1 k ∑ ni xi è îáùàÿ âûáîðî÷íàÿ äèñïåðñèÿ n i =1 1 k ∑ (ni − 1) si2 . n − k i =1 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 1 1 k ∑ ni ( xi − x )2 . s 2 k − 1 i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k. Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1.  ñëó÷àå äâóõ âûáîðîê êðèòåðèé ýêâèâàëåíòåí êðèòåðèþ Ñòüþäåíòà ïðîâåðêè ãèïîòåçû î ðàâåíñòâå ìàòåìàòè÷åñêèõ îæèäàíèé (ñì. âûøå). 2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ ðàñïðåäåëåíèÿ âûáîðêè îò íîðìàëüíîãî, åñëè âûáîðêè äîñòàòî÷íîãî áîëüøîãî îáúåìà. 3. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ ðàâåíñòâà äèñïåðñèé, åñëè âûáîðêè ïðèìåðíî îäíîãî îáúåìà. 4. Ìîæíî ïðîâåðÿòü äðóãèå êðèòåðèè, íàïðèìåð: Í0: µ1 – µ2 = δ, µ2 = µ3 = ... = µk; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà.  ýòîì ñëó÷àå ñëåäóåò âû÷åñòü δ èç çíà÷åíèé ïåðâîé âûáîðêè è çàòåì ïðèìåíèòü êðèòåðèé. 5. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, òî äëÿ îïðåäåëåíèÿ òîãî, êàêèå ñðåäíèå ðàçëè÷àþòñÿ, íåîáõîäèìî ïðèìåíèòü êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå, îïèñàííûé â ñëåäóþùåì ðàçäåëå. 6. Åñëè ïðåäïîëîæåíèÿ äàííîãî êðèòåðèÿ ÿâíî íå âûïîëíÿþòñÿ, ñëåäóåò îáðàòèòü âíèìàíèå íà íåïàðàìåòðè÷åñêèé êðèòåðèé Êðàñêàëà–Óîëëèñà (ðàçäåë 12.1.3), êîòîðûé ìîæíî èñïîëüçîâàòü êàê êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.13 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé. Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïîêàçàíû íà ýòîì ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âûñòóïàþò òðè âûáîðêè. Ïåðâàÿ èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ åäèíè÷íûì ìàòåìàòè÷åñêèì îæèäàíèåì è åäèíè÷íîé äèñïåðñèåé, âòîðàÿ è òðåòüÿ — ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1, Выборка2, Выборка3. Îáðàùàåì âíèìàíèå íà ïðèìåíåíèå ôóíêöèè СУММПРОИЗВ (ñì. ðàçäåë 6.1.6), â òîì ÷èñëå â ôîðìóëàõ ìàññèâà, ÷òî ïîçâîëÿåò èñêëþ÷èòü èñïîëüçîâàíèå ïðîìåæóòî÷íûõ âû÷èñëåíèé. 372 Часть III. Анализ одномерных выборок Ðèñ. 12.13. Êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íåñêîëüêèõ ìàòåìàòè÷åñêèõ îæèäàíèé Ýòîò êðèòåðèé ðåàëèçóåò òàêæå ñðåäñòâî Однофакторный дисперсионный анализ, îïèñàííîå â ðàçäåëå 5.11. Òàì æå ïðèâîäèòñÿ ïðèìåð èñïîëüçîâàíèÿ ýòîãî ñðåäñòâà. Критерий множественных сравнений Шеффе Åñëè ïðåäûäóùèé êðèòåðèé ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé îòâåðãàåò íóëåâóþ ãèïîòåçó î ðàâåíñòâå âñåõ ìàòåìàòè÷åñêèõ îæèäàíèé, òî êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå ïîçâîëÿåò îïðåäåëèòü, ìàòåìàòè÷åñêèå îæèäàíèÿ êàêèõ âûáîðîê âûäåëÿþòñÿ èç îáùåãî ðÿäà. Ñ ïîìîùüþ ýòîãî ìåòîäà ìîæíî ïðîâåñòè íåñêîëüêî ïàðíûõ ñðàâíåíèé âûáîðîê, íå óâåëè÷èâàÿ ïðè ýòîì âåðîÿòíîñòü îøèáêè ïåðâîãî ðîäà. Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ íåèçâåñòíûk ìè, íî ðàâíûìè äèñïåðñèÿìè. Îáîçíà÷èì n = ∑ ni . i =1 Ãèïîòåçû Í0: ñ1µ1 + ñ2µ2 + ... + ñkµk = 0, ãäå ñ1, ñ2, ..., ñk — çàäàííûå ïîñòîÿííûå, ñóììà êîòîðûõ ðàâíà íóëþ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 . Глава 12. Сравнение одномерных выборок 373 2. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x = s2 = 1 k ∑ ni xi è îáùàÿ âûáîðî÷íàÿ äèñïåðñèÿ n i =1 1 k ∑ (ni − 1) si2 . n − k i =1 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = k ∑ ci xi i =1 k 2 s 2 (k − 1)∑ ci2 /ni . i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k. Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû ν1 = k – 1 è ν2 = n – k. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÷àñòî ïðèìåíÿþò äëÿ ñåðèè ñðàâíåíèé òèïà Í0: µ1 – µ2 = 0; Í1: µ1 – µ2 ≠ 0. Ïðè ïîïàðíûõ ñðàâíåíèÿõ îáû÷íî ñíà÷àëà ñðàâíèâàþò âûáîðêó ñ íàèìåíüøèì âûáîðî÷íûì ñðåäíèì ñ êàæäîé ïîñëåäóþùåé, îòìå÷àÿ òå âûáîðêè, äëÿ êîòîðûõ êðèòåðèé Øåôôå íå îòâåðãàåò íóëåâóþ ãèïîòåçó. Çàòåì ïîâòîðÿþò ñðàâíåíèÿ ñ âûáîðêîé, èìåþùåé âòîðîå ïî âåëè÷èíå çíà÷åíèå âûáîðî÷íîãî ñðåäíåãî, è ò.ä. 2. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ ðàâåíñòâà äèñïåðñèé, åñëè âûáîðêè ïðèìåðíî îäíîãî îáúåìà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ðåàëèçàöèÿ ýòîãî êðèòåðèÿ â Excel íåçíà÷èòåëüíî îòëè÷àåòñÿ îò ðåàëèçàöèè ïðåäûäóùåãî êðèòåðèÿ. Íà ðèñ. 12.14 ïîêàçàí ðàáî÷èé ëèñò, ðåàëèçóþùèé êðèòåðèé Øåôôå. Êðîìå ôîðìóëû âû÷èñëåíèÿ êðèòåðèàëüíîé ñòàòèñòèêè â ÿ÷åéêå G7 (ôîðìóëà ïðèâåäåíà íà ðèñóíêå), âñå îñòàëüíûå ôîðìóëû ñîâïàäàþò ñ àíàëîãè÷íûìè ôîðìóëàìè, ïîêàçàííûìè íà ðèñ. 12.13.  êà÷åñòâå òåñòîâûõ äàííûõ òàêæå èñïîëüçóþòñÿ âûáîðêè èç ïðåäûäóùåãî ðàçäåëà. Íà ðèñ. 12.14 ïîêàçàíî ñðàâíåíèå âòîðîé è òðåòüåé âûáîðîê — ðàçëè÷èå ìåæäó íèìè íåçíà÷èìî. Íà ðèñ. 12.15 ñðàâíèâàþòñÿ ïåðâàÿ è òðåòüÿ âûáîðêè, çäåñü ðàçëè÷èå çíà÷èìî — íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ. 12.3.2. Проверка гипотез о дисперсиях нормальных распределений  ýòîì ðàçäåëå ïðèâåäåíû êðèòåðèè ïðîâåðêè ðàâåíñòâà äèñïåðñèé íîðìàëüíûõ ñîâîêóïíîñòåé. 374 Часть III. Анализ одномерных выборок Ðèñ. 12.14. Êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå: ñðàâíåíèå âòîðîé è òðåòüåé âûáîðîê Ðèñ. 12.15. Ñðàâíåíèå ïåðâîé è òðåòüåé âûáîðîê Критерий Фишера проверки равенства дисперсий Ýòîò êðèòåðèé îïèñàí â ðàçäåëå 2.4.2 è â ðàçäåëå 5.10, ïîñâÿùåííîì ñðåäñòâó Двухвыборочный F-тест для дисперсий èç ïàêåòà àíàëèçà. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22 è ìàòåìàòè÷åñêèìè îæèäàíèÿìè µ1 è µ2 ñîîòâåòñòâåííî. Глава 12. Сравнение одномерных выборок 375 Ãèïîòåçû à) Ðàâåíñòâî 2 á) Íåðàâåíñòâî 2 Í0: σ12 ≤ σ22 Í1: σ12 ≠ σ22 Í1: σ12 > σ22 Í0: σ1 = σ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Äëÿ êàæäîé âûáîðêè âû÷èñëÿþòñÿ âûáîðî÷íûå äèñïåðñèè 1 n 1 m S x2 = ∑ ( xi − x ) 2 , S y2 = ∑ ( yi − y ) 2 . n i =1 m i =1 2.  êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè âû÷èñëÿåòñÿ äèñïåðñèîííîå îòíîøåíèå Ôèøåðà F = S x2 . S y2 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè.  ñëó÷àå èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà F èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k1 è k2, ãäå k1 = n – 1, k2 = m – 1, åñëè F ≥ 1, è k1 = m – 1, k2 = n – 1, åñëè F < 1. Ñëó÷àé à). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α/2 F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 è k2. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî F ≤ têð, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 è k2. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè F ≤ têð. Êîììåíòàðèè 1. Åñëè èçâåñòíû ìàòåìàòè÷åñêèå îæèäàíèÿ âûáîðîê, òî â ôîðìóëàõ âû÷èñëåíèÿ âûáîðî÷íûõ äèñïåðñèé ñðåäíèå âûáîðîê çàìåíÿþòñÿ èçâåñòíûìè çíà÷åíèÿìè ìàòåìàòè÷åñêèõ îæèäàíèé.  ýòîì ñëó÷àå êðèòè÷åñêèå çíà÷åíèÿ âû÷èñëÿþòñÿ êàê êâàíòèëè F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k1 è k2, ãäå k1 = n, k2 = m, åñëè F ≥ 1, è k1 = m, k2 = n, åñëè F < 1. 2. Êðèòåðèé íåóñòîé÷èâ ïðè îòêëîíåíèè îò íîðìàëüíîñòè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Двухвыборочный F-тест для дисперсий, êîòîðîå îïèñàíî â ðàçäåëå 5.10. Òàì æå ïðèâîäèòñÿ ïðèìåð ðåàëèçàöèè êðèòåðèÿ. Критерий Бартлета проверки равенства нескольких дисперсий Ñòàòèñòè÷åñêàÿ ìîäåëü. Äàíî k îäíîìåðíûõ íåçàâèñèìûõ âûáîðîê îáúåìîì ñîîòâåòñòâåííî n1, n2, ..., nk, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå ñ äèñïåðñèÿìè k σ12, σ22, ..., σk2. Îáîçíà÷èì n = ∑ ni . i =1 Ãèïîòåçû Í0: σ12 = σ22 = ... = σk2; Í1: äèñïåðñèè ðàçëè÷íû. Çàäàí óðîâåíü çíà÷èìîñòè α. 376 Часть III. Анализ одномерных выборок Âû÷èñëåíèÿ 1. Ïî êàæäîé âûáîðêå âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå è âûáîðî÷íûå äèñïåðñèè ïî ñòàíäàðòíûì ôîðìóëàì x1 , x2 , ..., xk , s12 , s22 , ..., sk2 . 2. Âû÷èñëÿþòñÿ âåëè÷èíû С = 1 + 1 k 1 1 1 k 2 (ni − 1) si2 . − ∑ èS = ∑ n − k i =1 3(k − 1) i =1 ni − 1 n − k 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = S2 1 k n ( 1) ln − 2 . ∑ i C i =1 si Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì.  ñëó÷àå äâóõ âûáîðîê ñëåäóåò ïðèìåíÿòü òî÷íûé êðèòåðèé Ôèøåðà. 2. Êðèòåðèé î÷åíü ÷óâñòâèòåëåí ê îòêëîíåíèÿì ðàñïðåäåëåíèÿ âûáîðîê îò íîðìàëüíîãî. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.16 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé. Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, òàêæå ïîêàçàíû íà ýòîì ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âûñòóïàþò òðè âûáîðêè, èìåþùèå ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1, Выборка2, Выборка3. Îáðàùàåì âíèìàíèå íà ïðèìåíåíèå ôîðìóë ìàññèâîâ, ÷òî äàåò âîçìîæíîñòü èñêëþ÷èòü ïðîìåæóòî÷íûå âû÷èñëåíèÿ. Ðèñ. 12.16. Êðèòåðèé ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íåñêîëüêèõ äèñïåðñèé Глава 12. Сравнение одномерных выборок 377 12.3.3. Непараметрический критерий Ансари–Бредли проверки гипотезы о равенстве дисперсий Ýòîò êðèòåðèé èñïîëüçóåòñÿ òîãäà, êîãäà íå âûïîëíÿåòñÿ ïðåäïîëîæåíèå î íîðìàëüíîñòè ðàñïðåäåëåíèé âûáîðîê. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðêè õ1, õ2, ..., õn è y1, y2, ..., ym îáúåìîì ñîîòâåòñòâåííî n è m èçâëå÷åíû èç ñîâîêóïíîñòåé, èìåþùèõ íåïðåðûâíûå ðàñïðåäåëåíèÿ ñ íåèçâåñòíûìè äèñïåðñèÿìè σ12 è σ22. Ïðåäïîëàãàåòñÿ, ÷òî ðàñïðåäåëåíèÿ èìåþò îäèíàêîâûå ìåäèàíû. Òàêæå ïðåäïîëàãàåòñÿ, ÷òî N = n + m ≥ 20. Ãèïîòåçû Í0: σ12 = σ22; Í1: σ12 ≠ σ22. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Îáå âûáîðêè îáúåäèíÿþòñÿ â åäèíóþ âûáîðêó, è ïî îáúåäèíåííîé âûáîðêå ñòðîèòñÿ âàðèàöèîííûé ðÿä õ(1) ≤ õ(2) ≤ ... ≤ õ(N). 2. Âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé ñëåäóþùèì îáðàçîì. Íàèáîëüøåìó è íàèìåíüøåìó çíà÷åíèÿì â îáúåäèíåííîé âûáîðêå ïðèñâàèâàåòñÿ ðàíã 1. Ñëåäóþùèì ïî âåëè÷èíå íàèìåíüøèì è íàèáîëüøèì çíà÷åíèÿì ïðèñâàèâàåòñÿ ðàíã 2 è ò.ä. Åñëè âñòðå÷àþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì ïðèïèñûâàþòñÿ ðàâíûå ñðåäíèå ðàíãè. 3. Äëÿ îäíîé èç âûáîðîê ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ R, êîòîðûå ïîëó÷èëè åå âûáîðî÷íûå çíà÷åíèÿ â îáúåäèíåííîé âûáîðêå. Ïóñòü äëÿ îïðåäåëåííîñòè ïîäñ÷èòûâàåòñÿ ñóììà ðàíãîâ ïåðâîé âûáîðêè. 4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T= 1 R − n( N + 2) 4 , åñëè N — ÷åòíîå ÷èñëî, è mn( N + 2)( N − 2) 48( N − 1) T= n( N + 1) 2 4N , åñëè N — íå÷åòíîå ÷èñëî. mn( N + 1)(3 + N 2 ) 48 N 2 R− (Åñëè âû÷èñëÿåòñÿ ñóììà ðàíãîâ âòîðîé âûáîðêè, òî â ýòèõ ôîðìóëàõ â ÷èñëèòåëå n çàìåíÿåòñÿ íà m.) Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè ãèïîòåçû Í0 ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì (îòñþäà òðåáîâàíèå, ÷òîáû N = n + m ≥ 20). Ïðè ìàëûõ N â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè èñ- 378 Часть III. Анализ одномерных выборок ïîëüçóåòñÿ âåëè÷èíà R, èìåþùàÿ ñïåöèàëüíîå ðàñïðåäåëåíèå, êâàíòèëè êîòîðîãî èñïîëüçóþòñÿ äëÿ ïîñòðîåíèÿ êðèòè÷åñêîé îáëàñòè [22]. 2.  ñëó÷àå, åñëè åñòü ñîâïàäàþùèå çíà÷åíèÿ, ñòàòèñòèêó Ò ìîæíî âû÷èñëèòü ïî áîëåå ñëîæíûì ôîðìóëàì, ó÷èòûâàþùèì ýòè ñîâïàäåíèÿ [13]. 3. Åñëè ðàñïðåäåëåíèÿ èìåþò ðàçëè÷íûå ìåäèàíû è çíà÷åíèÿ ýòèõ ìåäèàí èçâåñòíû (èëè õîòÿ áû èçâåñòíû èõ îöåíêè), ýòîò ìåòîä òàêæå ìîæíî ïðèìåíÿòü, åñëè âìåñòî èñõîäíûõ âûáîðîê èñïîëüçîâàòü âûáîðêè, çíà÷åíèÿ êîòîðûõ óìåíüøåíû íà âåëè÷èíû ìåäèàí (äëÿ êàæäîé âûáîðêè — ñâîÿ ìåäèàíà). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 12.17 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé. Âñå îñíîâíûå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, òàêæå ïîêàçàíû íà ýòîì ðèñóíêå.  êà÷åñòâå òåñòîâûõ âûáîðîê âçÿòû äâå âûáîðêè, èìåþùèå ðàâíîìåðíîå ðàñïðåäåëåíèå: ïåðâàÿ íà èíòåðâàëå [–1, 1], âòîðàÿ — íà èíòåðâàëå [–2, 2]. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ, íàçâàíû ñîîòâåòñòâåííî Выборка1 è Выборка2.  ñòîëáöàõ Ñ è D ñ ïîìîùüþ ôîðìóëû ìàññèâîâ {=ЕСЛИ(РАНГ(A2:B26;A2:B26;1)>ЦЕЛОЕ($F$4/2);$F$4РАНГ(A2:B26;A2:B26;1)+1;РАНГ(A2:B26;A2:B26;1))} âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé, êàê îïèñàíî âûøå, â ï. 2. Çäåñü ôóíêöèÿ РАНГ(A2:B26;A2:B26;1) ñòðîèò âèðòóàëüíûé ìàññèâ “ñòàíäàðòíûõ” ðàíãîâ îáúåäèíåííîé âûáîðêè. Åñëè çíà÷åíèÿ ýòèõ ðàíãîâ Ri ïðåâûøàþò ïîëîâèíó ÷èñëà N îáùåãî îáúåìà âûáîðîê, òî îíè çàìåùàþòñÿ çíà÷åíèåì N – Ri + 1.  ïðîòèâíîì ñëó÷àå çíà÷åíèÿ ðàíãîâ îñòàþòñÿ áåç èçìåíåíèÿ. Îáðàùàåì âíèìàíèå, ÷òî çíà÷åíèå ñòàòèñòèêè Ò âû÷èñëÿåòñÿ ïî ðàçíûì ôîðìóëàì â ÿ÷åéêàõ Í4 è Í5 äëÿ ÷åòíîãî è íå÷åòíîãî çíà÷åíèé N. Êîíå÷íî, ýòè ôîðìóëû ìîæíî îáúåäèíèòü â îäíó ñ ïîìîùüþ ôóíêöèè ЕСЛИ, îäíàêî òàêàÿ îáúåäèíåííàÿ ôîðìóëà áóäåò âåñüìà ñëîæíîé è íå÷èòàåìîé. Âûáîð çíà÷åíèÿ Ò, â çàâèñèìîñòè îò ÷åòíîñòè èëè íå÷åòíîñòè N, îñóùåñòâëÿåòñÿ â ôîðìóëå ÿ÷åéêè G8 ïðè îïðåäåëåíèè, îòâåðãàåòñÿ íóëåâàÿ ãèïîòåçà èëè ïðèíèìàåòñÿ.  äàííîì ñëó÷àå ãèïîòåçà î ðàâåíñòâå äèñïåðñèé îòâåðãàåòñÿ. Ðèñ. 12.17. Êðèòåðèé Àíñàðè–Áðåäëè ïðîâåðêè ãèïîòåçû î ðàâåíñòâå äèñïåðñèé Глава 12. Сравнение одномерных выборок 379 12.3.4. Проверка гипотез о равенстве биномиальных вероятностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìåþòñÿ äâå ñåðèè íàáëþäåíèé çà ýêñïåðèìåíòîì.  ïåðâîé ñåðèè â êàæäîì ýêñïåðèìåíòå ñ âåðîÿòíîñòüþ ð1 ïðîèñõîäèò ñîáûòèå “1” (“óñïåõ”), âî âòîðîé ñåðèè ýòî ñîáûòèå ïðîèñõîäèò ñ âåðîÿòíîñòüþ ð2. Ïóñòü â ïåðâîé ñåðèè çàôèêñèðîâàíî n ýêñïåðèìåíòîâ, èç íèõ â r1 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Âî âòîðîé ñåðèè çàôèêñèðîâàíî m ýêñïåðèìåíòîâ, èç íèõ â r2 ñëó÷àÿõ íàáëþäàëîñü ñîáûòèå “1”. Ðàçìåðû ñåðèé áîëüøå 20. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî Í0: ð1 – ð2 = δ Í0: ð1 – ð2 ≤ δ Í1: ð1 – ð2 ≠ δ Í1: ð1 – ð2 > δ Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè âåðîÿòíîñòåé ð1 è ð2: pˆ1 = r1 / n , pˆ 2 = r2 / m è äîïîëíèòåëüíî δˆ = pˆ1 − pˆ 2 , An , m = pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) + . n m 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = δ̂ − δ . An, m Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |Ò| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Âû÷èñëÿåòñÿ êâàíòèëü t ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ ïðèáëèæåííûì è îñíîâûâàåòñÿ íà àïïðîêñèìàöèè áèíîìèàëüíîãî ðàñïðåäåëåíèÿ íîðìàëüíûì. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåìû âûáîðîê áûëè íå ìåíüøå 20. 2. Êðèòåðèé ïîñòðîåí íà îñíîâå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòåé áèíîìèàëüíûõ âåðîÿòíîñòåé (ñì. ðàçäåë 12.2.4). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî ìåòîäà íå âûçûâàåò çàòðóäíåíèé. 380 Часть III. Анализ одномерных выборок Часть IV Статистический анализ зависимостей В этой части... Ãëàâà 13. Êîððåëÿöèîííûé àíàëèç Ãëàâà 14. Ñðàâíåíèå çàâèñèìûõ âûáîðîê Ãëàâà 15. Ðåãðåññèîííûé àíàëèç  ýòîé ÷àñòè îïèñàíû ìåòîäû àíàëèçà ñòàòèñòè÷åñêèõ çàâèñèìîñòåé, âêëþ÷àþùèå â ñåáÿ øèðîêèé ñïåêòð ñòàòèñòè÷åñêèõ àëãîðèòìîâ.  ãëàâå 13 ðàññìîòðåíû ìåòîäû êîððåëÿöèîííîãî àíàëèçà, êîòîðûå óñòàíàâëèâàþò ñàì ôàêò ñòàòèñòè÷åñêîé çàâèñèìîñòè ìåæäó äàííûìè, à òàêæå ñïîñîáû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè.  ãëàâå 14 ïîêàçàíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé çàâèñèìûõ êîìïîíåíòîâ ìíîãîìåðíûõ âûáîðîê.  ãëàâå 15 îïèñàí êðóã çàäà÷, ñâÿçàííûõ ñ ïîñòðîåíèåì ðåãðåññèé, íà÷èíàÿ ñ îáùåé âû÷èñëèòåëüíîé ñõåìû îïðåäåëåíèÿ êîýôôèöèåíòîâ óðàâíåíèé ðåãðåññèè è çàêàí÷èâàÿ êðèòåðèÿìè ïðîâåðêè àäåêâàòíîñòè ïîñòðîåííîãî óðàâíåíèÿ ðåãðåññèè. Глава 13 Корреляционный анализ Í àñòîÿùàÿ ãëàâà ïîñâÿùåíà çàäà÷å óñòàíîâëåíèÿ ñàìîãî ôàêòà íàëè÷èÿ ñòàòèñòè÷åñêè çíà÷èìîé ñâÿçè ìåæäó ïåðåìåííûìè.  îáùåì âèäå ýòà çàäà÷à îïèñàíà â ãëàâå 3. Íàïîìíèì, ÷òî ìåòîäû, ïðèìåíÿåìûå äëÿ åå ðåøåíèÿ, çàâèñÿò îò ïðèðîäû èññëåäóåìûõ ñëó÷àéíûõ ïåðåìåííûõ (êîëè÷åñòâåííûå, ïîðÿäêîâûå èëè êëàññèôèêàöèîííûå), îò âûáðàííîãî ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè (èíäåêñ èëè êîýôôèöèåíò êîððåëÿöèè, ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè è ò.ï.) è îò êîíêðåòíîé ðåøàåìîé çàäà÷è (òî÷å÷íîå èëè èíòåðâàëüíîå îöåíèâàíèå ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè, ïðîâåðêà ãèïîòåçû î çíà÷åíèè ïîêàçàòåëÿ ñòàòèñòè÷åñêîé çàâèñèìîñòè). 13.1. Критерии независимости  ýòîì ðàçäåëå îïèñàíû êðèòåðèè ïðîâåðêè ãèïîòåç î íåçàâèñèìîñòè ìíîãîìåðíûõ ñëó÷àéíûõ âåëè÷èí. Äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí ýòî êðèòåðèè ïðîâåðêè ãèïîòåç î íóëåâîì çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè, äëÿ ïîðÿäêîâûõ ñëó÷àéíûõ âåëè÷èí àíàëîãè÷íûå êðèòåðèè ñòðîÿòñÿ íà îñíîâå ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè, äëÿ êëàññèôèêàöèîííûõ âåëè÷èí ïðèìåíÿåòñÿ àíàëèç òàáëèö ñîïðÿæåííîñòè (ñì. ãëàâó 3). Äëÿ âñåõ ýòèõ ìåòîäîâ ñïðàâåäëèâî “ïðàâèëî âëîæåííîñòè” — ìåòîäû, ïðèìåíèìûå äëÿ êëàññèôèêàöèîííûõ ñëó÷àéíûõ âåëè÷èí, òàêæå ïðèìåíèìû äëÿ ïîðÿäêîâûõ è êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí; ìåòîäû, ïðèìåíèìûå äëÿ ïîðÿäêîâûõ ñëó÷àéíûõ âåëè÷èí, òàêæå ïðèìåíèìû äëÿ êîëè÷åñòâåííûõ âåëè÷èí. Îäíàêî ïî âîçìîæíîñòè ñëåäóåò èñïîëüçîâàòü êðèòåðèè, ïðåäíàçíà÷åííûå äëÿ êîíêðåòíîãî òèïà ñëó÷àéíûõ ïåðåìåííûõ. Èñêëþ÷åíèå ñîñòàâëÿþò êðèòåðèè, ïîñòðîåííûå íà îñíîâå ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè, ïîñêîëüêó êðèòåðèé íåçàâèñèìîñòè äëÿ êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ñëåäóþùèé ðàçäåë) ÿâëÿåòñÿ ïðèáëèæåííûì è áóäåò òî÷íûì òîëüêî äëÿ íîðìàëüíî ðàñïðåäåëåííûõ âåëè÷èí. Êðîìå òîãî, íåïàðàìåòðè÷åñêèé êðèòåðèé íà îñíîâå êîýôôèöèåíòà êîíêîðäàöèè ïîçâîëÿåò îöåíèòü âçàèìîçàâèñèìîñòü íåñêîëüêèõ (áîëüøå äâóõ) ñëó÷àéíûõ âåëè÷èí. Òàêæå íåîáõîäèìî ïîìíèòü, ÷òî êðèòåðèè, ïîñòðîåííûå íà îñíîâå êîýôôèöèåíòà êîððåëÿöèè, íå äîêàçûâàþò íåçàâèñèìîñòü ñëó÷àéíûõ âåëè÷èí: íåçíà÷èìîå îòëè÷èå êîýôôèöèåíòà êîððåëÿöèè îò íóëÿ ãîâîðèò òîëüêî î òîì, ÷òî îòñóòñòâóåò ëèíåéíàÿ çàâèñèìîñòü ìåæäó ñëó÷àéíûìè âåëè÷èíàìè. Âîçìîæíû âèäû íåëèíåéíîé çàâèñèìîñòè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, êîãäà êîýôôèöèåíò êîððåëÿöèè ìåæäó íèìè ðàâåí íóëþ. Íî íà ïðàêòèêå, êàê ïðàâèëî, íåêîððåëèðóåìîñòü îòîæäåñòâëÿþò ñ íåçàâèñèìîñòüþ. 382 Часть IV. Статистический анализ зависимостей 13.1.1. Критерий независимости на основе преобразования Фишера Íîðìàëèçóþùåå z-ïðåîáðàçîâàíèå Ôèøåðà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.1. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà è ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20. Ãèïîòåçû Í0: êîýôôèöèåíò êîððåëÿöèè ρ = 0; Í1: êîýôôèöèåíò êîððåëÿöèè ρ ≠ 0. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x = 2. Âû÷èñëÿåòñÿ òî÷å÷íàÿ n ∑ ( x − x )( y i r= i ∑ (x − x) ⋅ ∑ ( y i êîýôôèöèåíòà êîððåëÿöèè . n 2 i =1 îöåíêà − y) i =1 n 1 n 1 n xi è y = ∑ yi . ∑ n i =1 n i =1 i − y) 2 i =1 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = n − 3 1+ r ln . 2 1− r Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé ïðèáëèæåííûé. Òî÷íîå ðàñïðåäåëåíèå ñòàòèñòèêè Ò çàâèñèò îò ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Z; îíî âåñüìà ñëîæíîå. 2. Äëÿ íîðìàëüíî ðàñïðåäåëåííîé ñëó÷àéíîé âåëè÷èíû ñóùåñòâóåò òî÷íûé êðèòåðèé (ñì. ñëåäóþùèé ðàçäåë). 3. Ïðåîáðàçîâàíèå Ôèøåðà z = 1 1+ r ln , ÿâëÿþùååñÿ îñíîâîé äàííîãî êðèòå2 1− r ðèÿ, òîëüêî àñèìïòîòè÷åñêè èìååò íîðìàëüíîå ðàñïðåäåëåíèå. Îòñþäà òðåáîâàíèå, ÷òîáû îáúåì âûáîðêè áûë íå ìåíåå 20. Òî÷íîñòü àïïðîêñèìàöèè ðàñïðåäåëåíèÿ âåëè÷èíû z íîðìàëüíûì ðàñïðåäåëåíèåì çàâèñèò îò ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû Z. Ïîýòîìó òî÷íîñòü ìîæåò áûòü ðàçëè÷íîé äëÿ ðàçíûõ âûáîðî÷íûõ ðàñïðåäåëåíèé. Глава 13. Корреляционный анализ 383 4. Âî ìíîãèõ ñëó÷àÿõ, êîãäà ðàñïðåäåëåíèå ñëó÷àéíîé âåëè÷èíû Z î÷åíü äàëåêî îò íîðìàëüíîãî èëè äèñêðåòíî, ñëåäóåò ïðèìåíÿòü íåïàðàìåòðè÷åñêèå êðèòåðèè íåçàâèñèìîñòè, îïèñàííûå íèæå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè â Excel ïðåäóñìîòðåíà ôóíêöèÿ КОРРЕЛ, à ïðåîáðàçîâàíèå Ôèøåðà âû÷èñëÿåò ôóíêöèÿ ФИШЕР. 13.1.2. Критерий независимости для двумерных нормальных совокупностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Ãèïîòåçû Í0: êîýôôèöèåíò êîððåëÿöèè ρ = 0; Í1: êîýôôèöèåíò êîððåëÿöèè ρ ≠ 0. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x = 2. Âû÷èñëÿåòñÿ òî÷å÷íàÿ n ∑ ( x − x )( y i r= i ∑ (x − x) ⋅ ∑ ( y i êîýôôèöèåíòà êîððåëÿöèè . n 2 i =1 îöåíêà − y) i =1 n 1 n 1 n xi è y = ∑ yi . ∑ n i =1 n i =1 i − y) 2 i =1 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = r n−2 1− r2 . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t; èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé ìîæíî ïðèìåíÿòü ïðè óìåðåííûõ îòêëîíåíèÿõ âûáîðî÷íîãî ðàñïðåäåëåíèÿ îò íîðìàëüíîãî. 2.  ðàçäåëå 13.3.1 ïðèâåäåí êðèòåðèé ïðîâåðêè çíà÷åíèÿ êîýôôèöèåíòà êîððåëÿöèè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel äàííîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. Äëÿ âû÷èñëåíèÿ âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè â Excel ïðåäóñìîòðåíà ôóíêöèÿ КОРРЕЛ. 384 Часть IV. Статистический анализ зависимостей 13.1.3. Критерий независимости на основе рангового коэффициента корреляции Спирмена Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.2. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà. Îáúåì âûáîðêè — áîëåå 10. Ãèïîòåçû Í0: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà rS = 0; Í1: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè rS ≠ 0. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi) ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(n). Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî ýòèì çíà÷åíèÿì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. 2. Âû÷èñëÿåòñÿ rS = 1 − ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Ñïèðìåíà n 6 (ri − qi )2 . ∑ n − n i =1 3 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = rS n − 2 1 − rS2 . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû êîýôôèöèåíò rS èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå; ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). Âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñî ñòåïåíüþ ñâîáîäû (n – 2). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ êîýôôèöèåíò rS, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Ñïèðìåíà. 2. Åñëè íåò äîñòàòî÷íûõ îñíîâàíèé îòâåðãàòü ãèïîòåçó î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé èçâëåêàåòñÿ âûáîðêà, òî öåëåñîîáðàçíî ïðèìåíÿòü áîëåå ìîùíûé ìåòîä, îñíîâàííûé íà êîýôôèöèåíòå êîððåëÿöèè (ñì. ïðåäûäóùèé ðàçäåë). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.1 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.  ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (â äàííîì ñëó÷àå çíà÷åíèÿ íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]). Äèàïàçîí Глава 13. Корреляционный анализ 385 ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå  íàçâàí Y. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 13.1. Ïîÿñíèì ôîðìóëó ìàññèâà, âû÷èñëÿþùóþ ñóììó êâàäðàòîâ ðàçíîñòåé ðàíãîâ â ÿ÷åéêå D3: {=СУММКВРАЗН(РАНГ(Х;Х;1);РАНГ(Y;Y;1))} Ýòà ôîðìóëà ñ ïîìîùüþ ôóíêöèé РАНГ(Х;Х;1) è РАНГ(Y;Y;1) ñîçäàåò äâà âèðòóàëüíûõ ìàññèâà, ñîäåðæàùèõ ðàíãè çíà÷åíèé äèàïàçîíà Х è äèàïàçîíà Y (ôóíêöèÿ РАНГ îïèñàíà â ðàçäåëå 4.2.5). Ôóíêöèÿ СУММКВРАЗН âû÷èñëÿåò ñóììó êâàäðàòîâ ïîïàðíûõ ðàçíîñòåé çíà÷åíèé ýòèõ âèðòóàëüíûõ ìàññèâîâ (ôóíêöèÿ СУММКВРАЗН îïèñàíà â ðàçäåëå 6.1.6). Ýòó ôîðìóëó ìîæíî áûëî áû íåïîñðåäñòâåííî âêëþ÷èòü â ôîðìóëó âû÷èñëåíèÿ êîýôôèöèåíòà Ñïèðìåíà, íî íå ðåêîìåíäóåì ýòîãî äåëàòü, ïîñêîëüêó â ñëó÷àå, åñëè âûáîðî÷íûå çíà÷åíèÿ áóäóò âû÷èñëÿòüñÿ ñ ïîìîùüþ ôóíêöèè СЛЧИС, ìîãóò âîçíèêíóòü íåêîòîðûå ïðîáëåìû, ñâÿçàííûå ñ àâòîìàòè÷åñêèì ïåðåñ÷åòîì ôîðìóë. Îñòàëüíûå ôîðìóëû íà ðàáî÷åì ëèñòå î÷åâèäíû. Ðèñ. 13.1. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå ðàíãîâîãî êîýôôèöèåíòà êîððåëÿöèè Ñïèðìåíà 13.1.4. Критерий независимости на основе рангового коэффициента корреляции Кендалла Ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà è åãî ñâîéñòâà îïèñàíû â ðàçäåëå 3.3.2. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà. Îáúåì âûáîðêè — áîëåå 10. Ãèïîòåçû Í0: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà rÊ = 0; Í1: ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè rÊ ≠ 0. Çàäàí óðîâåíü çíà÷èìîñòè α. 386 Часть IV. Статистический анализ зависимостей Âû÷èñëåíèÿ 1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (xi, yi) ïðèñâàèâàþòñÿ ðàíãè (ri, qi) ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ õ(1) ≤ õ(2) ≤ ... ≤ õ(n) è ó(1) ≤ ó(2) ≤ ... ≤ ó(n). Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî ýòèì çíà÷åíèÿì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. 2. Ïîëó÷åííàÿ ïîñëåäîâàòåëüíîñòü ðàíãîâ (r1, q1), (r2, q2), ..., (rn, qn) óïîðÿäî÷èâàåòñÿ ïî âîçðàñòàíèþ ðàíãîâ ri — ïîëó÷àåòñÿ ïîñëåäîâàòåëüíîñòü (1, q(1)), (2, q(2)), ..., (n, q(n)). 3. Âû÷èñëÿåòñÿ ðàíãîâûé êîýôôèöèåíò êîððåëÿöèè Êåíäàëëà n n 2 rK = sign(q( j ) − q( i ) ) , ãäå ôóíêöèÿ sign(x) ïðèíèìàåò çíà÷åíèå ∑ ∑ n(n − 1) i =1 j = i +1 +1, åñëè õ > 0, è çíà÷åíèå –1, åñëè õ < 0. 4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = rK 9n(n − 1) . 2(2n + 5) Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû êîýôôèöèåíò rÊ èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Êåíäàëëà, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî |T| ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ êîýôôèöèåíò rÊ, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Êåíäàëëà. 2. Åñëè íåò äîñòàòî÷íûõ îñíîâàíèé îòâåðãàòü ãèïîòåçó î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè, èç êîòîðîé èçâëåêàåòñÿ âûáîðêà, òî öåëåñîîáðàçíî ïðèìåíÿòü áîëåå ìîùíûé ìåòîä èç ðàçäåëà 13.1.2. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.2 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.  ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (êàê è â ïðåäûäóùåì ïðèìåðå, âûáîðî÷íûå çíà÷åíèÿ íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]). Äèàïàçîí ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå  íàçâàí Y. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 13.2. Ê ñîæàëåíèþ, äëÿ ðåàëèçàöèè êðèòåðèÿ íåêîòîðûå äåéñòâèÿ íåîáõîäèìî âûïîëíèòü âðó÷íóþ è íåâîçìîæíî îáîéòèñü áåç íåêîòîðûõ ïðîìåæóòî÷íûõ âû÷èñëåíèé.  ñòîëáöàõ À è  çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ, à â ñòîëáöàõ Ñ è D ïîäñ÷èòàíû ðàíãè ýòèõ çíà÷åíèé ñ ïîìîùüþ ôîðìóë ìàññèâîâ {=РАНГ(Х;Х;1)} è {=РАНГ(Y;Y;1)}. (Äèàïàçîí ÿ÷ååê â ñòîëáöå À, ñîäåðæàùèé âûáîðî÷íûå çíà÷åíèÿ, íàçâàí Х, à ñîîòâåòñòâóþùèé äèàïàçîí â ñòîëáöå  íàçâàí Y.) Äàëåå íåîáõîäèìî ñîðòèðîâàòü äâóõñòîëáöîâûé äèàïàçîí, ñîäåðæàùèé ðàíãè, ïî çíà÷åíèÿì ðàíãîâ Глава 13. Корреляционный анализ 387 ñòîëáöà Ñ. Ýòî ìîæíî ñäåëàòü â òåõ æå ñòîëáöàõ Ñ è D, ïðåäâàðèòåëüíî ïðåîáðàçîâàâ ôîðìóëû, ïî êîòîðûì âû÷èñëÿëèñü ðàíãè, â çíà÷åíèÿ. Äëÿ ýòîãî íàäî âûäåëèòü äèàïàçîí Ñ2:D21, ñîäåðæàùèé ðàíãè, ñêîïèðîâàòü åãî è, íå îòìåíÿÿ åãî âûäåëåíèå, âûïîëíèòü êîìàíäó ПравкаÖСпециальная вставка.  îòêðûâøåìñÿ îäíîèìåííîì äèàëîãîâîì îêíå ñëåäóåò óñòàíîâèòü ïåðåêëþ÷àòåëü Значения è ùåëêíóòü íà êíîïêå ОК. Íà ðèñ. 13.2 äëÿ íàãëÿäíîñòè ðàíãè ñîðòèðóþòñÿ â ñîñåäíèõ ñòîëáöàõ Å è F, â êîòîðûå îíè ñêîïèðîâàíû èç äèàïàçîíà Ñ2:D21 êàê çíà÷åíèÿ (îïÿòü ñ ïîìîùüþ äèàëîãîâîãî îêíà Специальная вставка). Ñîðòèðîâêà îñóùåñòâëÿåòñÿ ñ ïîìîùüþ êîìàíäû ДанныеÖСортировка.  ñòîëáöå G ðåàëèçón åòñÿ ÷àñòü ôîðìóëû ∑ sign(q ( j) − q( i ) ) âû÷èñëåíèÿ êîýôôèöèåíòà Êåíäàëëà. Äëÿ j = i +1 ýòîãî â ÿ÷åéêó G2 ââåäåíà ôîðìóëà ìàññèâà {=СУММ(ЗНАК(F3:$F$21-F2))}, êîòîðàÿ ñíà÷àëà ñîçäàåò âèðòóàëüíûé ìàññèâ çíà÷åíèé sign(q( j ) − q(1) ) (j ≥ 2), à çàòåì ñóììèðóåò ýòè çíà÷åíèÿ. Ôóíêöèÿ ЗНАК — ýòî ýêâèâàëåíò ôóíêöèè sign. Îáðàùàåì âíèìàíèå, ÷òî â ýòîé ôîðìóëå èñïîëüçóþòñÿ îòíîñèòåëüíûå ññûëêè íà ÿ÷åéêó F2 è íà íà÷àëî äèàïàçîíà F3:$F$21. Äàííàÿ ôîðìóëà êîïèðóåòñÿ âíèç äî ÿ÷åéêè F20, ïðè ýòîì àäðåñà ÿ÷ååê F2 è F3 ñîîòâåòñòâóþùèì îáðàçîì ìîäèôèöèðóþòñÿ, à êîíå÷íàÿ ÿ÷åéêà $F$21 äèàïàçîíà ñóììèðîâàíèÿ îñòàåòñÿ íåèçìåííîé. Äèàïàçîí ÿ÷ååê â ñòîëáöå G íàçâàí Знаки, ýòî èìÿ èñïîëüçóåòñÿ â ôîðìóëå ÿ÷åéêè I3. Îñòàëüíûå ôîðìóëû äàííîãî ðàáî÷åãî ëèñòà î÷åâèäíû. Ðèñ. 13.2. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå ðàíãîâîãî êîýôôèöèåíòà êîððåëÿöèè Êåíäàëëà Ïîñêîëüêó íåêîòîðûå äåéñòâèÿ âûïîëíÿþòñÿ âðó÷íóþ, äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè äëÿ íîâîé âûáîðêè èõ ïðèäåòñÿ ïîâòîðèòü ñíîâà (ýòî ïðåîáðàçîâàíèå ôîðìóë, âû÷èñëÿþùèõ ðàíãè, â çíà÷åíèÿ, è âûïîëíåíèå ñîðòèðîâêè). Åñëè äàííûé êðèòåðèé èñïîëüçóåòñÿ ÷àñòî, òî ìîæíî íàïèñàòü ïðîñòûå ìàêðîñû, êîòîðûå áóäóò àâòîìàòèçèðîâàòü ýòè äåéñòâèÿ. 388 Часть IV. Статистический анализ зависимостей 13.1.5. Критерий независимости для многомерных выборок Ýòîò êðèòåðèé îñíîâàí íà êîýôôèöèåíòå ñîãëàñîâàííîñòè (êîíêîðäàöèè), îïèñàííîì â ðàçäåëå 3.3.2, è ïðèìåíÿåòñÿ äëÿ ïðîâåðêè ãèïîòåçû î íåçàâèñèìîñòè äëÿ íåñêîëüêèõ (áîëüøå äâóõ) ñëó÷àéíûõ âåëè÷èí1. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X1, X2, ..., Xm).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x11, x21, ..., xm1), (x12, x22, ..., xm2), ..., (x1n, x2n, ..., xmn). Ãèïîòåçû Í0: êîýôôèöèåíò ñîãëàñîâàííîñòè W = 0; Í1: êîýôôèöèåíò ñîãëàñîâàííîñòè W ≠ 0. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Êàæäîìó âûáîðî÷íîìó çíà÷åíèþ (x1i, x2i, ..., xmi) ïðèñâàèâàþòñÿ ðàíãè (r1i, r2i, ..., rmi). Ðàíãè rji ïðèñâàèâàþòñÿ çíà÷åíèÿì xji íåçàâèñèìî ïóòåì ïîñòðîåíèÿ îòäåëüíûõ âàðèàöèîííûõ ðÿäîâ äëÿ ðåàëèçàöèè êàæäîãî êîìïîíåíòà Xj òàê æå, êàê ïðè âû÷èñëåíèè êîýôôèöèåíòîâ Ñïèðìåíà è Êåíäàëëà. Åñëè åñòü ñîâïàäàþùèå âûáîðî÷íûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ îäèíàêîâûå ðàíãè, ðàâíûå ñðåäíåìó ðàíãîâ, êîòîðûå áûëè áû èì ïðèñâîåíû ïðè îòñóòñòâèè ðàâåíñòâà çíà÷åíèé. 2. Âû÷èñëÿåòñÿ êîýôôèöèåíò ñîãëàñîâàííîñòè 2 n m 12 m(n + 1) 3. W = 2 3 ∑ rji − . ∑ 2 m (n − n) i =1 j =1 4. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = m(n – 1)W. Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû êîýôôèöèåíò W èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Ýòîò êðèòåðèé ïðèáëèæåííûé è ïðèìåíÿåòñÿ äëÿ âûáîðîê îáúåìîì íå ìåíåå 10. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè áåðåòñÿ êîýôôèöèåíò W, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ èç òàáëèöû ñïåöèàëüíîãî ðàñïðåäåëåíèÿ ýòîãî êîýôôèöèåíòà. 2. Äëÿ ïðîâåðêè íåçàâèñèìîñòè äâóõ ñëó÷àéíûõ âåëè÷èí ðåêîìåíäóåòñÿ ïðèìåíÿòü êðèòåðèè íà îñíîâå ðàíãîâûõ êîýôôèöèåíòîâ êîððåëÿöèè Ñïèðìåíà èëè Êåíäàëëà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.3 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.  ñòîëáöàõ À,  è Ñ çàïèñàíû âûáîðî÷íûå çíà÷åíèÿ (âûáîðî÷íûå çíà÷åíèÿ 1 Ïîïóòíî îòìåòèì, ÷òî äëÿ ìíîãîìåðíûõ âûáîðîê ñðåäñòâî Excel Корреляция ìîæåò âû÷èñëèòü êîððåëÿöèîííóþ ìàòðèöó, à ñðåäñòâî Ковариация — êîâàðèàöèîííóþ ìàòðèöó. Ýòè ñðåäñòâà îïèñàíû â ãëàâå 5. Глава 13. Корреляционный анализ 389 íåçàâèñèìû è èìåþò ðàâíîìåðíûå ðàñïðåäåëåíèÿ íà èíòåðâàëå [0, 1]).  ñòîëáöàõ D, E è F ïîäñ÷èòàíû ðàíãè ñ ïîìîùüþ ôóíêöèè РАНГ äëÿ çíà÷åíèé êàæäîãî ñòîëáöà â îòäåëüíîñòè (òàê æå, êàê â ïðåäûäóùèõ êðèòåðèÿõ). Äàëåå â ÿ÷åéêó G2 ââåäåíà ôîðìóëà =(СУММ(D2:F2)-$I$3*($I$1+1)/2)^2 m j =1 Îíà ðåàëèçóåò äëÿ i = 1 ÷àñòü ôîðìóëû ∑ rji − 2 m(n + 1) âû÷èñëåíèÿ êîýôôèöè2 åíòà ñîãëàñîâàííîñòè. Ýòà ôîðìóëà çàòåì ñêîïèðîâàíà âíèç äî êîíöà èíòåðâàëà G2:G21. Îñòàëüíûå ôîðìóëû äàííîãî ðàáî÷åãî ëèñòà î÷åâèäíû. Ðèñ. 13.3. Êðèòåðèé íåçàâèñèìîñòè äëÿ ìíîãîìåðíûõ âûáîðîê 13.1.6. Критерий независимости на основе таблиц сопряженности Ýòîò êðèòåðèé, èíîãäà íàçûâàåìûé êðèòåðèåì íåçàâèñèìîñòè χ2, ðàçðàáîòàí äëÿ îïðåäåëåíèÿ íåçàâèñèìîñòè êëàññèôèêàöèîííûõ ñëó÷àéíûõ âåëè÷èí (ñì. ðàçäåë 3.3.3). Îäíàêî åãî ìîæíî ïðèìåíÿòü ê ñëó÷àéíûì âåëè÷èíàì äðóãèõ òèïîâ.  ÷àñòíîñòè, îí õîðîøî ïîäõîäèò äëÿ îïðåäåëåíèÿ íåçàâèñèìîñòè êîëè÷åñòâåííûõ ñëó÷àéíûõ âåëè÷èí, èìåþùèõ äèñêðåòíûå ðàñïðåäåëåíèÿ íà êîíå÷íîì ìíîæåñòâå çíà÷åíèé. Ìû ïîêàæåò ýòîò êðèòåðèé íà ïðèìåðå èìåííî äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí. Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü èìååòñÿ âûáîðêà (õ1, ó1), (õ2, ó2), ..., (xn, yn), êîòîðàÿ ÿâëÿåòñÿ ðåàëèçàöèåé äâóìåðíîé äèñêðåòíîé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), ãäå ñëó÷àéíàÿ âåëè÷èíà Õ ïðèíèìàåò êîíå÷íîå ÷èñëî çíà÷åíèé À1, À2, ..., Às, à ñëó÷àéíàÿ âåëè÷èíà Y — òàêæå êîíå÷íîå ÷èñëî çíà÷åíèé B1, B2, ..., Br. Ãèïîòåçû Í0: ñëó÷àéíûå âåëè÷èíû Õ è Y íåçàâèñèìû; Í1: ñëó÷àéíûå âåëè÷èíû Õ è Y çàâèñèìû. Çàäàí óðîâåíü çíà÷èìîñòè α. 390 Часть IV. Статистический анализ зависимостей Âû÷èñëåíèÿ 1. Ïî âûáîðêå ñîñòàâëÿåòñÿ òàáëèöà ñîïðÿæåííîñòè ñëåäóþùåãî âèäà. B1 À1 À2 ... Às Âñåãî ν11 ν12 ... ν1s n1* = ∑ ν1i s i =1 B2 ν21 ν22 ... ν2s n2* = ∑ ν 2i ... ... ... ... ... ... Br νr1 νr2 ... νrs nr * = ∑ ν ri r r ... r s i =1 s i =1 Âñåãî n*1 = ∑ ν i1 i =1 n*2 = ∑ ν i 2 i =1 n*s = ∑ ν is i =1 s r i =1 i =1 n = ∑ n*i = ∑ ni* Çäåñü νij — êîëè÷åñòâî âûáîðî÷íûõ çíà÷åíèé (xk, yt), èìåþùèõ çíà÷åíèÿ Aj è Bi. 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà r s T = n∑∑ i =1 j =1 (ν ij − ni * n* j )2 ni* n* j r s ν ij2 = n ∑∑ − 1 . i =1 j =1 ni * n* j Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò ïðèáëèæåííî èìååò ðàñïðåäåëåíèå χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1)(s – 1). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1)(s – 1). Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè âûïîëíÿåòñÿ íåðàâåíñòâî T ≤ t, èíà÷å ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèé 1. Ýòî àñèìïòîòè÷åñêèé êðèòåðèé. Ïîýòîìó íåîáõîäèìî, ÷òîáû îáúåì âûáîðêè áûë íå ìåíåå 20. 2. Ñóùåñòâóåò îïðåäåëåííàÿ ïðîáëåìà, ñâÿçàííàÿ ñ êîëè÷åñòâîì íàáëþäåíèé â êàæäîé ÿ÷åéêå òàáëèöû ñîïðÿæåííîñòè. Ìîæíî âñòðåòèòü ðåêîìåíäàöèè îáúåäèíÿòü ÿ÷åéêè ñ ìàëûì êîëè÷åñòâîì íàáëþäåíèé.  îáùåì ñëó÷àå çäåñü íàäî ïðèäåðæèâàòüñÿ òåõ æå ïðàâèë, ÷òî è â êðèòåðèè χ2 (ñì. ðàçäåë 9.2.1). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.4 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.  êà÷åñòâå òåñòîâîé âûáîðêè âçÿòà äâóìåðíàÿ âûáîðêà, êîìïîíåíòû êîòîðîé íåçàâèñèìû è èìåþò ðàñïðåäåëåíèå Ïóàññîíà ñ ïàðàìåòðîì λ = 2. Âûáîðêà ïîëó÷åíà ñ ïîìîùüþ ñðåäñòâà Генерация случайных чисел. Ïîñêîëüêó â äàííîì ñëó÷àå ñëó÷àéíûå âåëè÷èíû ïðèíèìàþò íåîòðèöàòåëüíûå öåëî÷èñëåííûå çíà÷åíèÿ, äëÿ îïðåäåëåíèÿ êîëè÷åñòâà ðàçëè÷íûõ çíà÷åíèé â âûáîðêàõ Õ è Y äîñòàòî÷íî Глава 13. Корреляционный анализ 391 íàéòè ìàêñèìàëüíûå çíà÷åíèÿ, èìåþùèåñÿ â ýòèõ âûáîðêàõ. Ýòè çíà÷åíèÿ ñ ïîìîùüþ ôóíêöèè МАКС ïîëó÷åíû â ÿ÷åéêàõ D1 è D2.  ÿ÷åéêå D3 ñ ïîìîùüþ ôóíêöèè СЧЁТ âû÷èñëåí îáúåì âûáîðêè. Ðèñ. 13.4. Êðèòåðèé íåçàâèñèìîñòè íà îñíîâå òàáëèöû ñîïðÿæåííîñòè Äàëåå ñîçäàåòñÿ òàáëèöà ñîïðÿæåííîñòè.  äèàïàçîíå D4:J4 çàïèñàíû çíà÷åíèÿ, êîòîðûå ïðèíèìàåò ïåðåìåííàÿ Y, à â äèàïàçîíå Ñ5:Ñ12 — ïåðåìåííàÿ Õ. Äëÿ âû÷èñëåíèÿ çíà÷åíèé òàáëèöû ñîïðÿæåííîñòè â ÿ÷åéêó D5 ââîäèòñÿ ôîðìóëà ìàññèâà {=СУММ((Х=$C5)*(Y=D$4))}, êîòîðàÿ çàòåì êîïèðóåòñÿ âî âñå îñòàëüíûå ÿ÷åéêè òàáëèöû ñîïðÿæåííîñòè. Ýòà ôîðìóëà â ÿ÷åéêå D5 ïîäñ÷èòûâàåò êîëè÷åñòâî îäíîâðåìåííûõ ñîâïàäåíèé çíà÷åíèé â äèàïàçîíå Х ñî çíà÷åíèåì ÿ÷åéêè C5 è çíà÷åíèé â äèàïàçîíå Y ñî çíà÷åíèåì ÿ÷åéêè D4. Ïðè íàëè÷èè òàêèõ ñîâïàäåíèé ÷àñòü ôîðìóëû (Х=$C5)*(Y=D$4) ïðîäóöèðóåò åäèíèöó, â ïðîòèâíîì ñëó÷àå — íóëü.  äèàïàçîíå Ê5:Ê12 ïîäñ÷èòûâàþòñÿ ñóììû çíà÷åíèé ïî ñòðîêàì òàáëèöû ñîïðÿæåííîñòè, à â äèàïàçîíå D13:J13 — ïî ñòîëáöàì. Âî èçáåæàíèå âîçìîæíîãî äåëåíèÿ íà íóëü â ôîðìóëå ÿ÷åéêè D14 ýòè ñóììû âû÷èñëÿþòñÿ ñ èñïîëüçîâàíèåì ôóíêöèè ЕСЛИ, êîòîðàÿ çàïèñûâàåò â ÿ÷åéêè çíà÷åíèå 0,01, åñëè ñóììà ðàâíà íóëþ. Íàïðèìåð, â ÿ÷åéêå Ê5 çàïèñàíà ôîðìóëà =ЕСЛИ(СУММ(D5:J5)=0;0,01;СУММ(D5:J5)) Àíàëîãè÷íûå ôîðìóëû èñïîëüçóþòñÿ â äðóãèõ ÿ÷åéêàõ, âû÷èñëÿþùèõ ñóììû ïî ñòðîêàì è ñòîëáöàì òàáëèöû ñîïðÿæåííîñòè. Çíà÷åíèå 0,01 âçÿòî ïðîèçâîëüíî, îíî íèêàê íå âëèÿåò íà ïîñëåäóþùèå âû÷èñëåíèÿ è ïðîñòî ïîêàçûâàåò, ÷òî â äàííîé ñòðîêå èëè ñòîëáöå ñóììà ðàâíà íóëþ.  ÿ÷åéêå Ê13 äëÿ êîíòðîëÿ âû÷èñëÿåòñÿ ñóììà äèàïàçîíà D13:J13, à â ÿ÷åéêå L13 — ñóììà äèàïàçîíà Ê5:Ê12. Öåëàÿ ÷àñòü çíà÷åíèÿ ýòèõ ñóìì äîëæíà ðàâíÿòüñÿ îáúåìó âûáîðêè. 392 Часть IV. Статистический анализ зависимостей r  ÿ÷åéêå D14 âû÷èñëÿåòñÿ ÷àñòü ôîðìóëû s ∑∑ n i =1 j =1 ν ij2 âû÷èñëåíèÿ êðèòåðè- n i* * j àëüíîé ñòàòèñòèêè. Ôîðìóëà ìàññèâà â ÿ÷åéêå D14 èìååò âèä {=СУММ(((D5:J12)^2)/((K5:K12)*(D13:J13)))} Çäåñü â ïîëíîé ìåðå ðåàëèçóþòñÿ âîçìîæíîñòè ôîðìóë ìàññèâîâ — áåç èñïîëüçîâàíèÿ ôîðìóëû ìàññèâà ïðèøëîñü áû ñòðîèòü ïðîìåæóòî÷íóþ òàáëèöó (ïîäîáíóþ òàáëèöå ñîïðÿæåííîñòè), ÷òîáû âûïîëíèòü âû÷èñëåíèÿ ν ij2 ni* n* j äëÿ êàæäîé ÿ÷åéêè òàáëèöû ñîïðÿæåííîñòè. Ïîñëå âû÷èñëåíèÿ ýòîé ñóììû íàõîæäåíèå êðèòåðèàëüíîé ñòàòèñòèêè (ÿ÷åéêà D15) è êðèòè÷åñêîãî çíà÷åíèÿ (ÿ÷åéêà D17) íå ïðåäñòàâëÿåò îñîáûõ òðóäíîñòåé. Ôîðìóëû äëÿ èõ âû÷èñëåíèé ïîêàçàíû íà ðèñ. 13.4. Îòìåòèì, ÷òî âñå ôîðìóëû íà ýòîì ðàáî÷åì ëèñòå “æèâûå” è àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ ïðè èçìåíåíèè âûáîðî÷íûõ çíà÷åíèé. 13.2. Оценивание коэффициента корреляции Åñëè ñ ïîìîùüþ êðèòåðèåâ íåçàâèñèìîñòè óñòàíîâëåí ôàêò çàâèñèìîñòè ìåæäó ñëó÷àéíûìè âåëè÷èíàìè, òî äàëåå âîçíèêàåò âîïðîñ îöåíêè ñòåïåíè ýòîé çàâèñèìîñòè.  êà÷åñòâå ìåðû ñòàòèñòè÷åñêîé çàâèñèìîñòè ñëó÷àéíûõ âåëè÷èí îáû÷íî âûñòóïàåò êîýôôèöèåíò êîððåëÿöèè. Ïîýòîìó âîïðîñ îá îöåíêå ñòåïåíè ñòàòèñòè÷åñêîé çàâèñèìîñòè ìîæíî ïåðåôîðìóëèðîâàòü â âîïðîñ î òî÷íîñòè çíà÷åíèÿ âû÷èñëåííîãî âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè. Îòâåò íà ïîñëåäíèé âîïðîñ äàþò äîâåðèòåëüíûå èíòåðâàëû è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèè êîýôôèöèåíòà êîððåëÿöèè.  ýòîì ðàçäåëå ðàññìîòðåíû ìåòîäû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ êîýôôèöèåíòîâ êîððåëÿöèè, à â ñëåäóþùåì — ìåòîäû ñðàâíåíèÿ âûáîðî÷íûõ êîýôôèöèåíòîâ êîððåëÿöèè. 13.2.1. Доверительные интервалы для коэффициента корреляции Åñëè êîýôôèöèåíò êîððåëÿöèè îòëè÷åí îò íóëÿ, òî òî÷íîå ðàñïðåäåëåíèå âûáîðî÷íîãî êîýôôèöèåíòà êîððåëÿöèè äàæå â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ çàâèñèìûõ ñëó÷àéíûõ âåëè÷èí ÿâëÿåòñÿ âåñüìà ñëîæíûì è íåïðèìåíèìûì äëÿ ïðàêòè÷åñêîãî èñïîëüçîâàíèÿ.  ýòîé ñèòóàöèè òîëüêî ïðèìåíåíèå zïðåîáðàçîâàíèÿ Ôèøåðà z = 1 1+ r ln (ñì. ðàçäåë 3.3.1) ïðåäîñòàâëÿåò âîçìîæ2 1− r íîñòü ïîñòðîèòü ïðèáëèæåííûå äîâåðèòåëüíûå èíòåðâàëû äëÿ íåèçâåñòíîãî êîýôôèöèåíòà êîððåëÿöèè. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå äâóìåðíîå ðàñïðåäåëåíèå ñ êîíå÷íûìè ìîìåíòàìè âòîðîãî ïîðÿäêà è ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20. Äîâåðèòåëüíûé èíòåðâàë äëÿ êîýôôèöèåíòà êîððåëÿöèè ρ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. Глава 13. Корреляционный анализ 393 2. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x = 3. Âû÷èñëÿåòñÿ òî÷å÷íàÿ n ∑ ( x − x )( y i r= i ∑ (x − x) ⋅ ∑ ( y i êîýôôèöèåíòà êîððåëÿöèè . n 2 i =1 îöåíêà − y) i =1 n 1 n 1 n x è y = ∑i ∑ yi . n i =1 n i =1 i − y) 2 i =1 4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíîãî 1+ α –1 , Ô — ôóíê2 íîðìàëüíîãî çàêîíà, âû÷èñëÿåòñÿ çíà÷åíèå k: k = Ф −1 öèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 5. Âû÷èñëÿþòñÿ âåëè÷èíû z1 = 1 1+ r k 1 1+ r k è z2 = ln . ln − + 2 1− r 2 1− r n−3 n−3 6. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë (r1, r2), ãäå r1 = e 2 z1 − 1 e 2 z2 − 1 = r è . 2 e2 z1 + 1 e 2 z2 + 1 Êîììåíòàðèè 1. Åùå ðàç ïîä÷åðêíåì, ÷òî ýòî ïðèáëèæåííûé ìåòîä, êîòîðûé äàåò óäîâëåòâîðèòåëüíûå ðåçóëüòàòû äëÿ äîñòàòî÷íî áîëüøèõ âûáîðîê (îáúåìîì áîëåå 20 çíà÷åíèé). 2. Äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé ìîæíî èñïîëüçîâàòü ìåòîä, îïèñàííûé â ñëåäóþùåì ðàçäåëå. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.5 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ äîâåðèòåëüíîãî èíòåðâàëà. Òåñòîâàÿ âûáîðêà èìååò ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè 0,5. Âûáîðêà ïîñòðîåíà ìåòîäîì, îïèñàííûì â ðàçäåëå 7.5.1. Îòìåòèì, ÷òî äëÿ âû÷èñëåíèÿ â ÿ÷åéêàõ D7 è F7 ãðàíèö äîâåðèòåëüíîãî èíòåðâàëà ïî èçâåñòíûì çíà÷åíèÿì z1 è z2 èñïîëüçóåòñÿ ôóíêöèÿ TANH, âû÷èñëÿþùàÿ çíà÷åíèÿ ãèïåðáîëè÷åñêîãî òàíãåíñà — ôîðìóëû r1 = e 2 z1 − 1 e 2 z2 − 1 = r è ÿâëÿþòñÿ ôîðìóëàìè 2 e2 z1 + 1 e 2 z2 + 1 ãèïåðáîëè÷åñêîãî òàíãåíñà. Òàêèå æå âû÷èñëåíèÿ âûïîëíÿåò ôóíêöèÿ ФИШЕРОБР. Äëÿ âû÷èñëåíèÿ ïðåîáðàçîâàíèÿ Ôèøåðà â Excel ïðåäóñìîòðåíà ñïåöèàëüíàÿ ôóíêöèÿ ФИШЕР, êîòîðàÿ èñïîëüçîâàíà â ôîðìóëå ÿ÷åéêè D3. Î ôóíêöèÿõ ФИШЕР è ФИШЕРОБР ðå÷ü èäåò â ðàçäåëå 4.10.5. 13.2.2. Доверительные интервалы для коэффициента корреляции нормальной совокупности Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20. 394 Часть IV. Статистический анализ зависимостей Ðèñ. 13.5. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà êîððåëÿöèè Äîâåðèòåëüíûé èíòåðâàë äëÿ êîýôôèöèåíòà êîððåëÿöèè ρ ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 2. Âû÷èñëÿþòñÿ âûáîðî÷íûå ñðåäíèå x = 3. Âû÷èñëÿåòñÿ òî÷å÷íàÿ n ∑ ( x − x )( y i r= i ∑ (x − x) ⋅ ∑ ( y i êîððåëÿöèè . n 2 i =1 êîýôôèöèåíòà − y) i =1 n îöåíêà 1 n 1 n x è y = ∑i ∑ yi . n i =1 n i =1 i − y) 2 i =1 4. Èç óðàâíåíèÿ α = 2Ô(k) – 1, ãäå Ô — ôóíêöèÿ ðàñïðåäåëåíèÿ ñòàíäàðòíî- 1+ α –1 , Ô — 2 ãî íîðìàëüíîãî çàêîíà, îïðåäåëÿåòñÿ çíà÷åíèå k: k = Ф −1 ôóíêöèÿ, îáðàòíàÿ ê ôóíêöèè ðàñïðåäåëåíèÿ ñòàíäàðòíîãî íîðìàëüíîãî çàêîíà. 5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë r (1 − r 2 ) 1− r2 r (1 − r 2 ) 1− r2 −k ,r + +k r + . 2n 2n n n Êîììåíòàðèè 1. Ýòî àñèìïòîòè÷åñêèé ìåòîä, ïîýòîìó îáúåì âûáîðêè äîëæåí áûòü áîëüøå 20. Ìåòîä ïîñòðîåí íà îñíîâå òîãî ôàêòà, ÷òî â ñëó÷àå íîðìàëüíîé ñîâîêóïíîñòè âûáîðî÷íûé êîýôôèöèåíò êîððåëÿöèè àñèìïòîòè÷åñêè èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ ìàòåìàòè÷åñêèì îæèäàíèåì ρ è äèñïåðñèåé Глава 13. Корреляционный анализ 395 2 1 − ρ2 r (1 − r 2 ) ââåäåíà èç-çà ñìåùåíèÿ âûáîðî÷íîãî êîýôôè . Ïîïðàâêà 2n n öèåíòà êîððåëÿöèè r îòíîñèòåëüíî èñòèííîãî êîýôôèöèåíòà êîððåëÿöèè ρ. 2. Ìåòîä ïëîõî ðàáîòàåò, åñëè ρ áëèçêî ê ±1.  ýòîì ñëó÷àå îáúåì âûáîðêè äîëæåí áûòü î÷åíü áîëüøèì, ÷òîáû ðàñïðåäåëåíèå r ñ ïðèåìëåìîé òî÷íîñòüþ àïïðîêñèìèðîâàëîñü íîðìàëüíûì ðàñïðåäåëåíèåì. 3. Åñëè ρ áëèçêî ê íóëþ, äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ìîæíî ïðèìåíèòü ðàñïðåäåëåíèå Ñòüþäåíòà, êàê ýòî ñäåëàíî â êðèòåðèè íåçàâèñèìîñòè äëÿ íîðìàëüíûõ ñîâîêóïíîñòåé (ñì. ðàçäåë 13.1.2). Íî òàêîé äîâåðèòåëüíûé èíòåðâàë òàêæå áóäåò ïðèáëèæåííûì. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 13.6 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà. Ðèñ. 13.6. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ êîýôôèöèåíòà êîððåëÿöèè íîðìàëüíîé ñîâîêóïíîñòè 13.3. Критерии проверки гипотез о значениях коэффициента корреляции Ñäåëàåì îáùèé êîììåíòàðèé êî âñåì îïèñàííûì â ýòîì ðàçäåëå êðèòåðèÿì ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ êîýôôèöèåíòà êîððåëÿöèè. Âñå ýòè êðèòåðèè ïîñòðîåíû ñ èñïîëüçîâàíèåì z-ïðåîáðàçîâàíèÿ Ôèøåðà. Ïîýòîìó âñå îíè ÿâëÿþòñÿ àñèìïòîòè÷åñêèìè è òðåáóþò, ÷òîáû âûáîðêè áûëè äîñòàòî÷íî áîëüøîãî îáúåìà. Äëÿ ïðîâåðêè ãèïîòåçû î ðàâåíñòâå íóëþ êîýôôèöèåíòà êîððåëÿöèè èñïîëüçóþòñÿ êðèòåðèè ïðîâåðêè íåçàâèñèìîñòè, êîòîðûå îïèñàíû â ðàçäåëå 13.1. 13.3.1. Критерий проверки значения коэффициента корреляции Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé ïðîèçâîëüíîå 396 Часть IV. Статистический анализ зависимостей äâóìåðíîå ðàñïðåäåëåíèå ñ êîýôôèöèåíòîì êîððåëÿöèè ρ. Îáúåì âûáîðêè — íå ìåíåå 20. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: ρ = ρ0 Í0: ρ ≤ ρ0 Í0: ρ ≥ ρ0 Í1: ρ ≠ ρ0 Í1: ρ > ρ0 Í1: ρ < ρ0 Çäåñü ρ0 — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿåòñÿ òî÷å÷íàÿ n ∑ ( x − x )( y i r= i − y) , ãäå x = i =1 n n ∑ (x − x) ⋅ ∑ ( y 2 i i =1 îöåíêà i − y )2 êîýôôèöèåíòà êîððåëÿöèè 1 n 1 n xi è y = ∑ yi . ∑ n i =1 n i =1 i =1 2. Âû÷èñëÿþòñÿ âåëè÷èíû z = 1 1+ r 1 1 + ρ0 è z0 = ln . ln 2 1− r 2 1 − ρ0 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = z − z0 n−3 . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. 13.3.2. Критерий проверки равенства двух коэффициентов корреляции Ñòàòèñòè÷åñêàÿ ìîäåëü. Çàäàíû äâå âûáîðêè, ñäåëàííûå èç äâóìåðíûõ ñîâîêóïíîñòåé ñ êîýôôèöèåíòàìè êîððåëÿöèè ρ1 è ρ2 ñîîòâåòñòâåííî. Îáúåì ïåðâîé âûáîðêè ðàâåí n1, îáúåì âòîðîé — n2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: ρ1 = ρ2 Í0: ρ1 ≤ ρ2 Í0: ρ1 ≥ ρ2 Í1: ρ1 ≠ ρ2 Í1: ρ1 > ρ2 Í1: ρ1 < ρ2 Çàäàí óðîâåíü çíà÷èìîñòè α. Глава 13. Корреляционный анализ 397 Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè êîýôôèöèåíòîâ êîððåëÿöèè ïåðâîé âûáîðêè r1 è âòîðîé âûáîðêè r2 ïî ñòàíäàðòíûì ôîðìóëàì. 2. Âû÷èñëÿþòñÿ âåëè÷èíû z1 = 1 1 + r1 1 1 + r2 , z2 = ln è S= ln 2 1 − r1 2 1 − r2 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 1 1 . + n1 − 3 n2 − 3 z1 − z 2 . S Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ ïîêàçàíà íà ðèñ. 13.7. Çäåñü æå ïðèâåäåíû âñå íåîáõîäèìûå äëÿ âû÷èñëåíèé ôîðìóëû. Ðèñ. 13.7. Êðèòåðèé ïðîâåðêè ðàâåíñòâà äâóõ êîýôôèöèåíòîâ êîððåëÿöèè 398 Часть IV. Статистический анализ зависимостей 13.3.3. Критерий проверки равенства нескольких коэффициентов корреляции Ñòàòèñòè÷åñêàÿ ìîäåëü. Çàäàíû k âûáîðîê, ñäåëàííûõ èç äâóìåðíûõ ñîâîêóïíîñòåé ñ êîýôôèöèåíòàìè êîððåëÿöèè ρ1, ρ2, ..., ρk ñîîòâåòñòâåííî. Îáúåì ïåðâîé âûáîðêè ðàâåí n1, îáúåì âòîðîé — n2, ..., k-é âûáîðêè — nk. Ãèïîòåçû Í0: ρ1 = ρ2 = ... = ρk; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ òî÷å÷íûå îöåíêè êîýôôèöèåíòîâ êîððåëÿöèè âñåõ âûáîðîê r1, r2, ..., rk ïî ñòàíäàðòíûì ôîðìóëàì. 2. Âû÷èñëÿþòñÿ âåëè÷èíû z1 = 1 1 + r1 1 1 + r2 1 1 + rk , z2 = ln , ..., zk = ln . ln 2 1 − r1 2 1 − r2 2 1 − rk 2 k ∑ (ni − 3) zi k i =1 . 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = ∑ (ni − 3) zi2 − k i =1 ∑ (ni − 3) i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ðàñïðåäåëåíèå χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñ (k – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè T ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Êîììåíòàðèé.  ñëó÷àå k = 2 êðèòåðèé ýêâèâàëåíòåí êðèòåðèþ à) èç ïðåäûäóùåãî ðàçäåëà, ïðè ýòîì çíà÷åíèå êðèòåðèàëüíîé ñòàòèñòèêè äàííîãî êðèòåðèÿ ðàâíÿåòñÿ êâàäðàòó ñòàòèñòèêè êðèòåðèÿ èç ïðåäûäóùåãî ðàçäåëà. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé. Глава 13. Корреляционный анализ 399 Глава 14 Сравнение зависимых выборок  ýòîé ãëàâå ðàññìîòðåíû ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé çàâèñèìûõ âûáîðîê. Åñëè ìåòîäàìè èç ãëàâû 13 óñòàíîâëåí ôàêò çàâèñèìîñòè âûáîðî÷íûõ çíà÷åíèé, òî ìåòîäû ñðàâíåíèÿ ïàðàìåòðîâ ðàñïðåäåëåíèé, îïèñàííûå â ãëàâå 12, ïðèìåíÿòü íåëüçÿ. Äëÿ çàâèñèìûõ âûáîðîê ñóùåñòâóþò ñïåöèàëüíûå ìåòîäû. Èì è ïîñâÿùåíà äàííàÿ ãëàâà.  ïåðâîì ðàçäåëå ðàññìîòðåíû ìåòîäû ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé, âî âòîðîì — êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷åíèÿõ ìàòåìàòè÷åñêèõ îæèäàíèé è â òðåòüåì — ìåòîäû äèñïåðñèîííîãî àíàëèçà. 14.1. Доверительные интервалы для разности математических ожиданий нормальных совокупностей Òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé çàâèñèìûõ âûáîðîê èçâåñòíû òîëüêî äëÿ ñëó÷àÿ íîðìàëüíî ðàñïðåäåëåííûõ ãåíåðàëüíûõ ñîâîêóïíîñòåé. Äëÿ ïðîèçâîëüíûõ ðàñïðåäåëåíèé ìîæíî ïðèìåíèòü íåïàðàìåòðè÷åñêèå êðèòåðèè ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé, êîòîðûå õîòÿ è íå ñòðîÿò äîâåðèòåëüíûå èíòåðâàëû, íî ïîçâîëÿþò ïðîâåðèòü ãèïîòåçû î ðàâåíñòâå èëè íåðàâåíñòâå ýòèõ ðàçíîñòåé íåêîòîðûì çàäàííûì çíà÷åíèÿì. 14.1.1. Доверительный интервал для разности математических ожиданий Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå µ1, ñëó÷àéíàÿ âåëè÷èíà Y — ìàòåìàòè÷åñêîå îæèäàíèå µ2. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè ∆µ = µ1 – µ2 ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 2. Âû÷èñëÿþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn. 3. Âû÷èñëÿåòñÿ ñðåäíåå ýòèõ ðàçíîñòåé d = ñèÿ Sd2 = 1 n (di − d )2 . ∑ n − 1 i =1 1 n ∑ di è èõ âûáîðî÷íàÿ äèñïåðn i =1 4. Îïðåäåëÿåòñÿ êîýôôèöèåíò k — êâàíòèëü ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Sd n 5. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë d − k ,d + k Sd . n Êîììåíòàðèè 1. Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ íà òîì îñíîâàíèè, ÷òî ðàçíîñòü íîðìàëüíûõ ñëó÷àéíûõ âåëè÷èí (äàæå çàâèñèìûõ) òàêæå áóäåò èìåòü íîðìàëüíîå ðàñïðåäåëåíèå. 2. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè. 3. Ìåòîä íåïðèìåíèì äëÿ íåçàâèñèìûõ íàáëþäåíèé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 14.1 ïîêàçàí ðàáî÷èé ëèñò, íà êîòîðîì ðåàëèçîâàí äàííûé ñïîñîá ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà.  ñòîëáöàõ À è  ñîäåðæàòñÿ âûáîðî÷íûå çíà÷åíèÿ, èìåþùèå ñîâìåñòíîå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è êîýôôèöèåíòîì êîððåëÿöèè 0,5 (ñïîñîáû ñîçäàíèÿ òàêèõ âûáîðîê ïîêàçàíû â ðàçäåëå 7.5.1). Òàêèì îáðàçîì, çäåñü ðàçíîñòü ìàòåìàòè÷åñêèõ îæèäàíèé ðàâíà íóëþ. Äèàïàçîí ÿ÷ååê, ñîäåðæàùèé çíà÷åíèÿ ïåðâîé âûáîðêè, íàçâàí Х, à âòîðîé âûáîðêè — Y. Îáðàùàåì âíèìàíèå íà ôîðìóëû ìàññèâîâ â ÿ÷åéêàõ D3 è D5, ñ ïîìîùüþ êîòîðûõ âû÷èñëÿþòñÿ ñðåäíåå ðàçíîñòåé è âûáîðî÷íàÿ äèñïåðñèÿ ðàçíîñòåé. Ïðèìåíåíèå ýòèõ ôîðìóë ïîçâîëÿåò èçáåæàòü ïðîìåæóòî÷íûõ âû÷èñëåíèé ñàìèõ ðàçíîñòåé. Ðèñ. 14.1. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé 14.1.2. Доверительный интервал для математических ожиданий нескольких совокупностей Ñòàòèñòè÷åñêàÿ ìîäåëü. Ïóñòü íàáëþäàåòñÿ m-ìåðíàÿ íîðìàëüíî ðàñïðåäåëåííàÿ ñëó÷àéíàÿ âåëè÷èíà Z = (X1, X2, ..., Xm).  ðåçóëüòàòå èìååì âûáîðêó îáúåìîì n (x11, x21, ..., xm1), (x12, x22, ..., xm2), ..., (x1n, x2n, ..., xmn). Îáîçíà÷èì ÷åðåç µ1, µ2, ..., µm íåèçâåñòíûå ìàòåìàòè÷åñêèå îæèäàíèÿ ñëó÷àéíûõ âåëè÷èí X1, X2, ..., Xm. Глава 14. Сравнение зависимых выборок 401 Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ äëÿ ëèíåéíîé êîìáèíàöèè ìàòåìàòè÷åñêèõ îæèäàíèé, ò.å. äëÿ âåëè÷èíû L = c1µ1+ c2µ2 + ... + cmµm, ãäå c1, c2, ..., cm — çàäàííûå ÷èñëà, ñóììà êîòîðûõ ðàâíà íóëþ. Äîâåðèòåëüíûé èíòåðâàë ñòðîèòñÿ ñëåäóþùèì îáðàçîì. 1. Çàäàåòñÿ äîâåðèòåëüíûé óðîâåíü α. 2. Âû÷èñëÿþòñÿ m ñðåäíèõ âèäà x1* = 1 n 1 n 1 n x1i , x2* = ∑ x2i , ..., xm* = ∑ xni . ∑ n i =1 n i =1 n i =1 3. Âû÷èñëÿåòñÿ âåëè÷èíà L = c1 x1* + c2 x2* + ... + cm xm* . 4. Âû÷èñëÿþòñÿ n ñðåäíèõ âèäà x*1 = 5. Âû÷èñëÿåòñÿ îáùåå ñðåäíåå x = 1 m 1 m 1 m xi1 , x*2 = ∑ xi 2 , ..., x*n = ∑ xin . ∑ m i =1 m i =1 m i =1 1 m n ∑∑ xij . mn i =1 j =1 m 6. Âû÷èñëÿåòñÿ ñóììà êâàäðàòîâ n S = ∑∑ ( xij − xi* − x* j + x )2 è äèñïåðñèÿ i =1 j =1 s2 = S . (m − 1)(n − 1) 7. Îïðåäåëÿåòñÿ âåëè÷èíà t êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû 1 è (n – 1)(m – 1). 8. Âû÷èñëÿåòñÿ âåëè÷èíà T = t (c12 + c22 + ... + cm2 ) s 2 . n 9. Âû÷èñëÿåòñÿ äîâåðèòåëüíûé èíòåðâàë ( L − T , L + T ) . Êîììåíòàðèè 1.  îñíîâå äàííîãî ìåòîäà ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà ëåæèò äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç (ñì. ðàçäåëû 3.5.3 è 14.3). 2. Ìåòîä óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè è ïðè íåáîëüøèõ îòêëîíåíèÿõ îò óñëîâèÿ ðàâåíñòâà äèñïåðñèé. 3. Ýòèì ìåòîäîì ìîæíî ñòðîèòü äîâåðèòåëüíûå èíòåðâàëû äëÿ ïîïàðíûõ ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé. Íàïðèìåð, åñëè ïîëîæèòü ñ1 = 1, ñ2 = –1, à âñå îñòàëüíûå ci ïîëîæèòü ðàâíûìè íóëþ, òî áóäåò ïîñòðîåí äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè ìàòåìàòè÷åñêèõ îæèäàíèé ïåðâûõ äâóõ âûáîðîê. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 14.2 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàí äàííûé ìåòîä ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà äëÿ ëèíåéíîé êîìáèíàöèè ìàòåìàòè÷åñêèõ îæèäàíèé.  ñòîëáöàõ À:D çàïèñàíû èñõîäíûå äàííûå — âûáîðêà èç ÷åòûðåõ çàâèñèìûõ êîìïîíåíòîâ, èìåþùèõ íîðìàëüíîå ðàñïðåäåëåíèå. Äèàïàçîíû ÿ÷ååê, ñîäåðæàùèå âûáîðî÷íûå çíà÷åíèÿ ýòèõ êîìïîíåíòîâ, íàçâàíû ñîîòâåòñòâåííî Х1, Х2, Х3 è Х4. 402 Часть IV. Статистический анализ зависимостей Ðèñ. 14.2. Ïîñòðîåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ëèíåéíîé êîìáèíàöèè ìàòåìàòè÷åñêèõ îæèäàíèé Ê ñîæàëåíèþ, äëÿ ðåàëèçàöèè äàííîãî ìåòîäà íåëüçÿ îáîéòèñü áåç íåêîòîðûõ ïðîìåæóòî÷íûõ âû÷èñëåíèé.  ñòîëáöå Å âû÷èñëåíû ñðåäíèå ïî ñòðîêàì (ôîðìóëà =СРЗНАЧ(A2:D2) â ÿ÷åéêå Å2, êîòîðàÿ çàòåì ñêîïèðîâàíà âíèç), â ÿ÷åéêàõ G7:J7 — ñðåäíèå ïî ñòîëáöàì (ôîðìóëà =СРЗНАЧ(Х1) â ÿ÷åéêå G7; àíàëîãè÷íûå ôîðìóëû ñîäåðæàòñÿ â îñòàëüíûõ ÿ÷åéêàõ ýòîãî äèàïàçîíà), îáùåå ñðåäíåå — â ÿ÷åéêå Í9. m  ñòîëáöå F âû÷èñëÿþòñÿ êâàäðàòû ∑ (x ij − xi* − x* j + x ) 2 (÷àñòü ôîðìóëû äëÿ i =1 âû÷èñëåíèÿ S; ñì. ïðèâåäåííûé âûøå ï. 6 ïîñëåäîâàòåëüíîñòè ïîñòðîåíèÿ äîâåðèòåëüíîãî èíòåðâàëà). Äëÿ ýòîãî â ÿ÷åéêå F2 ââåäåíà ôîðìóëà ìàññèâà {=СУММКВ(A2:D2-$G$7:$J$7-E2+$H$9)}, êîòîðàÿ çàòåì ñêîïèðîâàíà âíèç. Ñàìà âåëè÷èíà S âû÷èñëÿåòñÿ êàê ÷àñòü ôîðìóëû â ÿ÷åéêå Í10, â êîòîðîé íàõîäèòñÿ çíà÷åíèå äèñïåðñèè s2. Ôîðìóëû äëÿ äðóãèõ âû÷èñëåíèé ïðåäñòàâëåíû íà ðàáî÷åì ëèñòå. Íà ðèñ. 14.2 ïîêàçàí äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1+ µ2 – µ3 – µ4. Èçìåíÿÿ êîýôôèöèåíòû ci (äèàïàçîí G4:J4), ìîæíî ñðàçó ïîëó÷èòü äîâåðèòåëüíûå èíòåðâàëû äëÿ äðóãèõ êîìáèíàöèé ìàòåìàòè÷åñêèõ îæèäàíèé. Íàïðèìåð, íà ðèñ. 14.3 ïîêàçàí äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1 – µ4. 14.2. Критерии проверки гипотез о равенстве математических ожиданий Êàê ïîêàçàíî â ïðåäûäóùåì ðàçäåëå, òî÷íûå äîâåðèòåëüíûå èíòåðâàëû äëÿ ðàçíîñòåé ìàòåìàòè÷åñêèõ îæèäàíèé çàâèñèìûõ âûáîðîê ìîæíî ïîñòðîèòü òîëüêî ïðè îáðåìåíèòåëüíîì ïðåäïîëîæåíèè î íîðìàëüíîì ðàñïðåäåëåíèè ãåíåðàëüíîé ñîâîêóïíîñòè. Òî÷íûå êðèòåðèè ïðîâåðêè ãèïîòåç î ðàâåíñòâå ìàòåìàòè÷åñêèõ Глава 14. Сравнение зависимых выборок 403 îæèäàíèé òàêæå ñòðîÿòñÿ íà îñíîâå òàêîãî æå ïðåäïîëîæåíèÿ. Îäíàêî ñóùåñòâóþò íåïàðàìåòðè÷åñêèå êðèòåðèè, êîòîðûå íå òðåáóþò ïðåäïîëîæåíèé î íîðìàëüíîñòè ðàñïðåäåëåíèé.  ýòîì îòíîøåíèè êðèòåðèè ïðåäïî÷òèòåëüíåå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé çàâèñèìûõ íàáëþäåíèé. Ðèñ. 14.3. Äîâåðèòåëüíûé èíòåðâàë äëÿ ðàçíîñòè µ1 – µ4 14.2.1. Парный критерий Стьюдента Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå íîðìàëüíîå ðàñïðåäåëåíèå. Ñëó÷àéíàÿ âåëè÷èíà Õ èìååò ìàòåìàòè÷åñêîå îæèäàíèå µ1, ñëó÷àéíàÿ âåëè÷èíà Y — µ2. Ãèïîòåçû à) Ðàâåíñòâî á) Íåðàâåíñòâî â) Íåðàâåíñòâî Í0: µ1 – µ2 = m Í0: µ1 – µ2 ≤ m Í0: µ1 – µ2 ≥ m Í1: µ1 – µ2 ≠ m Í1: µ1 – µ2 > m Í1: µ1 – µ2 < m Çäåñü m — çàäàííîå ÷èñëî. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn. 2. Âû÷èñëÿåòñÿ ñðåäíåå ýòèõ ðàçíîñòåé d = ñèÿ Sd2 = 1 n ∑ di è èõ âûáîðî÷íàÿ äèñïåðn i =1 1 n ∑ (di − d )2 . n − 1 i =1 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = 404 Часть IV. Статистический анализ зависимостей n ( d − m) . Sd Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Ò èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ñëó÷àé à). Îïðåäåëÿþòñÿ êðèòè÷åñêèå çíà÷åíèÿ t êàê êâàíòèëü ïîðÿäêà 1 – α/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |T| ≤ t.  ïðîòèâíîì ñëó÷àå ãèïîòåçà Í0 îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t1 êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè Ò ≤ t1. Ñëó÷àé â). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t2 êàê êâàíòèëü ïîðÿäêà α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – 1) ñòåïåíüþ ñâîáîäû. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè t2 ≤ Ò. Êîììåíòàðèè 1. Äëÿ ïðîâåðêè ãèïîòåçû î òîì, ÷òî µ1 = µ2, â ãèïîòåçå à) ñëåäóåò ïîëîæèòü m = 0. 2. Êðèòåðèé íåïðèìåíèì äëÿ íåçàâèñèìûõ âûáîðîê. 3. Êðèòåðèé íå ÷óâñòâèòåëåí ê óìåðåííûì îòêëîíåíèÿì îò íîðìàëüíîñòè. 4. Ïðè çíà÷èòåëüíûõ îòêëîíåíèÿõ îò íîðìàëüíîñòè ñëåäóåò ïðèìåíÿòü íåïàðàìåòðè÷åñêèé êðèòåðèé çíàêîâ èëè êðèòåðèé Óèëêîêñîíà (ñì. ñëåäóþùèå ðàçäåëû). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ êðèòåðèÿ â Excel íå ïðåäñòàâëÿåò òðóäíîñòåé è âî ìíîãîì ñîâïàäàåò ñ âû÷èñëåíèåì äîâåðèòåëüíîãî èíòåðâàëà èç ðàçäåëà 14.1.1. Êðîìå òîãî, â Excel ðåàëèçàöèÿ ýòîãî êðèòåðèÿ îñóùåñòâëÿåòñÿ ñ ïîìîùüþ ñðåäñòâà Парный двухвыборочный t-тест для средних, îïèñàíèå êîòîðîãî äàíî â ðàçäåëå 5.9. Òàì æå ïðèâåäåí ïðèìåð ðåàëèçàöèè êðèòåðèÿ. 14.2.2. Непараметрический критерий знаков Ýòîò êðèòåðèé ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ ìåñòîïîëîæåíèÿ ðàñïðåäåëåíèé êîìïîíåíòîâ ñëó÷àéíîé âåëè÷èíû Z = (X, Y). Ìåðîé ðàçëè÷èÿ â ìåñòîïîëîæåíèè ðàñïðåäåëåíèé ñëóæèò ìåäèàíà ñëó÷àéíîé âåëè÷èíû X – Y. Ïîñêîëüêó äëÿ áîëüøèíñòâà ðàñïðåäåëåíèé ìåäèàíà è ìàòåìàòè÷åñêîå îæèäàíèå áëèçêè, îñîáåííî åñëè ðàñïðåäåëåíèÿ ñèììåòðè÷íû èëè õîòÿ áû îäíîìîäàëüíû, òî â ñëó÷àå, êîãäà ðàçëè÷èå íåçíà÷èìî (ò.å. ìåäèàíà áëèçêà ê íóëþ), ìîæíî ñ÷èòàòü, ÷òî ìàòåìàòè÷åñêèå îæèäàíèÿ ñëó÷àéíûõ âåëè÷èí X è Y òàêæå ðàçëè÷àþòñÿ íåçíà÷èìî. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå ðàñïðåäåëåíèå. Ðàññìàòðèâàþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn. Ãèïîòåçû Í0: ìåäèàíà ðàçíîñòåé ðàâíà íóëþ; Í1: ìåäèàíà ðàçíîñòåé íå ðàâíà íóëþ. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïîäñ÷èòûâàåòñÿ êîëè÷åñòâî N ïîëîæèòåëüíûõ ðàçíîñòåé õ1 – ó1, õ2 – ó2, ..., xn – yn. Глава 14. Сравнение зависимых выборок 405 2. Äëÿ ìàëûõ âûáîðîê ÷èñëî N áåðåòñÿ â êà÷åñòâå êðèòåðèàëüíîé ñòàòèñòèêè. Äëÿ áîëüøèõ âûáîðîê êðèòåðèàëüíàÿ ñòàòèñòèêà âû÷èñëÿåòñÿ ïî ôîðìóëå T = 2N − n n . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà N èìååò áèíîìèàëüíîå ðàñïðåäåëåíèå ñ ïàðàìåòðàìè n è ð = 0,5, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Äëÿ ìàëûõ âûáîðîê â êà÷åñòâå êðèòè÷åñêèõ çíà÷åíèé tí è tâ áåðóòñÿ ñîîòâåòñòâåííî êâàíòèëè ïîðÿäêà α/2 è 1 – α/2 áèíîìèàëüíîãî ðàñïðåäåëåíèÿ ñ ïàðàìåòðàìè n è ð = 0,5. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè tí ≤ N ≤ tâ.  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ. Äëÿ áîëüøèõ âûáîðîê â êà÷åñòâå êðèòè÷åñêîãî çíà÷åíèÿ t áåðåòñÿ êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |Ò| ≤ t.  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ. Êîììåíòàðèè 1. Åñëè åñòü ðàçíîñòè xi – yi, ðàâíûå íóëþ, òî çà êàæäóþ íóëåâóþ ðàçíîñòü ê çíà÷åíèþ N íàäî ïðèáàâèòü 0,5. 2.  äàííîì êðèòåðèè áîëüøîé ñ÷èòàåòñÿ âûáîðêà îáúåìîì áîëåå 20 çíà÷åíèé. 3. Ñ ïîìîùüþ äàííîãî êðèòåðèÿ ìîæíî ïðîâåðÿòü äðóãèå ãèïîòåçû. Íàïðèìåð, Í0: ìåäèàíà ðàçíîñòåé ðàâíà δ (çàäàííîå ÷èñëî), Í1: ìåäèàíà ðàçíîñòåé íå ðàâíà δ. Äëÿ ïðîâåðêè òàêèõ ãèïîòåç èç êàæäîé ðàçíîñòè xi – yi íåîáõîäèìî âû÷åñòü δ. Îñòàëüíûå âû÷èñëåíèÿ îñòàþòñÿ áåç èçìåíåíèé. 4. Åñëè íåò îñíîâàíèé îòêëîíÿòü ïðåäïîëîæåíèå î íîðìàëüíîñòè ãåíåðàëüíîé ñîâîêóïíîñòè, òî ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé ïàðíûé êðèòåðèé Ñòüþäåíòà (ñì. ïðåäûäóùèé ðàçäåë). Íåïàðàìåòðè÷åñêèé êðèòåðèé Óèëêîêñîíà, îïèñàííûé íèæå, òàêæå áîëåå ìîùíûé, íî îí ïðåäïîëàãàåò âûïîëíåíèÿ áîëåå ñèëüíîãî óñëîâèÿ, ÷åì êðèòåðèé çíàêîâ, à èìåííî — ñèììåòðè÷íîñòü ðàñïðåäåëåíèé. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 14.4 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé äëÿ áîëüøèõ âûáîðîê. Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèé, ïðèâåäåíû íà ýòîì ëèñòå. Ðèñ. 14.4. Íåïàðàìåòðè÷åñêèé êðèòåðèé çíàêîâ 406 Часть IV. Статистический анализ зависимостей 14.2.3. Непараметрический критерий Уилкоксона Ýòîò êðèòåðèé ïðèìåíÿåòñÿ äëÿ ñðàâíåíèÿ ìàòåìàòè÷åñêèõ îæèäàíèé µ1 è µ2 êîìïîíåíòîâ ñëó÷àéíîé âåëè÷èíû Z = (X, Y). Îäíàêî ïðîâåðÿåìàÿ ñ ïîìîùüþ äàííîãî êðèòåðèÿ ãèïîòåçà Í0 ñîñòîèò â òîì, ÷òî ðàñïðåäåëåíèå ðàçíîñòåé õ1 – ó1, õ2 – ó2, ..., xn – yn ñèììåòðè÷íî îòíîñèòåëüíî íóëÿ (òîãäà ìàòåìàòè÷åñêîå îæèäàíèå ðàçíîñòåé ðàâíî íóëþ è, ñëåäîâàòåëüíî, µ1 = µ2). Åñëè æå ýòà ãèïîòåçà îòêëîíÿåòñÿ, òî âûâîä, ÷òî µ1 ≠ µ2, ìîæíî ñäåëàòü ëèøü òîãäà, êîãäà âûïîëíÿåòñÿ ïðåäïîëîæåíèå î òîì, ÷òî ðàñïðåäåëåíèÿ êîìïîíåíòîâ Õ è Y èìåþò îäèí è òîò æå âèä (ðàçëè÷íû òîëüêî çíà÷åíèÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ) ëèáî ýòè ðàñïðåäåëåíèÿ ñèììåòðè÷íû îòíîñèòåëüíî ìàòåìàòè÷åñêîãî îæèäàíèÿ. Íà ïðàêòèêå, îäíàêî, äîïóñòèìû óìåðåííûå îòêëîíåíèÿ îò âûïîëíåíèÿ óêàçàííûõ òðåáîâàíèé, òàê êàê êðèòåðèé íåçíà÷èòåëüíî ÷óâñòâèòåëåí ê íèì. Ñòàòèñòè÷åñêàÿ ìîäåëü. Âûáîðî÷íûå çíà÷åíèÿ (õ1, ó1), (õ2, ó2), ..., (xn, yn) ÿâëÿþòñÿ ðåàëèçàöèåé ñëó÷àéíîé âåëè÷èíû Z = (X, Y), èìåþùåé äâóìåðíîå ðàñïðåäåëåíèå. Ðàññìàòðèâàþòñÿ ðàçíîñòè õ1 – ó1, õ2 – ó2, ..., xn – yn. Ãèïîòåçû Í0: ðàñïðåäåëåíèå ðàçíîñòåé ñèììåòðè÷íî îòíîñèòåëüíî íóëÿ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Ïî ñîâîêóïíîñòè ìîäóëåé ðàçíîñòåé d1 = |õ1 – ó1|, d2 = |õ2 – ó2|, ..., dn = |xn – yn| ñòðîèòñÿ âàðèàöèîííûé ðÿä d(1) ≤ d(2) ≤ ... ≤ d(n), ïî êîòîðîìó îïðåäåëÿþòñÿ ðàíãè âåëè÷èí di. Ðàâíûì ïî àáñîëþòíîé âåëè÷èíå ðàçíîñòÿì ïðèïèñûâàþòñÿ ñðåäíèå ðàíãè. Íóëåâûå ðàçíîñòè èãíîðèðóþòñÿ, ïðè ýòîì çíà÷åíèå n óìåíüøàåòñÿ íà êîëè÷åñòâî íóëåâûõ ðàçíîñòåé. 2. Ïîäñ÷èòûâàåòñÿ ñóììà N ðàíãîâ, êîòîðûì ñîîòâåòñòâóþò ïîëîæèòåëüíûå ðàçíîñòè xi – yi. 3. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = N − n(n + 1)/4 n(n + 1)(2n + 1)/24 . Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû âåëè÷èíà N èìååò ñïåöèàëüíîå ðàñïðåäåëåíèå Óèëêîêñîíà, ñòàòèñòèêà Ò àñèìïòîòè÷åñêè èìååò ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå.  êà÷åñòâå êðèòè÷åñêîãî çíà÷åíèÿ t áåðåòñÿ êâàíòèëü ïîðÿäêà 1 – α/2 ñòàíäàðòíîãî íîðìàëüíîãî ðàñïðåäåëåíèÿ. Ãèïîòåçà Í0 ïðèíèìàåòñÿ, åñëè |Ò| ≤ t.  ïðîòèâíîì ñëó÷àå íóëåâàÿ ãèïîòåçà îòâåðãàåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé ÿâëÿåòñÿ àñèìïòîòè÷åñêèì è ïðèìåíÿåòñÿ äëÿ áîëüøèõ âûáîðîê (îáúåìîì áîëåå 20). Äëÿ ìàëûõ âûáîðîê êðèòåðèàëüíîé ñòàòèñòèêîé ÿâëÿåòñÿ âåëè÷èíà N, à êðèòè÷åñêîå çíà÷åíèå îïðåäåëÿåòñÿ ïî òàáëèöå ñïåöèàëüíîãî ðàñïðåäåëåíèÿ Óèëêîêñîíà [14]. 2. Ñ ïîìîùüþ äàííîãî êðèòåðèÿ ìîæíî ïðîâåðÿòü äðóãèå ãèïîòåçû, íàïðèìåð Í0: ðàñïðåäåëåíèå ðàçíîñòåé ñèììåòðè÷íî îòíîñèòåëüíî δ, ãäå δ — çàäàííîå ÷èñëî (ýòî ðàâíîñèëüíî ãèïîòåçå, ÷òî µ1 – µ2 = δ); Í1: íóëåâàÿ ãèïîòåçà Глава 14. Сравнение зависимых выборок 407 íåâåðíà. Äëÿ ïðîâåðêè òàêèõ ãèïîòåç èç êàæäîé ðàçíîñòè xi – yi íåîáõîäèìî âû÷åñòü δ. Îñòàëüíûå âû÷èñëåíèÿ îñòàþòñÿ áåç èçìåíåíèé. 3. Åñëè íåò îñíîâàíèé îòêëîíÿòü ïðåäïîëîæåíèå î íîðìàëüíîñòè ãåíåðàëüíîé ñîâîêóïíîñòè, òî ñëåäóåò ïðèìåíÿòü áîëåå ìîùíûé ïàðíûé êðèòåðèé Ñòüþäåíòà (ñì. ðàçäåë 14.2.1). Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Ðåàëèçàöèÿ äàííîãî êðèòåðèÿ â Excel ïîêàçàíà íà ðèñ. 14.5, íà êîòîðîì ïðèâåäåíû âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ. Îòìåòèì, ÷òî çäåñü íåâîçìîæíî îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé: â ñòîëáöå Ñ âû÷èñëÿþòñÿ ìîäóëè ïîïàðíûõ ðàçíîñòåé âûáîðî÷íûõ çíà÷åíèé, â ñòîëáöå D — ðàíãè ýòèõ ìîäóëåé.  ÿ÷åéêå Å3 âû÷èñëÿåòñÿ êîëè÷åñòâî ñîâïàäàþùèõ ïàðíûõ çíà÷åíèé, ïîñêîëüêó ïðè ñîâïàäåíèè îáúåì âûáîðêè óìåíüøàåòñÿ íà ÷èñëî òàêèõ ñîâïàäåíèé. Ðèñ. 14.5. Íåïàðàìåòðè÷åñêèé êðèòåðèé Óèëêîêñîíà 14.3. Дисперсионный анализ для зависимых выборок Îñíîâíûå ñòàòèñòè÷åñêèå ïðåäïîëîæåíèÿ, íà êîòîðûõ ñòðîèòñÿ äèñïåðñèîííûé àíàëèç (ñì. ðàçäåë 3.5.1), çàêëþ÷àþòñÿ â òîì, ÷òî îøèáêè íàáëþäåíèé íåçàâèñèìû è èìåþò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè. Èññëåäîâàíèÿ âëèÿíèÿ íàðóøåíèé îñíîâíûõ ïðåäïîëîæåíèé íà âûâîäû äèñïåðñèîííîãî àíàëèçà [24, ãë. 10] ïîêàçûâàþò, ÷òî äèñïåðñèîííûé àíàëèç íàèáîëåå ÷óâñòâèòåëåí ê íàðóøåíèÿì ïðåäïîëîæåíèé î íîðìàëüíîñòè ðàñïðåäåëåíèé è ðàâåíñòâå äèñïåðñèé è íàèìåíåå ÷óâñòâèòåëåí ê íàðóøåíèÿì ïðåäïîëîæåíèÿ î íåçàâèñèìîñòè íàáëþäåíèé1. Ïîýòîìó íà ïðàêòèêå äèñïåðñèîííûé àíàëèç ÷àñòî ïðèìåíÿåòñÿ ê çàâèñèìûì âûáîðêàì. 1 Ïîä÷åðêíåì, ÷òî çäåñü ðå÷ü èäåò íå î ìîäåëè ñî ñëó÷àéíûìè ôàêòîðàìè (ñì. ðàçäåë 3.5.1), à î ìîäåëè ñ ïîñòîÿííûìè ôàêòîðàìè, íî ñëó÷àéíûìè îøèáêàìè íàáëþäåíèé.  ìîäåëè ñî ñëó÷àéíûìè ôàêòîðàìè ïðèìåíÿåòñÿ ñõåìà âû÷èñëåíèé, îòëè÷íàÿ îò ñõåìû âû÷èñëåíèé â ìîäåëè ñ ïîñòîÿííûìè ôàêòîðàìè. 408 Часть IV. Статистический анализ зависимостей 14.3.1. Двухфакторный дисперсионный анализ Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå õij = µ + βi + γj + εij, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè. Âñå âåëè÷èíû εij íåçàâèñèìû. Ãèïîòåçû à) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà β á) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà γ Í0: β1 = β2 = ... = βr; Í0: γ1 = γ2 = ... = γt; Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû. Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âûáîðêó óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû, ïî çíà÷åíèÿì êîòîðîé âû÷èñëÿþòñÿ ñðåäíèå ïî ñòðîêàì è ñòîëáöàì è îáùåå ñðåäíåå. γ1 γ2 ... γt β1 x11 x12 ... x1t β2 x21 x22 ... x2t ... ... ... ... ... βr xr1 xr2 ... xrt Ñðåäíèå x*1 = ∑ xi1 r ... x*t = ∑ xit r i =1 x*2 = ∑ xi 2 i =1 Ñðåäíèå x1* = 1 t ∑ x1i t i =1 x2* = 1 t ∑ x2 i t i =1 ... xr * = r i =1 x= 1 t ∑ xri t i =1 1 r t ∑∑ xij rt i =1 j =1 2. Âû÷èñëÿþòñÿ êîìïîíåíòû äèñïåðñèîííîé òàáëèöû. Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ (êîìïîíåíòû äèñïåðñèè) Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòðîêàì (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà β) r SS1 = t ∑ ( xi* − x ) 2 i =1 ×èñëî ñòåïåíåé Äèñïåðñèÿ ñâîáîäû r–1 s12 = SS1 r −1 Глава 14. Сравнение зависимых выборок 409 Îêîí÷àíèå òàáë. Èñòî÷íèê âàðèàöèè Ñóììà êâàäðàòîâ (êîìïîíåíòû äèñïåðñèè) Âàðèàöèÿ ìåæäó ñðåäíèìè ïî ñòîëáöàì (ðàçëè÷èÿ ìåæäó óðîâíÿìè ôàêòîðà γ) ×èñëî ñòåïåíåé Äèñïåðñèÿ ñâîáîäû t SS 2 = r ∑ ( x*i − x ) 2 t–1 s22 = i =1 Îñòàòî÷íàÿ âàðèàöèÿ (ðàçëè÷èÿ âíóòðè âûáîðêè) SS3 = ∑∑ ( xij − xi * − x* j + x )2 Ïîëíàÿ (îáùàÿ) âàðèàöèÿ SS = ∑∑ ( xij − x )2 r t (r – 1)(t – 1) i =1 j =1 r t rt – 1 i =1 j =1 3. Âû÷èñëÿþòñÿ êðèòåðèàëüíûå ñòàòèñòèêè Tβ = s32 = SS2 t −1 SS3 (r − 1)(t − 1) s2 = SS rt − 1 s12 s22 è . T = γ s32 s32 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç ñòàòèñòèêà Òβ èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1), ñòàòèñòèêà Òγ èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (t – 1) è (r – 1)(t – 1). Ñëó÷àé à). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Òβ < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòêëîíÿåòñÿ. Ñëó÷àé á). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α F-ðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (t – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Òγ < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, â ïðîòèâíîì ñëó÷àå — îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé óñòîé÷èâ ïðè óìåðåííûõ îòêëîíåíèÿõ îò òðåáîâàíèÿ íîðìàëüíîñòè è ðàâåíñòâà äèñïåðñèé. 2. Äëÿ âûáîðîê, äëÿ êîòîðûõ íå âûïîëíÿþòñÿ òðåáîâàíèÿ íîðìàëüíîñòè è ðàâåíñòâà äèñïåðñèé, íåîáõîäèìî ïðèìåíÿòü íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà èç ñëåäóþùåãî ðàçäåëà. 3. Ìîãóò ïðîâåðÿòüñÿ äðóãèå ãèïîòåçû, íàïðèìåð Í0: β1 – β2 = à, β2 = β3 = ... = βr; Í1: íóëåâàÿ ãèïîòåçà íå âåðíà (à — çàäàííîå ÷èñëî).  ýòîì ñëó÷àå ñíà÷àëà ÷èñëî à âû÷èòàåòñÿ èç âûáîðî÷íûõ çíà÷åíèé õ1i (i = 1, 2, ..., t), à çàòåì âûïîëíÿþòñÿ âñå âû÷èñëåíèÿ êðèòåðèÿ áåç èçìåíåíèé. Àíàëîãè÷íûå ãèïîòåçû ìîæíî ïðîâåðÿòü îòíîñèòåëüíî çíà÷åíèé óðîâíåé ôàêòîðà γ. 4. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ, çíà÷èò, íå âñå çíà÷åíèÿ óðîâíåé ôàêòîðà îäèíàêîâû. Äëÿ òîãî ÷òîáû îïðåäåëèòü, êàêèå çíà÷åíèÿ óðîâíåé ôàêòîðà îòëè÷àþòñÿ îò äðóãèõ, ñëåäóåò ïðèìåíèòü ìåòîä ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå èç ðàçäåëà 14.3.3. 410 Часть IV. Статистический анализ зависимостей Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ  Excel äàííûé êðèòåðèé ðåàëèçóåò îïèñàííîå â ðàçäåëå 5.13 ñðåäñòâî Двухфакторный дисперсионный анализ без повторений èç ïàêåòà àíàëèçà. Òàì æå ïðèâåäåí ïðèìåð åãî ïðèìåíåíèÿ. Çäåñü ïîêàæåì âûïîëíåíèå êðèòåðèÿ áåç ñðåäñòâà Двухфакторный дисперсионный анализ без повторений. Åãî èñïîëüçîâàíèå èìååò òîò íåäîñòàòîê, ÷òî ïðè èçìåíåíèè âûáîðî÷íûõ çíà÷åíèé èëè äëÿ äðóãîãî óðîâíÿ çíà÷èìîñòè åãî íåîáõîäèìî ïðèìåíÿòü çàíîâî. Ðàáî÷èé ëèñò, ïîêàçàííûé íà ðèñ. 14.6, ëèøåí ýòîãî íåäîñòàòêà — ëþáûå èçìåíåíèÿ â âûáîðêå ïðèâîäÿò ê àâòîìàòè÷åñêîìó ïåðåñ÷åòó êðèòåðèÿ. Íàïðèìåð, íà ðèñ. 14.7 èçìåíåí ïåðâûé ñòîëáåö âûáîðî÷íûõ çíà÷åíèé (“âîëþíòàðèñòñêè” ââåäåíû åäèíèöû2) — ðàáî÷èé ëèñò àâòîìàòè÷åñêè ïåðåñ÷èòàí è ïîëó÷åí íîâûé ðåçóëüòàò. Çäåñü âåðíî îòâåðãàåòñÿ ãèïîòåçà î ðàâåíñòâå çíà÷åíèé óðîâíåé ôàêòîðà γ. Ðèñ. 14.6. Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç Âñå ôîðìóëû, íåîáõîäèìûå äëÿ âû÷èñëåíèÿ êðèòåðèÿ, ïîêàçàíû íà ðèñ. 14.6.  ñòîëáöå df äèñïåðñèîííîé òàáëèöû âû÷èñëÿþòñÿ ñòåïåíè ñâîáîäû ñîîòâåòñòâóþùèõ ñóìì êâàäðàòîâ. Îáðàùàåì âíèìàíèå, ÷òî îñòàòî÷íàÿ ñóììà êâàäðàòîâ (ÿ÷åéêà Â13) âû÷èñëÿåòñÿ, êàê ðàçíîñòü ìåæäó ïîëíîé ñóììîé êâàäðàòîâ (ÿ÷åéêà Â14) è ñóììîé êâàäðàòîâ, âû÷èñëåííûõ äëÿ ôàêòîðîâ (ÿ÷åéêè Â11 è Â12). 14.3.2. Двухфакторный дисперсионный анализ Фридмана Åñëè ïðåäïîëîæåíèÿ, íà êîòîðûõ îñíîâàí äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç (ñì. ðàçäåë 3.5.3), íå âûïîëíÿþòñÿ, èñïîëüçóåòñÿ íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà. Íî íåîáõîäèìî îòìåòèòü, ÷òî îáû÷íûé äèñïåðñèîííûé àíàëèç áîëåå ìîùíûé, ÷åì äàííûé êðèòåðèé. Ïîýòîìó êðèòåðèé Ôðèäìàíà ïðèìåíÿåòñÿ òîëüêî òîãäà, êîãäà åñòü âåñêèå îñíîâàíèÿ îòâåðãíóòü ñòàòèñòè÷åñêóþ ìîäåëü îáû÷íîãî äèñïåðñèîííîãî àíàëèçà 2 Ýòè äàííûå íå óäîâëåòâîðÿþò óñëîâèÿì ïðèìåíèìîñòè ðàññìàòðèâàåìîãî êðèòåðèÿ. Глава 14. Сравнение зависимых выборок 411 Ðèñ. 14.7. Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç äëÿ íîâûõ äàííûõ Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå õij = µ + βi + γj + εij, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå îäèíàêîâûå ðàñïðåäåëåíèÿ ñ îäèíàêîâûìè äèñïåðñèÿìè (íîðìàëüíîñòü ðàñïðåäåëåíèÿ íå ïðåäïîëàãàåòñÿ). Âñå âåëè÷èíû εij íåçàâèñèìû. Ãèïîòåçû à) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà β á) Ðàâåíñòâî çíà÷åíèé óðîâíåé ôàêòîðà γ Í0: β1 = β2 = ... = βr; Í0: γ1 = γ2 = ... = γt; Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû. Í1: íå âñå çíà÷åíèÿ óðîâíåé ðàâíû. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ Âûáîðêó óäîáíî ïðåäñòàâëÿòü â âèäå òàáëèöû. γ1 γ2 ... γt β1 x11 x12 ... x1t β2 x21 x22 ... x2t ... ... ... ... ... βr xr1 xr2 ... xrt 1. Âû÷èñëåíèÿ äëÿ ïðîâåðêè ãèïîòåçû à). a)  êàæäîì ñòîëáöå òàáëèöû ïî îòäåëüíîñòè âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé. 412 Часть IV. Статистический анализ зависимостей á) Âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðî÷íûõ çíà÷åíèé êàæäîé ñòðîêè R1, R2, ..., Rr. r 1 r r i =1 2 â) Âû÷èñëÿåòñÿ âåëè÷èíà Sr = ∑ Ri2 − ∑ Ri . i =1 ã) Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Tβ = 12Sr . tr (r + 1) 2. Âû÷èñëåíèÿ äëÿ ïðîâåðêè ãèïîòåçû á). a)  êàæäîé ñòðîêå òàáëèöû ïî îòäåëüíîñòè âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé. á) Âû÷èñëÿåòñÿ ñóììà ðàíãîâ âûáîðî÷íûõ çíà÷åíèé êàæäîãî ñòîëáöà R1 , R2 , ..., Rt . t 1 t t i =1 2 â) Âû÷èñëÿåòñÿ âåëè÷èíà St = ∑ Ri2 − ∑ Ri . i =1 ã) Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà Tγ = 12St . rt (t + 1) Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâûõ ãèïîòåç âåëè÷èíû Sr è St èìåþò ñïåöèàëüíîå ðàñïðåäåëåíèå Ôðèäìàíà, ñòàòèñòèêè Òβ è Òγ àñèìïòîòè÷åñêè èìåþò ðàñïðåäåëåíèå χ2 ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (t – 1) ñîîòâåòñòâåííî. Äëÿ ìàëûõ âûáîðîê êðèòè÷åñêèå çíà÷åíèÿ îïðåäåëÿþòñÿ ïî òàáëèöàì ðàñïðåäåëåíèÿ Ôðèäìàíà [14].  ñëó÷àå áîëüøèõ âûáîðîê (r ≥ 5, t ≥ 5) äëÿ ïðîâåðêè ãèïîòåçû à) êðèòè÷åñêîå çíà÷åíèå têð îïðåäåëÿåòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1). Åñëè Òβ ≤ têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Äëÿ ïðîâåðêè ãèïîòåçû á) êðèòè÷åñêîå çíà÷åíèå têð íàõîäèòñÿ êàê êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ χ2 ñî ñòåïåíüþ ñâîáîäû (r – 1). Åñëè Òγ ≤ têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå — îòâåðãàåòñÿ. Êîììåíòàðèè 1. Åñëè â êàêîé-ëèáî ñòðîêå èëè ñòîëáöå èìåþòñÿ îäèíàêîâûå çíà÷åíèÿ, òî èì ïðèñâàèâàþòñÿ ñðåäíèå ðàíãè. 2. Êðèòåðèé ìàëî ÷óâñòâèòåëåí ê óìåðåííûì îòêëîíåíèÿì îò òðåáîâàíèÿ îäèíàêîâîé ðàñïðåäåëåííîñòè âåëè÷èí εij. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 14.8 ïîêàçàí ðàáî÷èé ëèñò Excel, ðåàëèçóþùèé äàííûé êðèòåðèé.  êà÷åñòâå èñõîäíûõ äàííûõ èñïîëüçîâàíà âûáîðêà èç ïðèìåðà ïðåäûäóùåãî ðàçäåëà. Ê ñîæàëåíèþ, â äàííîì ñëó÷àå íå óäàëîñü îáîéòèñü áåç ïðîìåæóòî÷íûõ âû÷èñëåíèé.  äèàïàçîíå G3:J7 âû÷èñëÿþòñÿ ðàíãè âûáîðî÷íûõ çíà÷åíèé ïî ñòîëáöàì. Äëÿ ýòîãî ñíà÷àëà âûäåëÿåòñÿ äèàïàçîí G3:G7 (êàê ïîêàçàíî íà ðèñ. 14.8) è ââîäèòñÿ ôîðìóëà ìàññèâà {=РАНГ(B3:B7;B3:B7;1)}, êîòîðàÿ çàòåì êîïèðóåòñÿ â ÿ÷åéêè âñåãî äèàïàçîíà G3:J7. Àíàëîãè÷íî â äèàïàçîíå Â9:Å13 âû÷èñëÿþòñÿ ðàíãè ïî ñòðîêàì — çäåñü ñíà÷àëà â äèàïàçîí Â9:Å9 ââîäèòñÿ ôîðìóëà ìàññèâà {=РАНГ(B3:Е3;B3:Е3;1)}, êîòîðàÿ çàòåì êîïèðóåòñÿ â ÿ÷åéêè âñåãî Глава 14. Сравнение зависимых выборок 413 äèàïàçîíà Â9:Å13.  äèàïàçîíàõ Ê3:Ê7 è Â14:Å14 âû÷èñëÿþòñÿ ñóììû ñîîòâåòñòâóþùèõ ðàíãîâ. Îñòàëüíûå ôîðìóëû ïðèâåäåíû íà ðèñ. 14.8. Åñëè êðèòåðèé âûïîëíÿåòñÿ ÷àñòî, òî, ÷òîáû îñâîáîäèòü äàííûé ðàáî÷èé ëèñò, äèàïàçîíû G3:Ê7 è Â9:Å14, ñîäåðæàùèå ðàíãè âûáîðî÷íûõ çíà÷åíèé è èõ ñóììû, ìîæíî ïåðåíåñòè â îòäàëåííóþ îáëàñòü ëèñòà. Âû÷èñëåíèÿ îò ýòîãî íå ïîñòðàäàþò. Ðèñ. 14.8. Íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà Íà ðèñ. 14.9 ïîêàçàí òîò æå ðàáî÷èé ëèñò ñ èçìåíåííûìè èñõîäíûìè äàííûìè: çíà÷åíèÿ â ïåðâîì ñòîëáöå âûáîðêè çàìåíåíû åäèíè÷íûìè çíà÷åíèÿìè. Êàê è ñëåäîâàëî îæèäàòü, êðèòåðèé îòêëîíèë ãèïîòåçó î ðàâåíñòâå çíà÷åíèé óðîâíåé ôàêòîðà β, íî òîëüêî ïðè óðîâíå çíà÷èìîñòè 0,13. Ðèñ. 14.9. Íåïàðàìåòðè÷åñêèé êðèòåðèé Ôðèäìàíà äëÿ íîâûõ äàííûõ 3 Ýòè äàííûå íå óäîâëåòâîðÿþò óñëîâèÿì ïðèìåíèìîñòè ðàññìàòðèâàåìîãî êðèòåðèÿ. 414 Часть IV. Статистический анализ зависимостей 14.3.3. Критерий множественных сравнений Шеффе для зависимых выборок Äâóõôàêòîðíûé äèñïåðñèîííûé àíàëèç ïîçâîëÿåò îáíàðóæèâàòü ðàçíûå çíà÷åíèÿ óðîâíåé ôàêòîðîâ, îäíàêî íå ïðåäñòàâëÿåò âîçìîæíîñòè óêàçûâàòü, êàêîé èìåííî óðîâåíü âûäåëÿåòñÿ â ðÿäó îñòàëüíûõ óðîâíåé. Äëÿ ðåøåíèÿ ýòîé çàäà÷è íåëüçÿ âûïîëíèòü ñåðèþ ïîñëåäîâàòåëüíûõ ïîïàðíûõ ñðàâíåíèé ñ ïîìîùüþ, íàïðèìåð, ïàðíîãî êðèòåðèÿ Ñòüþäåíòà, ïîñêîëüêó â ñåðèè ïîïàðíûõ ñðàâíåíèé ðåçêî âîçðàñòàåò ãðóïïîâàÿ âåðîÿòíîñòü îòêëîíåíèÿ íóëåâîé ãèïîòåçû â ñëó÷àå åå èñòèííîñòè. Ïîïàðíûå ñðàâíåíèÿ ñëåäóåò âûïîëíÿòü ñ ïîìîùüþ êðèòåðèÿ ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå. Ñòàòèñòè÷åñêàÿ ìîäåëü. Èìååòñÿ äâóìåðíàÿ âûáîðêà, ñîñòîÿùàÿ èç âûáîðî÷íûõ çíà÷åíèé xij; èíäåêñ i ñîîòâåòñòâóåò óðîâíþ βi ôàêòîðà β, èíäåêñ j ñîîòâåòñòâóåò óðîâíþ γj ôàêòîðà γ. Ïóñòü ôàêòîð β èìååò r óðîâíåé, à ôàêòîð γ — t óðîâíåé; âûáîðêà èìååò ðàçìåðíîñòü r×t. Òàêèì îáðàçîì, êàæäîå âûáîðî÷íîå çíà÷åíèå õij ìîæíî ïðåäñòàâèòü â âèäå õij = µ + βi + γj + εij, ãäå µ — êîíñòàíòà (îáùåå ñðåäíåå), εij — ñëó÷àéíûå âåëè÷èíû, èìåþùèå íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì è îäèíàêîâûìè äèñïåðñèÿìè. Âñå âåëè÷èíû εij íåçàâèñèìû. Ãèïîòåçû Í0: c1β1+ c2β2 + ... + crβr, ãäå c1, c2, ..., cr — çàäàííûå ÷èñëà, ñóììà êîòîðûõ ðàâíà íóëþ; Í1: íóëåâàÿ ãèïîòåçà íåâåðíà. Çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ â çíà÷èòåëüíîé ìåðå ïîâòîðÿþò âû÷èñëåíèÿ äâóõôàêòîðíîãî äèñïåðñèîííîãî àíàëèçà (ñì. ðàçäåë 14.3.1): ñíà÷àëà âû÷èñëÿþòñÿ ñðåäíèå ïî ñòðîêàì xi* (i = 1, 2, ..., r) è ñòîëáöàì x* j (j = 1, 2, ..., t) è îáùåå ñðåäíåå x . Äàëåå âû÷èñëÿþòñÿ êîìïîíåíòû äèñïåðñèîííîé òàáëèöû; õîòÿ äëÿ äàëüíåéøèõ âû÷èñëåíèé íåîáõîäèìà òîëüêî îñòàòî÷íàÿ äèñïåðñèÿ s32 , åå ñëîæíî âû÷èñëèòü áåç îñòàëüíûõ êîìïîíåíòîâ äèñïåðñèîííîé òàáëèöû. r ∑c x i i* Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà T = i =1 r (r − 1) s32 ∑ ci2 /t . i =1 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà Ò èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå têð êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû (r – 1) è (r – 1)(t – 1). Åñëè âûïîëíÿåòñÿ íåðàâåíñòâî Ò < têð, òî íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ.  ïðîòèâíîì ñëó÷àå — îòêëîíÿåòñÿ. Êîììåíòàðèè 1. Êðèòåðèé îáû÷íî ïðèìåíÿåòñÿ äëÿ ñåðèè ñðàâíåíèé òèïà Í0: β1 – β2 = 0; Í0: β1 – β2 ≠ 0. Глава 14. Сравнение зависимых выборок 415 2. Î÷åâèäíî èñïîëüçîâàíèå ýòîãî êðèòåðèÿ äëÿ ñðàâíåíèÿ çíà÷åíèé óðîâíåé ôàêòîðà γ. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ Íà ðèñ. 14.10 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ðåàëèçîâàí äàííûé êðèòåðèé. Êîýôôèöèåíòû ñi çàäàþòñÿ â äèàïàçîíå G6:J6. Ôîðìóëû äëÿ âû÷èñëåíèÿ êîìïîíåíòîâ äèñïåðñèîííîé òàáëèöû ïîêàçàíû íà ðèñ. 14.6. Ðèñ. 14.10. Êðèòåðèé ìíîæåñòâåííûõ ñðàâíåíèé Øåôôå 416 Часть IV. Статистический анализ зависимостей Глава 15 Регрессионный анализ Ð åãðåññèîííûé àíàëèç âûïîëíÿåòñÿ â ðàìêàõ ìîäåëè, â êîòîðîé ïåðåìåííûå Õ è Y (âîçìîæíî, âåêòîðîçíà÷íûå) ñâÿçàíû çàâèñèìîñòüþ Y(Õ) = f(X) + ε, ãäå ε — ñëó÷àéíàÿ ïåðåìåííàÿ. Ýòî óðàâíåíèå íàçûâàåòñÿ óðàâíåíèåì ðåãðåññèè, à ôóíêöèÿ f(Õ) — ôóíêöèåé ðåãðåññèè. Îòíîñèòåëüíî ñëó÷àéíîé âåëè÷èíû ε îáû÷íî äåëàåòñÿ ïðåäïîëîæåíèå, ÷òî îíà èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Ýòà ìîäåëü è îñíîâíûå ïîíÿòèÿ ðåãðåññèîííîãî àíàëèçà îïèñàíû â ðàçäåëå 3.4. Ïóñòü èìåþòñÿ èñõîäíûå äàííûå (íàáëþäåíèÿ) (õ1, y1), (õ2, y2), ..., (õn, yn), ãäå õi è yi ìîãóò áûòü âåêòîðàìè. Ìåòîäû ðåãðåññèîííîãî àíàëèçà èñïîëüçóþòñÿ äëÿ ðåøåíèÿ ñëåäóþùèõ çàäà÷. 1. Ïîäáîð ôóíêöèè ðåãðåññèè f(X), êîòîðàÿ íàèëó÷øèì îáðàçîì àïïðîêñèìèðóåò èñõîäíûå äàííûå. Êðèòåðèåì íàèëó÷øåãî ïîäáîðà îáû÷íî âûñòóïàåò êðèòåðèé ìèíèìóìà ñóììû êâàäðàòîâ (ðàçäåë 3.4.1). Ïðè ýòîì, êàê ïðàâèëî, ôóíêöèþ f(X) âûáèðàþò òàêèì îáðàçîì, ÷òîáû îíà èìåëà âèä f(X) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X), ãäå ôóíêöèè ϕi çàäàíû. Êîýôôèöèåíòû bi îïðåäåëÿþòñÿ íà îñíîâå èñõîäíûõ äàííûõ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ (ñì. ðàçäåë 3.4.2). Êîíå÷íî, íè÷òî íå ìåøàåò âûáèðàòü ôóíêöèè ðåãðåññèè èç äðóãîãî êëàññà ôóíêöèé èëè èñïîëüçîâàòü äðóãîé ìåòîä âû÷èñëåíèÿ êîýôôèöèåíòîâ bi. Îäíàêî òàêèå ôóíêöèè ëèíåéíû îòíîñèòåëüíî íåèçâåñòíûõ êîýôôèöèåíòîâ bi, ÷òî çíà÷èòåëüíî îáëåã÷àåò âû÷èñëåíèå çíà÷åíèé ýòèõ êîýôôèöèåíòîâ. Êðîìå òîãî, çíà÷åíèÿ êîýôôèöèåíòîâ, âû÷èñëåííûå ïî ìåòîäó íàèìåíüøèõ êâàäðàòîâ îáëàäàþò õîðîøèìè ñòàòèñòè÷åñêèìè ñâîéñòâàìè (åñëè âûïîëíÿåòñÿ ïðåäïîëîæåíèå î íîðìàëüíîì ðàñïðåäåëåíèè ñëó÷àéíîé âåëè÷èíû ε), ÷òî äàåò âîçìîæíîñòü ñòðîèòü äëÿ íèõ äîâåðèòåëüíûå èíòåðâàëû è ïðîâåðÿòü ãèïîòåçû î èõ çíà÷èìîñòè. 2. Ïðîâåðêà ãèïîòåç î ñòàòèñòè÷åñêîé çíà÷èìîñòè óðàâíåíèÿ ðåãðåññèè, ò.å. ïðîâåðêà òîãî, ÷òî âûáðàííàÿ ôóíêöèÿ ðåãðåññèè àäåêâàòíî îïèñûâàåò çàâèñèìîñòü ìåæäó ïåðåìåííûìè Õ è Y. 3. Ïðîâåðêà ãèïîòåç î ñòàòèñòè÷åñêîé çíà÷èìîñòè êîýôôèöèåíòîâ ðåãðåññèè.  ÷àñòíîñòè, åñëè âñå êîýôôèöèåíòû íåçíà÷èìî îòëè÷àþòñÿ îò íóëÿ, ìîæíî óòâåðæäàòü, ÷òî ìåæäó ïåðåìåííûìè Õ è Y íåò çàâèñèìîñòè, ïî êðàéíåé ìåðå òàêîé, êàêóþ ìîæíî ïðåäñòàâèòü â âèäå âûáðàííîé ôóíêöèè ðåãðåññèè. 4. Ïîñòðîåíèå äîâåðèòåëüíûõ èíòåðâàëîâ äëÿ çíà÷åíèé êîýôôèöèåíòîâ ðåãðåññèè. Òàêèå èíòåðâàëû ïîêàçûâàþò òî÷íîñòü íàéäåííûõ çíà÷åíèé êîýôôèöèåíòîâ. Ýòî îñîáåííî âàæíî, åñëè êîýôôèöèåíòû èìåþò îïðåäåëåííûé “ôèçè÷åñêèé” ñìûñë â ðàìêàõ îïðåäåëåííîé èíòåðïðåòàöèè ýêñïåðèìåíòàëüíûõ äàííûõ. 5. Îïðåäåëåíèå çíà÷åíèÿ ïåðåìåííîé Y ïðè òåõ çíà÷åíèÿõ ïåðåìåííîé Õ, êîòîðûå îòñóòñòâóþò â èñõîäíûõ äàííûõ. Ýòî çàäà÷à ïðîãíîçèðîâàíèÿ èëè âîññòàíîâëåíèÿ çíà÷åíèé (ñì. ðàçäåë 3.4.5). Ïðàêòè÷åñêèå ìåòîäû ðåøåíèÿ îïèñàííûõ çàäà÷ ïðèâåäåíû â ñëåäóþùèõ ðàçäåëàõ ãëàâû. Ñðàçó îòìåòèì, ÷òî â Excel èìååòñÿ äîñòàòî÷íî ñðåäñòâ äëÿ ðåøåíèÿ äàííûõ çàäà÷, ïîýòîìó ïðàêòè÷åñêè íå âîçíèêàåò íåîáõîäèìîñòè ñîçäàâàòü ñîáñòâåííûå ôîðìóëû — äîñòàòî÷íî ïðèìåíèòü èìåþùèåñÿ ôóíêöèè è ñðåäñòâà. 15.1. Построение функции регрессии Ïóñòü èìåþòñÿ èñõîäíûå äàííûå (íàáëþäåíèÿ) (õ1, y1), (õ2, y2), ..., (õn, yn). Ïðåäïîëàãàåì, ÷òî èñõîäÿ èç êàêèõ-ëèáî ñîîáðàæåíèé âûáðàí âèä ôóíêöèè ðåãðåññèè Y(Õ) = b0ϕ0(X) + b1ϕ1(X) + b2ϕ2(X) + ... + bmϕm(X), ãäå ôóíêöèè ϕi èçâåñòíû (çàäàíû), è íóæíî âû÷èñëèòü êîýôôèöèåíòû b0, b1, ..., bm.  ñîîòâåòñòâèè ñ ìåòîäîì íàèìåíüøèõ êâàäðàòîâ äëÿ ýòîãî íåîáõîäèìî ðåøèòü ñèñòåìó íîðìàëüíûõ óðàâíåíèé (ñì. ðàçäåë 3.4.2) n n n n 2 b0 ∑ ϕ0 ( xi ) + b1 ∑ ϕ0 ( xi )ϕ1 ( xi ) + ... + bm ∑ ϕ0 ( xi )ϕm ( xi ) = ∑ yiϕ0 ( xi ); i =1 i =1 i =1 i =1 n n n n 2 b0 ∑ ϕ0 ( xi )ϕ1 ( xi ) + b1 ∑ ϕ1 ( xi ) + ... + bm ∑ ϕ1 ( xi )ϕm ( xi ) = ∑ yiϕ1 ( xi ); i =1 i =1 i =1 i =1 … n n n n 2 b ϕ ( x ) ϕ ( x ) + b ϕ ( x ) ϕ ( x ) + ... + b ϕ ( x ) = yiϕ m ( xi ). ∑ ∑ ∑ ∑ i m i i m i m m i 0 1 1 0 i =1 i =1 i =1 i =1 Äëÿ ðåøåíèÿ ïîäîáíûõ ñèñòåì ñíà÷àëà ñëåäóåò ïîäñ÷èòàòü âñå ñóììû, êîòîðûå èìåþòñÿ â ýòîé ñèñòåìå, è çàòåì ïðèìåíèòü îäíî èç ñðåäñòâ Excel: èñïîëüçîâàòü ìàòðè÷íûå âû÷èñëåíèÿ (ñì. ðàçäåë 6.1.5) èëè ñðåäñòâî Поиск решения (ðàçäåë 6.3.3). Ïîïóòíî îòìåòèì, ÷òî ñ ïîìîùüþ ñðåäñòâà Поиск решения ìîæíî íàõîäèòü ïàðàìåòðû (êîýôôèöèåíòû) ôóíêöèé ðåãðåññèè, íåëèíåéíûõ îòíîñèòåëüíî ýòèõ ïàðàìåòðîâ. Âìåñòå ñ òåì Excel ïîçâîëÿåò íàõîäèòü êîýôôèöèåíòû ðåãðåññèè áåç ïîñòðîåíèÿ íîðìàëüíîé ñèñòåìû óðàâíåíèé. Îñíîâíûìè ñðåäñòâàìè Excel, âû÷èñëÿþùèìè êîýôôèöèåíòû ðåãðåññèè, ÿâëÿþòñÿ ôóíêöèÿ ЛИНЕЙН (ñì. ðàçäåë 4.9.1) è ñðåäñòâî Регрессия (ðàçäåë 5.16). Îíè ìîãóò âû÷èñëèòü êîýôôèöèåíòû ëþáîé ôóíêöèè ðåãðåññèè, ëèíåéíîé îòíîñèòåëüíî ýòèõ êîýôôèöèåíòîâ. Äëÿ ýòîãî íåîáõîäèìî, ÷òîáû èñõîäíûå äàííûå èìåëè îïðåäåëåííóþ ñòðóêòóðó, à èìåííî, ÷òîáû â îòäåëüíûõ äèàïàçîíàõ áûëè çàðàíåå âû÷èñëåíû çíà÷åíèÿ ϕk(xi). Ïðèìåðû òàêèõ ñòðóêòóð äàííûõ äëÿ ìíîæåñòâåííîé ðåãðåññèè ïðèâåäåíû ïðè îïèñàíèè ôóíêöèè ЛИНЕЙН è ñðåäñòâà Регрессия. Çäåñü ïîêàæåì ñòðóêòóðó äàííûõ äëÿ ôóíêöèè íåëèíåéíîé ðåãðåññèè Y = X2 + 2ln(1 + X). Íà ðèñ. 15.1 ïðåäñòàâëåíû èñõîäíûå äàííûå: â ñòîëáöå À çàïèñàíû çíà÷åíèÿ õi, â ñòîëáöå  — çíà÷åíèÿ õi2, â ñòîëáöå Ñ — çíà÷åíèÿ ln(1 + õi). Çíà÷åíèÿ yi 418 Часть IV. Статистический анализ зависимостей ïîëó÷åíû ïî ôîðìóëå yi = xi2 + 2×ln(1 + xi) + εi, ãäå εi — ðåàëèçàöèè ñëó÷àéíîé âåëè÷èíû, èìåþùåé ñòàíäàðòíîå íîðìàëüíîå ðàñïðåäåëåíèå. Êîýôôèöèåíòû b1 è b2 ôóíêöèè ðåãðåññèè Y = b1X2 + b2ln(1 + X) îïðåäåëåíû ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН (èñòèííûå çíà÷åíèÿ êîýôôèöèåíòîâ b1 = 1 è b2 = 2). Ñíà÷àëà âûäåëÿåòñÿ äèàïàçîí ÿ÷ååê, â êîòîðûé áóäóò çàïèñàíû çíà÷åíèÿ êîýôôèöèåíòîâ, çàòåì ââîäèòñÿ ôóíêöèÿ ЛИНЕЙН ñ íåîáõîäèìûìè àðãóìåíòàìè è íàæèìàåòñÿ êîìáèíàöèÿ êëàâèø <Ctrl+Shift+Enter>, ïîñêîëüêó ôóíêöèÿ ââîäèòñÿ, êàê ôîðìóëà ìàññèâà. Ðèñ. 15.1. Âû÷èñëåíèå êîýôôèöèåíòîâ ðåãðåññèè  äèàïàçîíå F3:I7 ââåäåíà ôîðìóëà {=ЛИНЕЙН(D2:D16;A2:C16;;1)}; çäåñü â êà÷åñòâå èñõîäíûõ äàííûõ èñïîëüçîâàíû çíà÷åíèÿ èç ñòîëáöîâ À:Ñ. (Îáðàùàåì âíèìàíèå, ÷òî çàãîëîâêè ñòîëáöîâ íå âêëþ÷àþòñÿ â èñõîäíûå äàííûå, èíà÷å ôóíêöèÿ âîçâðàùàåò çíà÷åíèå îøèáêè #ЧИСЛО!.) Ïðè òàêèõ èñõîäíûõ äàííûõ b1, b2 è b3 ôóíêöèè ðåãðåññèè âû÷èñëÿþòñÿ êîýôôèöèåíòû b0, Y = b0 + b1X + b2X2 + b3ln(1+X). Êàê âèäíî íà ðèñ. 15.1, âû÷èñëåííûå çíà÷åíèÿ êîýôôèöèåíòîâ b2 è b3 âåñüìà äàëåêè îò èñòèííûõ çíà÷åíèé. Åñëè ñòîëáåö À íå âêëþ÷àòü â èñõîäíûå äàííûå, òî áóäóò âû÷èñëåíû êîýôôèöèåíòû b0, b1 è b2 ôóíêöèè Y = b0 + b1X2 + b2ln(1+X), êàê ýòî ñäåëàíî â äèàïàçîíå F10:H14 ñ ïîìîùüþ ôîðìóëû {=ЛИНЕЙН(D2:D16;В2:C16;;1)}. Çäåñü êîýôôèöèåíòû b1 è b2 òàêæå åùå äàëåêè îò èñòèííûõ. Åñëè â ïîñëåäíåé ôîðìóëå â êà÷åñòâå òðåòüåãî àðãóìåíòà ôóíêöèè ЛИНЕЙН óêàçàòü 0 (ýòî îçíà÷àåò, ÷òî ïðèíóäèòåëüíî ïîëàãàåòñÿ b0 = 0), òî ïîëó÷àòñÿ çíà÷åíèÿ êîýôôèöèåíòîâ b1 è b2, âåñüìà áëèçêèå ê èñòèííûì (ÿ÷åéêè F17 è G17). Õîòÿ â ïîñëåäíåì ñëó÷àå çíà÷åíèÿ êîýôôèöèåíòîâ b1 è b2 áëèçêè ê èñòèííûì, êîýôôèöèåíò äåòåðìèíàöèè R2, îïðåäåëÿþùèé ñòåïåíü òî÷íîñòè àïïðîêñèìàöèè èñõîäíûõ äàííûõ ôóíêöèåé ðåãðåññèè (ñì. ðàçäåë 3.4.3), íàèìåíüøèé Глава 15. Регрессионный анализ 419 ñðåäè òðåõ âû÷èñëåííûõ (ÿ÷åéêè F5, F12 è F19). Ýòî âïîëíå îáúÿñíèìî: ÷åì áîëüøå ÷ëåíîâ â ôóíêöèè ðåãðåññèè, òåì òî÷íåå àïïðîêñèìàöèÿ. Àíàëîãè÷íûå ðåçóëüòàòû ìîæíî ïîëó÷èòü ñ ïîìîùüþ ñðåäñòâà Регрессия. Ïðåèìóùåñòâî èñïîëüçîâàíèÿ ôóíêöèè ЛИНЕЙН ïî ñðàâíåíèþ ñî ñðåäñòâîì Регрессия ñîñòîèò â òîì, ÷òî ïðè èçìåíåíèè èñõîäíûõ äàííûõ ôîðìóëû, ïîñòðîåííûå íà îñíîâå ôóíêöèè ЛИНЕЙН, àâòîìàòè÷åñêè ïåðåñ÷èòûâàþòñÿ, â òî âðåìÿ êàê ñðåäñòâî Регрессия ïðèøëîñü áû ïðèìåíÿòü ïîâòîðíî. Êðîìå ôóíêöèè ЛИНЕЙН è ñðåäñòâà Регрессия, â Excel èìåþòñÿ è äðóãèå ñðåäñòâà âû÷èñëåíèÿ êîýôôèöèåíòîâ ðåãðåññèè. Ýòî ôóíêöèÿ ЛГРФПРИБЛ, êîòîðàÿ âû÷èñëÿåò êîýôôèöèåíòû b0, m1, m2, ..., mk ýêñïîíåíöèàëüíîé ðåãðåññèè âèäà Y = b0 ⋅ m1 1 ⋅ m2 X X2 ⋅ ... ⋅ mk Xk (ñì. ðàçäåë 4.9.6); ôóíêöèÿ òàêæå âû÷èñëÿåò ñòà- òèñòè÷åñêèå ïîêàçàòåëè ðåãðåññèè. Ôóíêöèè ОТРЕЗОК è НАКЛОН (ñì. ðàçäåë 4.9.2) âû÷èñëÿþò ñîîòâåòñòâåííî êîýôôèöèåíòû b è m óðàâíåíèÿ ëèíåéíîé ðåãðåññèè Y = b + mX.  Excel ôóíêöèþ ðåãðåññèè ìîæíî ïîñòðîèòü íåïîñðåäñòâåííî íà ãðàôèêå çàâèñèìîñòè Y îò Õ, ïîñòðîåííîì ïî ýêñïåðèìåíòàëüíûì äàííûì. Ðîëü ôóíêöèè ðåãðåññèè âûïîëíÿåò ëèíèÿ òðåíäà (ñì. ðàçäåë 6.2.1). Òàêèì ñïîñîáîì ìîæíî ïîñòðîèòü ôóíêöèþ ðåãðåññèè òîëüêî îäíîé ïåðåìåííîé. Ýòîò íåäîñòàòîê êîìïåíñèðóåòñÿ øèðîêèì íàáîðîì òèïîâ ôóíêöèè ðåãðåññèè: • ëèíåéíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b + mX; • ëîãàðèôìè÷åñêàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b + m ln(X); • ïîëèíîìèàëüíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = b0 + b1X + b2X2 + ... + bkXk (ñòåïåíü ïîëèíîìà k äîëæíà áûòü îò 2 äî 6); • ñòåïåííàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = m Xb; • ýêñïîíåíöèàëüíàÿ — ôóíêöèÿ ðåãðåññèè âèäà Y = m ebX. Íà ðèñ. 15.2 ïîêàçàíû òî÷å÷íûé ãðàôèê ýêñïåðèìåíòàëüíîé çàâèñèìîñòè Y îò Õ è ôóíêöèÿ ðåãðåññèè ýêñïîíåíöèàëüíîãî âèäà. Íà ãðàôèêå òàêæå âûâîäÿòñÿ óðàâíåíèå ðåãðåññèè è çíà÷åíèå êîýôôèöèåíòà äåòåðìèíàöèè R2. Î òîì, êàê äîáàâèòü ê äèàãðàììå ôóíêöèþ ðåãðåññèè (ëèíèþ òðåíäà) è êàê çàäàòü åå ïàðàìåòðû, ïîäðîáíî ðàññêàçàíî â ðàçäåëå 6.2.1. Íåäîñòàòêîì òàêîãî ñïîñîáà ïîñòðîåíèÿ ôóíêöèè ðåãðåññèè ÿâëÿåòñÿ òî, ÷òî ïðè íåîáõîäèìîñòè ïðîäîëæèòü ðàáîòó ñ ýòîé ôóíêöèåé ïðèõîäèòñÿ âðó÷íóþ ïåðåíîñèòü íà ðàáî÷èé ëèñò çíà÷åíèÿ åå êîýôôèöèåíòîâ. 15.2. Адекватность уравнения регрессии Ñòàòèñòè÷åñêàÿ ìîäåëü. Ñòàòèñòè÷åñêèå õàðàêòåðèñòèêè óðàâíåíèÿ ðåãðåññèè è êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè îáû÷íî îïðåäåëÿþòñÿ ïðè óñëîâèè, ÷òî ñëó÷àéíàÿ âåëè÷èíà ε èç óðàâíåíèÿ çàâèñèìîñòè Y(Õ) = f(X) + ε èìååò íîðìàëüíîå ðàñïðåäåëåíèå ñ íóëåâûì ìàòåìàòè÷åñêèì îæèäàíèåì. Äðóãèìè ñëîâàìè, åñëè íàáëþäåíèÿ yi ïðåäñòàâèìû â âèäå yi = f(xi) + εi, òî ñëó÷àéíûå âåëè÷èíû εi äîëæíû áûòü íåçàâèñèìûìè è èìåòü îäèíàêîâûå íîðìàëüíûå ðàñïðåäåëåíèÿ ñ íóëåâûìè ìàòåìàòè÷åñêèìè îæèäàíèÿìè è îäèíàêîâûìè äèñïåðñèÿìè. Îáû÷íî äîïóñêàåòñÿ íåêîòîðîå îòêëîíåíèå îò óñëîâèÿ íîðìàëüíîñòè, íî óñëîâèå ðàâåíñòâà äèñïåðñèé âñåõ âûáîðî÷íûõ çíà÷åíèé áîëåå æåñòêî. Åñëè ïîñëåäíåå óñëîâèå ÿâíî íå âûïîëíÿåòñÿ, òî, âî-ïåðâûõ, äëÿ âû÷èñëåíèÿ êîýôôèöèåíòîâ 420 Часть IV. Статистический анализ зависимостей ôóíêöèè ðåãðåññèè ñëåäóåò ïðèìåíÿòü íå ñòàíäàðòíûé ìåòîä íàèìåíüøèõ êâàäðàòîâ, à åãî ìîäèôèêàöèþ — òàê íàçûâàåìûé âçâåøåííûé ìåòîä íàèìåíüøèõ êâàäðàòîâ [14], êîòîðûé ó÷èòûâàåò íåðàâíîòî÷íîñòü íàáëþäåíèé yi. Âî-âòîðûõ, îñíîâíûå ñòàòèñòè÷åñêèå ïîêàçàòåëè (ñì. äèñïåðñèîííóþ òàáëèöó èç ðàçäåëà 3.4.3) òàêæå âû÷èñëÿþòñÿ ïî èçìåíåííûì ôîðìóëàì [14]. Ðèñ. 15.2. Ïîñòðîåíèå ôóíêöèè ðåãðåññèè êàê ëèíèè òðåíäà Äàëåå â ýòîì ðàçäåëå è â ïîñëåäóþùèõ ðàçäåëàõ áóäåì ïðåäïîëàãàòü, ÷òî âûïîëíÿåòñÿ îïèñàííàÿ âûøå ñòàòèñòè÷åñêàÿ ìîäåëü. Êðèòåðèé ïðîâåðêè àäåêâàòíîñòè ôóíêöèè ðåãðåññèè îïèñàí â ðàçäåëå 3.4.3. Íàïîìíèì, ÷òî êðèòåðèé ïðîâåðÿåò íóëåâóþ ãèïîòåçó Í0: R2 = 0 (R2 — êîýôôèöèåíò äåòåðìèíàöèè) ïðîòèâ ãèïîòåçû Í1: R2 ≠ 0. Åñëè íóëåâàÿ ãèïîòåçà îòêëîíÿåòñÿ (ñ çàäàííûì óðîâíåì çíà÷èìîñòè α), òî ñ÷èòàåòñÿ, ÷òî ôóíêöèÿ ðåãðåññèè ñòàòèñòè÷åñêè çíà÷èìà, ò.å. àäåêâàòíî îïèñûâàåò èñõîäíûå äàííûå1. Ñ÷èòàåì, ÷òî çàäàí óðîâåíü çíà÷èìîñòè α. Âû÷èñëåíèÿ 1. Âû÷èñëÿåòñÿ êîýôôèöèåíò äåòåðìèíàöèè R2. Ôîðìóëà äëÿ âû÷èñëåíèÿ ïðèâåäåíà â ðàçäåëå 3.4.3. (Ìû íå ïðèâîäèì åå çäåñü, ïîñêîëüêó ðàññ÷èòûâàåì íà ïðèìåíåíèå ôóíêöèè ЛИНЕЙН èëè ñðåäñòâà Регрессия, êîòîðûå âû÷èñëÿþò ýòîò êîýôôèöèåíò.) 2. Âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà F = n − k −1 R2 ⋅ , ãäå n — êîëèk 1 − R2 ÷åñòâî íàáëþäåíèé yi, k — êîëè÷åñòâî âû÷èñëÿåìûõ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè áåç ñâîáîäíîãî ÷ëåíà, ò.å. êîëè÷åñòâî ñòîëáöîâ ñî çíà÷åíèÿìè Õ â èñõîäíûõ äàííûõ. (Äðóãàÿ ôîðìóëà äëÿ âû÷èñëåíèÿ ñòàòèñòèêè F ïðèâåäåíà â ðàçäåëå 3.4.3. Ýòó ñòàòèñòèêó òàêæå âû÷èñëÿþò ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия.) 1 Íà ïðàêòèêå ñ÷èòàåòñÿ, ÷òî åñëè R2 ≥ 0,7, òî òàêîå çíà÷åíèå çíà÷èìî àïðèîðè. Глава 15. Регрессионный анализ 421 Ïîñòðîåíèå êðèòè÷åñêîé îáëàñòè. Ïðè óñëîâèè èñòèííîñòè íóëåâîé ãèïîòåçû ñòàòèñòèêà F èìååò F-ðàñïðåäåëåíèå ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1). Îïðåäåëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t êàê êâàíòèëü ïîðÿäêà 1 – α Fðàñïðåäåëåíèÿ ñî ñòåïåíÿìè ñâîáîäû k è (n – k – 1). Íóëåâàÿ ãèïîòåçà ïðèíèìàåòñÿ, åñëè F ≤ t.  ïðîòèâíîì ñëó÷àå ïðèíèìàåòñÿ ãèïîòåçà î ñòàòèñòè÷åñêîé çíà÷èìîñòè ðåãðåññèè. Ïðàêòè÷åñêàÿ ðåàëèçàöèÿ â Excel ýòîãî êðèòåðèÿ íå âûçûâàåò çàòðóäíåíèé, åñëè âû÷èñëåíà êðèòåðèàëüíàÿ ñòàòèñòèêà F (ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èëè ñðåäñòâà Регрессия). Äëÿ ðåàëèçàöèè êðèòåðèÿ íåîáõîäèìî íàéòè òîëüêî êâàíòèëü F-ðàñïðåäåëåíèÿ. Íà ðèñ. 15.3 ïîêàçàí ðàáî÷èé ëèñò Excel ñ èñõîäíûìè äàííûìè è ôóíêöèåé ðåãðåññèè, ïîâòîðÿþùèìè ðàáî÷èé ëèñò íà ðèñ. 15.1. Çíà÷åíèÿ ñòàòèñòèêè F âû÷èñëåíû â ÿ÷åéêàõ F6 è F15 ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН, êðèòè÷åñêèå çíà÷åíèÿ — â ÿ÷åéêàõ Í8 è Í16 ñ ïîìîùüþ ôîðìóë, ïîêàçàííûõ íà ðèñ. 15.3. Êàê è ñëåäîâàëî îæèäàòü, ðåãðåññèÿ â îáîèõ ñëó÷àÿõ çíà÷èìà (çíà÷åíèÿ ñòàòèñòèê F ñóùåñòâåííî ïðåâûøàþò êðèòè÷åñêèå çíà÷åíèÿ). Ðèñ. 15.3. Ïðîâåðêà àäåêâàòíîñòè ðåãðåññèè 15.3. Доверительные интервалы и проверка гипотез для коэффициентов функции регрессии Ñòàòèñòè÷åñêàÿ ìîäåëü îïèñàíà â ïðåäûäóùåì ðàçäåëå. Ïðåäïîëîæèì, ÷òî çíà÷åíèÿ êîýôôèöèåíòîâ è èõ ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ óæå ïîäñ÷èòàíû. Ñðåäíåêâàäðàòè÷åñêèå îòêëîíåíèÿ êîýôôèöèåíòîâ ðåãðåññèè âû÷èñëÿþò ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия. Íà ðèñ. 15.4, íà êîòîðîì ïðèâåäåíû ðåçóëüòàòû ðàñ÷åòîâ ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èç ïðåäûäóùåãî ïðèìåðà, çíà÷åíèÿ ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé çàïèñàíû â ÿ÷åéêàõ ïîä çíà÷åíèÿìè êîýôôèöèåíòîâ (äèàïàçîíû F4:I4 è F13:G13). 422 Часть IV. Статистический анализ зависимостей Äîâåðèòåëüíûå èíòåðâàëû è êðèòåðèè ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè ñòðîÿòñÿ íà òîì îñíîâàíèè, ÷òî ïðè âûïîëíåíèè óñëîâèé ñòàòèñòè÷åñêîé ìîäåëè îòíîøåíèå âû÷èñëåííîãî êîýôôèöèåíòà ê åãî ñðåäíåêâàäðàòè÷åñêîìó îòêëîíåíèþ èìååò ðàñïðåäåëåíèå Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû. Äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ íåîáõîäèìî âû÷èñëèòü òîëüêî êâàíòèëü t ïîðÿäêà (1 + α)/2 ýòîãî ðàñïðåäåëåíèÿ, ãäå α — çàäàííûé óðîâåíü çíà÷èìîñòè. Íà ðèñ. 15.4 ïîêàçàíû äîâåðèòåëüíûå èíòåðâàëû äëÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè è ôîðìóëû, ïî êîòîðûì âû÷èñëÿþòñÿ ãðàíèöû ýòèõ èíòåðâàëîâ. Ðèñ. 15.4. Äîâåðèòåëüíûå èíòåðâàëû äëÿ êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè Äëÿ ïðîâåðêè ãèïîòåç î çíà÷èìîñòè êîýôôèöèåíòà ôóíêöèè ðåãðåññèè âû÷èñëÿåòñÿ êðèòåðèàëüíàÿ ñòàòèñòèêà êàê ìîäóëü îòíîøåíèÿ çíà÷åíèÿ ýòîãî êîýôôèöèåíòà ê åãî ñðåäíåêâàäðàòè÷åñêîìó îòêëîíåíèþ. Ïî çàäàííîìó óðîâíþ çíà÷èìîñòè α âû÷èñëÿåòñÿ êðèòè÷åñêîå çíà÷åíèå t — êâàíòèëü ïîðÿäêà 1 – α ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû. Åñëè êðèòåðèàëüíàÿ ñòàòèñòèêà ìåíüøå êðèòè÷åñêîãî çíà÷åíèÿ, ïðèíèìàåòñÿ ãèïîòåçà î òîì, ÷òî äàííûé êîýôôèöèåíò ðàâåí íóëþ.  ïðîòèâíîì ñëó÷àå ñ÷èòàåòñÿ, ÷òî êîýôôèöèåíò çíà÷èìî îòëè÷àåòñÿ îò íóëÿ. Ðåàëèçàöèÿ êðèòåðèÿ ïîêàçàíà íà ðèñ. 15.5, íà êîòîðîì ïðèâåäåíû âñå íåîáõîäèìûå ôîðìóëû. Èíòåðåñíî îòìåòèòü, ÷òî äëÿ ôóíêöèè ðåãðåññèè Y = b0 + b1X + b2X2 + b3ln(1+X) âñå êîýôôèöèåíòû, êðîìå îäíîãî, îêàçàëèñü íåçíà÷èìî îòëè÷íûìè îò íóëÿ, íåñìîòðÿ íà òî ÷òî èõ çíà÷åíèÿ âåñüìà âåëèêè ïî àáñîëþòíîé âåëè÷èíå. 15.4. Доверительный интервал для значения прогноза Ñòàòèñòè÷åñêàÿ ìîäåëü îïèñàíà â ðàçäåëå 15.2. Ïðåäïîëîæèì, ÷òî ïîäñ÷èòàíû çíà÷åíèÿ êîýôôèöèåíòîâ è îñòàòî÷íàÿ äèñïåðñèÿ sε2 (ñì. ðàçäåë 3.4.3). Ñðåäíåêâàäðàòè÷åñêîå îòêëîíåíèå îñòàòêîâ (êîðåíü èç îñòàòî÷íîé äèñïåðñèè) âû÷èñГлава 15. Регрессионный анализ 423 ëÿþò ôóíêöèÿ ЛИНЕЙН è ñðåäñòâî Регрессия. Íà ðèñ. 15.6, íà êîòîðîì ïðèâåäåíû ðåçóëüòàòû ðàñ÷åòîâ ñ ïîìîùüþ ôóíêöèè ЛИНЕЙН èç ïðåäûäóùåãî ïðèìåðà, çíà÷åíèÿ ñðåäíåêâàäðàòè÷åñêèõ îòêëîíåíèé îñòàòêîâ çàïèñàíû â ÿ÷åéêàõ G5 è G12. Ðèñ. 15.5. Êðèòåðèé ïðîâåðêè çíà÷èìîñòè êîýôôèöèåíòîâ ôóíêöèè ðåãðåññèè ×òîáû ñïðîãíîçèðîâàòü çíà÷åíèå ïåðåìåííîé Y â òî÷êå õ0, êîòîðàÿ íå âõîäèò â èñõîäíîå ìíîæåñòâî çíà÷åíèé {x1, x2, ..., xn} ïåðåìåííîé Õ, èñïîëüçóåòñÿ ïîñòðîåííàÿ ôóíêöèÿ ðåãðåññèè f(X) è çà çíà÷åíèå ïåðåìåííîé Y â òî÷êå õ0 ïðèíèìàåòñÿ âåëè÷èíà yˆ = f ( x0 ) . Âîçìîæíûå ïðîáëåìû, âîçíèêàþùèå ïðè ïðîãíîçèðîâàíèè, îïèñàíû â ðàçäåëå 3.4.5. Çäåñü ïîêàæåì, êàê ïîñòðîèòü äîâåðèòåëüíûé èíòåðâàë äëÿ âåëè÷èíû yˆ = f ( x0 ) ñ çàäàííûì äîâåðèòåëüíûì óðîâíåì α. 1. Âû÷èñëÿåòñÿ çíà÷åíèå yˆ = f ( x0 ) . n 2. Âû÷èñëÿþòñÿ ñðåäíåå x çíà÷åíèé x1, x2, ..., xn è ñóììà SS x = ∑ ( xi − x ) 2 . i =1 3. Âû÷èñëÿåòñÿ ñòàíäàðòíàÿ îøèáêà ïðîãíîçà s0 = sε 1 + 1 ( x0 − x ) 2 . + n SS x 4. Îïðåäåëÿåòñÿ êâàíòèëü t ïîðÿäêà (1 + α)/2 ðàñïðåäåëåíèÿ Ñòüþäåíòà ñ (n – k – 1) ñòåïåíüþ ñâîáîäû. 5. Ñòðîèòñÿ äîâåðèòåëüíûé èíòåðâàë âèäà ( ŷ – t×s0, ŷ + t×s0). Íà ðèñ. 15.6 ïîêàçàí ðàáî÷èé ëèñò Excel, íà êîòîðîì ïîñòðîåíû äîâåðèòåëüíûå èíòåðâàëû äëÿ çíà÷åíèé äâóõ ôóíêöèé ðåãðåññèè, âû÷èñëåííûõ ïðè õ0 = 5 (ÿ÷åéêà L5). Âñå ôîðìóëû, íåîáõîäèìûå äëÿ ïîñòðîåíèÿ äîâåðèòåëüíûõ èíòåðâàëîâ, òàêæå ïîêàçàíû íà ýòîì ðèñóíêå. 424 Часть IV. Статистический анализ зависимостей Ðèñ. 15.6. Äîâåðèòåëüíûå èíòåðâàëû äëÿ çíà÷åíèé ïðîãíîçà  çàêëþ÷åíèå îòìåòèì, ÷òî â Excel èìåþòñÿ òðè ôóíêöèè, êîòîðûå ìîãóò îïðåäåëÿòü çíà÷åíèÿ ïðîãíîçà áåç ÿâíîãî âû÷èñëåíèÿ óðàâíåíèÿ ðåãðåññèè. • ПРЕДСКАЗ âû÷èñëÿåò çíà÷åíèÿ ëèíåéíîé ôóíêöèè ðåãðåññèè Y = mX + b (ñì. ðàçäåë 4.9.4). • ТЕНДЕНЦИЯ âû÷èñëÿåò çíà÷åíèÿ ïîëèíîìèàëüíîé ôóíêöèè ðåãðåññèè, â òîì ÷èñëå ìíîæåñòâåííîé ðåãðåññèè (ôóíêöèÿ îïèñàíà â ðàçäåëå 4.9.5). Òèï ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé âõîäíûõ äàííûõ ïåðåìåííîé Õ òàê æå, êàê äëÿ ôóíêöèè ЛИНЕЙН. • РОСТ âû÷èñëÿåò çíà÷åíèÿ ýêñïîíåíöèàëüíîé ôóíêöèè ðåãðåññèè, â òîì ÷èñëå ìíîæåñòâåííîé ðåãðåññèè (ôóíêöèÿ îïèñàíà â ðàçäåëå 4.9.7). Òèï ôóíêöèè ðåãðåññèè îïðåäåëÿåòñÿ ñòðóêòóðîé âõîäíûõ äàííûõ ïåðåìåííîé Õ òàê æå, êàê äëÿ ôóíêöèè ЛГРФПРИБЛ. Âñå òðè ôóíêöèè ìîãóò èñïîëüçîâàòüñÿ â ôîðìóëàõ ìàññèâîâ è, òàêèì îáðàçîì, ìîãóò âû÷èñëÿòü íå òîëüêî îòäåëüíûå çíà÷åíèÿ, íî è ìàññèâû çíà÷åíèé. Èõ óäîáíî ïðèìåíÿòü äëÿ âû÷èñëåíèÿ îñòàòêîâ, ò.å. ðàçíîñòåé ìåæäó èñõîäíûìè çíà÷åíèÿìè ïåðåìåííîé Y è çíà÷åíèÿìè, âû÷èñëåííûìè ïî ôóíêöèè ðåãðåññèè. Íà ðèñ. 15.7 ïîêàçàí ðàáî÷èé ëèñò Excel è ñîîòâåòñòâóþùèå ôîðìóëû, ñ ïîìîùüþ êîòîðûõ âû÷èñëÿþòñÿ ïðîãíîçèðóåìûå çíà÷åíèÿ ïåðåìåííîé Y è îñòàòêè äëÿ èñõîäíûõ äàííûõ è äâóõ ôóíêöèé ðåãðåññèè, ðàññìîòðåííûõ â ïðåäûäóùèõ ïðèìåðàõ. Глава 15. Регрессионный анализ 425 Ðèñ. 15.7. Âû÷èñëåíèå ïðîãíîçèðóåìûõ çíà÷åíèé è îñòàòêîâ 426 Часть IV. Статистический анализ зависимостей Литература 1. Àéâàçÿí Ñ.À., Åíþêîâ È.Ñ., Ìåøàëêèí Ë.Ä. Ïðèêëàäíàÿ ñòàòèñòèêà: èññëåäîâàíèå çàâèñèìîñòåé. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1985. 2. Àéâàçÿí Ñ.À., Ìõèòàðÿí Â.Ñ. Ïðèêëàäíàÿ ñòàòèñòèêà è îñíîâû ýêîíîìåòðèêè. — Ì. : ÞÍÈÒÈ-ÄÀÍÀ, 2001. 3. Àïòîí Ã. Àíàëèç òàáëèö ñîïðÿæåííîñòè. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1982. 4. Áîëüøåâ Ë.Í., Ñìèðíîâ Í.Â. Òàáëèöû ìàòåìàòè÷åñêîé ñòàòèñòèêè. — 3-å èçä. — Ì. : Íàóêà, 1983. 5. Áîðîâêîâ À.À. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — Ì. : Íàóêà, 1984. 6. Ãèõìàí È.È., Ñêîðîõîä À.Â., ßäðåíêî Ì.È. Òåîðèÿ âåðîÿòíîñòåé è ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — 2-å èçä. — Ê. : Âèùà øê., 1988. 7. Èâ÷åíêî Ã.È., Ìåäâåäåâ Þ.È. Ìàòåìàòè÷åñêàÿ ñòàòèñòèêà. — Ì. : Âûñø. øê., 1984. 8. Êîðîëþê Â.Ñ., Ïîðòåíêî Í.È., Ñêîðîõîä À.Â., Òóðáèí À.Ô. Ñïðàâî÷íèê ïî òåîðèè âåðîÿòíîñòåé è ìàòåìàòè÷åñêîé ñòàòèñòèêå. — Ê. : Íàóê. äóìêà, 1978. 9. Ëèêåø È., Ëÿãà É. Îñíîâíûå òàáëèöû ìàòåìàòè÷åñêîé ñòàòèñòèêè. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1985. 10. Ìàêàðîâà Í.Â., Òðîôèìåö Â.ß. Ñòàòèñòèêà â Excel. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 2002. 11. Ìèíüêî À.À., Ïåòóíèí Þ.È. Ñõîäèìîñòü ìåòîäà íàèìåíüøèõ êâàäðàòîâ â ðàâíîìåðíîé ìåòðèêå // Ñèá. ìàòåì. æ. — 1990. — ¹ 2. 12. Ìóð Äæ., Óýäåðôîðä Ë. Ýêîíîìè÷åñêîå ìîäåëèðîâàíèå â Microsoft Excel. — 6-å èçä. — Ì. : Èçäàò. äîì “Âèëüÿìñ”, 2004. 13. Ïåòðîâè÷ Ì.Ë., Äàâèäîâè÷ Ì.È. Ñòàòèñòè÷åñêîå îöåíèâàíèå è ïðîâåðêà ãèïîòåç íà ÝÂÌ. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1989. 14. Ïîëëàðä Äæ. Ñïðàâî÷íèê ïî âû÷èñëèòåëüíûì ìåòîäàì ñòàòèñòèêè. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1982. 15. Ñèãåë Ý.Ô. Ïðàêòè÷åñêàÿ “Âèëüÿìñ”, 2002. áèçíåñ-ñòàòèñòèêà. — Ì. : Èçäàò. äîì 16. Ñîáîëü È.Ì. ×èñëåííûå ìåòîäû Ìîíòå-Êàðëî. — Ì. : Íàóêà, 1973. 17. Ñïðàâî÷íèê ïî ïðèêëàäíîé ñòàòèñòèêå. Ò.1. / Ïîä ðåä. Ý. Ëîéäà, Ó. Ëåäåðìàíà. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1989. 18. Ñïðàâî÷íèê ïî ïðèêëàäíîé ñòàòèñòèêå. Ò.2. / Ïîä ðåä. Ý. Ëîéäà, Ó. Ëåäåðìàíà. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1990. 19. Òþðèí Þ.Í., Ìàêàðîâ À.À. Ñòàòèñòè÷åñêèé àíàëèç äàííûõ íà êîìïüþòåðå. — Ì. : Èíôðà-Ì, 1998. 20. Óîêåíáàõ Äæ., Àíäåðäàë Á. Excel 2002. Áèáëèÿ ïîëüçîâàòåëÿ. — Ì. : Äèàëåêòèêà, 2002. 21. Õàíê Äæ.Ý., Ðàéòñ À.Äæ., Óè÷åðíè Ä.Ó. Áèçíåñ-ïðîãíîçèðîâàíèå. — Ì. : Èçäàò. äîì “Âèëüÿìñ”, 2003. 22. Õîëëåíäåð Ì., Âóëô Ä. Íåïàðàìåòðè÷åñêèå ìåòîäû ñòàòèñòèêè. — Ì. : Ôèíàíñû è ñòàòèñòèêà, 1983. 23. Õüþáåðò Ï. Ðîáàñòíîñòü â ñòàòèñòèêå. — Ì. : Ìèð, 1984. 24. Øåôôå Ã. Äèñïåðñèîííûé àíàëèç. — Ì. : Íàóêà, 1980. 428 Литература Предметный указатель F Fраспределение, 41 А Адекватность уравнения регрессии, 420 Алгебра случайных событий, 22 Анализ дисперсионный, 94; 408 корреляционный, 81; 382 регрессионный, 88; 181; 417 Фурье, 189 Анализ зависимостей между классификационными переменными, 86 количественными переменными, 81 порядковыми переменными, 83 В Вариационной ряд, 59; 65 Вероятность ошибки второго рода, 66 ошибки первого рода, 66 условная, 22 Винзоризация, 258 Выборка, 49 размах, 65 широта, 65 Выборочная дисперсия, 50 Выборочное пространство, 49 среднее, 50 Выборочный момент, 50 Выбросы, 250; 288 Г Генеральная совокупность, 49 Гипотеза альтернативная, 65 конкурирующая, 65 нулевая, 65 статистическая, 65 Гистограмма, 141; 286 с перекрытием, 215 Д Дециль, 27 Диаграмма, 206 планки погрешностей, 210 Диалоговое окно Анализ данных, 146; 147 Анализ Фурье, 191 Выборка, 160 Генерация случайных чисел, 155 Гистограмма, 152 Двухвыборочный Fтест для дисперсий, 172 Двухвыборочный tтест с одинаковыми дисперсиями, 165 Двухвыборочный tтест с различными дисперсиями, 167 Двухвыборочный zтест для средних, 163 Двухфакторный дисперсионный анализ без повторений, 178 Двухфакторный дисперсионный анализ с повторениями, 175 Добавление ограничения, 221 Ковариация, 181 Корреляция, 179 Линия тренда, 207 Однофакторный дисперсионный анализ, 173 Описательная статистика, 147; 149; 151 Параметры поиска решения, 221 Парный двухвыборочный tтест для средних, 170 Поиск решения, 221; 227 Присвоение имени, 196; 199; 200 Ранг и персентиль, 161 Регрессия, 182 Результаты поиска решения, 223 Скользящее среднее, 188 Создать имена, 200 Специальная вставка, 232 Таблица подстановки, 232 Формат линии тренда, 210 Формат планок погрешностей, 211 Формат ряда данных, 210; 212; 217; 270 Формат ячеек, 254 Экспоненциальное сглаживание, 189 Дисперсионное отношение Фишера, 75; 376 Дисперсионный анализ, 94 двухфакторный, 97; 175; 177; 409 многофакторный, 95 модель с постоянными факторами, 95 модель смешанная, 95 модель со случайными факторами, 95 однофакторный, 95; 173 статистическая модель, 94 таблица, 96 факторы, 94 Фридмана, 411 Дисперсия, 26 выборочная, 112 интервальные оценки, 57 точечная оценка, 56 Доверительная область, 53 Доверительные границы, 52 Доверительные интервалы для дисперсий, 310; 315 для квантилей, 333 для математического ожидания, 307; 312 Доверительный интервал, 52 для значения прогноза, 423 для коэффициента корреляции, 393 для коэффициента корреляции нормальной совокупности, 394 для коэффициентов функции регрессии, 422 для математических ожиданий нескольких совокупностей, 401 для математического ожидания, 140 для отношения дисперсий нормальных совокупностей, 366 для разности двух биномиальных вероятностей, 367 430 Предметный указатель для разности математических ожиданий, 400 для разности средних нормальных совокупностей, 364; 365 З Задача восстановления значений, 93 экстраполяции, 94 Задачи статистического анализа зависимостей, 79 Закон больших чисел, 21 Закон распределения, 23 И Имена диапазона, 197 переопределение, 200 создание, 199 ячеек, 197 Индекс корреляции, 83; 92; 183 Интервал модальный, 285 К Квантиль, 27; 65 доверительные интервалы, 333 Квартиль, 27; 104 Ковариация, 28 выборочная, 136 Корреляционный анализ, 81 Коэффициент асимметрии, 26; 58; 110; 291 асимметрии Пирсона, 27; 28 детерминации, 83; 92; 96; 130; 184 конкордации, 85; 389 корреляции, 28; 81; 137;139; 170; 384 корреляции выборочный, 137 корреляции Кендалла, 85; 386 корреляции множественный, 183 корреляции Пирсона, 138 корреляции ранговый, 84 корреляции Спирмена, 84; 385 согласованности, 85; 389 эксцесса, 26; 58; 111; 291 Критерии независимости, 382 однородности, 349 Критерии проверки статистических гипотез непараметрические, 67 робастные, 67 свободные от распределений, 67 устойчивые, 67 Критерий 2 χ (Пирсона), 76 Ансари–Бредли проверки гипотезы о равенстве дисперсий, 378 Бартлета проверки равенства нескольких дисперсий, 376 Бартлетта, 95 Беренса–Фишера, 73 Беренса–Фишера проверки гипотезы о равенстве математических ожиданий, 370 знаков, 344; 405 знаковых рангов Уилкоксона, 346 Колмогорова, 77; 304 Краскала–Уоллиса, 357 медианы, 350 минимума суммы квадратов, 88 множественных сравнений Шеффе, 96; 373; 415 отклонения от распределения Пуассона, 296 отклонения распределения от нормального, 293 Пирсона, 297 проверки статистической гипотезы, 66 серий Вальда–Вольфовица, 359 Смирнова, 362 согласия хиквадрат, 297 Стьюдента модифицированный, 96 Стьюдента парный, 404 Уилкоксона, 407 Уилкоксона–Манна–Уитни, 74; 202; 355 Фишера, 95; 172 Фишера проверки равенства дисперсий, 375 Фишера–Беренса, 167 Фридмана, 411 хиквадрат, 127; 226; 297; 299; 360 Критерий независимости для двумерных нормальных совокупностей, 384 для многомерных выборок, 389 на основе коэффициента корреляции Кендалла, 386 на основе коэффициента корреляции Спирмена, 385 на основе преобразования Фишера, 383 на основе таблиц сопряженности, 390 хиквадрат, 390 Критерий проверки значения дисперсии нормальной совокупности, 337 значения коэффициента корреляции, 396 равенства двух коэффициентов корреляции, 397 равенства нескольких коэффициентов корреляции, 399 Критерий проверки гипотез о значении коэффициента корреляции, 396 о значении математического ожидания, 124 о значении медианы, 343 о значении параметра биномиального распределения, 341 о значении параметра показательного распределения, 339 о параметрах нормального распределения, 335 о равенстве биномиальных вероятностей, 380 о равенстве математических ожиданий, 368 о равенстве нескольких математических ожиданий, 371 Критерий проверки гипотезы о равенстве математических ожиданий, 124 о равенстве математических ожиданий для нормальных совокупностей, 71 Критерий проверки значения дисперсии нормальной совокупности, 70 математического ожидания нормальной совокупности, 69; 335 Предметный указатель 431 Критерий проверки статистической гипотезы, 66 критическая область, 66 критические значения, 66 Критерий Стьюдента парный, 194 проверки гипотезы о равенстве математических ожиданий, 369 проверки гипотезы о равенстве математических ожиданий для зависимых нормальных совокупностей, 73 проверки гипотезы о равенстве математических ожиданий для нормальных совокупностей, 71; 72 Критерий Фишера проверки равенства дисперсий, 75; 126 Критическая точка левосторонняя, 67 правосторонняя, 67 Л Линия тренда, 207; 420 параметры, 209 форматирование, 209 М Массив, 193 констант, 193; 196 Математическое ожидание интервальные оценки, 55 точечная оценка, 54 Матрица ковариационная, 180 корреляционная, 179; 246 Медиана, 27; 106 вычисление, 284 точечная оценка, 59 Метод быстрого преобразования Фурье, 190 наименьших квадратов, 89; 417 Неймана, 242 непараметрические, 65 обратных функций, 234 отбора, 242 432 Предметный указатель свободные от распределения, 65 скользящего среднего, 187 суперпозиций, 238 цензурирования Тьюки, 257 Мода, 27; 141 вычисление, 285 Моделирование случайных величин, 229 зависимых, 245 метод Неймана, 242 метод обратных функций, 234 метод отбора, 242 метод суперпозиций, 238 многомерных, 244 Модель статистических зависимостей, 78 Мощность критерия, 66 Н Надстройка Пакет анализа, 146 Поиск решения, 217 Начальные моменты точечные оценки, 58 Неравенство Гаусса, 28; 55; 251; 308 Маркова, 27 Пика, 28 Чебышева, 27; 55; 251; 252; 308 Несмещенность оценки, 50 О Область двухсторонняя критическая, 67 критическая, 66 левосторонняя критическая, 67 непринятия гипотезы, 66 правосторонняя критическая, 67 Однофакторный дисперсионный анализ, 371 Отклонение нормированное среднее абсолютное, 292 Оценка асимптотически несмещенная, 51 интервальная, 50; 52 квантилей, 65 несмещенная, 50 параметра распределения Бернулли, 61 параметра распределения Пуассона, 63 параметров нормального распределения, 59 состоятельная, 51 точечная, 49 точечные, вычисление, 278; 283 эффективная, 51 Оценки параметров гаммараспределения, 319 геометрического распределения, 331 логарифмически нормального распределения, 317 нормального распределения, 312 показательного распределения, 318 равномерного распределения, 323 распределения Бернулли, 324 распределения Пуассона, 329 Ошибка второго рода, 66 первого рода, 66 П Переменные классификационные, 79 количественные, 79 номинальные, 79 ординальные, 79 порядковые, 79 Пирсона коэффициент корреляции, 138 Планки погрешностей, 210 Плотность вероятности, 25 Порядковые статистики, 65 Построение гистограмм, 212; 267; 273 полигонов, 267; 273 пробитграфика, 288 функции регрессии, 90 функций распределения, 212 эмпирических функций распределения, 267 Правило трех сигм, 39 Преобразование арксинуса, 63; 328 квадратного корня, 263 логарифмическое, 265 стандартизирующее, 267 Фишера, 82; 139; 383; 393 Фурье дискретное, 189 Энскомба, 63 Пробитграфик, 288 построение, 288 Проверка гипотез для коэффициентов функции регрессии, 422 Прогнозирование, 93 Процентиль, 27; 105 Р Размах, 279 выборки, 65 интерквартильный, 279 Разности кумулятивные, 304 Ранг, 65; 107 вычисление, 202 процентный, 106 Распределение безгранично делимое, 245 Бернулли, 32; 154; 230; 324 бета, 43; 114; 121; 234 биномиальное, 33; 115; 123; 154; 230; 341 Вейбулла–Гнеденко, 44; 115 гамма, 44; 116; 121; 234; 319 геометрическое, 34; 331 гипергеометрическое, 35; 116 двумерное, 28 дискретное, 155; 230 дискретное равномерное, 144 Кендалла, 387 Колмогорова–Смирнова, 77; 304 Краскала–Уоллиса, 358 логарифмически нормальное, 42; 117; 121; 234; 252; 317 логнормальное, 42 Манна–Уитти, 75; 357 модельное, 154 нормальное, 38; 117; 122; 154; 230; 234 одномодальное, 27; 55; 252; 308 отрицательное биномиальное, 35; 117 Паскаля, 35; 117 показательное, 37; 119; 318; 339 Пуассона, 34; 118; 154; 230; 263; 296; 329; 354 равномерное, 36; 144; 154; 230; 323 Предметный указатель 433 равномерное дискретное, 32 случайных величин, 23 Смирнова, 362 Снедекора, 41; 114; 120; 234; 342 Спирмена, 385 стандартное нормальное, 38; 117; 122 Стьюдента, 40; 118; 122; 169; 234; 295; 309; 317; 336; 347; 370; 384 треугольное, 37 Уилкоксона, 407 Фридмана, 413 хиквадрат, 39; 119; 122; 234; 264; 297; 330; 338; 351; 361 экспоненциальное, 37; 119 Распределения Пирсона, 45; 291 Регрессионный анализ, 88 Регрессия, 182; 417 линейная, 91 множественная, 90 нелинейная, 89 построение функции, 90 проверка адекватности, 91 статистические характеристики, 92 уравнение, 88 функция, 88 функция полиномиальная, 89 экспоненциальная, 134; 135 С Система нормальных уравнений, 418 Случайная величина асимптотически нормальная, 32 дециль, 27 дискретная, 23 дисперсия, 26 квантиль, 27 квартиль, 27 коэффициент асимметрии, 26 коэффициент эксцесса, 26 линейное преобразование, 30 математическое ожидание, 26 медиана, 27 мода, 27 моменты, 26 непрерывная, 25 434 Предметный указатель нормирование, 30 процентиль, 27 стандартизованная, 30 центральные моменты, 26 числовые характеристики, 25 Случайное событие, 20 Случайный опыт, 20 Состоятельность оценки, 51 Среднее арифметическое, 109 гармоническое, 109 геометрическое, 109 скользящее, 187 Средство Анализ Фурье, 189 Выборка, 160 Генерация случайных чисел, 154; 225; 229; 230; 235; 301; 309; 336; 354 Гистограмма, 151; 226; 270; 278 Двухвыборочный Fтест для дисперсий, 127; 172; 376 Двухвыборочный tтест с одинаковыми дисперсиями, 126; 165 Двухвыборочный tтест с различными дисперсиями, 73; 126; 167; 371 Двухвыборочный zтест для средних, 161; 369 Двухвыборочный zтест с одинаковыми дисперсиями, 370 Двухфакторный дисперсионный анализ без повторений, 177; 411 Двухфакторный дисперсионный анализ с повторениями, 175 Ковариация, 180 Корреляция, 179 Однофакторный дисперсионный анализ, 173; 373 Описательная статистика, 149; 279 Парный двухвыборочный tтест для средних, 125; 169 Подбор параметра, 236 Поиск решения, 236; 237; 418 Ранг и персентиль, 161; 202 Регрессия, 93; 181; 418; 422 Скользящее среднее, 187 Экспоненциальное сглаживание, 188 Средство Поиск решения подбор параметров, 224 подбор параметров распределения, 225 поиск безусловного оптимума, 224 поиск допустимого решения, 224 поиск оптимума, 224 решение системы линейных алгебраических уравнений, 225 Статистика, 50 критериальная, 68 оценивания дисперсии, 56 оценивания коэффициента асимметрии, 58 оценивания коэффициента эксцесса, 58 оценивания математического ожидания, 54 оценивания медианы, 59 оценивания моментов, 58 Статистики порядковые, 65 ранговые, 65 Статистическая модель, 54 Сумма квадратов остатков, 130 регрессии, 130 Суммы случайных величин, 30 Т Таблица дисперсионная, 91; 96 дисперсионного анализа, 96 сопряженности, 391 частотная, 268 Таблица подстановки, 232 сопряженности, 86 Теорема сложения вероятностей, 22 умножения вероятностей, 22 центральная предельная, 31 У Уравнение регрессии, 88 Уровень доверительный, 52 значимости, 52 значимости критерия, 66 Условное форматирование, 253 Ф Фишера дисперсионное отношение, 75 Формула массива, 141; 193; 196 Стерджесса, 152; 273 Функции FРАСП, 114 FРАСПОБР, 120; 234 TANH, 394 ZТЕСТ, 124; 164; 336 БЕТАОБР, 121; 234 БЕТАРАСП, 114 БИЗВЛЕЧЬ, 352 БИНОМРАСП, 115 ВЕЙБУЛЛ, 115 вероятностей, 24 ВЕРОЯТНОСТЬ, 140 ВПР, 236; 352; 364 вычисления выборочной дисперсии и отклонения, 111 вычисления геометрических характеристик распределения, 110 вычисления значений функций распределения, 113 вычисления ковариации, 136 вычисления коэффициента корреляции, 136 вычисления средних, 109 гамма Эйлера, 142 ГАММАНЛОГ, 142 ГАММАОБР, 121; 234; 319; 340 ГАММАРАСП, 116 ГИПЕРГЕОМЕТ, 116 ДВССЫЛ, 302 ДИСП, 112 ДИСПА, 112 ДИСПР, 112; 338 ДИСПРА, 112 ДОВЕРИТ, 60; 140; 313 ЕНД, 352 ЗНАК, 388 КВАДРОТКЛ, 112 Предметный указатель 435 КВАРТИЛЬ, 104 КВПИРСОН, 138 КОВАР, 136; 180 КОРРЕЛ, 137; 180; 384 КРИТБИНОМ, 123 ЛГРФПРИБЛ, 134; 420; 425 ЛИНЕЙН, 93; 129; 132; 138; 418; 422 ЛОГНОРМОБР, 121; 234 ЛОГНОРМРАСП, 117 МАКС, 103; 392 МАКСА, 103 МЕДИАНА, 106 МИН, 103 МИНА, 103 МОБР, 204 МОДА, 141; 285 МОПРЕД, 204 МУМНОЖ, 204 НАИБОЛЬШИЙ, 103 НАИМЕНЬШИЙ, 103 НАКЛОН, 131; 420 нелинейной регрессии, 89 НОРМАЛИЗАЦИЯ, 142 НОРМОБР, 122; 234 НОРМРАСП, 117 НОРМСТОБР, 122; 234; 288 НОРМСТРАСП, 117 обратные к функциям распределения, 119 определения экстремальных значений выборки, 102 ОСТАТ, 202 от случайных величин, 29 ОТРБИНОМРАСП, 117 ОТРЕЗОК, 131; 420 ПЕРЕСТ, 143 ПЕРСЕНТИЛЬ, 105 ПИРСОН, 137 построения уравнения регрессии, 128 ПРЕДСКАЗ, 133; 134; 425 проверки статистических критериев, 123 ПРОЦЕНТРАНГ, 106 ПУАССОН, 118; 298 работы с порядковыми статистиками, 104 РАНГ, 107; 202; 333; 347; 352; 379; 386; 390 распределения частная, 28 распределения, 24 436 Предметный указатель регрессии, 88; 129 регрессии полиномиальная, 89 РОСТ, 135; 425 СКОС, 110 СЛУЧМЕЖДУ, 144; 230 СЛЧИС, 144; 229 СРГАМ, 109 СРГЕОМ, 109 СРЗНАЧ, 109 СРЗНАЧА, 109 СРОТКЛ, 113 СТАНДОТКЛОН, 112 СТАНДОТКЛОНА, 112 СТАНДОТКЛОНП, 113 СТАНДОТКЛОНПА, 113 СТОШYX, 132; 290 СТРОКА, 302 СТЬЮДРАСП, 118 СТЬЮДРАСПОБР, 122; 234; 235; 314; 366 СУММЕСЛИ, 200 СУММКВ, 204 СУММКВРАЗН, 205; 386 СУММПРОИЗВ, 205 СУММРАЗНКВ, 206 СУММСУММКВ, 206 СЧЁТ, 143; 392 СЧЁТЗ, 143 ТЕНДЕНЦИЯ, 133; 135; 425 ТТЕСТ, 124; 167; 169; 171 УРЕЗСРЕДНЕЕ, 110 ФИШЕР, 139; 384; 394 ФИШЕРОБР, 139; 394 ФТЕСТ, 126; 173 ХИ2ОБР, 122; 234; 300; 315; 330 ХИ2РАСП, 119 ХИ2ТЕСТ, 127; 298; 300; 303 ЧАСТОТА, 141; 277; 298 ЭКСПРАСП, 119; 319 ЭКСЦЕСС, 111 Функция регрессии построение, 418 Ц Цензурирование, 250 метод Тьюки, 257 на основе доверительных интервалов, 251 непараметрическое, 257 Центральная предельная теорема, 31 Центральные моменты точечные оценки, 58 Ч Частости, 268 накопленные, 268; 288 накопленные относительные, 268 Частота события, 21 Частоты, 268 накопленные, 268 относительные, 268 относительные накопленные, 268 Ш Широта выборки, 65 Э Экспоненциальное сглаживание, 188 Эффективность оценки, 51 Предметный указатель 437 Íàó÷íî-ïîïóëÿðíîå èçäàíèå Àëåêñàíäð Àëåêñàíäðîâè÷ Ìèíüêî Ñòàòèñòè÷åñêèé àíàëèç â MS Excel Ëèòåðàòóðíûé ðåäàêòîð Âåðñòêà Õóäîæåñòâåííûé ðåäàêòîð Êîððåêòîðû Ë.Í. Êðàñíîæîí Â.È. Áîðäþê Â.Ã. Ïàâëþòèí Ç.Â. Àëåêñàíäðîâà, Ë.À. Ãîðäèåíêî, Î.Â. Ìèøóòèíà Èçäàòåëüñêèé äîì “Âèëüÿìñ” 101509, ã. Ìîñêâà, óë. Ëåñíàÿ, ä. 43, ñòð. 1 Èçä. ëèö. ËÐ ¹ 090230 îò 23.06.99 Ãîñêîìèòåòà ÐÔ ïî ïå÷àòè Ïîäïèñàíî â ïå÷àòü 20.09.2004. Ôîðìàò 70õ100/16. Ãàðíèòóðà Times. Ïå÷àòü îôñåòíàÿ. Óñë. ïå÷. ë. 36,12. Ó÷.-èçä. ë. 27,5. Òèðàæ 3000 ýêç. Çàêàç ¹ . Îòïå÷àòàíî ñ äèàïîçèòèâîâ â ÔÃÓÏ “Ïå÷àòíûé äâîð” Ìèíèñòåðñòâà ÐÔ ïî äåëàì ïå÷àòè, òåëåðàäèîâåùàíèÿ è ñðåäñòâ ìàññîâûõ êîììóíèêàöèé. 197110, Ñ.-Ïåòåðáóðã, ×êàëîâñêèé ïð., 15.