Глава 9. Проверка статистических гипотез. 9.1. Критерий согласия. Во многих случаях закон распределения изучаемой случайной величины X неизвестен, но есть основания предположить, что он имеет вполне определённый вид: нормальный, биноминальный или какой-либо другой. Под статистической гипотезой H принимается утверждение о виде неизвестного распределения, или параметрах генеральной совокупности известных распределений. Для проверки гипотезы H о распределении случайной величины X производится выборка: xi x2 … n2 … x1 xk k ni n1 , где nk n i 1 i n - объём выборки. Требуется сделать заключение: согласуются ли результаты наблюдений с высказанным предположением H . Для этого используют специально подобранную величину – критерий согласия. Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Существуют различные критерии согласия: Пирсона, Колмогорова, Фишера и другие. Наиболее часто для проверки гипотезы о законе распределения применяется критерий согласия Пирсона хи-квадрат ( 2 ) . Пусть эмпирическое распределение задано в виде xi x1 x2 … xk ni n1 n2 … nk Если эмпирические частоты ni сильно отличаются от теоретических npi ni , то проверяемую гипотезу H следует отвергнуть, в противном случае – принять. В качестве меры расхождения между ni и npi для i 1, k Пирсон предложил величину (критерий Пирсона): k ni npi i 1 npi 2 2 k i 1 ni2 n (9.1.1) npi Согласно теореме Пирсона, при n статистика 2 - распределение с k r 1 степенями свободы, где k - число групп (интервалов) выборки, r - число параметров предполагаемого распределения. В частности, если предполагаемое распределение нормально, то оценивают 2 параметра ( a и ), поэтому число степеней свободы k 3 . Вычислим теоретические вероятности pi попадания случайной величины X в частичные интервалы xi 1 , xi по формуле: pi p xi 1 x xi ui ui 1 , i 1, k , где ui xi x 1 ui 2 ; ui e t2 2 dt 0 (9.1.2) Правило применения критерия 2 сводится к следующему: 2 1. По формуле (9.1.1) вычисляют набл - выборочное значение статистики критерия. 2. Выбрав уровень значимости критерия по таблице 2 распределения находим критическую точку 2, . 2 3. Если набл 2, , то гипотеза H не противоречит опытным данным; если 2 набл 2, , то гипотеза H отвергается. Пример 9.1.1. Измерены 100 обработанных деталей; отклонения от заданного размера приведены в таблице xi ; xi 1 3; 1 1;0 0;1 1;2 2;3 3;5 ni 13 15 24 25 13 10 (9.1.1). n 100 . Проверить при уровне значимости 0,01 гипотезу H о том, что отклонения от проектного размера подчиняются нормальному закону распределения. Решение: Случайную величину – отклонение – обозначим через X . Для вычисления вероятностей pi необходимо вычислить параметры, определяющие нормальный закон распределения (a и Их оценки ). 1 Xв 13 2 15 0,5 ... 4 10 0,885 0,9 . 100 Dв вычислим по выборке: ; , то крайние 1 2 4 13 0, 25 15 ... 16 10 0,885 2,809 , 1,676 1,7 . 100 Находим pi i 1,6 . Так как c b N (a; ) определена на интервалы в ряде распределения заменим, соответственно, на ; 1 и 3; . Применяя формулу (9.1.2), вычислим 1 1 0,9 P1 p X 1 1,12 0,1314 . 2 1,7 Аналогично получим P2 0,1667 , P3 0,2258 , P4 0,2183 , P5 0,1503 , 3 0,9 1 P6 p 3 X 1, 24 0,1075 . 1,7 2 Полученные результаты приведём в следующей таблице: xi ; xi 1 ; 1 1;0 0;1 1;2 2;3 3; ni 13 15 24 25 13 10 n ' npi 13,14 16,68 22,58 21,83 15,03 10,75 (9.1.2). 2 Вычислим набл : 6 2 набл i 1 132 ni2 152 102 2 1,045 . n ... 100 101,045 100 , т.е. набл npi 10,75 13,14 16,67 Найдём число степеней свободы. По выборке рассчитаны два параметра, значит, r 2 . Количество интервалов 6, т.е. k 6 . Следовательно, 6 2 1 3 . Зная, что 0,01 и 3 , по таблице 2 -распределения находим 2, 11,3 . Таким образом, 1,045 11 3,2 , 2 т.е. набл 2, . Следовательно, нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.