МСИ. 2009-2030. ЧАСТЬ 2. Критерии ОБРАБОТКА РЕЗУЛЬТАТОВ СРАВНИТЕЛЬНЫХ И ОТСЕИВАЮЩИХ ЭКСПЕРИМЕНТОВ Проверка статистических гипотез Сравнительные эксперименты проводятся для получения данных для сравнения показателей работы серийных (базовых) и опытных (новых) технических средств или технологий и выявления целесообразности применения их в практике Главным требованием проведения сравнительных испытаний является требование идентичности условий их проведения стандартным типичным условиям эксплуатации базового оборудования 83 Результаты сравнительных испытаний предъявляются в виде выборок Устанавливается существенность различия выборок Выдвинутая гипотеза называется ОСНОВНОЙ или НУЛЕВОЙ Н0 (69) H 0 : x1 x 2 H 0 : D1 D2. Сравнение осуществляется путём сравнения различного рода статистических гипотез Конкурирующая гипотеза называется АЛЬТЕРНАТИВНОЙ Н1 H1 : x1 x2 H1 : x1 x2 H1 : x1 x2 H1 : D1 D2; H1 : D1 D2 ; H1 : D1 D2 . (70) 86 ПРАВИЛО, ПО КОТОРОМУ ПРИНИМАЕТСЯ РЕШЕНИЕ О ТОМ, ВЕРНА ИЛИ НЕТ НУЛЕВАЯ ГИПОТЕЗА Н0 НАЗЫВАЕТСЯ «КРИТЕРИЕМ» Параметрические критерии применимы для СВ, подчиняющихся НЗ. Они хорошо обоснованы теоретически, но область применения их ограничена. Непараметрические критерии универсальны, не зависят от закона распределения случайной величины. Основное достоинство – простота вычислений. Недостаток –для сравнения больших выборок неприменимы. Основной принцип проверки статистических гипотез: если расчётное значение критерия принадлежит области принятия нулевой гипотезы, то её принимают, если критической области, отвергающей нулевую гипотезу, то её отклоняют 1. Верна гипотеза Н0 и она допускается критерием; 2. Верна гипотеза Н0 и она отвергается критерием; 3. Верна гипотеза Н1, а гипотеза Н0 отвергается критерием; 4. Верна гипотеза Н1, но Н0 допускается критерием. Возможные исходы проверки гипотез 87 Во втором случае допускается ОШИБКА ПЕРВОГО РОДА, т.е. отклоняется ВЕРНАЯ ГИПОТЕЗА Н0. Вероятность ошибки первого рода равна уровню значимости . Чем меньше , тем меньше вероятность отвергнуть правильную гипотезу. В четвёртом случае допускается ОШИБКА ВТОРОГО РОДА: принимается ЛОЖНАЯ ГИПОТЕЗА Н0, в то время как верная гипотеза Н1 отвергается. Вероятность принятия ложной гипотезы зависит от мощности критерия (чем больше мощность критерия, тем меньше вероятность отвергнуть правильную гипотезу). Принятая гипотеза Н0 или Н1 используется в качестве рабочей до тех пор, пока новые результаты испытаний не опровергнут её 88 КРАТКАЯ ХАРАКТЕРИСТИКА ОСНОВНЫХ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ СРАВНЕНИЯ Тип критерия Название критерия Сравниваемые показатели Мощность критерия Параметри ческий Стьюдента Ср. арифм Высокая Фишера дисперсии Высокая Кохрена дисперсия Высокая Розенбаума Ср. арифм. Низкая Знаков Ср. арифм Низкая Вилкоксона Ср. арифм Низкая ВилкоксонаМанна-Уитни Ср. арифм Высокая Сиджела-Тьюки дисперсии высокая Непарамет рический 89 Параметрические критерии сравнения Критерий Стьюдента (t - критерий) H 0 : x1 x 2 Сравнение среднего арифметического значения выборки с эталоном (генеральной средней); Сравнение средних арифметических двух выборок I Вариант. Среднее арифметическое значение выборки не отличается от эталона, если выполняется следующее неравенство: Где x x x * t табл. x n (71) - среднее арифметическое значение СВ в выборке; x*- эталон; - среднеквадратическое отклонение СВ; n – объем выборки; t - табличное значение критерия Стьюдента для уровня значимости α/2 и числа степеней свободы m = n 1. 90 Если неравенство не выполняется. Делается вывод о том, что эталонная и сравниваемая величины СУЩЕСТВЕННО ОТЛИЧНЫ. По второму варианту средние арифметические значения двух выборок a и b не отличаются, если выполняется следующее равенство: xa xb t т абл Sp Sp na 1 na nb , na nb (72) nb 1 . na nb 2 2 a 2 b (73) 91 Критерий Фишера (F- критерий) Дисперсии двух выборок не отличаются, (т.е. верна нулевая гипотеза ), если выполняется неравенство H0 : D1 D2 , Dm ax F Fтабл. Dm i n (74) Где: F – расчётное значение критерия Фишера; Dmax, Dmin – соответственно большее и меньшее значения дисперсий двух сравниваемых выборок; Fтабл. - табличное значение критерия Фишера для заданного уровня значимости и числа степеней свободы m1 = n1 – 1 и m2 = n2 – 1 при объёме выборок n1 и n2 . Таблица дана ниже. 92 Значения F критерия Фишера при уровне значимости = 0.05 m2 m1 4 6 8 10 12 24 4 6.4 6.2 6.0 6.0 5.9 5.8 5 5.2 5.0 4.8 4.7 4.7 4.5 6 4.5 4.3 4.2 4.1 4.0 3.8 7 4.1 3.9 3.7 3.6 3.6 3.4 8 3.8 3.6 3.4 3.4 3.3 3.1 9 3.6 3.4 3.2 3.1 3.1 2.9 10 3.5 3.2 3.1 3.0 2.9 2.7 15 3.1 2.8 2.6 2.5 2.5 2.3 20 2.9 2.6 2.5 2.3 2.3 2.1 30 2.7 2.4 2.3 2.1 2.0 1.8 93 Критерий Кохрена (G – критерий) При наличии нескольких выборок ОДИНАКОВОГО ОБЪЁМА нередко выдвигается гипотеза о том, что НАИБОЛЬШАЯ из дисперсий НЕОТЛИЧИМА от дисперсий остальных выборок G Dm a x k Di G т а б л. (75) i 1 Где: Di - дисперсия i – ой выборки при общем числе выборок равном k; Gтабл. – табличное значение критерия Кохрена для заданного уровня значимости и числа степеней свободы m1 = k (k – число выборок) и m2 = (n – 1), где n – объём отдельной выборки. См. табл. 94 ЗНАЧЕНИЯ КРИТЕРИЯ КОХРЕНА при уровне значимости = 0.05 m1 m2 3 5 7 10 16 36 3 0.7977 0.7071 0.6530 0.6025 0.5466 0.4748 4 0.6841 0.5897 0.5365 0.4884 0.4366 0.3720 5 0.5981 0.5065 0.4564 0.4118 0.3645 0.3066 6 0.5321 0.4447 0.3980 0.3568 0.3135 0.2612 95 НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СРАВНЕНИЯ Критерий Розенбаума (Q) Гипотеза Н0 = x1 x2 следующее неравенство: верна, если выполняется Q = S + k < Qтабл, (76) Где: Q – расчётное значение критерия Розенбаума; S – число значений случайной величины одной ранжированной выборки, превышающих максимальное значение случайной величины другой ранжированной выборки; k – число значений случайной величины одной ранжированной выборки, меньших максимального значения случайной величины другой ранжированной выборки; Qтабл. – табличное значение критерия Розенбаума, которое при = 0.05 может быть принято равным 7. 96 Используется для сравнения средних арифметических значений двух равных по объёму выборок, полученных по результатам параллельных опытов Критерий знаков Но : х1 х2 Д К N Д кр (77) Неравенство x1 > x2 принято обозначать знаком (+), а неравенство x1 < x2 - знаком (). Отсюда К = ( N – сумма плюсов (+) и минусов , т.е. N = ( + ) + Дкр – критическое значение критерия знаков, величина которого при = 0.05 равна 2.0, а при = 0.1 Д кр = 1.6 97 Критерий Вилкоксона Для определения расчётной критерия НЕОБХОДИМО: величины этого • расположить данные двух сравниваемых выборок по мере возрастания их значений в два ряда таким образом, чтобы в каждом столбце находилось только одно значение случайной величины; • присвоить ранги (номера) каждому значению случайной величины от 1 до (n1 + n2 ), учтя при этом, что если несколько значений ранжированного ряда совпали по величине, то то каждому из них присваивается ранг, равный чсрелнему арифметическому их номеров; • просуммировать ранги первой (Т1) и второй (Т2) выборок; • если n1 и n2 окажутся 10, то меньшую из найденных сумм рангов (Тmin) сравнить с табличным значением критерия Вилкоксона (Ттабл) при = 0.05 (табл. 8); 98 ЗНАЧЕНИЯ КРИТЕРИЯ ВИЛКОКСОНА ПРИ = 0.05 n2 n1 5 6 7 8 9 10 4 11 12 13 14 15 15 5 17 18 20 21 22 23 6 - 26 27 29 31 32 7 - - 36 38 40 42 8 - - - 49 51 53 9 - - - - 63 65 10 - - - - - 78 99 Нулевая гипотеза верна, минимального МЕНЬШЕ Тmin < Ттабл. если Т значение Т табличного: • Если n1 ( n2) > 10, то расчётное значение критерия Вилкоксона ТРАСЧ. определяется по формуле: n n 1 2T ТРАС Ч n1n 2 n 1 (79) n Где: Т - объём выборки с меньшей суммой рангов ;n1, n2 – объем соответственно первой и второй выборок; n = n1 + n2 – объем обеих выборок. Нулевая гипотеза верна, если Трасч < Ткр, где Ткр – критическое значение критерия Вилкоксона, которое при α = 0,05 100 равно 1,13. КРИТЕРИЙ ВИЛКОКСОНА МАННА УИТНИ (V) Наиболее мощный непараметрический критерий, который обычно применяется для сравнения выборок с n ≤ 20. Для определения расчетной критерия необходимо: величины этого 1. Расположить данные двух сравниваемых выборок по мере возрастания их значений в два ряда таким образом, чтобы в каждом столбце находилось только одно значение СВ (см. порядок расположения данных при определении критерия Вилкоксона). 2. Для каждого значения СВ определить число инверсий (число нарушения в порядке101 расположения данных двух выборок). Если перед каким-либо значением случайной величины из первого (второго) ряда оказывается Vi значений случайной их второго (первого) ряда, то число этих значений дает инверсию для рассматриваемого значения случайной величины первой (второй) выборки. 3. Определить сумму инверсий для каждой из выборок (сумма инверсий равна произведению объемов двух выборок). 4. Меньшую сумму инверсий (Vmin) сравнить с табличным значением критерия Вилкоксона Манна Уитни VТАБЛ. (табл. 9). 102 Значения критерия Вилкоксона – Манна – Уитни при = 0.05 n2 n1 4 5 6 7 8 9 10 11 13 15 4 1 5 2 4 6 3 5 7 7 4 6 8 11 8 5 8 10 13 15 9 6 9 12 15 18 21 10 7 11 14 17 20 24 27 11 8 12 16 19 23 27 31 34 13 10 15 19 24 28 33 37 42 51 15 12 18 23 28 33 39 44 50 61 72 17 15 20 26 33 39 45 51 57 70 83 17 96 103 КРИТЕРИЙ СИДЖЕЛА – ТЬЮКИ ( Z ) Используется для проверки различия дисперсий двух выборок разного объема (n1 < n2) Нулевая гипотеза Н0 : Д1 = Д2 верна, если выполняется следующее неравенство n1 n1 n 2 1 R1 2 Z Z кр . n1 n1 n 2 1 n 2 12 (82) где n1, n2 – объем соответственно первой и второй выборок; R1 – сумма рангов для выборки меньшего объема (для выборки n1); Zкр – критическое значение критерия Сиджела-Тьюки: при α = 0,05; Zкр(0,05) = 1,282; при α = 0,1; Zкр(0,1) = 1,960. 104