Министерство образования и науки Российской Федерации НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ Кафедра технологии вяжущих веществ и бетонов СТАТИСТИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ ТЕХНОЛОГИЧЕСКИХ ЗАДАЧ Методические указания к выполнению практических занятий по дисциплине «Архитектурно-строительное материаловедение», для студентов магистратуры направления подготовки 08.04.01 Строительство © НИУ МГСУ, 2015 Москва 2015 УДК 691.3:311 ББК 38.3 С78 Составитель О.В. Александрова С78 Статистические методы решения технологических задач [Электронный ресурс] : методические указания к практическим занятиям по дисциплине «Архитектурно-строительное материаловедение», для студентов магистратуры направления подготовки 08.04.01 Строительство/ М-во образования и науки Рос. Федерации, Нац. исследоват. Моск. гос. строит. ун-т, каф. технологии вяжущих веществ и бетонов; сост. О.В. Александрова. — Электрон.дан. и прогр. (1,4 Мб). — Москва : НИУ МГСУ, 2015. — Учебное сетевое электронное издание — Режим доступа: http://lib.mgsu.ru/Scripts/irbis64r_91/cgiirbis_64.exe?C21COM=F&I21DBN=IBIS& P21DBN=IBIS — Загл. с титул.экрана. Освещены вопросы планирования и обработки результатов эксперимента в области строительных материалов. Для студентов магистратуры направления подготовки 08.04.01 Строительство. Учебное сетевое электронное издание ©НИУ МГСУ, 2015 Отв. за выпуск — кафедра технологии вяжущих веществ и бетонов Подписано к использованию 21.09.2015 г.Уч.-изд. л. 2,2. Объем данных 1,4 Мб Федеральное государственное бюджетное образовательное учреждение высшего образования «Национальный исследовательский Московский государственный строительный университет» (НИУ МГСУ). 129337, Москва, Ярославское ш., 26. Издательство МИСИ – МГСУ. Тел. (495) 287-49-14, вн. 13-71, (499) 188-29-75, (499) 183-97-95. E-mail: ric@mgsu.ru, rio@mgsu.ru Практическое занятие 1 Статистические оценки результатов наблюдений Множество значений случайной величины, полученных в результате эксперимента или наблюдений над объектом исследования, представляет собой статистическую совокупность. Статистическая совокупность, содержащая в себе все возможные значения случайной величины, называется генеральной статистической совокупностью. Выборочной статистической совокупностьюназывается совокупность, в которой содержится только некоторая часть элементов генеральной совокупности. По результатам эксперимента практически всегда встречаются с выборочной статистической совокупностью, а не с генеральной совокупностью. Выборочную статистическую совокупность будем в дальнейшем называть выборкой, а число опытов (наблюдений) n, содержащееся в выборке – объемом выборки. При повторении опытов в одинаковых условиях обычно обнаруживается закономерность в частоте появлений тех или иных результатов. Некоторые значения случайной величины появляются значительно чаще других, при этом в целом они группируются относительно некоторого значения – центра группирования, которое обозначим через Му.Для описания Му этого явления используется вероятностный подход. Пусть pi–вероятность того, что случайная величина, являющаяся результатом эксперимента, примет значение yi, i=1,2,…,n.Если значения рiизвестны для всех возможных значений yi из генеральной совокупности, то величину Муможно найти по формуле = + + ⋯+ = (1) Величину Муназывают математическим ожиданием или генеральным средним случайной величины. Одно только математическое ожидание не может отобразить все характерные черты статической совокупности. Исследователю необходимо знать, кроме того, изменчивость, или вариацию наблюдаемой характеристики объекта. Рассеивание случайной величины относительно математического ожидания характеризуется величиной, называемой дисперсией, обычно она обозначается через σ2. Для генеральной совокупности дисперсия определяется по формуле = − (2) σ2 часто называют генеральной дисперсией. Квадратный корень из Дисперсию дисперсии называется средним квадратическим отклонением случайной величины, или =√ стандартом .Как и дисперсия, среднее квадратическое отклонение является характеристикой рассеивания значений случайной величины относительно математического ожидания. Формулы (1) и (2) справедливы для дискретных случайных величин. Для непрерывных случайных величин математическое ожидание и дисперсия выражаются через соответствующие интегралы. Поскольку экспериментатор встречается не с генеральной совокупностью, а с выборкой, необходимо иметь формулы, позволяющие приближенно оценить математическое ожидание Муи дисперсию σ2 на основе экспериментальных данных. Пусть по результатам однородной серии опытов получена выборка + + ⋯+ . Наилучшей оценкой для математического ожидания Муявляется среднее арифметическое или просто «среднее» = + + ⋯+ (3) Найденное значение называют еще выборочным средним в отличие от генерального среднего Му. Оценкой дисперсииσ2случайной величины является выборочная, или эмпирическая дисперсия. Она обозначается через s2 , вычисляется по формуле = ( − ) +( − ) + ⋯+ ( − − ) (4) Числитель этой формулы представляет собой сумму квадратов отклонений значений случайной величины от среднего значения . Знаменатель формулы для выборочной дисперсии называется числом степеней свободы, связанным с этой дисперсией, и обозначается через f: = − (5) Формулу (1.4) можно преобразовать к виду, более удобному для вычислений: = − Величина − (6) = = ( − − ) (7) является оценкой среднего квадратического отклонения выборки. Ее также называют выборочным стандартом. Часто для оценки изменчивости (вариации) случайных величин используют коэффициент вариацииv. Он равен отношению sк ,%: = 100%(8) Коэффициент вариации характеризует не абсолютное, а относительное рассеивание случайной величины относительно среднего. Важное значение в статистике имеют также следующие статистические показатели: средняя квадратическая ошибка среднего значения = √ (9) показатель точности среднего значения = 100% = (10) √ ошибка среднего квадратического отклонения = √ Статистическая совокупность может иногда содержать сотни и даже тысячи наблюдений. При этом экспериментальный материал будет труднообозримым, и даже нахождение оценок математического ожидания и дисперсии по формулам (1.3) и (1.6) является трудоемкой задачей. Для вычисления выборочного среднего и выборочной дисперсии в подобных случаях прибегают к группировке данных. При этом весь диапазон значений случайной величины от yminдо ymax разбивается на интервалы. Для ориентировочного определения числа интервалов k можно воспользоваться формулой = + , (11) гдеn - объем выборки. Значение k, найденное по этой формуле округляется до ближайшего целого. Чаще всего используются интервалы равной длины. В этом случае длина (h) каждого интервала равна = ( − ) . Определяются границы интервалов. Так, первый интервал лежит в пределах … ,где = + ; второй интервал – в пределах … , где = + и т.д. ∗ Для каждого i-го интервала вычисляется его середина ∗ = ( − ) , по формуле = , ,…, Далее подсчитывается число наблюдений, попавших в каждый интервал. Обозначим его (интервал) через mi, i=1,2,…,k. Предварительно договариваются (решают), к какому интервалу приписывать значение случайной величины, попавшее на границу интервала. Можно, например, условиться, что значение случайной величины, попавшее на границу , всегда относится кi+1-му интервалу. Сума всех величин mi равна, очевидно, объему выборки: = . Тогда выборочное среднее и выборочная дисперсия ∗ = = − определяются по формулам (12) ( ∗ − ) (13) Сгруппированные данные записывают в виде статистического ряда (табл. 1). В последнем столбце этой таблицы приведены значения относительной частоты, равной отношению числа наблюдений, попавших в данный интервал, к объему nвыборки: ∗ = . Таблица 1 № интервала Граница интервала Середина интервала Число наблюдений в интервале ∗ Относительная частота ∗ = 1 − ∗ ∗ 2 . . . i . . . k − . . . − . . . − ∗ ∗ . . . . . . . . . . . . . . . . . . ∗ ∗ ∗ ∗ График, построенный по данным статистического ряда, называется гистограммой. При построении гистограммы по оси абсцисс откладывают значения границ интервалов и на каждом из них, как на основании, строят прямоугольник, площадь которого равна относительной частоте, соответствующей данному интервалу. Высота каждого прямоугольника равна относительной частоте, деленной на длину интервала. Пример1. В результате измерений активности цемента получено n=400 значений, кгс/см2. Значения активности цемента измеряются в диапазоне от 285 до 555 МПа. = Определим значение числа интервалов = + , + , − ) Определим длину интервала = ( ) − = ( = Далее определяем границы интервалов. В четвертый и пятый столбец таблицы заносим значения числа наблюдений в интервале и относительных частот ∗ Таблица 2 Середина интервала Число наблюдений в интервале 2 3 4 285-315 315-345 345-375 375-405 405-435 435-465 465-495 495-525 525-555 300 330 360 390 420 450 480 510 540 10 22 42 56 86 77 65 22 20 № интервала Граница интервала 1 1 2 3 4 5 6 7 8 9 5 m, шт Гистограмма эмперического распределения 100 90 80 70 60 50 40 30 20 10 0 300 330 360 390 420 450 480 510 540 Rcж, кгс/м2 Рис. 1 На рис. 1 изображена гистограмма, соответствующая статистическому ряду, приведенному в таблице 1. Т.к. сумма всех относительных частот равна единице, то площадь всей гистограммы также равна единице. С увеличением числа опытов n значение каждой частоты становиться все ближе к pi утверждение, выражающее требование статистической устойчивости часто, является важнейшей предпосылкой применения статистических методов. Если одновременно с увеличением числа опытов n увеличивать и количество интервалов, то ломаная, ограничивающая гистограмму сверху, приближается к некоторой кривой, называемой кривой распределения или кривой плотности вероятности. Она является графиком соотношения между значениями данной случайной величины и их вероятностями. В теории вероятности это соотношение называется статистическим распределением. Для случайных величин, имеющих разную природу, статистические распределения могут быть различными. Известны, например. Распределения Пуансона, Пирсона, биномиальное и многие другие. Среди них существует распределение, называемое нормальным (или гауссовским), которое применяется наиболее часто и играет важную роль в теории в теории вероятностей и математической статистке. Основанием для этого служит центральная предельная теорема теории вероятностей. Смысл ее состоит в утверждении, сто сумма достаточно большого числа произвольно распределенных случайных величин распределена приблизительно по нормальному закону и тем точнее, чем больше членов этой сумме. При этом предполагается, что среди рассматриваемых случайных величин нет такой, влияние которой на сумму существенно преобладало бы по сравнению с остальными случайными величинами. Таким условиям, как правило, удовлетворяет измеряемая величина в однородной серии опытов, подверженная влиянию большого числа факторов. Поэтому распределение этой величины обычно считается нормальным. На рис. 1.2 изображена кривая плотности нормального распределения. Рис. 1.2 При изложении дальнейшего материала данного раздела будем предполагать, что результаты наблюдений свободны от систематических ошибок, а случайные ошибки (а значит и результаты наблюдений) подчинены нормальному закону распределения. Практическое занятие 2 Расчет доверительного интервала для математического ожидания Величина (выборочное среднее), найденная по выборке, представляет ценность постольку, поскольку по ней можно судить об истинном среднем, математическом ожидании . Представляет интерес отыскание величины максимальной ошибки ∆, которую мы допускаем, предполагая равным .Требуется, следовательно, найти величину ∆, при которой − ∆≤ Неравенством ≤ (1.14) + ∆(14) задается интервал, в котором находится значение математического ожиданияМу. Этот интервал называется доверительным интервалом для математического ожидания. Величина ∆зависит, очевидно, от объема выборки n.Чем меньше n, тем максимальная ошибка ∆. Однако, даже при заданном nнельзя абсолютно достоверно указать величину ∆, так как расчет этой величины, как и любой статистически вывод, делают на основе результатов эксперимента, а они заведомо содержат ошибки. Выводы, которые делают на основе неточных данных, принципиально не могут быть абсолютно достоверными. Поэтому говорят о надежности статистического вывода, которую оценивают величиной доверительной вероятности p, где 0<p<1. Например, статистический вывод, сделанный с доверительной вероятностью p=0,95, будет справедлив в 95 случаях из 100. Будем пользоваться чаще величиной q=1-p, называемой уровнем значимости. Уровень значимости задается заранее, до проведения расчетов. Типичные значения для q:0,01; 0,05; и 0,1 или, в процентах: 1, 5, 10. Вернемся к отысканию доверительного интервала для математического ожидания. Будем предполагать, что дисперсия измеряемой величины yзаранее неизвестна, а ее оценка s2 найдена по выборке с помощью формул (1.4) или (1.13). В этом случае величина ∆ определяется по формуле ∆=ts/√n,следовательно, доверительный интервал для математического ожидания равен − √ ≤ ≤ + √ (15) Величина s- оценка стандарта: s=√s2. Кроме известных величинsи n в формулу (1.15) входит величина t, для отыскания которой понадобятся статистические таблицы. Они имеются практически в каждом руководстве по математической статистике или планирование эксперимента. Величина tназывается табличным значением t –критерия Стьюдента. В соответствующей таблице ее следует отыскать по предварительно заданному уровню значимости qчислу степеней свободы f=n-1(приложение, таблица 1). Оценку для математического ожидания в виде интервала (15) часто называют интервальной оценкой в отличие от оценок по формулам (3) и (12), которые называют точечными оценками для математического ожидания. Пример 2. В результате эксперимента была определена прочность R28 твердения цемента по ГОСТ 310.4-81.было выполнено 6 измерений прочности. В результате получены следующие значения: Число опытов n Активность R28, кгс/см2( ) Требуется 1 2 3 4 5 6 450 452 458 460 466 488 рассчитать точечную оценку и доверительный математического ожидания. Вычислим среднее арифметическое и оценку дисперсииs2выборки = ∑ , = 450 + 452 + ⋯ + 488 = 6 , ∑ R28=2774 интервал для = = − − , 450 + 452 + ⋯ + 488 − 6 ∗ 462,3 5 Отсюда = √ = ( = 228 кгс ). см Зададимся уровнем значимости q=0,05. Это соответствует доверительной вероятности p=1-q=0,95. Из таблицы 1 приложения по величинам q=0,05 и f= n-1 = 5 найдем значение t=2,57. Подставляя найденные значения для R28, s, n и t в формулу (1.15), получим доверительный интервал для математического ожидания , − т. е. 2,57 ∗ 15 ≤ 6 ≤ , , ( ≤ ≤ , + 2,57 ∗ 15 , 6 кгс ). см Не следует думать, что во всех случаях целесообразно задаваться возможно большей надежностью статистического вывода. Покажем на материале предыдущего примера к чему это может привести. Зададимся теперь уровнем значимости q=0,01. Доверительная вероятность будет теперь равна p=1-q=0,99. Новое значение t, найденное из таблицы 1.3, составит 4,03, а доверительная оценка примет вид , ( кгс ). см , ≤ ≤ Как и следовало ожидать, с большей надежностью можно гарантировать только более широкий доверительный интервал для математического ожидания при тех же опытных данных. Практическое занятие 3 Определение необходимого объема выборки Пусть требуется найти минимальное число nповторений опытов, при котором среднее арифметическое , найденное по этой выборке, отличалось бы от математического ожидания не более, чем на заданную величину ∆. Это, по существу, задача обратная предыдущей. Для ее решения необходимо знать оценку дисперсииs2. Здесь можно использовать, например, результаты проведенных ранее исследований. Искомое значение n определяется по формуле n=t2s2/∆2(16) величину tнаходят из таблицы 1 приложения при уровне значимости qи числе степеней свободыf, связанном с оценкой дисперсии s2. Если эта дисперсия найдена по выборке объема, большего 120, то вместо величины t в формуле (16) можно пользоваться величиной τ, зависящей только от уровня значимости q. Значения τприведены ниже: q 0,2 0,1 0,05 0,01 0,005 τ 1,28 1,64 1,96 2,58 2,81 Формулу (1.16) можно преобразовать следующим образом. Поделим числитель и знаменатель на .Обозначим черезε величину = (∆/ ) %.Это выражение представляет собой относительную допускаемую ошибку. Учитывая, что отношение ( / )100% −это, по определению, коэффициент вариацииv, получим n=t2v2/ε 2(17) Пример 3. На основе измерений активности цемента (пример 1) найти необходимый объем выборки, при котором среднее отличалось бы от математического ожидания не более чем на ∆=15 кгс/см2с доверительной вероятностью p=0,95. Середина интервала Число наблюдений в интервале 2 3 4 285-315 315-345 345-375 375-405 405-435 435-465 465-495 495-525 525-555 300 330 360 390 420 450 480 510 540 10 22 42 56 86 77 65 22 20 № интервала Граница интервала 1 1 2 3 4 5 6 7 8 9 5 Для определения необходимого объема выборки воспользуемся формулой (1.16), причем вместо значения t можно подставить в нее значение τ (объем выборки более 120). Данной величине p соответствует уровень значимости q=1-p=0,05. Соответствующее значение τ = 1,96. По данным примера 1 вычислим среднее и оценку дисперсии s2: = ,s2=628,8. Таблица 3 № интервал а 1 1 2 428 3 300 4 10 5 3000 6 -128 7 16384 8 163840 2 3 4 5 6 7 8 9 330 360 390 420 450 480 510 540 22 42 56 86 77 65 22 20 7260 15120 21840 36120 34650 31200 11220 10800 ∑ -98 -68 -38 -8 22 52 82 112 171210 9604 4624 1444 64 484 2704 6724 12544 211288 194208 80864 5504 37268 175760 147928 250880 1267540 Тогда согласно формуле (16), имеем: n=t2s2/∆2; n= (1,962*628,8)/152≈11 В изложении дальнейшего материала широко используются процедуры проверки статистических гипотез. Статистическая гипотеза – это некоторое предположение относительно свойств совокупности, проверяемое по выборке. Например, гипотезе об однородности средних или дисперсий, законе распределения и т.д. Проверка статистической гипотезы – это процедура, по результатам которой гипотеза принимается или отбрасывается. Проверка статистических гипотез связана с такими распространенными задачами, как сравнительная оценка различных технологических процессов по их производительности, точности, экономичности или сравнение конструктивных особенностей машин и приборов. В планировании эксперимента проверка статистических гипотез позволяет правильно оценить преимущества одной модели перед другой, выявить наиболее значимые факторы, влияющие на данное явление, а также убедиться в пригодности (адекватности) полученного математического описания процесса. Выдвинутую гипотезу называют основной, или нулевой. Гипотезу, противоречащую нулевой, называют конкурирующей. Для проверки нулевой гипотезы используют специально подобранную случайную величину, распределение которой известно. Ее называют статистическим критерием. Например, при проверке гипотезы об однородности дисперсий в качестве критерия используют отношение выборочных дисперсий, которое подчиняется статистическому распределению Фишера. Для проверки статистической гипотезы вычисляют значение критерия по имеющимся опытным данным. Если оно находится внутри некоторой заданной заранее области, называемой областью принятия гипотезы (областью допустимых значений), то нулевая гипотеза принимается. В противоположном случае значение критерия попадает в критическую область, и тогда гипотеза отвергается. Однако попадание критерия в область допустимых значений не дает права категорически утверждать, что гипотеза полностью подтвердилась. Можно только заключить, что по данным выборки значение критерия не противоречит гипотезе. Поэтому, принимая решение о правильности гипотезы, можно допустить ошибку. Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность этой ошибки задается заранее выбором уровня значимостиq. (Как указывалось, типичные значения q: 0,01; 0,05; 0,1 или 1, 5 и 10%). Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она неверна. Уменьшение ошибки второго рода достигается увеличением уровня значимости. Таким образом, уменьшение уровня значимости приводит к уменьшению ошибки первого рода и при этом к увеличению ошибки второго рода. Отметим, что единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объема выборок. Практическое занятие 4 Отбрасывание грубых наблюдений Грубые наблюдения (промахи) подлежат исключению из выборки. Для их обнаружения можно вновь воспользоваться t –критерием Стьюдента. В этом случае сомнительный результатyiвременно исключают из выборки, а по оставшимся данным рассчитывают среднее арифметическое расч = | и оценку дисперсии s2. Далее вычисляют − |⁄ . Из таблиц распределения Стьюдента (таб. 1 приложения) по выбранному уровню значимости qи числу степеней свободы f,связанному с дисперсиейs2, находят табличное значение t-критерия Стьюдента tтабл. Если tрасч>tтабл, то подозреваемый результат является промахом и должен быть исключен из выборки. Иногда сомнение вызывают одновременно два или даже три элемента выборки. Исследование начинают с того из сомнительных элементов, значение которого ближе к среднему выборки, а остальные сомнительные элементы временно отбрасывают. Затем рассчитывают значения и s выборки без исключенных элементов, а также значениеtрасч для оставшегося сомнительного элемента. Далее решают вопрос об исключении этого элемента с уровнем значимости q. Если tрасч>tтабл, то оставшийся элемент выборки отбрасывают как грубое измерение. Тем более грубыми будут и остальные, ранее исключенные элементы. Если наименее сомнительный элемент не оказался промахом (tрасч≤tтабл), то его присоединяют к выборке и исследуют следующий сомнительный элемент, и т.д. Пример 4.Проверим, не является ли промахом результатR28=488кгс/см2 в примере 2. Исключив это значение из выборки, найдем среднее и дисперсию по оставшимся данным: = , ;s2= 41,2;s≈6,4 ;tрасч=|488-457,2 |/6,4=4,8. Зададимся уровнем значимости q= 0,01. Для этого q при f= 5– 1 = 4 из табл. 1 приложения найдем tтабл=4,60. Полученное соотношение tрасч<tтаблне дает оснований считать результат R28= 488 промахом при выбранном уровне значимости. Проверка гипотезы об однородности двух дисперсий Результаты экспериментальных исследований часто используют, например, для сравнения условий функционирования объектов, оценки сравнительной эффективности различных технологий, разных способов измерения и т.д. Во многих случаях соответствующие выводы делают на основе анализа и сравнения нескольких выборок. Одна из простых задач такого типа возникает, когда надо сравнивать точность двух измерительных приборов. В этом случае следует сравнивать оценки дисперсий соответствующих выборок. Пусть имеются две выборки объемом n1и n2, по которым найдены выборочные дисперсии s иs . Они являются оценками для генеральных дисперсий соответственно и . Предположим, чтоs ≠ s Требуется выяснить, можно ли утверждать, что обе выборки взяты из одной и той же генеральной совокупности. Если это так, то = вэтом случае выборочные дисперсии s иs называют однородными, а различие между ними объясняется влиянием случайных ошибок. В противном случае генеральные дисперсии и не равны друг другу.Тогда говорят, что различие между выборочными дисперсиями значимо. Для проверки используется статистической гипотезы об однородности двух дисперсий F – критерий Фишера. Вначале вычисляется величина Fрасч, равная отношению большей из выборочных дисперсий к меньшей. Пусть для определенности s > s . Тогда расч = s (18) s Далее задаются уровнем значимостиq и вычисляют числа степеней свободы дисперсий числителя изнаменателя по формуле (1.5):f1 = n1–1 и f2= n2–1. По трем величинам q,f1 и f2из таблиц распределения Фишера отыскивают величину F=Fтабл. (таблица 4 приложения). Если Fрасч>Fтабл, то выборочные дисперсии считаются неоднородными (различие между ними значимо) для выбранного уровня значимости q. Если Fрасч≤Fтабл, то можно принять гипотезу об однородности дисперсий. Пример 5.Для сравнения точности двух электровлагомеров ЭВ-2К каждым из них проведено 10 измерений влажности одного и того же участка доски. Результаты замеров влажности W, %, первым и вторым приборами следующие: Первый прибор 35 41 47 38 41 43 42 37 49 39 Второй прибор 42 39 42 43 45 40 37 44 44 43 Задание: вычислить значения средних и выборочных дисперсий для каждого прибора. Вычисленные значения средних и выборочных дисперсий для каждого прибора соответственно равныy = 41,2;y = 41,9; s = 18,84;s = 6,32. Дисперсии отличаются почти втрое. Следует ли отсюда, что точность первого влагомера меньше, чем второго? Вычислим Fрасч. по формуле (18). В данном случае в числителе должна быть дисперсия s . расч = s /s = 1,84/6,32 = 2,98. Зададимся уровнем значимости q=0,05. Числа степеней свободы каждой из дисперсий равны f1 = f2 =10 – 1 = 9.Из табл. 2 приложения для q=0,05, f1 = f2 = 9найдемFтабл=3,18. Полученное соотношение Fрасч<Fтабл. не дает оснований сделать вывод о значимости расхождения в точности исследуемых влагомеров по результатам данного эксперимента. Для окончательного решения вопроса необходимо повторить эксперимент, существенно увеличив объем каждой выборки. Проверка однородности средних Здесь исследуют две выборки, имеющие различные средние арифметические. Данная проверка позволяет установить, вызвано ли расхождение между средними случайными ошибками измерения или оно связано с влиянием каких-либо неслучайных факторов. Эта процедура находит широкое применение, например, в случаях, если требуется установить идентичность параметров одинаковых изделий, приготавливаемых на разном оборудовании. Проверка проводится с применением t-критерия Стьюдента. Пусть n1 и n2 – объемы выборок, и – соответствующие средние,s иs - оценкидисперсий, найденные по этим выборкам. Рассмотрим два случая. 1. Дисперсии s иs однородны.Вычисляется расчетноеt-отношение по формуле расч − = ) ( + ( ) (20) Из таблиц распределения Стьюдента при уровне значимости qи числе степеней свободы f = n1+n2 – 2 находят табличное значение tтабл.(табл. 1 приложения). Если tрасч>tтабл., то расхождение между среднимизначимо. В противном случае можно принять гипотезу об однородности средних. Формула (20) упрощается, если обе выборки имеют одинаковый объем, т.е. n1=n2=n. В этом случае расч − = ( (21) ) 2. Дисперсии s иs неоднородны. Как и в предыдущем случае здесь можно использовать t-критерий Стьюдента, но формула для tрасч имеет следующий вид: расч = − ⁄ + ⁄ (22) Далее вычисляют величинуfпо формуле = ( ⁄ ⁄ ⁄ + + ⁄ ) (23) −2 Найденное значение f округляют до целого и принимают за число степеней свободы. По этой величине и по уровню значимости qиз таблиц распределения Стьюдента отыскивается tтабл. Дальнейший ход проверки не отличается от предыдущего случая. Практическое занятие 5 Проверка нормальности распределения При рассмотрении всех предыдущих статистических процедур предполагалось, что выходная величина подчиняется нормальному закону распределения. Это предположение можно проверить разными способами. Наиболее строгим из них является применение критерияχ2 Пирсона. Для этого необходимо иметь выборку достаточно большого объема: n≥ 50 –150. Диапазон изменения выходной величины в этой выборке разбивается на lинтервалов так, чтобы эти интервалы покрывали всю ось от -∞ до +∞ и в каждый интервал при этом попало не менее пяти значений выходной величины. Подсчитывают количество miнаблюдений, попавших в каждый интервал. Затем вычисляют теоретические вероятности попадания случайной величины в каждый i-й интервал. Для этого используют формулу pi = Ф(z2) – Ф(z1), где н =( где н выборки; − )/ ; в =( − )/ (1.24), – среднее арифметическое выборки; – среднее квадратическое отклонение в – верхняя границаi-го интервала; Ф(z)- – нижняя границаi-го интервала; нормированная функция Лапласа: Ф( ) = 1 ⁄ √2 Значения ее дляz=z1иz=z2определяют из таблиц (Гмурман В.Е.). При отыскании значений этой функции для отрицательных значений аргумента следует иметь в виду, что функция Ф(z)нечетная: Ф(-z)= - Ф(z). Следующим этапом является вычисление величины χ2расч по формуле расч = ( ) ⁄ − .(25) По выбранному уровню значимости q и числе степеней свободыk = l –3 из табл. 3 приложения находят χ2табл. Гипотезу о нормальности распределения можно принять, если χ2расч<χ2табл. Пример. Проверим гипотезу о нормальности распределения значений морозостойкости бетона при постоянном В/Ц=0,6 по выборке объема n=80, приведенной в таблице 4. Таблица4 1 2 3 4 5 6 7 8 Значения морозостойкости бетона, цикл 4 5 6 7 8 1 2 3 330 160 150 560 190 350 190 220 630 355 390 180 290 320 240 300 500 140 230 360 325 220 480 455 250 300 290 280 270 290 540 430 230 257 114 203 180 346 168 366 356 212 470 258 285 270 275 283 Вычисления удобно вести, заполняя табл. 5. 1. Данные выборки разобьем на l=6интервалов. y=288 s2=s=115 285 203 555 362 392 194 243 106 219 381 129 120 187 154 343 265 9 10 215 354 257 198 222 468 386 156 506 308 164 249 189 250 165 342 Таблица 5 (mi- рi*n)2/ рi*n № интервала Yiн Yiв mi Z1 Z2 Ф( Z1) Ф( Z2) рi рi*n (mi- рi*n)2 1 2 3 4 5 6 7 8 9 10 11 12 1 -∞ 200 20 -∞ -0,9 -0,5 -0,07171 0,42829 34,2632 203,4389 5,937533 2 200 300 29 -0,9 0,01 -0,07171 0,00798 0,07969 6,3752 511,8816 80,29263 3 300 400 20 0,01 0,11 0,00798 0,08759 0,07961 6,3688 185,8096 29,17498 4 400 500 5 0,11 0,22 0,08759 0,17413 0,08654 6,9232 3,698698 0,534247 5 500 600 5 0,22 0,32 0,17413 0,25103 0,0769 6,152 1,327104 0,215719 6 600 ∞ 1 0,32 ∞ 0,25103 0,5 0,24897 19,9176 357,8756 17,96781 ∑ 0 χ2расч=134 χ2табл=7, 81 к=l-3=6-3=3 q=0,05 Вывод: полученное соотношение позволяет или не позволяет принять гипотезу о нормальности распределения. 134,1229 Практическое занятие 6 Коэффициент корреляции Во многих случаях целью экспериментальных исследований установление и изучение зависимости между некоторыми величинами. Если каждая из этих величин является случайной, то при этом используют методы корреляционного анализа. Так, методами корреляционного анализа можно оценить степень взаимосвязи между пределом прочности бетона при сжатии и водопоглощением и т.д. Будем говорить, что между двумя случайными величинами имеется статистическая связь, если при изменении одной из них меняется распределение другой. Для оценки статистической связи по данным эксперимента широко используется выборочный коэффициент корреляции. Пусть проведено n наблюдений и в каждом из них определялись значения двух параметров (признаков) х и y. Следовательно, получаются две одновременно получаемые выборки: х1, х2,…, хnи y1, y2, …, yn. По каждой из них найдем среднее арифметическое и , а также выборочный стандарт sx и sy. Выборочный коэффициент корреляции rрассчитывается по формуле = ∑ ( − ̅ )( ( − 1) − ) ,(26) которую можно переписать в виде, более удобном для вычислений = ∑ ∑ (∑ (∑ ) )(∑ ∑ ) (∑ . (27) ) При расчетах полезно иметь в виду, что выборочный коэффициент корреляции не изменяется при изменении начала отсчета и масштаба измерения х и y. Коэффициент корреляции всегда лежит в пределах – 1 ≤ r≤1. Он характеризует не всякую, а только линейную зависимость между случайными величинами. При положительном rможно предполагать, что с возрастанием одной из случайных величин другая в среднем тоже возрастает. При отрицательном rс ростом одной из них другая величина в среднем будет убывать. Чем ближе величина r к (+1) или к (-1), тем больше степень линейной зависимости между рассматриваемыми случайными величинами. 21 Значение r =0 свидетельствует об отсутствии линейной статистической связи между ними. Такие случайные величины называются некоррелированными. Обычно величина rоказывается не равной нулю. Для выяснения того, будут ли некоррелированными в этом случае признаки х и y, вычисляют величину расч. =| | . (28) Ее сравнивают с табличным значением t-критерия Стьюдента, найденным при выбранном уровне значимости qи числе степеней свободы f= n – 2. Если tрасч.<tтабл., принимается гипотеза о некоррелированности величин х и y. В противном случае коэффициент корреляции значимо отличается от нуля, т.е. между величинами х и y существует линейная статистическая связь. Если требуется исследовать статистическую связь между тремя и более случайными величинами, то пользуются коэффициентом множественной корреляции. Так, для оценки степени статистической связи случайной величины z с величинами х и y рассчитывают выборочный совокупный коэффициент корреляции ρ по формуле = −2 + 1− где rху,rуz,rхz, - коэффициенты корреляции соответственно между величинами х и y, yиz,х и z. Величина ρ лежит в пределах 0 ≤ ρ≤1 и, так же как и обычный коэффициент корреляции, служит для оценки линейной статистической связи. Пример.К системам двух случайных величин. Малая выборка нескольких свойств. Случай, когда измеряется не одно свойство, а сразу несколько. В этом случае вводится понятие о коэффициенте парной корреляции. Результаты измерения трех свойств бетона на малой выборке представлены в таблице: Rб- прочность, МПа, V - скорость прохождения ультразвука, м/с, W - водопоглощение, % по массе. 22 Таблица 6 № опыта 1 R, МПа 20,3 2 V, м/с W, % R2 V2 W2 RV RW VW 3,85 3,68 412,09 14,82 13,54 78,16 74,70 14,17 22,7 4,21 3,22 515,29 17,72 10,37 95,57 73,09 13,56 3 24 4,1 3,5 576,00 16,81 12,25 98,40 84,00 14,35 4 24 4,29 3,2 576,00 18,40 10,24 102,96 76,80 13,73 5 24,5 4,21 3,4 600,25 17,72 11,56 103,15 83,30 14,31 6 24,8 4,25 3,25 615,04 18,06 10,56 105,40 80,60 13,81 Σ 140,30 24,91 20,25 3294,67 103,55 68,52 583,63 472,50 83,93 Вычисляем коэффициенты корреляции по формуле (27). ∑ = ∑ = RV − (∑ R − (∑ 6∙ [6 ∙ , − [6 ∙ = [6 ∙ , −( 6∙ , , , , −( − ∙ , = , −( ∙ ) ][6 ∙ , = 0,85 ) ] , , , ∙ ) ][6 ∙ V) , , , − V) V − (∑ ) ][6 ∙ , 6∙ = ∑ R) , −( R) (∑ −( ) ] , , , −( , ] = −0,64 = −0,94 Судя по абсолютному значению оценок коэффициента корреляции взаимосвязь может быть ранжирована так: (V = W) > (Rб = V) > (Rб = W) 0,94 > 0,64 0,85 > Знак при r (R, V) указывает на направление взаимосвязи: при r > 0 рост первого показателя должен сопровождаться линейным увеличением второго и наоборот, при r < 0 за ростом первого показателя должно следовать линейное снижение второго. Оценка коэффициента множественной корреляции для тех случайных величин производится по формуле: 23 −2 = + (0,85) − 2 ∙ 0,85 ∙ (−0,64) ∙ (−0,94) + (−0,94) = 0,98 1 − (0,85) = 1− при ρ = 0 взаимосвязь между случайными величинами отсутствует, а приближается к детерминированной (существует значительная корреляционная связь). при ρ Практическое занятие 7 Статистический анализ уравнения регрессии Дисперсия воспроизводимости После того как уравнение регрессии получено, приступают к его статистическому анализу. При этом решают две основные задачи: оценивают значимость коэффициентов регрессии и проверяют адекватность математической модели Для выполнения каждой из этих процедур необходимо иметь количественную оценку ошибок эксперимента в целом. Соответствующей характеристикой является дисперсия воспроизводимости, обозначаемая s2{y}.рассмотрим способы ее вычисления в зависимости от методики дублирования опытов. 1. Равномерное дублирование. Каждый из N запланированных опытов повторяется одинаковое число n раз, т.е. имеется N серий, в каждой из которых становится n дублированных опытов. По результатам опытов первой серии рассчитываем дисперсию первого опыта = [( где − ) +( − ) + ⋯+ ( − ) ]/( − 1) = ∑( − ) / ( − 1), − среднеепосериидублированныхопытов, равное + = + ⋯+ = / Аналогично рассчитываются средние и дисперсии всех остальных опытов: =∑ = ∑( / ; (29) − ) / ( − 1), (30) j=1,2,…,N Числа степеней свободы всех дисперсий одинаковы и равны n-1: fj=f=n-1. В качестве дисперсии воспроизводимости s2{y} берется среднее арифметическое дисперсий опытов s y = ⋯ =∑ / , (31) Число степеней свободы fуэтой дисперсии равно сумме чисел степей свободы дисперсий опытов 24 =∑ = ( − 1), (32) Необходимыми предпосылками статистического анализа являются нормальность распределения выходной величины и однородность дисперсий опытов. Проверка однородности дисперсий опытов при равномерном дублировании проводится по критерию Кохрена. 2. Отсутствие дублированных опытов. Для оценки дисперсии воспроизводимости в этом случае приходится ставить отдельную серию дублированных опытов, если это возможно. Как и в предыдущем случае, дисперсия опытов этой серии служит оценкой дисперсии воспроизводимости с числом степеней свободы, равным fу=n0-1, где n0 – число дублированных опытов в отдельной серии. Оценка точности, значимости коэффициентов регрессии и интерпретация результатов Статистическую обработку проводят обычно для модели, записанной в нормализованных обозначениях факторов. Для определенности будем иметь в виду линейную модель, содержащую k факторов. После того, как уравнение регрессии получено и рассчитана дисперсия воспроизводимости, следует оценить точность, с которой найдены коэффициенты регрессии. Поскольку они вычислены по результатам эксперимента, а эти результаты являются случайными величинами, то случайными величинами будут и коэффициенты регрессии bi . Поэтому в качестве показателя точности отыскания коэффициента bi удобно взять его дисперсию s{bi}. Для большинства планов, рекомендованных теорией эксперимента, существуют простые формулы для отыскания дисперсий коэффициентов регрессии (будут рассмотрены дальше при изучении планов эксперимента). После того как найдены дисперсии коэффициентов регрессии, следует выявить незначимые коэффициенты, т.е., которые в математической модели можно приравнять нулю. Для этого используется t-критерий Стьюдента. Для каждого коэффициента регрессии bi отыскивается t-отношение ti=|bi|/s{bi} (33) вычисленную величину ti сравнивают с табличным значением tтабл. Стьюдента для заданного уровня значимости q и числа степеней свободы t-критерия fy , с которым определялась дисперсия воспроизводимости s{y}. Если ti<tтабл., токоэффициент регрессииbi незначим и соответствующий член в уравнении регрессии должен быть отброшен. 25 С учетом (3.24)условие того, что коэффициент регрессии незначим, можно записать в более удобном виде: |bi| ≤ tтабл.s{bi} (34) При отбрасывании незначимых членов возникает определенное неудобство, связанное со статической зависимостью коэффициентов регрессии. Эта зависимость появляется в том, что, после того как незначимые коэффициенты регрессии приравняли нулю, оценки остальных коэффициентов регрессии изменяются. Практический вывод: после отбрасывания незначимых коэффициентов регрессии желательно снова воспользоваться МНК для уточнения оставшихся значимых коэффициентов регрессии. С помощью t-критерия можно найти и доверительный интервал для произвольного коэффициента регрессии bi. обозначим истинную величину этого коэффициента через βi. Тогда bi- tтабл.s{bi} ≤ βi≤ bi+tтабл.s{bi} (35) даже простейшая линейная модель позволяет получить важную информацию об объекте исследования. Запишем ее в нормализованных обозначениях факторов у =в0 + в1х1+в2х2+…+вkхk (35) Коэффициенты этой модели имеют четкий физический смысл Коэффициент в0 равен, очевидно, значению выходной величины, рассчитанному по уравнению регрессии, если все факторы зафиксированы на основном уровне, т.е. в середине диапазона варьирования. Знак коэффициента вi свидетельствует о характере влияния соответствующего фактора. Если вi> 0, то с ростом значений факторов Хi выходная величина растет. Если вi<0, то с ростом Хi отклик уменьшается. Величина вi равна приросту выходной величины, полученному при увеличении значения фактора Хi на половину диапазона его варьирования, например, - с основного уровня (Хi= Х 0i) до верхнего уровня (Хi= Х 1i). Графиком зависимости величины уот любого фактора будет прямая. Рассмотрение зависимостей выходной величины от этого фактора при разных фиксированных значениях других факторов позволит получить семейство прямых, причем все эти прямые будут параллельны. Это связано с тем, что представление регрессионной модели в линейном виде предполагает отсутствие взаимодействий факторов. 26 Чем больше абсолютная величина линейного коэффициента регрессии в модели (35), тем сильнее влияние соответствующего фактора. Если, например, оказалось, что |b3|>|b1 |, то можно сделать вывод о том, что изменение фактора Х3 в пределах его диапазона варьирования оказывает большее влияние на изменение отклика, чем варьирование фактора Х1 в его диапазоне. Т.о., с помощью линейной регрессионной модели можно сравнить степень влияния факторов на выходную величину и выявить важнейшие факторы. Если уравнение регрессии отличается от линейного, то степень влияния фактора может изменяться от начала к концу диапазона варьирования и зависит от уровней варьирования других факторов. Проверка адекватности регрессионной модели Регрессионная модель, построенная по результатам эксперимента, позволяет рассчитать значения отклика в разных точках области варьирования факторов. Для этого в уравнение регрессии подставляют соответствующие значения варьируемых факторов. Проверка адекватности математической модели дает возможность экспериментатору ответить на вопрос, будет ли построенная модель предсказывать значения выходной величины с той же точностью, что и результаты эксперимента. Пусть N – число опытов экспериментального плана или число серий параллельных опытов, если опыты дублируются; р – число оцениваемых коэффициентов регрессии математической модели. Проверка адекватности возможна только при N>p, т.е. если план эксперимента является насыщенным. Для проверки адекватности модели необходимо знать оценку дисперсии воспроизводимости s2{у}, которую можно вычислить в зависимости от методики дублирования по одной из формул, приведенных ранее в разделе 3.4.1. Порядок проверки адекватности модели. 1. Определяют сумму квадратов, характеризующую адекватность модели Sад. При равномерном дублировании е рассчитывают по формуле ад = [( − ) +( − ) +⋯+ ( − ) ] = n ( − ) (36) Здесь n – число дублированных опытов в каждой серии; ȳj – среднее значение результатов эксперимента в j-й серии дублированных опытов, j=1,2,…,N; ŷj– среднее значение по уравнению регрессии для j-го основного опыта. 27 В случае неравномерного дублирования ад = ( − ) (37) где n – число дублированных опытов в j-й серии. 2. Вычисляют число степеней свободы fад дисперсии адекватности. При любой методике дублирования опытов оно равно fад = N – p (38) 3. Вычисляют дисперсию адекватности s2ад ад = ад ⁄ ад (39) 4. С помощью F-критерия Фишера проверяют однородность дисперсии адекватности s2ад и дисперсии воспроизводимости s2{у}. При этом вычисляют Fрасч= s2ад/ s2{у}, (40) которое сравнивают с табличным значением F – критерия Fтабл, найденным при выбранном уровне значимости qдля чисел степеней свободы fад в числителе и fy в знаменателе (см. табл. приложения). Если Fрасч<Fтабл, то модель считается адекватной и может быть использована для описания объекта. В противном случае модель неадекватна. Если оказалось, что уравнение не адекватно, следовательно, при проведении опытов были допущены грубые ошибки или выбранный полином недостаточно полно отражает исследуемую зависимость. В этих случаях необходимо повторить опыты либо изменить интервалы варьирования, либо применить другой план. Рассмотренный метод проверки адекватности модели имеет простой физический смысл. В основе этой процедуры лежит проверка гипотезы об однородности дисперсии адекватности и дисперсии, характеризующей ошибку эксперимента. Заметим, что дисперсия адекватности характеризует расхождение между результатами эксперимента yj и значениями выходной величины ŷj, вычисленными по уравнению регрессии. Логично принять, что модель удовлетворительно описывает объект исследования, т.е. является адекватной, если указанное расхождение связано только экспериментальными ошибками, а не связано, например, с неудачным выбором вида математической модели. Поверка гипотезы об однородности рассматриваемых дисперсий и выясняет «общность происхождения» экспериментальных ошибок и расхождения между yj и ŷj. Кроме поверки адекватности модели информационную ценность. 28 можно оценить ее эффективность, При отсутствии дублированных опытов эффективность регрессионной модели оценивают следующим образом. 1. Вычисляют дисперсию относительно среднего значения отклика с = ( − ) ( − 1) (41) где ȳ - среднее значение отклика по всем опытам; =∑ ⁄ . 2. Рассчитывают остаточную дисперсию s2ост: ост = ( − ( − ) (42) ) 3. Вычисляют отношение Fu: Fрасч= s2с / s2ост(43) Величина Fu показывает, во сколько раз уравнение регрессии описывает результаты эксперимента точнее, чем простое среднее арифметическое, взятое по всем опытам. Регрессионная модель считается эффективной, если Fu> (3÷5). Для экспериментов с дублированными опытами формула (43) остается в силе, а выражения для дисперсий s2с и s2ост примут вид: с ост = ∑ = ∑ − ) ( ∑ ∑ ∑ ( − − ) ∑ − гдеyju –значение отклика в u-м дублированном опыте j-й серии; N – число серий дублированныхопытов; = ∑ ∑ ∑ Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта 1. Выбор варьируемых и стабилизируемых факторов, а также выходных величин эксперимента. 2. Выбор регрессионной модели. 3. Определение диапазона варьирования факторов. 4. Выбор плана эксперимента. 5. Составление методики проведения эксперимента. 29 6. Постановка разведывательных опытов. Проверка нормальности распределения выходной величины. Определение числа дублированных опытов. 7. Проведение основного эксперимента. 8. Отбрасывание грубых наблюдений. Проверка однородности дисперсий опытов. Расчет дисперсии воспроизводимости (при отсутствии дублированных опытов дисперсия воспроизводимости определяется по результатам отдельной серии опытов). 9. Расчет коэффициентов регрессии математической модели. 10. Оценка значимости коэффициентов регрессии. Отбрасывание незначимых членов и повторный расчет коэффициентов регрессии. 11. Проверка адекватности и эффективности регрессионной модели. 12. Интерпретация результатов. Приведенный перечень этапов только приблизительно отражает реальную последовательность действий экспериментатора, поскольку многие этапы оказываются взаимосвязанными. Таковы, например, выбор математической модели и определение диапазона варьирования факторов. При выборе диапазона варьирования факторов существенны, прежде всего, соображения экспериментатора, связанные с возможностью применения полученных им результатов и рекомендаций в производственной сфере. Поэтому диапазоны варьирования факторов в эксперименте обычно соответствуют реальным производственным условиям. Необходимо отметить, кроме того, что диапазоны варьирования факторов следует выбирать тем больше, чем ниже точность фиксирования факторов и чем меньше диапазон изменения выходной величины. С другой стороны, для адекватного описания объекта моделью второго порядка требуются, по сравнению с моделью первого порядка, более узкие диапазоны варьирования факторов. 30 Библиографический список 1. Статистические методы решения технологических задач : учебное пособие /О.В. Александрова, Т.А. Мацеевич, и др. ; М-во образования и науки Рос. Федерации, Моск. гос. строит.уе-т. Москва : МГСУ, 2015. 160 с. 2. Сидняев, Н. И. Введение в теорию планирования эксперимента [Текст]: учебное пособие для студентов высших учебных заведений / Н. И. Сидняев, Н. Т. Вилисова. - Москва : МГТУ им. Н. Э. Баумана, 2011. - 463 3. Яковлев, В. П. Теория вероятностей и математическая статистика [Текст] : учебное пособие / В. П. Яковлев. - 3-е изд. - Москва : Дашков и К, 2012. - 181 с. : ил., табл. Библиогр.: с. 179-181. 4. Соловьев, В. П. Организация эксперимента [Текст] : учебное пособие для вузов / В. П. Соловьев, Е. М. Богатов. - Старый Оскол : ТНТ, 2012. - 255 с. : ил., табл. - Библиогр.: с. 235 5. Жуков, А. Д. Технологическое моделирование [Текст] : учебное пособие для студентов вузов, обучающихся по программе бакалавриата по направлению 270800 "Строительство" (профиль "Производство и применение строительных материалов, изделий и конструкций") / А. Д. Жуков ; Московский государственный строительный университет. - Москва : МГСУ, 2013. - 203 с. 6. Ермаков, С. М. Математическая теория оптимального эксперимента [Text] / С. М. Ермаков, А. А. Жиглявский. - М. : Наука, 1987. - 318 с. 7. Дворкин Л.И. оптимальное проектирование составов бетона. Львов: Вища школа. Изд-во приЛьвов, ун-те, 1981 8. Хамханов К.М. Основы планирования эксперимента. Методическое пособие. Улан-Удэ, 2001 31 Приложение Значения t-критерия Стьюдента Таблица 1 n p 0.80 0.90 0.95 0.98 0.99 0.995 0.998 0.999 1 3.0770 6.3130 12.7060 31.820 63.656 127.656 318.306 636.619 2 1.8850 2.9200 4.3020 6.964 9.924 14.089 22.327 31.599 3 1.6377 2.35340 3.182 4.540 5.840 7.458 10.214 12.924 4 1.5332 2.13180 2.776 3.746 4.604 5.597 7.173 8.610 5 1.4759 2.01500 2.570 3.649 4.0321 4.773 5.893 6.863 6 1.4390 1.943 2.4460 3.1420 3.7070 4.316 5.2070 5.958 7 1.4149 1.8946 2.3646 2.998 3.4995 4.2293 4.785 5.4079 8 1.3968 1.8596 2.3060 2.8965 3.3554 3.832 4.5008 5.0413 9 1.3830 1.8331 2.2622 2.8214 3.2498 3.6897 4.2968 4.780 10 1.3720 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.5869 11 1.363 1.795 2.201 2.718 3.105 3.496 4.024 4.437 12 1.3562 1.7823 2.1788 2.6810 3.0845 3.4284 3.929 4.178 13 1.3502 1.7709 2.1604 2.6503 3.1123 3.3725 3.852 4.220 14 1.3450 1.7613 2.1448 2.6245 2.976 3.3257 3.787 4.140 15 1.3406 1.7530 2.1314 2.6025 2.9467 3.2860 3.732 4.072 16 1.3360 1.7450 2.1190 2.5830 2.9200 3.2520 3.6860 4.0150 17 1.3334 1.7396 2.1098 2.5668 2.8982 3.2224 3.6458 3.965 18 1.3304 1.7341 2.1009 2.5514 2.8784 3.1966 3.6105 3.9216 19 1.3277 1.7291 2.0930 2.5395 2.8609 3.1737 3.5794 3.8834 20 1.3253 1.7247 2.08600 2.5280 2.8453 3.1534 3.5518 3.8495 21 1.3230 1.7200 2.2.0790 2.5170 2.8310 3.1350 3.5270 3.8190 22 1.3212 1.7117 2.0739 2.5083 2.8188 3.1188 3.5050 3.7921 23 1.3195 1.7139 2.0687 2.4999 2.8073 3.1040 3.4850 3.7676 24 1.3178 1.7109 2.0639 2.4922 2.7969 3.0905 3.4668 3.7454 25 1.3163 1.7081 2.0595 2.4851 2.7874 3.0782 3.4502 3.7251 26 1.315 1.705 2.059 2.478 2.778 3.0660 3.4360 3.7060 27 1.3137 1.7033 2.0518 2.4727 2.7707 3.0565 3.4210 3.6896 28 1.3125 1.7011 2.0484 2.4671 2.7633 3.0469 3.4082 3.6739 29 1.3114 1.6991 2.0452 2.4620 2.7564 3.0360 3.3962 3.8494 30 1.3104 1.6973 2.0423 2.4573 2.7500 3.0298 3.3852 3.6460 32 1.3080 1.6930 2.0360 2.4480 2.7380 3.0140 3.3650 3.6210 34 1.3070 1.6909 2.0322 2.4411 2.7284 3.9520 3.3479 3.6007 36 1.3050 1.6883 2.0281 2.4345 2.7195 9.490 3.3326 3.5821 38 1.3042 1.6860 2.0244 2.4286 2.7116 3.9808 3.3190 3.5657 40 1.303 1.6839 2.0211 2.4233 2.7045 3.9712 3.3069 3.5510 42 1.320 1.682 2.018 2.418 2.6980 2.6930 3.2960 3.5370 44 1.301 1.6802 2.0154 2.4141 2.6923 3.9555 3.2861 3.5258 46 1.300 1.6767 2.0129 2.4102 2.6870 3.9488 3.2771 3.5150 32 48 1.299 1.6772 2.0106 2.4056 2.6822 3.9426 3.2689 3.5051 50 1.298 1.6759 2.0086 2.4033 2.6778 3.9370 3.2614 3.4060 55 1.2997 1.673 2.0040 2.3960 2.6680 2.9240 3.2560 3.4760 60 1.2958 1.6706 2.0003 2.3901 2.6603 3.9146 3.2317 3.4602 65 1.2947 1.6686 1.997 2.3851 2.6536 3.9060 3.2204 3.4466 70 1.2938 1.6689 1.9944 2.3808 2.6479 3.8987 3.2108 3.4350 80 1.2820 1.6640 1.9900 2.3730 2.6380 2.8870 3.1950 3.4160 90 1.2910 1.6620 1.9867 2.3885 2.6316 2.8779 3.1833 3.4019 100 1.2901 1.6602 1.9840 2.3642 2.6259 2.8707 3.1737 3.3905 120 1.2888 1.6577 1.9719 2.3578 2.6174 2.8598 3.1595 3.3735 150 1.2872 1.6551 1.9759 2.3515 2.6090 2.8482 3.1455 3.3566 200 1.2858 1.6525 1.9719 2.3451 2.6006 2.8385 3.1315 3.3398 250 1.2849 1.6510 1.9695 2.3414 2.5966 2.8222 3.1232 3.3299 300 1.2844 1.6499 1.9679 2.3388 2.5923 2.8279 3.1176 3.3233 400 500 1.2837 1.2830 1.6487 1.6470 1.9659 1.9640 2.3357 2.3330 2.5882 2.7850 2.8227 2.8190 3.1107 3.1060 3.3150 3.3100 Таблица 2 Значения t-критерия Стьюдента f 1 2 3 4 5 6 7 8 9 10 11 12 13 q 0,05 12,71 4,30 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,20 2,18 2,16 f 0,01 63,66 9,92 5,84 4,60 4,03 3,71 3,50 3,36 3,25 3,17 3,11 3,05 3,01 14 15 16 17 18 19 20 21 22 23 24 25 26 q 0,05 2,14 2,13 2,12 2,11 2,10 2,09 2,09 2,08 2,07 2,07 2,06 2,06 2,06 33 f 0,01 2,98 2,95 2,92 2,90 2,88 2,86 2,85 2,83 2,82 2,81 2,80 2,79 2,78 27 28 29 30 40 50 60 80 100 120 200 500 ∞ q 0,05 2,05 2,05 2,05 2,04 2,02 2,01 2,00 1,99 1,98 1,98 1,97 1,96 1,96 0,01 2,77 2,76 2,76 2,75 2,70 2,68 2,66 2,64 2,63 2,62 2,60 2,59 2,58 Таблица 3 Вероятность Р( ( )> ) = f 0,99 0,98 0,95 0,90 0,80 0,20 0,10 0,05 0,02 0,01 5 0,554 0,752 1,145 1,610 2,343 7,289 9,236 11,070 13,388 15,086 6 0,872 1,134 1,635 2,204 3,070 8,558 10,645 12,592 15,033 16,812 7 1,239 1,564 2,167 2,833 3,822 9,803 12,017 14,067 16,622 18,475 8 1,646 2,032 2,733 3,490 4,594 11,030 13,362 15,507 18,168 20,090 9 2,088 2,532 3,325 4,168 5,380 12,242 14,684 16,919 19,679 21,666 10 2,558 3,059 3,940 4,865 6,179 13,442 15,987 18,307 21,161 23,209 11 3,053 3,609 4,575 5,578 6,989 14,631 17,275 19,675 22,618 24,725 12 3,571 4,178 5,226 6,304 7,807 15,812 18,549 21,026 24,054 26,217 13 4,107 4,765 5,892 7,042 8,634 16,985 19,812 22,362 25,472 27,688 14 4,660 5,368 6,571 7,790 9,467 18,151 21,064 23,685 26,873 29,141 15 5,229 5,985 7,262 8,547 10,307 19,311 22,307 24,996 28,259 30,578 16 5,812 6,614 7,962 9,312 11,152 20,465 23,542 26,296 29,633 32,000 17 6,408 7,255 8,672 10,085 12,002 21,615 24,769 27,587 30,995 33,409 18 7,015 7,906 9,390 10,865 12,857 22,760 25,989 28,869 32,346 34,805 19 7,633 8,567 10,117 11,651 13,716 23,900 27,204 30,144 33,687 36,191 20 8,260 9,237 10,851 12,443 14,578 25,038 28,412 31,410 35,020 37,566 21 8,897 9,915 11,591 13,240 15,445 26,171 29,615 32,671 36,343 38,932 22 9,542 10,600 12,338 14,041 16,314 27,301 30,813 33,924 37,659 40,289 23 10,196 11,293 13,091 14,848 17,187 28,429 32,007 35,172 38,968 41,638 24 10,856 11,992 13,848 15,659 18,062 29,553 33,196 36,415 40,270 42,980 25 11,524 12,697 14,611 16,473 18,940 30,675 34,382 37,652 41,566 44,314 26 12,198 13,409 15,379 17,292 19,820 31,795 35,563 38,885 42,856 45,642 27 12,879 14,125 16,151 18,114 20,703 32,912 36,741 40,113 44,140 46,963 34 28 13,565 14,847 16,928 18,939 21,588 34,027 37,916 41,337 45,419 48,278 29 14,256 15,574 17,708 19,768 22,475 35,139 39,087 42,557 46,693 49,588 30 14,953 16,306 18,493 20,599 23,364 36,250 40,256 43,773 47,962 50,892 35 Таблица 4 Значения F – критерия Фишера (f1 – число степеней свободы большей дисперсии, f2 – число степеней свободы меньшей дисперсии) f2 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 ∞ 161 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,08 4,00 3,92 3,84 2 3 4 200 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,15 3,07 3,00 216 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2,76 2,68 2,60 225 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,61 2,53 2,45 2,37 5 230 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,37 2,29 2,21 6 234 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,25 2,17 2,10 f1 8 q=0,05 237 239 19,35 19,37 8,89 8,85 6,09 6,04 4,88 4,82 4,21 4,15 3,79 3,73 3,50 3,44 3,29 3,23 3,14 3,07 3,01 2,95 2,91 2,85 2,83 2,77 2,76 2,70 2,71 2,64 2,66 2,59 2,61 2,55 2,58 2,51 2,54 2,48 2,51 2,45 2,49 2,42 2,46 2,40 2,44 2,37 2,42 2,36 2,40 2,34 2,39 2,32 2,37 2,31 2,36 2,29 2,35 2,28 2,33 2,27 2,25 2,18 2,17 2,10 2,09 2,02 2,01 1,94 7 9 241 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,12 2,04 1,96 1,88 10 12 15 20 30 ∞ 242 19,40 8,79 5,94 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,08 1,99 1,91 1,83 244 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1,92 1,83 1,75 246 19,43 8,70 5,86 4,62 3,94 3,51 3,22 3,01 2,85 2,72 2,62 2,53 2,46 2,40 2,35 2,31 2,27 2,2 2,20 2,18 2,15 2,13 2,11 2,09 2,07 2,06 2,04 2,03 2,01 1,92 1,84 1,75 1,67 248 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,84 1,75 1,66 1,57 250 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,65 1,55 1,46 254 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,39 1,25 1,00 ОГЛАВЛЕНИЕ Практическое занятие 1 4 Практическое занятие 2 10 Практическое занятие 3 12 Практическое занятие 4 15 Практическое занятие 5 18 Практическое занятие 6 21 Практическое занятие 7 24 Библиографический список 31 ПРИЛОЖЕНИЕ 32 37