Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Задачи по математической статистике Задача 1. По данным распределения возрастного состава участников революционного движения в России 70-х годов 19-го века была построена следующая таблица Возраст 17-23 Процент 27 на 1000 участников 23-29 45,2 29-35 22,5 35-41 2,8 41-47 1,4 47-53 1,1 По имеющимся данным: а) построить гистограмму относительных частот; б) оценить плотность распределения случайной величины с помощью гистограммы; в) проверить гипотезу о законе распределения с уровнем значимости 0,01. Решение. Построим гистограмму относительных частот, для чего дополнительно n ni вычислим плотность относительных частот pi = i = . Получаем: nh 100 ⋅ 6 начало 17 23 29 35 41 47 конец 23 29 35 41 47 53 частота 27 45,2 22,5 2,8 1,4 1,1 100 pi 0,045 0,07533 0,0375 0,00467 0,00233 0,00183 1 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Гистограмма относительных частот 0,08 0,0753 0,07 0,06 0,05 0,0450 0,0375 0,04 0,03 0,02 0,01 0,0047 0,0023 0,0018 44 50 0 20 26 32 38 По виду гистограммы можно предположить, что исследуемая величина имеет нормальный закон распределения. Найдем точечные оценки параметров распределения. Для этого перейдем к простому вариационному ряду, выбирая в качестве вариант середины интервалов, составим расчетную таблицу: xi ni x i ni ( xi − x ) 2 ni 20 26 32 38 44 50 Сумма 27 45,2 22,5 2,8 1,4 1,1 100 540 1175,2 720 106,4 61,6 55 2658,2 1169,71 15,3103 660,481 365,038 424,741 603,243 3238,53 Выборочное среднее: 1 1 x = ∑ xi ni = 2658, 2 = 26, 582 . n 100 Выборочная исправленная дисперсия: 1 1 S2 = ( x − xi ) 2 ni = 3238, 53 ≈ 32, 712 . ∑ n −1 99 Выборочное исправленное среднее квадратическое отклонение: S = 32, 712 ≈ 5, 719 . Таким образом, предполагаем, что исследуемая величина имеет нормальный закон распределения с параметрами a = 26,582 и σ = 5, 719 . С помощью критерия согласия Пирсона проверим, согласуется ли гипотеза с опытными данными на уровне значимости α = 0, 01 . 2 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Пронормируем случайную величину X , то есть перейдем к величине Z = x−x , вычислим S xi − x x −x , zi +1 = i +1 . S S Вычислим теоретические (выравнивающие частоты) ni ' = nPi , где n = 100 , концы интервалов по формулам zi = Pi = Φ ( z i +1 ) − Φ ( z i ) - вероятность попадания в интервал ( zi , zi +1 ) , Φ(z ) - функция Лапласа. Для нахождения значений составим расчетную таблицу: xi xi +1 ni zi zi +1 Φ ( zi ) Φ( zi +1 ) Pi ni ' 17 23 29 35 41 47 Сумма 23 29 35 41 47 53 27 45,2 22,5 2,8 1,4 1,1 100 -1,675 -0,626 0,423 1,472 2,521 3,570 -0,626 0,423 1,472 2,521 3,570 4,619 -0,500 -0,234 0,164 0,429 0,494 0,500 -0,234 0,164 0,429 0,494 0,500 0,500 0,266 0,398 0,266 0,065 0,006 0,000 26,557 39,820 26,570 6,468 0,567 0,018 100,000 Последние три интервала объединим как малочисленные: ni ni ' (ni − ni ')2 ni ' 27 45,2 22,5 5,3 26,557 39,820 26,570 7,054 0,007 0,727 0,623 0,436 Сумма 1,794 Сравним эмпирические и теоретические частоты, используя критерий Пирсона: (n − ni ')2 χ2 = ∑ i = 1, 794 . ni ' По таблице критических точек распределения χ по уровню значимости α = 0, 01 и числу 2 степеней свободы k = 4 - 3 = 1, находим χ кр. = 6,6. Так как χ набл. = 1,794 < χ то можно принять гипотезу о нормальном распределении данной величины. 2 2 2 кр. = 6,6, Задача 2. Среди 500 молодых семей, живущих с родителями, было зарегистрировано 38 разводов в течение первых трех лет совместной жизни. Построить приближенный доверительный интервал для вероятности развода в таких семьях с уровнем доверия 0,9. Решение. Доверительный интервал для вероятности развода p найдем по формуле 3 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей w(1 − w) w(1 − w) 38 < p < w + tкр , где w = = 0, 076 n n 500 tкр = Φ −1 (0,9 / 2) = Φ −1 (0, 45) = 1, 645 . Подставляем: w − tкр 0, 076 − 1, 645 0, 076 (1 − 0, 076 ) 500 < p < 0, 076 + 1, 645 0, 076 (1 − 0, 076 ) 500 - выборочная доля, , 0, 0565 < p < 0, 0955 . Ответ: от 5,65% до 9,55%. Задача 3. Известно, что случайная величина Х имеет нормальное распределение с неизвестным математическим ожиданием а и известной дисперсией σ2=144. По выборке объема n=90 вычислено выборочное среднее хв=120. Определить доверительный интервал для неизвестного параметра а, отвечающий заданной надежности γ=0,9. Решение. Найдем доверительный интервал для математического по формуле: xB − t σ < a < xB + t σ , n n где n = 90 , xB = 120 , σ = 144 = 12 , t определяется по доверительной вероятности из таблицы распределения Лапласа t (0, 9) = Φ −1 (0, 9 / 2) = Φ −1 (0, 45) = 1, 645 . Получаем: 12 12 120 − 1, 645 < a < 120 + 1, 645 90 90 117, 919 < a < 122, 081 . Ответ: от 117,919 до 122,081. Задача 4. При обработке исторических материалов профессиональной переписи 1914 года были получены следующие данные: из 329 рабочих фабрики Тамбовской губернии на полевые работы уходило 146 человек, а из 494 рабочих фабрики Ярославской губернии уходило 263 человек. Проверить гипотезу о равенстве вероятности ухода рабочих на полевые работы для двух губерний при уровне значимости 0,1. Решение. Нулевая гипотеза: H 0 : p1 = p2 . В качестве конкурирующей гипотезы выберем H1 : p1 ≠ p2 . Вычислим наблюдаемое значение критерия по формуле: m1 m2 − n1 n2 U набл = , m1 + m2 m1 + m2 1 1 1 − + n1 + n2 n1 + n2 n1 n2 Где 4 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей n1 = 329, n2 = 494, m1 = 146, m2 = 263. Получаем: U набл = 146 263 − 329 494 ≈ −2, 75 146 + 263 146 + 263 1 1 + 1 − 329 + 494 329 + 494 329 494 1 − α 1 − 0,1 = = 0, 45 , откуда 2 2 uкр = 1, 645 . Так как | U набл |= 2, 75 > 1, 645 = uкр , нулевую гипотезу следует отвергнуть. Вычисляем критическое значение из равенства Φ ( uкр ) = Вероятности ухода рабочих на фабриках разных губерний отличаются значимо. Задача 5. При уровне значимости α=0,1 проверить гипотезу о равенстве дисперсии двух нормально распределенных случайных величин X и Y на основе выборочных данных, приведенных в следующих таблицах: X xi ni yi mi Y 35 1 36 3 37 3 37 5 39 5 38 2 40 4 44 1 41 4 42 4 Решение. Вычислим по данным выборок исправленные выборочные дисперсии S x2 , S y2 . xi ni x i ni ( xi − x) 2 ni 35 37 39 40 41 Сумма 1 3 5 4 4 17 35 111 195 160 164 665 16,955 13,453 0,069 3,114 14,173 47,765 1 1 xi ni = 665 ≈ 39,118 . ∑ n 17 Исправленная (несмещенная) выборочная дисперсия Выборочная средняя x = Sx2 = 1 1 ( xi − x)2 ni = 47,765 = 2,985 ∑ n −1 16 yi mi y i mi ( y i − y ) 2 mi 36 37 38 44 42 Сумма 3 5 2 1 4 15 108 185 76 44 168 581 22,413 15,022 1,076 27,738 42,684 108,933 5 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей 1 1 yi mi = 581 ≈ 38, 733 . ∑ m 15 Исправленная (несмещенная) выборочная дисперсия Выборочная средняя y = S y2 = 1 1 ( yi − y)2 mi = 108,933 = 7,781 ∑ m −1 14 Вычислим наблюдаемое значение критерия Fнабл = S y2 S 2 x = 7, 781 ≈ 2, 606 2,985 Найдем критическую точку при уровне значимости α / 2 = 0,05 и числам степеней свободы k1 = m − 1 = 14 , k2 = n − 1 = 16 , Fкр = 2,373 . Так как Fнабл = 2, 606 > 2,373 = Fкр , следует отвергнуть нулевую гипотезу. Дисперсии различаются значимо. Задача 6. Результаты наблюдений переменных X и Y приведены в таблице. Найти выборочный коэффициент линейной корреляции и уравнение прямой регрессии Y по X. X Y 20 40 60 80 100 10 4 4 12 14 16 18 2 6 5 5 10 1 2 3 8 3 10 6 4 20 22 4 7 4 2 5 5 Решение. Построим ряды распределений для X и Y , вычислим их характеристики (выборочное среднее и выборочное среднее квадратическое отклонение). xi ni 10 12 14 16 18 20 22 Сумма Среднее 11 7 18 20 17 11 16 100 xi ⋅ ni ( xi − x) 2 ⋅ ni 110 84 252 320 306 220 352 1644 16,44 456,2096 137,9952 107,1648 3,872 41,3712 139,4096 494,6176 1380,64 13,8064 1 1 xi ni = 1644 = 16, 44 ∑ n 100 1 1 Выборочная дисперсия D x = ∑ ( xi − x) 2 ni = 1380, 64 = 13,8064 n 100 Выборочная средняя x = 6 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Выборочное квадратическое отклонение σ x = Dx = 3, 716 yi ni yi ⋅ ni ( yi − y ) 2 ⋅ ni 20 40 60 80 100 Сумма Среднее 17 17 28 20 18 100 340 680 1680 1600 1800 6100 61 28577,000 7497,000 28,000 7220,000 27378,000 70700,000 707,000 1 1 yi ni = 6100 = 61, 0 ∑ n 100 1 1 Выборочная дисперсия D y = ∑ ( yi − y ) 2 ni = 70700 = 707, 0 n 100 Выборочная средняя y = Выборочное квадратическое отклонение σ y = Dy = 26,589 Коэффициент линейной корреляции вычислим по формуле r = Найдем сумму Y\X 20 40 60 80 100 10 0 4 4 0 3 ∑n ∑n x yi − nx y xy i nσ xσ y . x yi = 100840 . Расчеты в таблице xy i 12 2 0 2 3 0 14 6 0 8 0 4 16 5 5 10 0 0 18 0 1 0 10 6 20 0 0 4 2 5 22 4 7 0 5 0 nxy xi nxy xi yi 276 292 416 366 294 5520 11680 24960 29280 29400 100840 Тогда коэффициент корреляции: 100800 − 100 ⋅16, 44 ⋅ 61 r= ≈ 0, 056 . 100 ⋅ 3, 716 ⋅ 26, 589 Связь очень слабая, прямая по направлению. Напишем уравнение регрессии Y на X . Оно имеет вид yx − y = r все величины: yx − 61 = 0, 056 26,589 ( x − 16, 44) , 3, 716 yx = 0, 402 x + 54,379 . 7 σy ( x − x) . Подставляем σx Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Задача 7. При уровне значимости α=0,05 методом дисперсионного анализа проверить нулевую гипотезу о влиянии фактора на качество объекта на основании пяти измерений для трех уровней фактора. Данные измерений приводятся в таблице: Номер измерения 1 2 3 4 5 Ф1 34 36 26 25 30 Ф2 38 30 34 36 38 Ф3 28 24 22 20 23 Решение. Составим дисперсионную таблицу: Φ1 Φ2 Φ3 i yi1 yi21 yi 2 yi22 yi 3 yi23 1 2 3 4 5 34 36 26 25 30 1156 1296 676 625 900 38 30 34 36 38 1444 900 1156 1296 1444 28 24 22 20 23 784 576 484 400 529 T j = ∑ yij Sj = ∑ y 151 176 2 ij T 2 j 4653 22801 117 6240 30976 444 2773 13689 Сумма 13666 67466 Найдем общую и факторную суммы квадратов отклонений, учитывая, что число уровней фактора p = 3 , число испытаний на каждом уровне q = 5 . Получаем: Sобщ 2 1 p 1 2 = ∑Sj − ∑ T j = 13666 − 444 = 523, 6 pq 15 j =1 j =1 p 2 1 p 1 p 1 1 2 Sфакт = ∑ T j2 − ∑ T j = 67466 − 444 = 350,8 q j =1 pq j =1 5 15 Найдем остаточную сумму квадратов отклонений Sост = S общ − S факт = 523, 6 − 350,8 = 172,8 Найдем дисперсии S 350,8 2 sфакт = факт = = 175, 4 p −1 2 Sост 172,8 2 sост = = = 14, 4 p (q − 1) 3⋅ 4 Сравним факторную и остаточную дисперсию с помощью критерия Фишера-Снедекора. Найдем наблюдаемое значение критерия 8 Контрольная работа выполнена на сайте www.MatBuro.ru ©МатБюро. Решение задач по математике, статистике, теории вероятностей Fнабл = 2 sфакт 2 ост s = 175, 4 = 12,18 . 14, 4 По числу степеней свободы k1 = 2 , k2 = 12 и по уровню значимости α = 0, 05 находим критическую точку Fкрит = 3,88 . Так как Fнабл > Fкрит , следует отвергнуть гипотезу, влияние фактора значимо. 9