Задание 4.1. Доверительные интервалы для математического ожидания Доверительный интервал для дисперсии Необходимо найти доверительные интервалы для математического ожидания М[] и дисперсии D[] по выборке x1 , x2 ,..., xn из нормального распределения. Доверительный интервал- это интервал, в котором находится истинное значение с заданной доверительной вероятностью.. Доверительная вероятность- это вероятность того, что истинное (генеральное) значение характеристики попадет в заданный интервал. Идет введение выборки в виде матрицы (1 столбец – количество раз, когда соответствующее значение в 2 столбце встречается в выборке): 3 904.3 1 910.2 6 923.6 7 928.8 9 944.0 1 941.2 D 4 956.4 5 953.6 4 998.8 6 966.0 2 900.1 1 978.4 ORIGIN 1 i 1 12 Далее вычисляются точечные оценки математического ожидания и дисперсии М[] и D[]: 12 n Di1 n 49 i1 Mx Dx 1 n 12 Di1Di2 Mx 944.22245 i1 1 n 1 12 Di1 Di2 Mx i1 2 Dx 646.25303 Вычисляются 95%-ный доверительный интервал для математического ожидания (функция qt(p, d) – квантиль распределения Стьюдента, где d определяет степень свободы. Квантиль – значение случайной величины с заданной доверительной вероятностью или это значение, которое заданная случайная величина не превышает с фиксированной вероятностью.): t qt 1 0.05 2 n t 2.00958 xl Mx t Dx xr Mx t Dx xl 936.92439 n xr 951.52051 n Вычисляется 90%-ный доверительный интервал для дисперсии (Функция qchisq(p, d) квантиль квадратного распределения): hl qchisq 0.1 2 n 1 hr qchisq 1 hl 33.09808 0.1 2 n 1 hr 65.17077 И затем находится доверительный интервал дисперсии: dl Dx dr Dx ( n 1) hr ( n 1) hl Вывод: dl 475.98251 dr 937.21895 были найдены 95%-ный доверительный интервал для математического ожидания М[] = 944.22245, равный [33.09808; 65.17077] и 90%-ный доверительный интервал для дисперсии D[] = 646.25303, равный [475.98251; 937.21895]. Иными словами, мат.ожидание и дисперсия попадают в свои доверительные интервалы с вероятностью 95% и 90% соответственно. 3 Задание 4.2. Доверительный интервал для параметра пуассоновского распределения. Необходимо найти доверительный интервал для параметра по заданной выборке x1, x2…xn из пуассоновского распределения. Распределение Пуассона- это распределение числа появления редких независимых друг от друга событий, которые происходят за фиксированное время. Если количество испытаний достаточно велико, а вероятность появления события в отдельно взятом испытании весьма мала, то вероятность того, что в данной серии испытаний событие появится ровно раз, можно приближенно вычислить по формуле Пуассона: , где Функция rpois(m, λ) формирует вектор m случайных чисел, имеющих распределение Пуассона ( λ>0). Сгенерируем выборку из 500 значений случайной величины, имеющей пуассоновское распределение с заданным параметром по первым 100, 150, 200, …, 500 элементам выборки. 0.1 5 N 500 P rpois ( N ) Далее необходимо построить гистограмму зависимости вероятности попадания элементов массива в границы от pk. Pmax max( P) Pmin min( P) R Pmax Pmin Pmax 12 Pmin 0 R 12 PS sort( P) m 9 j 1 m k 1 m 1 p Pmin j 2 R m ( 2 j 1) f hist ( p PS) fk N pk 4 После нужно найти для заданного значения доверительной вероятности квантиль уровня 1–0.5 стандартного нормального распределения, а после – точечную оценку параметра (доверительный интервал от объема выборки). Функция qnorm(p, μ, σ): возвращает обратное кумулятивное распределение вероятности для вероятности p: (qnorm(P,µ,σ) – обратная функция нормального распределения, P – значение вероятности; µ – математическое ожидание; σ – среднеквадратичное отклонение.) x qnorm 1 2 0 1 x 1.64485 n 10 500 est ( n ) 1 n n Pj est ( 50) 4.52 est ( 100) 4.69 j 1 left ( n ) est ( n ) x 2 right ( n ) est ( n ) 2 n left ( 500) 4.80736 x 2 2 n right ( 500) 5.13534 7 est ( n) 6 left ( n) 5 right ( n) 4 3 0 100 200 300 400 500 n На графике можно заметить, что доверительный интервал сужается с увеличением выборки. График зависимости оценки параметра от объема выборки. С увеличением объема выборки параметр становится точнее. Разность между правой и левой границей интервала сужается при увеличении объема выборки: 5 2.5 2 right ( n) left ( n) 1.5 1 0.5 0 0 100 200 300 400 500 n Вывод: для выборки из 500 значений случайной величины, имеющей распределение Пуассона с параметром = 5, был получен 90%-ный доверительный интервал для параметра [4.80736; 5.13534]. 6 Задание 4.3. Доверительный интервал для вероятности. Необходимо найти доверительный интервал для вероятности события по заданным значениям числа испытаний n и числа m появлений события в серии из n испытаний: Найдем для заданного значения доверительной вероятности =0.1 квантиль уровня 1–0.5 стандартного нормального распределения: 0.1 n 70 x qnorm 1 2 m 27 0 1 x 1.64485 Найдем точечную оценку параметра p и вычислим доверительный интервал для параметра р с заданным значением доверительной вероятности =0.1. p m n p 0.38571 pp p pleft sin acos p 2 pright sin 2 x pleft 0.27328 2 n acos p 2 x 2 n 2 pright 0.51748 Далее поиск доверительного интервала для параметра р: 7 n 10 70 p ( n ) m( n ) acos p ( n ) x m( n) rbinom( 10n p ) pleft ( n ) sin 2 pright ( n ) sin 2 Вывод: 1 n 2 n acos p ( n ) 2 x 2 2 n Были найдены точечная оценка параметра p = 0.38571; Точечные оценки доверительных интервалов pleft = 0.27328 и pright = 0.51748. График показывает, что доверительный интервал сужается с увеличением объема выборки. С ростом объема выборки п растет и точность вычисления границ доверительного интервала. 0.8 pleft ( n) 0.6 pright ( n) 0.4 pp 0.2 0 0 20 40 60 80 n Был получен 90%-ный доверительный интервал для вероятности события p = 0.38571, который равен [0.27328; 0.51748]. 8 Задание 4.4. Доверительный интервал для коэффициента корреляции. Необходимо найти доверительный интервал для коэффициента корреляции по заданной выборке x1 , y1 , x2 , y 2 ,..., xn , y n из двумерной случайной величины. Коэффициент корреляции- это показатель зависимости двух величин. x 1.64485 0.1 x qnorm 1 n 15 2 0 1 2.7 0.931 0.257 1.383 0.315 3.05 0.054 0.835 1.661 3.333 1.12 0.377 2.28 5.092 3.124 14.902 18.113 6.138 13.813 0.227 4.927 2.576 1.184 14.433 1.527 11.866 2.121 6.254 1.58 13.972 XY 20 10 XYT 2 0 10 20 6 4 2 0 XYT 2 1 Далее вычисление средних значений: Xmean 1 n n XY i1 Xmean 1.16653 1 i Ymean 1 n n XY2 i i1 Ymean 0.385 Вычисляются величины m , ˆ x2 и ˆ y2 : 9 4 m 1 n 2x n XY1 i Xmean XY2 i Ymean i1 n XY1 i Xmean n 1 2 2y i1 n XY2 i Ymean n 1 2 i1 Вычисляются коэффициент корреляции и его доверительный интервал: k m k 0.42819 2x 2y kleft tanh atanh ( k ) n 3 x n 3 x kright tanh atanh ( k ) kleft 0.01714 kright 0.73176 Вычисляется коэффициент корреляции по другой формуле: n 1 i XY k XY 2 i i1 1 n n i1 n XY 1 i XY2 i i1 2 2 n n n n 1 1 2 2 XY XY XY XY 1 i n 2 i n 1 i 2 i i 1 i 1 i 1 i 1 k 0.42819 И в конце вычисляется доверительный интервал для коэффициента корреляции с заданным значением доверительной вероятности , используя точечную оценку коэффициента корреляции, найденную ранее: kmin tanh atanh ( k ) x n 3 kmax tanh atanh ( k ) n 3 kmin 0.01714 kmax 0.73176 x Вывод: Было получено значение коэффициента корреляции k = 0.42819, корреляция (линейная связь между случайными величинами x,y) прямая средняя. 10 90%-ный доверительный интервал для k = [-0.01715; 0.93251]. При заданной доверительной вероятности с ростом объема выборки ширина доверительного интервала уменьшается и при стремиться к нулю. При заданном объеме выборки с ростом доверительной вероятности ширина доверительного интервала тоже растет. Это означает, что, чем выше точность оценки, тем меньше ее надежность (достоверность). 11