Загрузил sleepy cat

4 lb моделирование миронов

реклама
Задание 4.1.
Доверительные интервалы для математического ожидания
Доверительный интервал для дисперсии
Необходимо найти доверительные интервалы для математического
ожидания М[] и дисперсии D[] по выборке x1 , x2 ,..., xn из нормального
распределения.
Доверительный интервал- это интервал, в котором находится истинное
значение с заданной доверительной вероятностью..
Доверительная
вероятность-
это
вероятность
того,
что
истинное
(генеральное) значение характеристики попадет в заданный интервал.
Идет введение выборки в виде матрицы (1 столбец – количество раз, когда
соответствующее значение в 2 столбце встречается в выборке):
 3 904.3 


 1 910.2 
 6 923.6 
 7 928.8 


 9 944.0 
 1 941.2 
D  

 4 956.4 
 5 953.6 
 4 998.8 


 6 966.0 
 2 900.1 
 1 978.4 


ORIGIN 1
i  1 12
Далее вычисляются точечные оценки математического ожидания и
дисперсии М[] и D[]:
12
n 
 Di1
n  49
i1
Mx 
Dx 
1
n
12

 Di1Di2
Mx  944.22245
i1
1
n 1
12

 Di1 Di2  Mx 
i1
2
Dx  646.25303
Вычисляются
95%-ный
доверительный
интервал
для
математического ожидания (функция qt(p, d) – квантиль распределения
Стьюдента, где d определяет степень свободы.
Квантиль – значение случайной величины с заданной доверительной
вероятностью или это значение, которое заданная случайная величина не
превышает с фиксированной вероятностью.):
t  qt  1 
0.05

2
n 
t  2.00958

xl  Mx  t 
Dx
xr  Mx  t 
Dx
xl  936.92439
n
xr  951.52051
n
Вычисляется 90%-ный доверительный интервал для дисперсии (Функция
qchisq(p, d) квантиль квадратного распределения):
hl  qchisq 
0.1
 2
n  1
hr  qchisq  1 

hl  33.09808

0.1
2
n  1

hr  65.17077
И затем находится доверительный интервал дисперсии:
dl  Dx
dr  Dx
( n  1)
hr
( n  1)
hl
Вывод:
dl  475.98251
dr  937.21895
были
найдены
95%-ный
доверительный
интервал
для
математического ожидания М[] = 944.22245, равный [33.09808; 65.17077] и
90%-ный доверительный интервал для дисперсии D[] = 646.25303, равный
[475.98251; 937.21895]. Иными словами, мат.ожидание и дисперсия попадают в
свои доверительные интервалы с вероятностью 95% и 90% соответственно.
3
Задание 4.2.
Доверительный интервал для параметра пуассоновского распределения.
Необходимо найти доверительный интервал для параметра  по заданной
выборке x1, x2…xn из пуассоновского распределения.
Распределение Пуассона- это распределение числа появления редких
независимых друг от друга событий, которые происходят за фиксированное
время.
Если
количество
испытаний
достаточно
велико,
а
вероятность
появления события
в отдельно взятом испытании весьма
мала, то вероятность того, что в данной серии испытаний событие появится
ровно раз, можно приближенно вычислить по формуле Пуассона:
, где
Функция rpois(m, λ) формирует вектор m случайных чисел, имеющих
распределение Пуассона ( λ>0).
Сгенерируем выборку из 500 значений случайной величины, имеющей
пуассоновское распределение с заданным параметром  по первым 100, 150,
200, …, 500 элементам выборки.
  0.1
  5
N  500
P  rpois ( N  )
Далее необходимо построить гистограмму зависимости вероятности
попадания элементов массива в границы от pk.
Pmax max( P)
Pmin  min( P)
R  Pmax  Pmin
Pmax  12
Pmin  0
R  12
PS  sort( P)
m  9
 
j  1 m
k  1 m  1
p  Pmin 
j

2
R
m
( 2 j  1)
f  hist ( p PS)
fk
N
pk
4
После нужно найти для заданного значения доверительной
вероятности  квантиль уровня 1–0.5 стандартного нормального
распределения, а после – точечную оценку параметра  (доверительный
интервал от объема выборки). Функция qnorm(p, μ, σ): возвращает обратное
кумулятивное распределение вероятности для вероятности p:
(qnorm(P,µ,σ) – обратная функция нормального распределения, P –
значение вероятности; µ – математическое ожидание; σ – среднеквадратичное
отклонение.)
x  qnorm  1 


2
0 1
x  1.64485

n  10 500
est ( n ) 
1
n
n

 Pj
est ( 50)  4.52
est ( 100)  4.69
j 1
left ( n )   est ( n ) 

x 
2
right ( n )   est ( n ) 

2 n 
left ( 500)  4.80736

x 
2

2 n 
right ( 500)  5.13534
7
est ( n) 6
left ( n) 5
right ( n)
4
3
0
100
200
300
400
500
n
На графике можно заметить, что доверительный интервал сужается с
увеличением выборки. График зависимости оценки параметра  от объема
выборки. С увеличением объема выборки параметр  становится точнее.
Разность между правой и левой границей интервала сужается при
увеличении объема выборки:
5
2.5
2
right ( n)  left ( n)
1.5
1
0.5
0
0
100
200
300
400
500
n
Вывод: для выборки из 500 значений случайной величины, имеющей
распределение Пуассона с параметром  = 5, был получен 90%-ный
доверительный интервал для параметра [4.80736; 5.13534].
6
Задание 4.3.
Доверительный интервал для вероятности.
Необходимо найти доверительный интервал для вероятности события по
заданным значениям числа испытаний n и числа m появлений события в серии
из n испытаний:
Найдем для заданного значения доверительной вероятности =0.1
квантиль уровня 1–0.5 стандартного нормального распределения:
  0.1
n  70
x  qnorm  1 


2
m  27
0 1
x  1.64485

Найдем точечную оценку параметра p и вычислим доверительный
интервал для параметра р с заданным значением доверительной вероятности
=0.1.
p 
m
n
p  0.38571
pp  p
pleft   sin 
 acos  p   

2

pright   sin 



2
x 

pleft  0.27328
2 n 
 acos  p  

2
x 

2 n 
2
pright  0.51748
Далее поиск доверительного интервала для параметра р:
7
n  10 70
p ( n ) 
m( n )
 acos  p ( n )  
x 
m( n)  rbinom( 10n p )
pleft ( n )   sin 

2

pright ( n )   sin 



2
Вывод:
1
n

2 n 
 acos  p ( n )  

2
x 
2

2 n 
Были найдены точечная оценка параметра p = 0.38571; Точечные
оценки доверительных интервалов pleft = 0.27328 и pright = 0.51748.
График показывает, что доверительный интервал сужается с увеличением
объема выборки. С ростом объема выборки п растет и точность вычисления
границ доверительного интервала.
0.8
pleft ( n) 0.6
pright ( n)
0.4
pp
0.2
0
0
20
40
60
80
n
Был получен 90%-ный доверительный интервал для вероятности события
p = 0.38571, который равен [0.27328; 0.51748].
8
Задание 4.4.
Доверительный интервал для коэффициента корреляции.
Необходимо
найти
доверительный
интервал
для
коэффициента
корреляции по заданной выборке x1 , y1 , x2 , y 2 ,..., xn , y n  из двумерной случайной
величины.
Коэффициент корреляции- это показатель зависимости двух величин.
x  1.64485
  0.1
x  qnorm 
1 
n  15


2
0 1


 2.7 0.931 0.257 1.383 0.315 3.05 0.054 0.835 1.661 3.333 1.12 0.377 2.28 5.092 3.124 

 14.902 18.113 6.138 13.813 0.227 4.927 2.576 1.184 14.433 1.527 11.866 2.121 6.254 1.58 13.972
XY  
20
10

 XYT  2
0
 10
 20
6
4
2
0
 XYT 
2
1
Далее вычисление средних значений:
Xmean 
1
n
n


XY
i1
Xmean  1.16653
1 i
Ymean 
1
n
n

 XY2 i
i1
Ymean  0.385
Вычисляются величины m , ˆ x2 и ˆ y2 :
9
4
m 
1
n
2x 
n

 XY1 i  Xmean XY2 i  Ymean
i1
n
XY1 i  Xmean 
n 
1

2
2y 
i1
n
XY2 i  Ymean
n 
1

2
i1
Вычисляются коэффициент корреляции и его доверительный интервал:
k 
m
k  0.42819
2x 2y
kleft  tanh  atanh ( k ) 


n  3
x 

n  3
x

kright  tanh  atanh ( k ) 

kleft  0.01714
kright  0.73176
Вычисляется коэффициент корреляции по другой формуле:
n
  1 i
XY
k 
 XY

2 i
i1

1
n
n


i1
n
XY

1 i
 XY2 i
i1
2 
2
 n
n
n
n







1 
1 
2
2



XY


XY



XY


XY

 1 i n 
 2 i n 
1 i
2 i
i  1




i  1
  i  1
i  1





k  0.42819
И в конце вычисляется доверительный интервал для коэффициента корреляции
с заданным значением доверительной вероятности , используя точечную
оценку коэффициента корреляции, найденную ранее:
kmin  tanh  atanh ( k ) 
x



n  3
kmax  tanh  atanh ( k ) 


n  3
kmin  0.01714

kmax  0.73176
x
Вывод: Было получено значение коэффициента корреляции
k = 0.42819,
корреляция (линейная связь между случайными величинами x,y) прямая средняя.
10
90%-ный доверительный интервал для k = [-0.01715; 0.93251]. При заданной
доверительной вероятности с ростом объема выборки ширина доверительного
интервала уменьшается и при
стремиться к нулю. При заданном объеме
выборки с ростом доверительной вероятности ширина доверительного
интервала тоже растет. Это означает, что, чем выше точность оценки, тем
меньше ее надежность (достоверность).
11
Скачать