Задание 2.1. Точечные оценки математического ожидания. Точечные оценки дисперсии. Необходимо найти состоятельные несмещенные оценки математического ожидания М[] и дисперсии D[] случайной величины по приведенным в задании выборочным значениям x1 , x2 ,..., xn . ORIGIN 1 3 921 2 918 1 933 D1 4 945 2 957 1 901 1 i 1 18 2 944 1 921 4 911 D2 3 969 1 950 3 978 D stack ( D1D2) 2 1 2 910 2 1 911 3 2 912 4 3 913 5 1 914 D 6 1 915 7 1 950 8 2 943 9 3 949 10 2 990 11 1 957 12 1 968 Далее необходимо определить объем выборки: 12 n Di1 i1 n 27 Следует найти точечную оценку математического ожидания М[], состоятельную смещенную оценку дисперсии среднеквадратичное отклонение Dx: Mx 1 n Dx 12 Di1 Di2 i1 12 Mx 939.66667 D D Mx n 1 i 1 i 2 1 i1 2 Dx 577.23077 Dx1 и несмещенное Dx1 12 D D Mx n i 1 i 2 1 2 Dx1 555.85185 i1 Математическим ожиданием случайной величины называют сумму произведений всех возможных значений этой случайной величины на соответсвующие им вероятности в объеме выборки. По-другому, это среднее значение случайной величины. Дисперсия случайной величины – это математическое ожидание квадрата ее отклонений от среднего значения. Иными словами, это величина, характеризующая степень отклонения значений случайной величины от ее среднего значения. Несмещенная оценка случайного события – это оценка, мат.ожидание которой равно оцениваемому параметру, дисперсия с увеличением объема выборки стремится к нулю. Соответственно, смещенная оценка- это такая оценка, мат. ожидание которой не равно параметру. Вывод: данная выборка характеризуется такими значениями: оценка математического ожидания Mx = 939.66667, несмещенное среднеквадратичное отклонение Dx = 577.23077 и смещенное среднеквадратичное отклонение Dx1 = 555.85185. Из приведенных вычислений видно, что смещенная оценка даёт заниженное значение оценки дисперсии. 2 Задание 2.2. Точечная оценка вероятности события. В данном задании необходимо смоделировать несколько выборок значений случайной величины, имеющей распределение Бернулли с заданным значением параметра р = 0,6. Биноминальное распределение – это распределение случайных величин, количества «успехов» в последовательности из независимых случайных экспериментов, таких, что вероятность «успеха» в каждом из них постоянна. Распределение Бернулли моделирует случайный эксперимент, когда заранее известна вероятность успеха или неудачи. Вычисление для каждого значения п точечных оценки p вероятности р. Функция rbinom(n, size, prob) генерирует количество случайных значений из заданной выборки с заданной вероятностью, т.е. формирует вектор из k случайных чисел, каждое из которых равно числу успехов в серии из n независимых испытаний с вероятностью успеха p в каждом. k 1 15000 p 0.6 rbinom ( 1 10k 0.3) P k 10k 1 , где 𝑃𝑘 – вероятность равномерного биноминального распределения. График зависимости величины р от объема выборки выглядит так: Pk 0.6 0.4 0.3 0.3 0.2 0 0 4 5 510 110 10 k 3 1.510 5 С увеличением объема выборки разброс вероятности равномерного биноминального распределения значений случайной величины стремится к нулю. Далее вычисляется значение отклонения, равное 2.5% от оптимального значения: 0.6 100 2.5 0.015 С учетом отклонения график выглядит так: 0.32 Pk 0.31 0.6 0.3 0.3 0.3 0.29 0.28 3 8.510 910 3 3 9.510 4 110 10 k Вывод: для того, чтобы отклонение идеального значения p = 0.6 не превышало 5% (то есть, входило в интервал [0.285; 0.315]), необходимо брать значение выборки равное, как минимум, 9240. 4 Задание 2.3. Точечная оценка параметров равномерного распределения. Необходимо смоделировать несколько выборок разного объема значений случайной величины, имеющей равномерное распределение на отрезке [0; θ] при значении θ = 3. (θ- верхняя граница интервала при распределении в условиях данной задачи) Непрерывное равномерное распределение — распределение случайной величины, принимающей некоторому промежутку конечной значения, длины, принадлежащие характеризующееся тем, что вероятности появления каждого значения выборки на этом промежутке почти всюду постоянна. Для этого нужно для каждого значения п вычислить точечные оценки T1k и T3k и их отклонение p1 и p3 (функция runif(m, a, b) возвращает вектор m случайных чисел, имеющих равномерное распределение, в котором b и a являются граничными точками интервала): k 1 20 T1 k T1 20 10k runif (10k 03) 3.061 T3 k T3 2 ORIGIN 1 20 10k 1 10k max( runif ( 10k 0 3) ) 2.998 График зависимости величин T1k и T3k от объема выборки: 5 4 4 3 T1k T3k 3 2 0.8 1 0 50 0 100 150 200 10k 200 Вывод: как видно из приведенных выше вычислений, значение θ = 3 при объеме выборки 20 T120 = 3.061, а T320 = 2.998, следовательно, вторая оценка более точная. T3 T1 k k 1.95972 2.10139 1.89134 mean( T1) 1.9869 3 2.11618 mean( T3) 2.00488 2.01885 var ( T3) 1.22223 10 2.01051 var ( T1) 8.56156 10 2.00358 1.91996 1.95834 2.16644 2.03305 2.08445 2.002 1.95345 2.01989 2.10682 1.91692 1.92085 2.00767 1.98123 2.00006 1.94959 2.01042 1.90429 2.01088 1.89234 1.98066 1.84792 2.00226 1.87908 ... ... 6 3 Вывод: вследствие того, что дисперсия оценки θ3 меньше θ1, имеем то, что θ3 является более точной оценкой. 7