ЛАБОРАТОРНАЯ РАБОТА Исследование свойств выборочного среднего Цель работы: Исследование статистическими методами сходимости по вероятности выборочного среднего. Основные соотношения: Выборочное среднее X 1 n X i с точки зрения математической статистики есть n i 1 среднее арифметическое независимых одинаково распределенных случайных величин X 1 , X 2 ,, X n . Следовательно, если для генеральной существуют конечные математическое ожидание и дисперсия, то для выборочного среднего справедлив закон больших чисел Чебышева. Теорема (Закон больших чисел в форме Чебышева). Если X 1 , X 2 ,, X n , - последовательность независимых и одинаково распределенных случайных величин, имеющих конечные математическое ожидание M ( X 1 ) и дисперсию D( X 1 ) , то среднее арифметическое этих величин сходится по вероятности к их математическому ожиданию: X 1 n p X i M ( X1 ) , n i 1 1 n или, для любого 0 : P X i X 1 1 при n . n i 1 Статистически данное утверждение можно проверить следующим образом. Генерируем последовательности случайных величин разной длины, вычисляем среднее значение для каждой последовательности и сравниваем с математическим ожиданием величин (поскольку мы сами генерируем случайные последовательности, то математическое ожидание генеральной совокупности нам известно). Если условия теоремы Чебышева выполняются, то с ростом n величина отклонения выборочного среднего X от математического ожидания величин M ( X 1 ) должна в среднем уменьшаться. Чтобы учесть случайный характер отклонений, следует для каждой длины последовательности генерировать несколько выборок (последовательностей) значений и сравнивать либо средние значения отклонений для выборок различного объема, либо величины разброса значений W X max X min . Кроме того, если наблюдается сходимость по вероятности, то всегда можно для заданной величины отклонения и вероятности определить необходимый объем выборки N, так, чтобы P X M ( X 1 ) . Это можно сделать, например, используя центральную предельную теорему (ЦПТ). Согласно ЦПТ, если X 1 , X 2 ,, X n , - независимые и одинаково распределенные случайных величины, имеющих конечные математическое ожидание M ( X 1 ) и дисперсию D( X 1 ) , то их среднее (при n 1 ) имеет приближенно нормальное распределение с математическим ожиданием M ( X 1 ) и дисперсией D( X 1 ) / n . Тогда: , P(| X M ( X 1 ) | ) 2 D( X ) / n 1 где x - функция Лапласа. Разрешив уравнение: 2 D( X ) / n 1 относительно n, получим необходимый объем выборки N. Определив N, можно убедиться, что величина отклонения не превышает (с вероятностью ), сгенерировав несколько последовательностей длиной N и подсчитав для каждой из них величину отклонения выборочного среднего от математического ожидания. Если для генеральной совокупности не существует конечного математического ожидания, то сходимость выборочного среднего в этом случае не должна наблюдаться (то есть разброс значений выборочных средних в этом случае с ростом объема выборок не должен уменьшаться). Задание. Задан закон распределения F случайной величины (приложение 1). Требуется: a) Для каждого из n {15, 60, 240, 960} , сгенерировать, используя генератор случайных чисел пакета EXCEL, по 10 выборок объемом n из генеральной совокупности F (для генерации случайных чисел распределенных по законам, которые отсутствуют в генераторе случайных чисел пакета EXCEL см. приложение 2). Для каждой выборки определить среднее: X 1 n X i , данные представить в виде таблицы: n i 1 Выборочное среднее X N п/п выборки 1 2 n=15 n=60 n=240 n=960 … 10 X min X max W X max X min Таблица 1. Значения выборочных средних X для выборок различного объема Оценить изменение величины разброса W X max X min с ростом объема выборки. Сделать выводы о сходимости выборочных характеристик. b) Если наблюдается сходимость выборочного среднего, используя центральную предельную теорему определить для заданной в задании (приложение 1) вероятности и величины отклонения необходимый объем выборки N, так чтобы P X M ( X 1 ) . Проверить, сгенерировав 10 выборок найденного объема N и подсчитав для каждой величину X M ( X 1 ) . Примечание. Указанные в задании действия проделать для каждого из двух законов распределений, указанных в варианте задания. Приложение 1. Варианты заданий. Вариант 1. 1) F - закон равномерной плотности на (1; 3). 0,01 , 0,95 . 1 1 2) F - закон с плотностью распределения f ( x) , x (, ) . 0,001 , 0,9 . 1 x2 Вариант 2. 1) F - нормальный закон с параметрами a 1 и 2 . 0,05 , 0,9 . 1 2) F - закон с плотностью распределения f ( x) , x (0, ) . 0,01 , 0,99 . (1 x ) 2 Вариант 3. 1) F - биномиальное распределение с n 20 и p 0,2 . 0,05 , 0,9 9. 1 1 2) F - закон с плотностью распределения f ( x) , x (, ) . 0,02 , 1 ( x 2) 2 0,97 . Вариант 4. 1). F - закон Пуассона с параметром 4 . 0,03 , 0,8 . 2). F - закон с плотностью распределения f ( x) 1/ 3 , x (0, ) . 0,01 , 0,9 . (1 x / 3) 2 Вариант 5. 1. F - показательный закон с параметром 0,8 . 0,02 , 0,85 . 1 1 2. F - закон с плотностью распределения f ( x) , x (, ) . 0,03 , 1 ( x 1) 2 0,85 Вариант 6. 1. F - показательный закон с параметром. 2 . 0,01 , 0,9 . 1 2. F - закон с плотностью распределения f ( x) , x (1, ) . 0,02 , 0,999 . (2 x) 2 Вариант 7. 1. F - закон Бернулли с параметром p 0,16 . 0,01 , 0,95 . 1 1 2. F - закон с плотностью распределения f ( x) , x (, ) . 0,03 , 5 1 ( x / 5) 2 0,9 . Вариант 8. 1. F - нормальный закон с параметрами a 7 и 2 . 0,03 , 0,8 . 1 2. F - закон с плотностью распределения f ( x) , x (2, ) . 0,05 , 0,8 . ( x 1) 2 Вариант 9. 1. F - биномиальный закон с параметрами n 50 и p 0,35 . 0,1 , 0,95 . 1 2. F - закон с плотностью распределения f ( x) , x (, ) . 0,01 , 0,92 . 1 2 x2 Вариант 10. 1. F - закон равномерной плотности на (-3; 3). 0,04 , 0,92 . 1 2. F - закон с плотностью распределения f ( x) , x (3, ) . 0,002 , 0,9 . ( x 2) 2 Вариант 11. 1. F - нормальный закон с параметрами a 2 и 1. 0,03 , 0,99 . 2. F - закон с плотностью распределения f ( x) 1 2 , x (, ) . 0,02 , 0,88 . 2 x2 Вариант 12. 1. F - биномиальное распределение с n 30 и p 0,3 . 0,05 , 0,95 . 3 2. F - закон с плотностью распределения f ( x) , x (0, ) . 0,03 , 0,94 . (3 x) 2 Вариант 13. 1. F - закон Пуассона с параметром 4 . 0,025 , 0,8 . 2. F - закон с плотностью распределения f ( x) 1 3 , x (, ) . 0,005 , 0,8 . 3 x2 Вариант 14. 1. F - показательный закон с параметром 0,1 . 0,2 , 0,85 . 1 2. F - закон с плотностью распределения f ( x) 2 , x (1, ) . 0,04 , 0,98 . x Вариант 15. 1. F - нормальный закон с параметрами a 10 и 2 . 0,05 , 0,99 . 1 2. F - закон с плотностью распределения f ( x) , x (, ) . 0,08 , 2 1 ( x 1) 2 0,999 . Вариант 16. 1. F - закон Бернулли с параметром p 0,35 . 0,01 , 0,98 . 1 2. F - закон с плотностью распределения f ( x) , x (1, ) . 0,01 , 0,99 . 3 3 x4 Вариант 17. 1. F - нормальный закон с параметрами a 0 и 3 . 0,04 , 0,85 . 1 1 2. F - закон с плотностью распределения f ( x) , x (, ) . 0,05 , 2 1 ( x / 2) 2 0,98 . Вариант 18. 1. F - биномиальный закон с параметрами n 20 и p 0,05 ., 0,015 , 0,92 . 1 2. F - закон с плотностью распределения f ( x) , x (1, ) . 0,02 , 0,95 . 2 x3 Вариант 19. 1. F - закон равномерной плотности на 0, 4 . 0,02 , 0,9 . 1 2. F - закон с плотностью распределения f ( x) , x (0, ) . 0,008 , 0,99 . 33 ( x 1) 4 Вариант 20. 3. F - показательный закон с параметром 2 . 0,01 , 0,80 . 1 4. F - закон с плотностью распределения f ( x) , x (0, ) . 0,001 , 2 ( x 1) 3 0,82 . Приложение 2. Генерация случайных чисел. Генерация случайных чисел при помощи пакета EXCEL. Для генерации случайных чисел в пакете EXCEL 2003 выберите меню “Cервис”, “Пакет анализа”, ”Генерация случайных чисел”. Если в меню “Сервис” отсутствует подменю “Пакет анализа”, следует зайти в меню “Сервис”, “Надстройки” и подключить “Пакет анализа”. В EXCEL 2007 выберите меню “Данные”, “Анализ данных”. Если в меню “Данные” отсутствует подменю “Анализ данных”, то следует нажать кнопку “Office”, перейти в “Параметры Excel”, выбрать “Надстройки”, нажать “Перейти” и подключить “Пакет анализа”. Параметры генератора случайных чисел “число переменных” и ”число случайных чисел”. определяют соответственно число столбцов и строк для вывода случайных чисел. Можно использовать, например, “число переменных” для того, чтобы получить сразу несколько независимых выборок-столбцов объема, определяемого параметром “число случайных чисел”. Генерация случайных чисел по законам, отсутствующим в пакете EXCEL. Для генерации случайных чисел распределенных по законам, которые отсутствуют в генераторе случайных чисел пакета EXCEL, можно использовать следующие приемы. 1. Воспользуемся следующей теоремой из курса “Теория вероятностей”: Если случайная величина имеет непрерывную и строго монотонную 1 1 функцию распределения F (x) , а величина U 0,1 , то F ( ) , где F ( x) функция обратная к F (x) . Итак, если y F (x ) - функция распределения непрерывной случайной величины, для которой можно найти обратную x F 1 ( y ) , то генерируя случайную величину , равномерно распределенную на [0, 1] , получим величину F 1 ( ) с требуемой функцией распределения F (x) . Данный прием можно использовать для генерации случайных величин, распределенных по показательному закону, по закону Коши и др. 2. Если случайная величина есть композиция других случайных величин, то генерируем эти величины и строим из них искомую величину. Данный прием можно использовать, например, для получения случайных величин распределенных по законам 2 , Стьюдента и др. Так, случайной величиной, имеющей распределение "хи-квадрат" с k степенями свободы называют величину равную сумме квадратов k независимых k стандартных нормальных случайных величин, т.е. 2 n2 , N 0,1 . Случайной n 1 величиной t , имеющей распределение Стьюдента с k степенями свободы называют величину равную t 2 k , где - случайная величина распределенная по закону N 0,1 , а 2 - независимая от нее случайная величина распределенная по закону хи- квадрат с k степенями свободы. 3. Используем “физический” смысл случайной величины. Например, случайная величина, распределенная по геометрическому закону, есть номер первого успешного испытания в бесконечной серии испытаний по схеме Бернулли. Тогда, можно сгенерировать последовательность случайных величин, распределенных по закону Бернулли, и определить порядковый номер всех единиц в этой последовательности, сбрасывая счетчик после появления каждой единицы в ноль. Последовательность номеров, очевидно, будет иметь геометрическое распределение. Приблизительно необходимую длину исходной последовательности можно оценить следующим образом: если M 1 / p - среднее число попыток до наступления успеха, то потребуется в среднем n M чисел, распределенных по закону Бернулли.