Работа 1 СТАТИСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ СОБЫТИЙ НА ОСНОВЕ ПРЕДСТАВЛЕНИЙ ОБ ЭЛЕМЕНТАРНЫХ ИСХОДАХ. Понятие метода Монте-Карло. Статистическая проверка классического определения вероятности Время на выполнение и защиту – 2 часа Цель работы: 1) уяснение сути классического определения вероятности; 2) получение практического опыта по применению теоремы Бернулли (статистического определения вероятности); 3) знакомство с применением метода Монте-Карло к решению вероятностных задач; 4) изучение ряда функций Excel и Mathcad. Понятие вероятности Вероятность события — это количественная мера возможности того, что некоторый факт (событие) осуществится при определённых условиях опыта. Невозможным называется такое событие Aневозм , наступление которого в данном опыте абсолютно исключено. Его вероятность принимается равной нулю P( Aневозм ) 0 . Достоверным называется событие Aдост , которое обязательно должно произойти при проведении опыта. Его вероятность принимается равной единице P( Aдост ) 1. Например, появление трёх «орлов» при бросании двух монет – невозможное событие. Появление от одного до шести очков при бросании игральной кости – достоверное событие. Событие A, не являющееся ни невозможным, ни достоверным (оно может либо наступить, либо нет), будем называть случайным. Вероятности событий ограничены неравенством 0 P ( A) 1 . «Границы» этого неравенства соответствуют невозможному и достоверному событиям, а вероятности случайных событий лежат внутри интервала (0, 1). Классическое определение вероятности Пространством элементарных исходов называется множество, содержащее все возможные результаты данного опыта. Элементы этого множества называют элементарными исходами. В результате проведения опыта происходит ровно один исход, заранее неизвестно – какой именно. Пусть всего имеется n равновозможных элементарных исходов некоторого опыта, m из которых ведут к наступлению события A (иначе говоря, благоприятствуют этому событию). Тогда вероятность события A равна: P( A) m . n (1.1) Подчеркнём, что классическое определение вероятности применимо только тогда, когда различные исходы опыта обладают симметрией и поэтому одинаково возможны. Пример 1. При бросании одной игральной кости имеется шесть равновозможных исходов: «1», «2», «3», «4», «5» и «6». Вероятность каждого из этих исходов равна 1 6 . Пример 2. При бросании двух игральных костей сумма выпавших очков может составить от 2 до 12. Однако соответствующие события «2», «3», «4», …, «12» не являются равновозможными. Рассмотрим, какие элементарные исходы благоприятствуют этим событиям, и найдём соответствующие вероятности (табл. 1.1). Элементарными исходами считаем любые возможные комбинации очков на двух брошенных костях (всего таких комбинаций существует 6 6 36 , поскольку каждый возможный результат бросания первой кости может сопровождаться любым возможным результатом бросания второй кости). Необходимо различать исходы с внешне одинаковым набором выпавших очков, но реализующиеся различным способом с учётом наличия двух разных костей. (Например, чтобы понять, что 1+2 и 2+1 есть разные исходы, достаточно представить себе, что первая кость – красного цвета, а вторая – жёлтого, и т.д.) Табл. 1.1. Бросание двух игральных костей Сумма очков на двух костях (событие) 2 3 4 5 6 7 8 9 10 11 12 Благоприятные исходы 1+1 1+2, 2+1 1+3, 3+1, 2+2 1+4, 4+1, 2+3, 3+2 1+5, 5+1, 2+4, 4+2, 3+3 1+6, 6+1, 2+5, 5+2, 3+4, 4+3 2+6, 6+2, 3+5, 5+3, 4+4 3+6, 6+3, 4+5, 5+4 4+6, 6+4, 5+5 5+6, 6+5 6+6 2 Число благоприятных исходов 1 2 3 4 5 6 5 4 3 2 1 Всего 36 Вероятность события 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 В сумме 1 Пример 3. При бросании трёх игральных костей сумма выпавших очков может составить от 3 до 18, и эти события, конечно, не являются равновозможными. Нахождение соответствующих вероятностей – значительно более сложная задача, чем в примере 2. Её решение представлено в табл. 1.2. Табл. 1.2. Бросание трёх игральных костей Сумма очков на трёх костях (событие) 3 4 5 6 … 10 11 … 18 Благоприятные исходы 1+1+1 1+1+2, 1+2+1, 2+1+1 1+1+3, 1+3+1, 3+1+1, 2+2+1, 2+1+2, 1+2+2 1+1+4, 1+4+1, 4+1+1, 3+2+1, 3+1+2, 2+1+3, 2+3+1, 1+2+3, 1+3+2, 2+2+2 … 5+4+1, 5+1+4, 4+5+1, 4+1+5, 1+5+4, 1+4+5, 5+3+2, 5+2+3, 3+5+2, 3+2+5, 2+3+5, 2+5+3, 6+3+1, 6+1+3, 3+1+6, 3+6+1, 1+6+3, 1+3+6, 6+2+2, 2+6+2, 2+2+6, 4+4+2, 4+2+4, 2+4+4, 4+3+3, 3+4+3, 3+3+4 … … 6+6+6 Число благоприятных исходов 1 3 Вероятность события 1 216 3 216 6 6 216 10 10 216 … … 27 27 216 27 … 1 Всего 216 27 216 … 1 216 В сумме 1 Табл. 1.2 заполнена лишь частично, чтобы читатель имел возможность закончить расчёты самостоятельно и убедиться, что полное число элементарных исходов равно 216, а сумма вероятностей равна 1. Поясним подсчёт числа благоприятных исходов. Набору, в котором присутствует 3 разных цифры, будет соответствовать 6 элементарных исходов (число перестановок из 3 элементов равно 6). Набору, в котором 2 цифры одинаковы, а третья отличается от них, будет соответствовать 3 элементарных исхода (число перестановок из 3 элементов с повторением 2 элементов, либо число сочетаний из 3 элементов по 2). Решение аналогичной задачи для случая четырёх и более костей «вручную» будет чрезвычайно громоздким. Собственно, смысл данной лабораторной работы как раз и состоит в том, чтобы разобраться, как найти (точнее, оценить) вероятность некоторого сложного события, если подсчитать эту вероятность «вручную» трудно или невозможно. 3 Статистическое определение вероятности Пусть в каждом испытании некоторое событие может наступить с одинаковой вероятностью p . Относительной частотой события A в серии n испытаний называется отношение числа m наступлений этого события к общему числу испытаний: w( A) m . n (1.2) Приведённая формула напоминает классическое определение вероятности (1.1), но смысл величин m и n в этих формулах различается. Классическое определение опирается на теоретический подсчёт элементарных исходов, а в формуле (1.2) фигурируют эмпирические (опытные) значения общего числа испытаний и числа наступлений события. Теорема Бернулли. При неограниченном возрастании числа однородных независимых испытаний с практической достоверностью (т.е. с вероятностью, близкой к 1) можно утверждать, что относительная частота события (1.2) будет сколь угодно близка к вероятности этого события в отдельном испытании: ( 0), ( 0), (n 0) : P ( w p ) 1 , или w P ( A), n p («сходимость по вероятности»). Благодаря теореме Бернулли, мы имеем возможность статистически оценивать такие вероятности, которые вряд ли могут быть вычислены теоретически (например, вероятность попадания снаряда в цель или вероятность рождения ребёнка определённого пола). Такое определение вероятности называется статистическим. Статистическое определение вероятности может применяться и в тех случаях, когда теоретический подсчёт вероятности события возможен, но затруднителен. Для этого надо смоделировать изучаемое случайное событие, точнее говоря, многократно имитировать опыт, в котором это событие может наступать. Метод, реализующий данную схему, называется методом МонтеКарло. Сведения о методе Монте-Карло Методом Монте-Карло называется метод решения различных математических задач при помощи моделирования случайных событий и случайных величин и статистической оценки их характеристик. Согласно этому методу, осуществляется большое число реализаций некоторого случайного опыта, который формируется таким образом, чтобы его вероятностные характеристики совпадали с аналогичными величинами решаемой задачи. Название «МонтеКарло» произошло от одноимённого города в княжестве Монако, известного своими казино, ибо одним из простейших приборов для моделирования случайных чисел является рулетка. 4 Теоретически сам метод возник давно и не раз использовался в теории вероятностей и математической статистике. Однако моделирование случайных событий и величин вручную (например, с помощью той же рулетки, игральной кости, монеты) весьма трудоёмкий процесс. Поэтому серьёзное развитие метод Монте-Карло получил с конца 1940-х годов (в США) с появлением и совершенствованием компьютеров. Метод Монте-Карло используется для решения задач физики, теории массового обслуживания, экономики, биологии всё перечислить невозможно. Задание для лабораторной работы В данной работе методом Монте-Карло должны быть решены задачи, рассмотренные выше в примерах 1, 2 и 3, а также более сложная задача, в которой число брошенных костей равно 4. Задание 1.1. Подбрасываются: (1.1.1) одна игральная кость; (1.1.2) две игральных кости; (1.1.3) три игральных кости; (1.1.4) четыре игральных кости. В качестве случайного события рассматривается появление определённого суммарного числа очков на брошенных костях. (Например, при бросании двух костей могут наступить следующие события: «2», «3», …, «12»). Необходимо в каждой из предложенных задач (1.1.1)(1.1.4) найти (оценить) вероятности всех возможных событий, проведя 10000 испытаний. Смысл настоящей работы состоит в том, чтобы, моделируя описанный опыт (подбрасывание игральных костей) с помощью генератора случайных чисел, получить (на основе случайных выборок объёма 10000) статистические оценки вероятностей случайных событий и убедиться, где это возможно, в том, что они (оценки) достаточно близки к истинным значениям вероятностей. Таким образом, вероятностная задача заменяется задачей статистической, в чём и состоит суть метода Монте-Карло. Инструкция по выполнению задания в Excel 1. Создайте в рабочем листе Excel следующую таблицу: 1 A № B 1-я кость C 2-я кость D 3-я кость E 4-я кость F Одна кость G Две кости H Три кости I Четыре кости 2 В первом столбце таблицы должен стоять номер испытания. Введите в ячейку A2 формулу 5 =1. Затем в ячейку A3 введите формулу =A2+1. Адрес (в данном случае A2) удобнее набирать не с клавиатуры, а щёлкая мышкой по нужной ячейке. В последующие ячейки этого столбца будет вводиться аналогичная формула с помощью автозаполнения. Однако эту операцию удобнее провести не для каждого столбца в отдельности, а для столбцов A-I разом. Пока же продолжим формирование строки 2. 2. В столбцах B-E должны находиться результаты бросания первой, второй, третьей и четвёртой костей соответственно – случайные числа (1, 2, 3, 4, 5, 6 с равной вероятностью). Используем функцию СЛЧИС (). Для этого активизируем ячейку B2, вызовем Вставку функций (кнопка f x на панели инструментов), в окне Категория выберем Математические, в окне Выберите функцию – СЛЧИС(). Однако с тем же успехом можно просто ввести в ячейку формулу =СЛЧИС() с клавиатуры. Эта функция даёт равномерно распределённую в интервале (0; 1) случайную величину. Формула =6*СЛЧИС()+1 будет давать равномерное распределение в интервале (1; 7). Функция ОТБР(…) из списка математических отбрасывает часть числа после запятой. Таким образом, формула =ОТБР(6*СЛЧИС()+1) будет давать именно то, что нужно (числа 1, 2, 3, 4, 5, 6 с равной вероятностью). Введите эту формулу в ячейку B2. Нет необходимости вводить её заново в ячейки C2, D2, E2. Выделите ячейку B2. Подведите курсор к правому нижнему углу ячейки так, чтобы он принял вид чёрного крестика, нажмите на левую кнопку мыши и, удерживая её, выделите ячейки C2:E2 (автозаполнение). 3. В ячейках F2:I2 должны находиться формулы, вычисляющие сумму выпавших очков (в четырёх различных задачах с разным числом брошенных костей). В ячейку F2 просто введите =B2, в ячейку G2 формулу =F2+C2, а к ячейкам H2 и I2 примените автозаполнение от «источника» G2. Обратите внимание, что при автозаполнении формула из ячейки G2 не просто скопировалась, а приняла вид =G2+D2 для ячейки H2 и =H2+E2 для ячейки I2. Относительные ссылки корректируются при автозаполнении и копировании, что и произошло. В данном случае нас это устраивает! Если перед буквой и/или номером стоит знак доллара, например, $A$1, то ссылка на столбец и/или строку является абсолютной. Абсолютные ссылки не корректируются при копировании и автозаполнении. В дальнейшем мы будем пользоваться этим приёмом, когда это будет необходимо. 6 4. Выделим диапазон B2:I2. Подведём курсор к правому нижнему углу ячейки I2 так, чтобы он принял вид чёрного крестика, нажмём на левую кнопку мыши и, удерживая её, выделим ячейки B3:I3. Теперь выделим диапазон A3:I3 и c помощью автозаполнения «растянем» таблицу до 10000-го номера испытания. 5. Когда таблица велика и не помещается на экране, удобно закрепить строку заголовков. Для этого щёлкните по ячейке B2, войдите в меню Окно и выберите Закрепить области. Теперь, даже если вы переместитесь вниз таблицы, названия столбцов останутся на экране. 6. Теперь перейдём к заданию формул для подсчёта числа наступивших событий. Если рассматривать совокупно все четыре задачи (1.1.1)-(1.1.4) (с разным количеством брошенных костей), то возможными являются события «1», «2», «3», …, «24». Поэтому в диапазоне J10002:J10025 введём соответствующие числа: 1, 2, 3, …, 24 (с помощью автозаполнения, подобно тому, как выше мы вводили номер испытания). Нам необходимо в каждой из четырёх задач подсчитать, сколько раз наступило то или иное событие во всей серии (10000) испытаний. С этой целью введём в ячейку F10002 формулу =СЧЁТЕСЛИ(F$2:F$10001;$J10002). Функция СЧЁТЕСЛИ(диапазон; условие) подсчитывает число непустых ячеек в диапазоне, удовлетворяющих заданному условию. В данном случае будет подсчитываться число единиц, выпавших при 10000 подбрасываний первой кости, поскольку в ячейку J10002 введено число 1. Значок $ нужен для того, чтобы применить автозаполнение ячеек G10002:I10002 от «источника» F10002. Сделав это автозаполнение, мы увидим, что диапазон, являющийся первым аргументом функции, сдвигается вправо, а адрес ячейки, в которой записано условие (второй аргумент) остаётся неизменным. 7. Щелчком мыши активизируйте любую свободную ячейку рабочего листа и раз за разом нажимайте на клавишу Delete. При каждом нажатии будет генерироваться новая выборка объёма 6 10000 , и, следовательно, должны появляться новые значения в ячейках F10002:I10002. Однако на самом деле, в ячейках G10002:I10002 будут оставаться нули, так как при бросании двух, трёх или четырёх костей сумма очков не может оказаться равной 1. Значение в ячейке F10002 будет колебаться вокруг числа 10000 / 6 1667 , т.к. в среднем единица выпадает в каждом шестом испытании. 8. Теперь выделим ячейки F10002:I10002 и выполним автозаполнение вниз до строки 10025 включительно. Расчёт ячеек может занять некоторое время в зависимости от быстродействия компьютера. В ячейку F10026 введите формулу =СУММ(F10002:F10025) и выполните автозаполнение ячеек G10026:I10026. Во всех ячейках диапазона F10026:I10026 должно появиться значение 10000 (число испытаний). 9. Осталось лишь ввести в таблицу формулы для подсчёта вероятностей событий. Как сказано выше, статистическое определение вероятности состоит в том, что мы приравниваем вероятность события к относительной частоте его 7 наступления в серии однородных независимых опытов. Следовательно, к примеру, вероятность того, что при бросании трёх игральных костей в сумме выпадет 10 очков, приближённо равна количеству таких испытаний, в которых это событие произошло, делённому на полное число испытаний (бросаний трёх костей) и т.д. Эту часть работы предлагаем читателю выполнить самостоятельно. На рисунке 1.1 показано, как может выглядеть в результате описанных действий электронная таблица. Рис. 1.1. Электронная таблица результатов По полученному распределению вероятностей событий постройте диаграмму (рис. 1.2). Ещё раз поясним, что если активизировать любую свободную ячейку рабочего листа и несколько раз нажать на клавишу Delete, то при каждом нажатии значения в таблице будут обновляться, т.к. случайные числа всякий раз генерируются заново. Однако в силу высокой репрезентативности выборки оценки вероятностей будут меняться незначительно, и каждый раз будут близки к истинным значениям вероятностей. Убедитесь, что это действительно так в задачах (1.1.1), (1.1.2) и (1.1.3). 8 0,18 0,16 0,14 Одна кость Две кости 0,12 0,1 0,08 Три кости Четыре кости 0,06 0,04 0,02 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Рис. 1.2. Вероятности появления определённой суммы очков при бросании разного числа игральных костей (статистическое определение) Дополнительное задание Задание 1.2. Каждый участник игры бросает: (1.2.1) четыре игральных кости; (1.2.2) пять игральных костей. Участник, у которого сумма выпавших очков составит ровно 21, получает крупный выигрыш. Оцените вероятность такого выигрыша статистически, по результатам 10000 испытаний. Попробуйте найти точное значение этой вероятности по классическому определению. Контрольные вопросы 1. Сформулируйте классическое определение вероятности. 2. Дайте определение и приведите расчётные формулы для числа перестановок (без повторяющихся элементов и с повторяющимися элементами), числа сочетаний, числа размещений. 3. Полностью завершите расчёт вероятностей в табл.2 (пример 3). 4. Как вы понимаете смысл теоремы Бернулли и статистического определения вероятности? Приведите примеры применения. 5. Проанализируйте результаты решения задания 1.2. 9