С. А. Лавренченко ТЕОРИЯ ВЕРОЯТНОСТЕЙ «Замечательно, что науке, которая начиналась с рассмотрения азартных игр, суждено было стать наиболее важным объектом человеческого знания.» Пьер-Симон Лаплас, 1812 г. Лекция 1. Понятие вероятности 1.1. Введение Теория вероятностей — это раздел математики, изучающий закономерности случайных явлений, наблюдающиеся при массовом повторении испытаний. На первый взгляд это определение кажется противоречивым. Какие могут быть закономерности, если явления случайные? И все же такие закономерности есть, и их мы и будем изучать в данном курсе. Фото 1. Архивное фото Андрея Николаевича Колмогорова (1903–1987). Классическая теория вероятностей родилась в 17-м веке. Основы теории вероятностей как науки заложили французские классики. Блез Паскаль был первым, кто начал применять математику для анализа азартных игр. Это было в 17-м веке, когда и родилась математическая наука — теория вероятностей. В 18-м и в начале 19-го веков другой классик, Пьер-Симон Лаплас, продолжил изучение азартных игр и предложил первое математическое определение вероятности. В своей основополагающей работе по теории вероятностей «Аналитическая теория вероятностей» (“Théorie Analytique des Probabilités”), опубликованной в 1812 г., он писал: «Замечательно, что науке, которая начиналась с рассмотрения азартных игр, суждено 2 было стать наиболее важным объектом человеческого знания… Ведь большей частью важнейшие жизненные вопросы являются на самом деле лишь задачами из теории вероятностей.» Во второй половине 19-го века основной вклад в теорию вероятностей внесли русские математики: П. Л. Чебышёв, А. А. Марков и А. М. Ляпунов, а в 20-м веке академик А. Н. Колмогоров (см. фото 1) и советская теоретико-вероятностная школа. В результате теория вероятностей приобрела строгий математический вид и окончательно стала признаваться как раздел современной математики. В качестве пререквизита для данного курса рекомендуется прослушать хотя бы начальный курс теории множеств и комбинаторики; см. источники [1, 4, 13, 14, 18] в списке рекомендованной литературы. Мы будем рассматривать конечные множества и бесконечные счетные множества. Бесконечное множество называется счетным, если существует взаимнооднозначное соответствие между его элементами и натуральными числами. Мощность конечного множества A обозначается A и определяется как число элементов в A. Универсальное множество — это такое всеобъемлющее множество, что все рассматриваемые множества являются его подмножествами. В каждой конкретной задаче свое универсальное множество. Роль универсального множества в этом курсе будет играть так называемое множество всех исходов, обозначаемое . Для иллюстрации рассматриваемых понятий служат диаграммы Венна. На этих диаграммах изображается в виде прямоугольника, а рассматриваемые множества в виде геометрических фигур внутри этого прямоугольника. 1.2. Классическое определение вероятности 1.2.1. Основные понятия Эксперимент — это некоторая процедура, ведущая к одному и только одному исходу из некоторого множества возможных исходов, обозначаемого . Каждое осуществление эксперимента называется испытанием. Событие — это подмножество множества . Пример 1.2.1.1. Бросание игральной кости есть эксперимент. Каждое конкретное бросание есть испытание. Множество исходов в этом эксперименте есть множество шести возможных чисел выпадающих очков. Обозначается это так: {1,2,3,4,5,6} , | | 6 . Рассмотрим событие A , состоящее в том, что при бросании игральной кости выпадет нечетное число очков. Имеем: A {1,3,5} , | A | 3 . Здесь A — событие во множестве исходов . Обозначается это так: A , и иллюстрируется диаграммой Венна на рис. 1. ■ Рисунок 1. A — событие во множестве исходов . 3 1.2.2. Классическое определение вероятности Это определение предложил еще Лаплас, поэтому оно также называется лапласовским определением вероятности. Область его применения ограничена, а именно предполагается, что A — событие в конечном множестве равновероятных исходов, обозначаемом в дальнейшем . Тогда вероятность события A обозначается p(A) и определяется так: p( A) | A| , || т. е. как отношение числа исходов, благоприятных событию A , к общему числу исходов. ■ Пример 1.2.2.1. Найти вероятность того, что на игральной кости выпадет нечетное число очков. Решение: Имеем A {1,3,5} , {1,2,3,4,5,6} . Значит число благоприятных исходов равно 3, а число всех исходов равно 6, поэтому p( A) | A| 3 1 .■ || 6 2 Замечание 1.2.2.2. Мы предполагаем, что кость справедливая, т. е. все исходы равновероятны, и поэтому классическое определение вероятности применимо. Пример 1.2.2.3. В урне 4 синих шара и 5 красных. Какова вероятность того, что наудачу вытащенный шар окажется синим? Решение: Имеем: | A | 4 , | | 4 5 9 , поэтому p( A) 4 . ■ 9 1.2.3. Вероятности комбинаций событий Рис. 2. Слева событие A , справа противоположное событие выделено зеленым. Определение 1.2.3.1. Пусть A , т. е. A — событие во множестве исходов . Противоположное к A событие определяется как теоретико-множественная разность: A A. 4 Словами, противоположное к событию A событие A состоит из тех и только тех исходов, которые не принадлежат A . Это определение иллюстрируется диаграммами Венна на рис. 2. ■ Заметим, что появление события A состоит в непоявлении события A , и обратно. Таким образом, A A , отношение противоположности событий симметрично. Теорема 1.2.3.2 (о вероятности противоположного события). Если A , то p( A ) 1 p( A) . Доказательство: Заметим, что | A | | | | A | . Следовательно, p( A ) | A| || | A| | A| 1 1 p( A) , || || || что и требовалось доказать. ■ Пример 1.2.3.3. Случайным образом генерируется последовательность десяти битов. Какова вероятность того, что, по меньшей мере, один из этих битов окажется нулевым? Решение: Множество исходов данного эксперимента — это множество всех битовых строк длины десять. Пусть A — событие, состоящее в том, что хотя бы один из десяти генерируемых битов нулевой. Тогда A — событие, состоящее в том, что все десять битов единичные. Следовательно, есть ровно один исход, благоприятный для события A — это битовая строка 1111111111 . Следовательно, по теореме о вероятности противоположного события имеем: p( A) 1 p( A) 1 |A| 1 1 1023 . 1 1 10 || 1024 1024 2 Заметим, что намного труднее было бы искать эту вероятность непосредственно по определению, без использования теоремы о вероятности противоположного события. ■ Определение 1.2.3.4. Пусть A , B . Сумма событий A и B обозначается A B и определяется как теоретико-множественное объединение: A B A B , а произведение событий обозначается AB и определяется как теоретико-множественное пересечение: AB A B . Словами, сумма событий есть событие, состоящее в появлении хотя бы одного из этих событий, а их произведение — событие, состоящее в одновременном появлении обоих событий. Понятие суммы и произведения событий иллюстрируются на рисунках 3 и 4, соответственно. ■ 5 Таким образом, наступление события A B состоит в том, что наступило событие A или событие B , а наступление события AB состоит в том, что наступило событие A и событие B . Рис. 3. Диаграммы Венна, иллюстрирующие сумму событий. Рис. 4. Диаграммы Венна, иллюстрирующие произведение событий. Теорема 1.2.3.5 (о вероятности суммы событий). Пусть A и B — события во множестве исходов . Тогда p( A B) p( A) p( B) p( AB) . Доказательство: Заметим, что | A B | | A | | B | | A B | . Это очевидное теоретикомножественное тождество. (Докажите его самостоятельно, используя рисунки 3 и 4.) Следовательно, p( A B ) | A B | | A| | B | | A B | || || | A| | B | | A B | p( A) p( B) p( AB) , || || || что и требовалось доказать. ■ Пример 1.2.3.6. Какова вероятность того, что число, выбранное наугад из множества целых чисел от 1 до 100, делится на 2 или на 5? Решение: Пусть A — событие, состоящее в том, что выбранное число делится на 2, и пусть событие B состоит в том, что оно делится на 5. Тогда событие A B состоит в том, что число делится на 2 или на 5, а событие AB состоит в том, что число делится и на 2, и на 5, т. е. делится на 10. Значит, | A | 50 , | B | 20 , | AB | 10 , и, по теореме о вероятности суммы событий имеем: 6 p ( A B ) p ( A) p ( B ) p ( A B ) 50 20 10 60 0 .6 . ■ 100 100 100 100 1.3. Общее определение вероятности 1.3.1. Введение Классическое определение вероятности, p( A) A , работает в случае, когда все исходы равновероятны. Например, если бросается справедливая монета, то вероятность выпадения орла p("" ) 1/ 2 и вероятность выпадения решки p("" ) 1 / 2 . Фото 2. Решка. Однако многие эксперименты имеют неравновероятные исходы. Например, если бросается монета со смещенным центром тяжести, может оказаться, например, что p("" ) 2 / 3 , а p("" ) 1 / 3 , т. е. орел выпадает в среднем в два раза чаще, чем решка. (См. фото 2.) Эту общую ситуацию необязательно равновероятных исходов мы сейчас и рассмотрим. 1.3.2. Назначение вероятностей исходам Пусть — множество исходов некоторого эксперимента. Будем предполагать, что — конечное или бесконечное счетное множество. Каждому исходу назначается вероятность p() таким образом, что выполняются следующие два условия: Условие 1: и Условие 2: 0 p() 1 для каждого , p( ) 1 . Условие 2 означает полноту множества , т.е. что в каждом испытании один из исходов обязательно произойдет. В случае, когда конечно, т. е. когда {1, 2 , , n } , условие 2 записывается в виде n p( j ) 1 . j 1 Если же — бесконечное счетное множество, то вместо конечной суммы получается бесконечный числовой ряд. 7 На практике, для моделирования эксперимента, в качестве вероятности p() , назначаемой исходу , берется отношение числа появлений исхода к общему числу испытаний при достаточно большом числе испытаний. Это отношение называется относительной частотой появления исхода . Таким образом, в качестве вероятности исхода принимают относительную частоту его появления. Так определенная вероятность называется статистической вероятностью. Пример 1.3.2.1. Какие вероятности следует назначить исходам “О” (орел) и “Р” (решка), когда бросается (а) справедливая монета? (б) Когда бросается монета, центр тяжести которой смещен так, что орел выпадают в два раза чаще, чем решка? Решение: (а) Имеем p(" " ) p(" " ) 1 / 2 . (б) Составляем систему уравнений: p (" " ) 2 p (" " ) p (" " ) p (" " ) 1 из которой находим p(" " ) 1 / 3 , p(" " ) 2 / 3 . ■ 1.3.3. Общее определение вероятности Область применения общего определения вероятности шире, чем классического, а именно, предполагается, что A — событие в конечном или бесконечном счетном множестве необязательно равновероятных исходов. Пусть всем исходам назначены вероятности p() , удовлетворяющие условиям 1 и 2 из пункта 1.3.2. Тогда общее определение вероятности следующее. Определение 1.3.3.1. Вероятность события A определяется так: p ( A) p( ) , A т.е. как сумма вероятностей составляющих его исходов. В частности, если A {a1, a2 , , am } , m p ( A) p( ai ) . ■ i 1 Пример 1.3.3.2. Пусть центр тяжести игральной кости смещен так, что три очка выпадают в два раза реже, чем не три, а другие числа очков выпадают с одинаковой относительной частотой. Какова вероятность выпадения нечетного числа очков? Решение: Надо найти вероятность события A {1, 3, 5} . Необходимо найти вероятности этих исходов. Для этого обозначаем через p(i ) вероятность того, что выпадет i очков, и составляем систему уравнений: 2 p(3) p(1) p(2) p( 4) p(5) p(6) p(1) p(2) p(4) p(5) p(6) p(1) p( 2) p(3) p(4) p(5) p(6) 1 8 Решая эту систему из шести линейных уравнений с шестью неизвестными, находим: p(3) 1 / 3 , p(1) p(2) p(4) p(5) p(6) 2 / 15 . Таким образом, по общему определению вероятности имеем p ( A) p (1) p (3) p (5) 2 1 2 9 0.60 . ■ 15 3 15 15 Замечание 1.3.3.3. На первый взгляд ответ в предыдущем примере неожиданный. Кажется, что вероятность 0.60 (что больше 50%) преувеличена, ведь все исходы, кроме трех очков, равновероятны, а три очка выпадают в два раза реже, чем не три. На самом деле, все правильно, потому что имеется в виду, что три очка выпадает в два раза реже, чем любое другое число очков в совокупности. Это значит, три очка выпадают в среднем при каждом третьем бросании кости, т.е. чаще, чем любое другое число очков по отдельности. ■ Замечание 1.3.3.4. В частном случае, когда число исходов в конечно и они равновероятны, общее определение вероятности совпадает с классическим. В самом деле, пусть состоит из n равновероятных исходов. Тогда, в силу условия 2, каждый исход должен иметь вероятность 1 / n . Далее, пусть некоторое событие A {a1 , , am } состоит из m исходов. Тогда, по общему определению вероятности, имеем m m 1 1 1 1 m | A| , n n n n n || i 1 p( A) p(ai ) i 1 m что совпадает с классическим определением вероятности. Таким образом, общее определение вероятности является обобщением классического. ■