Игры в смешанных стратегиях Моделирование конфликтных ситуаций в экономике Рассмотрим две игры в чистых стратегиях Ai\Bj B1 B2 B3 αi Ai\Bj B1 B2 B3 αi A1 -3 4 4 -3 A1 0.7 0.5 0.3 0.3 A2 1 -2 1 -2 A2 0.6 0.9 0.4 0.4 A3 4 4 -2 -2 0.7 0.9 0.4 0.4\0.4 βj 4 4 4 4\-2 βj α < β игра не устойчивая. α = β игра устойчивая Ситуации, в которых α = β, называются седловыми. Моделирование конфликтных ситуаций в экономике Седловых ситуаций (точек) в матрице игры может быть несколько. Например: B1 B2 B3 B4 B5 B6 αi A1 2 3 2 6 2 4 2 A2 1 2 0 0 1 1 0 A3 2 6 2 3 2 7 2 A4 0 5 1 7 1 4 0 βj 6 2 7 2 7 2\2 2 Здесь α=β=2 Оптимальные стратегии игроков: А1 и А3; В1,В3 и В5 Вопрос. Как построить игру, чтобы выигрыш был больше α, а проигрыш меньше β. Моделирование конфликтных ситуаций в экономике 1. Игры в смешанных стратегиях. Имеем SAc={A1,A2,…,Am}, ScB={B1,B2,…,Bn}, FA(x), FB(y) Определение. Смешанной называется стратегия игрока, состоящая в случайном чередовании одной из своих чистых стратегий. Смешанная стратегия – дискретная случайная величина, значениями которой являются номера чистых стратегий. Т.е. каждой чистой стратегии ставится в соответствие вероятность ее появления в игре. Моделирование конфликтных ситуаций в экономике 1. Игры в смешанных стратегиях. Имеем: SAc={A1,A2,…,Am}, Р={p1,p2,…,pm}, Σpi = 1 ScB={B1,B2,…,Bn} Q={q1,q2,…,qn}, Σqi = 1 P и Q будем называть смешанными стратегиями игроков А и В. Определение. Множество SA={P(p1,p2,…,pm), Σpi = 1} называется множеством смешанных стратегий игрока А. Моделирование конфликтных ситуаций в экономике 1. Игры в смешанных стратегиях. Свойства множества смешанных стратегий: - SA={P(p1,p2,…,pm), Σpi = 1} – бесконечно, - множество SA={P(p1,p2,…,pm), Σpi = 1} содержит множество SAc={A1,A2,…,Am} как частный случай: А1 = {1,0,0,…,0}, A2={0,1,0,…,0}, A3={0,0,1,0,…,0} Для смешанной стратегии справедливо равенство: P = p1A1+p2A2+…+pmAm = =p1(1,0,…,0)+p2(0,1,0…,0)+…+pm(0,0,…,1) = Σpi Ai Моделирование конфликтных ситуаций в экономике 1. Игры в смешанных стратегиях. Игра протекает следующим образом: Если игрок А придерживается одной из своих смешанных стратегий, то для определения конкретной чистой стратегии в партии, вначале запускается генератор случайных чисел и в соответствии с полученным числом делается ход. Например. Стратегия игрока А - P = {1/6, 3/6, 2/6}. 1. Бросается «кубик» с гранями {1,2,2,2,3,3}. 2. Если выпал «2», делается ход А2. Моделирование конфликтных ситуаций в экономике 2. Геометрическая интерпретация конфигураций смешанной игры. Если в качестве единичных орт взять чистые стратегии А1,A2,…,Аm, тогда множество всех смешанных стратегий есть симплекс размерностью m-1с вершинами в точках А1,A2,…,Аm. A2 Примеры. p2 A2 pi pi 0.5 A1 0.5 M =2 A1 p1 A3 m=3 Моделирование конфликтных ситуаций в экономике 3. Функция выигрыша в смешанных стратегиях. Игра в смешанных стратегиях есть расширение игры с множества чистых стратегий на множество смешанных стратегий. Состояние (PQ) в игре называется ситуацией в смешанных стратегиях. Вероятность появления в игре ситуации (AiBj) равна произведению piqj. Следовательно, (piqj) есть вероятность получения игроком А выигрыша F(AiBj)=aij. Таким образом, вероятность появления выигрыша aij есть дискретная случайная величина. Тогда средний выигрыш в игре есть математическое ожидание случайной величины aij : M(x) = ΣΣpiaijqj Моделирование конфликтных ситуаций в экономике 3. Функция выигрыша в смешанных стратегиях Определение. Функция H(P,Q), заданная на множестве смешанных стратегий SA×SB игроков А и В в ситуации (P,Q) называется функцией выигрыша игрока А, если ее значение равно среднему выигрышу в этой ситуации: H(P,Q) = ΣΣpiaijqj, PQ є SA×SB (2.1) или матричной форме: H(P,Q) = PAQT (2.2) Совокупность {SA,SB,H} множеств смешанных стратегий игроков А и В и функции выигрыша игрока А в смешанных стратегиях называют смешанным расширением игры {SAc,SBc,FA} Моделирование конфликтных ситуаций в экономике 3. Функция выигрыша в смешанных стратегиях. Задача. Дана платежная матрица игры 2×3 и две смешанные стратегии игроков P0={3/8,5/8}, Q0={1/4,0,3/4} Ai\Bj B1 B2 B3 A1 0 ½ 5/6 A2 1 ¾ ½ Определить выигрыш игрока А в ситуациях: (P0Q0), (P0B1), (P0B2), (P0B3) Моделирование конфликтных ситуаций в экономике Задача. Решение 1. H P , Q 0 0 0 0 0 2. H P , B1 1 1 5 0 4 5 21 5 4 5 3 5 6 0 0 0.625 1 3 8 32 8 3 8 8 8 1 4 2 4 2 3 5 5 0 a1i Pi 0 1 0.625 8 8 8 i 1 1 2 3 4 2 3. H P , B2 a 2i Pi i 1 0 1 3 3 5 21 0.656 2 8 4 8 32 2 5 3 1 5 5 0 4. H P , B3 a 3i Pi 0.625 6 8 2 8 8 i 1 Аналогично можно вычислить выигрыш игроков в различных ситуациях Моделирование конфликтных ситуаций в экономике 4. Основные определения и теоремы. Теорема 1. Для каждой смешанной стратегии Р игрока А существует α(Р,SB) = min H(PQ), a для каждой смешанной стратегии Q игрока В существует β(Q,SA) = max Н(PQ) Определение. Число α(Р,SB) называется показателем эффективности смешанной стратегии Р игрока А относительно множества смешанных стратегий игрока В. Если заменить SB на SBс, то получим определение показателя эффективности смешанной стратегии Р игрока А относительно множества чистых стратегий игрока В. Если Р есть Аi, то α(Р,SBс) =min H(PQ) = αi Моделирование конфликтных ситуаций в экономике 4. Основные определения и теоремы. Теорема 2. Показатели эффективности любой смешанной стратегии Р игрока А относительно множеств SBс и SB равны между собой α(Р,SB) = α(Р,SBс). Расширение множества чистых стратегий игрока В не изменяет показателя эффективности игрока А. Моделирование конфликтных ситуаций в экономике 4. Основные определения и теоремы. Определение. Число β(Р,SА) называется показателем неэффективности смешанной стратегии Q игрока B относительно множества смешанных стратегий игрока A. Если заменить SA на SAс, то получим определение показателя неэффективности смешанной стратегии Q игрока B относительно множества чистых стратегий игрока A. Если Q есть Bj, то β(Q,SAс) =max H(PQ) = βj Справедлива теорема β(Q,SAс) = β(Q,SA) Моделирование конфликтных ситуаций в экономике 4. Основные определения и теоремы. Определение. Нижней ценой (максимином) матричной игры в смешанных стратегиях называется величина V = max α(P) = max minH(PQ) Верхней ценой (минимаксом) матричной игры в смешанных стратегиях называется величина V = min β(Q) = min max H(PQ) Теорема. Для любой конечной матричной игры существуют нижняя и верхняя границы игры в смешанных стратегиях, т.е. для любой матрицы игры А существует смешанная стратегия Р0, для которой V=max α(P)= α(P0) и существует Q0, для которой V=minβ(Q)= β(Q0) Частный случай: Р0=Аi, Q0=Bi V и V равны соответственно максимину и минимаксу игры в чистых стратегиях Моделирование конфликтных ситуаций в экономике 4. Основные определения и теоремы. Теорема. Нижняя цена игры α и верхняя цена игры β в чистых и нижняя V и верхняя V цены игры в смешанных стратегиях удовлетворяют следующему неравенству: α≤V≤V≤β. Это означает, что в любой ситуации в смешанных стратегиях (PQ) выигрыш H(PQ) не ниже показателя эффективности α(P) его стратегий Моделирование конфликтных ситуаций в экономике 5. Решение игры в смешанных стратегиях Определение. Если нижняя V и верхняя V цены игры в смешанных стратегиях равны , то их общее значение V называется ценой игры в смешанных стратегиях, а стратегии P0 и Q0, для которых выполняется равенство V = α(P0) =β(Q0) = H(P0Q0) называются оптимальными смешанными стратегиями соответственно игроков А и В. Оптимальные смешанные стратегии игроков обладают тем свойством, что, если один из игроков придерживается своей оптимальной стратегии, то противнику не выгодно отклоняться от своей оптимальной стратегии. Цена игры в смешанных стратегиях: α≤V≤β Моделирование конфликтных ситуаций в экономике 5. Решение игры в смешанных стратегиях. Определение. Полным решением игры в смешанных стратегиях называется совокупность {SA0, SB0, V} множеств оптимальных стратегий игроков и цены игры. Определение. Любая пара оптимальных стратегий (P0,Q0) образуют частное решение игры в смешанных стратегиях. Теорема фон Неймана. Любая матричная игра имеет решение в смешанных стратегиях, т.е. существуют оптимальные стратегии игроков P0, Q0 и цена игры V. Точка H(P0,Q0) называется седловой точкой матрицы игры в смешанных стратегиях.