Теорія ігор та прийняття рішень. Прийнтяття рішень в умовах невизначеності. Боровський Денис

Боровський Денис Завдання: Визначити краще рішення за критеріями: азартного гравця, мінімаксним критерієм, критерієм Гурвіца, критерієм Севіджа, критерієм Байєса-Лапласа, критерієм Ходжа-Лемана, критерієм BL(MM) та критерієм добутку. Для критеріїв Гурвіца та Ходжа-Лемана необхідні коефіцієнти вказати самостійно. Адміністратору театру необхідно вирішити, скільки замовити програмок для нового спектаклю. Вартість замовлення 200$ плюс 30 центів за штуку. Програмки продаються по 60 центів за штуку, і до того ж, прибуток від реклами додатково складе 300 доларів. З минулого досвіду відома відвідуваність театру: Відвідуваність 7000 7500 8000 8500 9000 Її ймовірність 0,1 0,3 0,3 0,2 0,1 Очікується, що 40% глядачів куплять програмки. Використовуючи кожне з восьми правил, визначте, скільки програмок має замовити адміністрація театру. Дана модель гри – це модель гри з природою. У якості гравців виступають, з одного боку, гравець Т — адміністрація театру, якому належить вибрати одну зі стратегій: — 𝐴1 , 𝐴2 , 𝐴3 , 𝐴4 , 𝐴5 − замовлення програмок, що забезпечує найбільший дохід, з іншого боку – гравець П, попит (природа), що характеризується п’ятьма можливими станами: 𝛱1 , 𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 − об'єктивна реальність, яка не переслідує жодних інтересів. Виграшем гравця Т буде дохід, який він зможе отримати залежно від попиту. Уведемо позначення. Нехай 𝑧𝑖 − величина замовлення програмок при виборі стратегії 𝐴𝑖 , 𝑠𝑗 − попит при стані природі 𝛱𝑗 , 𝑝𝑖 − ціна свіжих булочок, 𝑐 −витрати театру на замовлення однієї програмки (собівартість програмки), 𝑑 − додатковий прибуток від реклами (300$), 𝑘 − вартість замовлення програмок (200$). Тоді функція виграшу гравця Т при ситуації (𝐴𝑖 , 𝛱𝑗 ) можна 𝑧𝑖 (𝑝 − 𝑐) + 𝑑 − 𝑘, 𝑧𝑖 < 𝑠𝑗 (1) визначити рівністю:{ 𝑠𝑗 (𝑝 − 𝑐) − 𝑐(𝑧𝑖 − 𝑠𝑗 ) + 𝑑 − 𝑘, 𝑧𝑖 ≥ 𝑠𝑗. Або другу нерівність можна переписати наступним чином так як доданок 𝑐(𝑧𝑗 − 𝑠𝑗 ) має сенс тоді, коли собівартість програмок може змінюватись (наприклад, залежність від того, скільки програмок вже продали). Якщо ж собівартість буде однаково для будь-якої кількості, то маємо наступне: 𝑧𝑖 (𝑝 − 𝑐) + 𝑑 − 𝑘, 𝑧𝑖 < 𝑠𝑗 { (2) 𝑝𝑠𝑗 − 𝑐𝑧𝑖 + 𝑑 − 𝑘, 𝑧𝑖 ≥ 𝑠𝑗. Очікується, що 40% глядачів куплять програмки. Тоді розподіл відвідуваності (глядачів, що придбають програмки) та відповідних ймовірностей становить: Відвідуваність 2800 3000 3200 3400 3600 Її ймовірність 0,1 0,3 0,3 0,2 0,1 Відповідно, матриця гри прийме наступний вигляд: Боровський Денис 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝑨𝟏 2800 𝑨𝟐 3000 𝑨𝟑 3200 𝑨𝟒 3400 𝑨𝟓 3600 Використовуючи функцію виграшу (2), для гравця Т, можна визначити ситуації (𝐴𝑖 , 𝛱𝑗 ). Наприклад, при виборі гравцем стратегії 𝐴1 величина замовлення програмок становить 𝑧1 = 2800 штук. А при стані природи 𝛱1 попит на програмки буде становити 𝑠1 = 2800 штук. Так як величина замовлення дорівнює попиту, то отримаємо наступний результат: (𝐴1 , 𝛱1 ): 0,6 ∙ 2800 − 0,3 ∙ 2800 + 300 − 200 = 940 Тоді при виборі гравцем стратегії 𝐴2 величина замовлення програмок становить 𝑧2 = 3000 штук. А при стані природи 𝛱1 попит на програмки буде становити 𝑠1 = 2800 штук: (𝐴2 , 𝛱1 ): 0,6 ∙ 2800 − 0,3 ∙ 3000 + 300 − 200 = 880 Тоді отримаємо наступну матрицю гри: 𝜫𝟏 𝜫𝟐 𝜫𝟑 𝜫𝟒 𝜫𝟓 2800 3000 3200 3400 3600 940 940 940 940 𝑨𝟏 2800 940 900 900 900 900 𝑨𝟐 3000 880 940 1060 1060 1060 𝑨𝟑 3200 820 880 1000 1120 1120 𝑨𝟒 3400 760 820 940 960 1180 𝑨𝟓 3600 700 КРИТЕРІЙ АЗАРТНОГО ГРАВЦЯ (критерій оптимізму або максімакс) Критерій азартного гравця слід використовувати у випадках дуже низького ризику, а також коли виграш набагато перевищує можливі втрати. Застосовується при ухваленні рішення в умовах невизначеності. Таким чином, матрицю гри необхідно доповнити ще одним стовпцем max(𝐴𝑖 , 𝛱𝑗 ), в 𝛱𝑗 який потрібно вказати значення найбільших елементів кожного рядка. Значення max{max(𝐴𝑖 , 𝛱𝑗 )} (тобто найбільше значення у новому стовбці) 𝐴𝑖 𝛱𝑗 буде оптимальною стратегією. Потім із елементів доданого стовпця потрібно вибрати найбільший. Рядок, в якому він стоїть і буде оптимальною стратегією. У нашому випадку ми повинні дописати стовбець max(𝐴𝑖 , 𝛱𝑗 ), що 𝛱𝑗 складається з найбільших значень елементів кожного рядка. У рядку 𝐴1 можна обрати будь-яке значення, так як усі значення у рядку однакові. Боровський Денис Наприклад, візьмемо значення у стовпці 𝛱1 . У рядку 𝐴2 найбільше значення знаходиться у стовпцях 𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 .Наприклад, візьмемо значення стовпця 𝛱2 . Таким чином будемо мати: 𝑨𝟏 2800 𝜫𝟏 2800 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 𝜫𝟐 3000 940 𝜫𝟑 3200 940 𝜫𝟒 3400 940 𝜫𝟓 3600 940 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 900 1060 1120 1180 𝜫𝒋 940 Обираємо у стовбці max(𝐴𝑖 , 𝛱𝑗 ) найбільше значення, тобто обираємо 𝛱𝑗 max{max(𝐴𝑖 , 𝛱𝑗 )}: 𝐴𝑖 𝛱𝑗 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 𝑨𝟏 2800 940 940 940 940 940 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 900 1060 1120 1180 𝐦𝐚𝐱{𝐦𝐚𝒙(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝜫𝒋 1180 Таким чином приходимо до висновку, що для адміністрації театру за критерієм азартного гравця найвигідніше використати стратегію 𝐴5 , тобто замовити 3600 програмок. КРИТЕРІЙ МІНІМАКСІВ (МАКСИМІНІВ) Побудований на консервативній обережній поведінці гравця, приймаючого рішення. Збігається до найкращої альтернативи з найпоганіших. Якщо величина (𝐴𝑖 , 𝛱𝑗 ) представляє прибуток, що отримаємо, то відповідно з максимінним критерієм (також називають критерієм Вальда) у якості оптимального обирається розв’язок, що забезпечує: max{min(𝐴𝑖 , 𝛱𝑗 )}. 𝐴𝑖 𝛱𝑗 Якщо величина (𝐴𝑖 , 𝛱𝑗 ) характеризує збитки або втрати, то використовується мінімаксний критерій: min{max(𝐴𝑖 , 𝛱𝑗 )}. 𝐴𝑖 𝛱𝑗 Якщо нашу задачу розглядати як задачу на прибуток, то слід використати максимінний критерій. Тому будуємо ще один стовбець, що складається із найменших значень у рядках. У рядку 𝐴1 можна обрати будь-яке значення, так як усі значення у рядку однакові. Наприклад, візьмемо значення у стовпці Боровський Денис 𝛱1 . У рядку 𝐴2 найменше значення знаходиться у стовпці 𝛱1 . Таким чином будемо мати: 𝑨𝟏 2800 𝜫𝟏 2800 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 𝜫𝟐 3000 940 𝜫𝟑 3200 940 𝜫𝟒 3400 940 𝜫𝟓 3600 940 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 880 820 760 700 𝜫𝒋 940 Тепер слід дописати ще один стовбець, у якому буде найбільше значення серед усіх значень у стовбці min(𝐴𝑖 , 𝛱𝑗 ): 𝛱𝑗 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐚𝐱{𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )} 940 𝜫𝒋 𝑨𝟏 2800 940 940 940 940 940 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 880 820 760 700 𝜫𝒋 𝑨𝒊 Таким чином приходимо до висновку, що для адміністрації театру за максимінним критерієм найвигідніше використати стратегію 𝐴1 , тобто замовити 2800 програмок. Якщо ж розглядати цю задачу на втрати, то слід використати мінімаксний критерій. Тому будуємо ще один стовбець, що складається із найбільших значень у рядках. У рядку 𝐴1 можна обрати будь-яке значення, так як усі значення у рядку однакові. Наприклад, візьмемо значення у стовпці 𝛱1 . У рядку 𝐴2 найбільше значення знаходиться у стовпцях 𝛱2 , 𝛱3 , 𝛱4 , 𝛱5 .Наприклад, візьмемо значення стовпця 𝛱2 . Таким чином будемо мати: 𝑨𝟏 2800 𝜫𝟏 2800 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 𝜫𝟐 3000 940 𝜫𝟑 3200 940 𝜫𝟒 3400 940 𝜫𝟓 3600 940 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 900 1060 1120 1180 𝜫𝒋 940 Тепер слід дописати ще один стовбець, у якому буде найменше значення 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 940 880 820 760 700 940 900 940 880 820 940 900 1060 1000 940 940 900 1060 1120 960 940 900 1060 1120 1180 940 900 1060 1120 1180 𝜫𝒋 𝐦𝐢𝐧{𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝜫𝒋 900 Боровський Денис Таким чином приходимо до висновку, що для адміністрації театру за мінімаксним критерієм найвигідніше використати стратегію 𝐴2 , тобто замовити 3000 програмок. КРИТЕРІЙ ГУРВІЦА (критерій песимізмуоптимізму) Побудований на консервативній обережній поведінці гравця, приймаючого рішення. Збігається до найкращої альтернативи з найпоганіших. Відповідно до цього критерію особа, яка приймає рішення, обчислює середньозважене значення між найкращою та найгіршою можливою виплатою для кожної альтернативи рішення (серед усіх можливих станів природи для цієї конкретної альтернативи), а потім обирає рішення, що має найбільше середньозважене значення. Таким чином, цей метод передбачає, що справи підуть десь посередині: і не погано, і не добре. Якщо величина (𝐴𝑖 , 𝛱𝑗 ) представляє прибуток, що отримаємо: max{α max(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) min(𝐴𝑖 , 𝛱𝑗 )}. 𝐴𝑖 𝛱𝑗 𝛱𝑗 Параметр α − показник оптимізму. Якщо α = 0, критерій Гурвіца стає консервативним, тому що його застосування еквівалентно застосуванню звичайного мінімаксного критерію. Якщо α = 1, то критерій Гурвіца стає досить оптимістичним, тому що розраховує на найкращі з найкращих умов. Ми можемо обрати степінь оптимізму (або песимізму) належним вибором величини α з інтегрвалу [0,1]. При відсутності яскраво вираженого оптимізму або песимізму вибір α = 0,5 представляється найбільш розумним. Якщо величина (𝐴𝑖 , 𝛱𝑗 ) представляє втрати, що отримаємо: min{α min(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) max(𝐴𝑖 , 𝛱𝑗 )}. 𝐴𝑖 𝛱𝑗 𝛱𝑗 У нашому випадку ми розглядаємо задачу на прибуток, тому слід розрахувати наступні величини. Нехай показник оптимізму α = 0,5. Доповнюємо матрицю гри стовбцями: перший складається з найбільших значень у рядках, другий – з найменших значень у рядках. 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 940 880 820 760 700 𝜫𝟐 3000 940 900 940 880 820 𝜫𝟑 3200 940 900 1060 1000 940 𝜫𝟒 3400 940 900 1060 1120 960 𝜫𝟓 3600 940 900 1060 1120 1180 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 940 900 1060 1120 1180 940 880 820 760 700 𝜫𝒋 𝜫𝒋 Тепер слід для кожної (альтернативи) стратегії гравця Т порахувати: 1 1 𝐴1 : { ∙ 940 + ∙ 940} = 940 2 2 1 1 𝐴2 : { ∙ 900 + ∙ 880} = 890 2 2 Боровський Денис 1 1 ∙ 820} = 940 2 2 1 1 𝐴4 : { ∙ 1120 + ∙ 760} = 940 2 2 1 1 𝐴5 : { ∙ 1180 + ∙ 700} = 940 2 2 Знайдемо найбільше значення max{α max(𝐴𝑖 , 𝛱𝑗 ) + (1 − α) min(𝐴𝑖 , 𝛱𝑗 )}. Тоді 𝐴3 : { ∙ 1060 + 𝐴𝑖 𝛱𝑗 𝛱𝑗 матриця гри прийме вигляд: 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 𝜫𝟐 𝜫𝟑 𝜫𝟒 𝜫𝟓 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 2800 3000 3200 3400 3600 𝜫𝒋 940 940 940 940 940 940 940 880 900 900 900 900 900 880 820 940 1060 1060 1060 1060 820 760 880 1000 1120 1120 1120 760 700 820 940 960 1180 1180 700 𝐦𝐚𝐱{𝛂 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) + 𝑨𝒊 𝜫𝒋 (𝟏 − 𝛂) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋)} 𝜫𝒋 940 890 940 940 940 Таким чином приходимо до висновку, що для адміністрації театру за критерієм Гурвіца найвигідніше використати одну із стратегій 𝐴1 , 𝐴3 , 𝐴4 , 𝐴5 тобто замовити 2800, або 3200, або 3400, або 3600 програмок. Якщо з змінити показник оптимізму α = 0,17, то отримаємо наступний результат: 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 𝜫𝟐 𝜫𝟑 𝜫𝟒 𝜫𝟓 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 2800 3000 3200 3400 3600 𝜫𝒋 940 940 940 940 940 940 940 880 900 900 900 900 900 880 820 940 1060 1060 1060 1060 820 760 880 1000 1120 1120 1120 760 700 820 940 960 1180 1180 700 𝐦𝐚𝐱{𝛂 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) + 𝑨𝒊 𝜫𝒋 (𝟏 − 𝛂) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋)} 𝜫𝒋 940 896,6 1019,2 1058,8 1098,4 Тепер приходимо до висновку, що для адміністрації театру за критерієм Гурвіца найвигідніше використати стратегію 𝐴5 тобто замовити 3600 програмок. КРИТЕРІЙ СЕВІДЖА Прагне пом'якшити консерватизм мінімаксного (максимінного) критерію шляхом заміни матриці платежів (виграшів або програшів) (𝐴𝑖 , 𝛱𝑗 ) матрицею втрат (штрафів) (𝐴̂ , 𝛱 ) , яка визначається наступним чином: 𝑖 (𝐴̂ 𝑖 , 𝛱𝑗 ) { 𝑗 max{(𝐴𝑖 , 𝛱𝑗 )} − (𝐴𝑖 , 𝛱𝑗 ), 𝐴𝑘 (𝐴𝑖 , 𝛱𝑗 ) − дохід (𝐴𝑖 , 𝛱𝑗 ) − min{(𝐴𝑖 , 𝛱𝑗 )}, (𝐴𝑖 , 𝛱𝑗 ) − втрати. 𝐴𝑘 Критерій Севіджа орієнтує статистику на несприятливі стану природи, тобто. цей критерій висловлює песимістичну оцінку ситуації. Боровський Денис У нашому випадку ми розглядаємо задачу на прибуток, тому побудуємо матрицю втрат) (𝐴̂ 𝑖 , 𝛱𝑗 ) . Знайдемо найбільше значення у стовбцях 𝛱j та запишемо це у додатковий стовпчик max{(𝐴𝑖 , 𝛱𝑗 )}. 𝐴𝑘 𝑨𝟏 2800 𝜫𝟏 2800 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 𝜫𝟐 3000 940 𝜫𝟑 3200 940 𝜫𝟒 3400 940 𝜫𝟓 3600 940 𝐦𝐚𝐱{(𝑨𝒊 , 𝜫𝒋 )}. 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 940 1060 1120 1180 𝑨𝒌 940 Тепер слід порахувати (𝐴̂ 𝑖 , 𝛱𝑗 ).Приведемо кілька прикладів: (𝐴̂ 1 , 𝛱1 ) : {940 − 940} = 0 (𝐴̂ 2 , 𝛱1 ) : {940 − 880} = 60 (𝐴̂ 3 , 𝛱1 ) : {940 − 820} = 120 (𝐴̂ 4 , 𝛱1 ) : {940 − 760} = 180 (𝐴̂ 5 , 𝛱1 ) : {940 − 700} = 240 (𝐴̂ 1 , 𝛱2 ) : {940 − 940} = 0 (𝐴̂ 2 , 𝛱2 ) : {940 − 900} = 40 (𝐴̂ 3 , 𝛱2 ) : {940 − 940} = 0 (𝐴̂ 4 , 𝛱2 ) : {940 − 880} = 60 (𝐴̂ 5 , 𝛱2 ) : {940 − 820} = 120 (𝐴̂ 1 , 𝛱3 ) : {1060 − 940} = 120 (𝐴̂ 2 , 𝛱3 ) : {1060 − 900} = 160 (𝐴̂ 3 , 𝛱3 ) : {1060 − 1060} = 0 (𝐴̂ 4 , 𝛱3 ) : {1060 − 1000} = 60 (𝐴̂ 5 , 𝛱3 ) : {1060 − 940} = 120 Тоді матриця витрат гри прийме наступний вигляд: 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 0 60 120 180 240 𝜫𝟐 3000 0 40 0 60 120 𝜫𝟑 3200 120 160 0 60 120 𝜫𝟒 3400 180 220 60 0 160 𝜫𝟓 3600 240 280 120 60 0 Побудуємо стовбець, який містить найбільше значення за рядком: 𝜫𝟏 2800 0 60 120 180 240 𝜫𝟐 3000 0 40 0 60 120 𝜫𝟑 3200 120 160 0 60 120 𝜫𝟒 𝜫𝟓 3400 3600 180 240 2800 𝑨𝟏 220 280 𝑨𝟐 3000 60 120 𝑨𝟑 3200 0 60 𝑨𝟒 3400 160 0 𝑨𝟓 3600 Знаходимо найменший елемент стовбця max(𝐴𝑖 , 𝛱𝑗 ): 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 240 280 120 180 240 𝛱𝑗 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 0 60 120 180 240 0 40 0 60 120 120 160 0 60 120 180 220 60 0 160 240 280 120 60 0 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧{𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝜫𝒋 240 280 120 180 240 𝜫𝒋 120 Таким чином приходимо до висновку, що для адміністрації театру за критерієм Севіджа найвигідніше використати стратегію 𝐴3 , тобто замовити 3200 програмок. Боровський Денис КРИТЕРІЙ БАЙЕСА (статистичний, найбільшого середнього результату, максимального математичного очікування) Значення критерію Байєса – це найбільше значення математичного очікування виграшу. Як випливає з суті та альтернативних назв цього критерію, він найкраще відповідає ситуації багаторазової повторюваності, коли найкращий середній результат приведе до кращого загального результату. Якщо ситуація вибору рішення буде часто повторюватися за незмінних умов, то вибір найкращої стратегії за критерієм Байєса представляється найкращим. В інших випадках цей критерій розумно використовувати лише як орієнтовний. Зазначимо, що у цьому критерії використовуються значення ймовірностей станів. В інших умовах застосовуються тільки значення виграшів. 𝒏 𝐦𝐚𝐱{∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )} , 𝑷(𝜫𝒋 ) − ймовірність 𝒋 − ого стану природи. 𝑨𝒊 𝒋=𝟏 Нехай 𝑃(𝛱1 ) = 𝑃(𝛱2 ) =. . . = 𝑃(𝛱5 ) = 0,2, тоді: 𝑛 ∑ 𝑃(𝛱𝑗 )(𝐴1 , 𝛱𝑗 ) = 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 + 940 ∙ 0,2 = 940 𝑗=1 𝑛 ∑ 𝑃(𝛱𝑗 )(𝐴2 , 𝛱𝑗 ) = 880 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 + 900 ∙ 0,2 = 896 𝑛 𝑗=1 ∑ 𝑃(𝛱𝑗 )(𝐴3 , 𝛱𝑗 ) = 820 ∙ 0,2 + 940 ∙ 0,2 + 1060 ∙ 0,2 + 1060 ∙ 0,2 + 1060 ∙ 0,2 = 988 𝑗=1 𝑛 ∑ 𝑃(𝛱𝑗 )(𝐴4 , 𝛱𝑗 ) = 760 ∙ 0,2 + 880 ∙ 0,2 + 1000 ∙ 0,2 + 1120 ∙ 0,2 + 1120 ∙ 0,2 = 976 𝑗=1 𝑛 ∑ 𝑃(𝛱𝑗 )(𝐴5 , 𝛱𝑗 ) = 700 ∙ 0,2 + 820 ∙ 0,2 + 940 ∙ 0,2 + 960 ∙ 0,2 + 1180 ∙ 0,2 = 920 𝑗=1 Матриця гри прийме наступний вигляд: 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 0 60 120 180 240 𝜫𝟐 3000 0 40 0 60 120 𝜫𝟑 3200 120 160 0 60 120 𝜫𝟒 3400 180 220 60 0 160 𝒏 𝒏 𝜫𝟓 3600 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) 240 280 120 60 0 940 896 988 976 920 𝒋=𝟏 𝐦𝐚𝐱{∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝒋=𝟏 988 Таким чином приходимо до висновку, що для адміністрації театру за критерієм Байеса найвигідніше використати стратегію 𝐴3 , тобто замовити 3200 програмок. 1 Слід зазначити , що при 𝑷(𝜫𝒋 ) = , 1 ≤ 𝑗 ≤ 𝑛 критерій Байєса стає 𝑛 критерієм Лапласа. Боровський Денис КРИТЕРІЙ ЛАПЛАСА Опирається на принцип недостатньої підстави, що трактується так: оскільки розподіл ймовірностей станів 𝑃(𝛱𝑗 ) невідомий, немає жодних причин вважати їх різними. Отже використовується оптимістичне припущення що ймовірності всіх стану природи рівні між собою, тобто 𝑃(𝛱1 ) = 𝑃(𝛱2 ) =. . . = 1 𝑃(𝛱𝑛 ) = . Якщо при цьому (𝐴𝑖 , 𝛱𝑗 ) представляє отримуваний прибуток, то 𝑛 найкращим розв’язком є те, що забезпечує 𝒏 𝟏 𝐦𝐚𝐱{ ∑(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝒏 𝒋=𝟏 Матриця гри прийме наступний вигляд: 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝒏 𝒏 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝟏 ∑(𝑨𝒊 , 𝜫𝒋 ) 𝒏 𝟏 𝐦𝐚𝐱{ ∑(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝒏 0 60 120 180 240 0 40 0 60 120 120 160 0 60 120 180 220 60 0 160 240 280 120 60 0 940 896 988 976 920 988 𝒋=𝟏 𝒋=𝟏 Таким чином приходимо до висновку, що для адміністрації театру за критерієм Лапласа найвигідніше використати стратегію 𝐴3 , тобто замовити 3200 програмок. КРИТЕРІЙ ХОДЖА - ЛЕМАНА Критерій Байеса-Лапласа дає більш оптимістичні прогнози, ніж максимінний критерій, проте він передбачає і вищий рівень поінформованості, і багаторазові реалізації. Критерій Байеса-Лапласа надійний лише тоді, коли достеменно відомі ймовірності появи станів зовнішнього середовища, проте на практиці точні числа, як правило, відсутні. Це послаблює довіру до критерію та змушує звертатися до більш надійного максимінного критерію, який гарантує певний мінімум. Цей гарантований мінімум можна спробувати збільшити за рахунок використання зваженої лінійної комбінації цих критеріїв: 𝒏 𝐦𝐚𝐱{𝑪 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) + (𝟏 − 𝑪) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )}. 𝑨𝒊 𝒋=𝟏 𝜫𝒋 З допомогою параметра З , з одного боку, виражається ступінь довіри до використовуваному розподілу ймовірностей, з другого – ступінь небажаності появи дуже малих значень. Оскільки числова оцінка ступеня довіри до використовуваного розподілу ймовірностей та ступеня небажаності появи малих значень зазвичай утруднена, вибір параметра 𝐶, як правило, суб'єктивний. У багатьох випадках вважають, що 𝐶 = 0,5. Боровський Денис Нехай у нашій задачі 𝑃(𝛱𝑗 ) = 0,2. Матриця гри буде виглядати наступним чином: 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 𝒏 𝒏 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐚𝐱{𝑪 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) + (𝟏 − 𝑪) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )} 𝑨𝒊 𝜫𝒋 𝒋=𝟏 𝒋=𝟏 𝑨𝟏 2800 940 940 940 940 940 940 940 940 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 900 940 880 820 900 1060 1000 940 900 1060 1120 960 900 1060 1120 1180 896 988 976 920 896 988 976 920 888 904 868 810 Таким чином приходимо до висновку, що для адміністрації театру за критерієм Ходжа-Лемана найвигідніше використати стратегію 𝐴1 , тобто замовити 2800 програмок. ОБ'ЄДНАНИЙ КРИТЕРІЙ БАЙЕСА-ЛАПЛАСА ТА МІНІМАКСУ (BL(MM)-критерій) Правило вибору цього критерію формується в такий спосіб. Матриця рішень (гри) доповнюється ще трьома стовпцями. 1. Математичне очікування кожного з рядків. 2. Різниця між опорним значенням max{min(𝐴𝑖 , 𝛱𝑗 )} та найменшим значенням min(𝐴𝑖 , 𝛱𝑗 ) відповідного рядка. 𝛱𝑗 𝐴𝑖 𝛱𝑗 3. Різниці між найбільшим значенням max(𝐴𝑖 , 𝛱𝑗 ) кожного рядка та 𝛱𝑗 найбільшим значенням max[max{min(𝐴𝑖 , 𝛱𝑗 )}] того рядка, в якому знаходиться значення max{min(𝐴𝑖 , 𝛱𝑗 )}. 𝛱𝑗 𝐴𝑖 𝛱𝑗 𝐴𝑖 Вибираються ті варіанти, рядки яких дають найбільше математичне очікування. Нехай у нашій задачі 𝑃(𝛱𝑗 ) = 0,2. Матриця гри буде виглядати наступним чином: 𝜫𝟏 2800 𝜫𝟐 3000 𝜫𝟑 3200 𝜫𝟒 3400 𝜫𝟓 3600 𝒏 ∑ 𝑷(𝜫𝒋 )(𝑨𝒊 , 𝜫𝒋 ) 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 𝐦𝐚𝐱(𝑨𝒊 , 𝜫𝒋 ) 𝜫𝒋 𝐦𝐚𝐱{𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 )} 𝜫𝒋 𝑨𝒊 𝐦𝐚𝐱 − 𝐦𝐚𝐱𝟏 − 𝐦𝐢𝐧(𝑨𝒊 , 𝜫𝒋 ) 𝒋=𝟏 𝜫𝒋 𝑨𝟏 2800 940 940 940 940 940 940 940 940 0 0 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 3000 3200 3400 3600 880 820 760 700 900 940 880 820 900 1060 1000 940 900 1060 1120 960 896 988 976 920 880 820 760 700 880 820 760 700 900 1060 1120 1180 60 120 180 240 -40 120 180 240 Вибираємо з (940; 988; 976; 920) максимальний елемент max = 988. Таким чином приходимо до висновку, що для адміністрації театру за критерієм BL(MM) найвигідніше використати стратегію 𝐴3 , тобто замовити 3200 програмок. Боровський Денис КРИТЕРІЙ ДОБУТКІВ Критерій творів теж застосовується після ухвалення рішення за умов невизначеності. Це більш нейтральний критерій порівняно з принципом максиміну та критерієм азартного гравця. 𝑨𝟏 𝑨𝟐 𝑨𝟑 𝑨𝟒 𝑨𝟓 2800 3000 3200 3400 3600 𝜫𝟏 2800 940 880 820 760 700 𝜫𝟐 3000 940 900 940 880 820 𝜫𝟑 3200 940 900 1060 1000 940 𝜫𝟒 3400 940 900 1060 1120 960 𝜫𝟓 3600 940 900 1060 1120 1180 𝐦𝐚𝐱{∏𝒏𝒋=𝟏(𝑨𝒊 , 𝜫𝒋 )}. 𝑨𝒊 733904022400000 577368000000000 918035132800000 838942720000000 611213568000000 Таким чином приходимо до висновку, що для адміністрації театру за критерієм добутків найвигідніше використати стратегію 𝐴3 , тобто замовити 3200 програмок. ВИСНОВОК: У результаті вирішення статистичної гри за різними критеріями найчастіше рекомендувалася стратегія 𝐴3 .

Теорія ігор та прийняття рішень. Прийнтяття рішень в умовах невизначеності. Боровський Денис

Products

Support

Теорія ігор та прийняття рішень. Прийнтяття рішень в умовах невизначеності. Боровський Денис

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib