Модели и методы принятия решений - конспект лекций

НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ УКРАИНЫ «КИЕВСКИЙ ПОЛИТЕХНИЧЕСКИЙ ИНСТИТУТ» Модели и методы принятия решений Конспект лекций pti08 [Выберите дату] [Введите аннотацию документа. Аннотация обычно представляет собой краткий обзор содержимого документа. Введите аннотацию документа. Аннотация обычно представляет собой краткий обзор содержимого документа.] Оглавление Вступление............................................................................................................................ Субъекты ППР ................................................................................................................... Лицо, принимающее решение (ЛПР) ......................................................................... Группа, принимающая решение (ГПР) ....................................................................... Консультанты (К) .......................................................................................................... Эксперты (Э).................................................................................................................. Лоббист (Л) ................................................................................................................... Принятие решений .......................................................................................................... Приём эффективного управления .............................................................................. Обобщённая задача ПР ....................................................................................................... Альтернативы ................................................................................................................... Критерий ........................................................................................................................... Предпочтение .................................................................................................................. Суждения .......................................................................................................................... Постановка задачи ........................................................................................................... Например...................................................................................................................... Анализ Парето .................................................................................................................. Definition (БО доминирования по Парето) ................................................................ Definition ....................................................................................................................... Пример.......................................................................................................................... Def (паретовское множество) ..................................................................................... Утверждение ................................................................................................................ Функция выбора............................................................................................................... Анализ Слейтера .............................................................................................................. Definition (БО доминирования по Слейтеру)............................................................. Def (Множество Слейтера) .......................................................................................... Утверждение ................................................................................................................ Сравнение Sle&Par ........................................................................................................... Бинарные отношения .......................................................................................................... Способы задания ............................................................................................................. Перечислением ............................................................................................................ Матрицей ...................................................................................................................... Графом .......................................................................................................................... Свойства ............................................................................................................................ Утверждение .................................................................................................................... Переход к двойственному графу .................................................................................... Операции над бинарными отношениями ......................................................................... Функции выбора .................................................................................................................. Способы задания ............................................................................................................. Табличный .................................................................................................................... Аксиоматический ......................................................................................................... Процедурный (механизм выбора) ............................................................................. Примеры функции выбора.......................................................................................... Классификация функций выбора ............................................................................... Свойства функций выбора .......................................................................................... Классы функций ........................................................................................................... Декомпозиция и Агрегирование ................................................................................ Агрегирование ............................................................................................................. Коллективные решения ...................................................................................................... Решающие правила по большинству ............................................................................. Кондорсе....................................................................................................................... Решающее правило по де Борда................................................................................ Метод Шульлце................................................................................................................ Пример Фишберна........................................................................................................... Пример Акулина (2006, КГУ) ........................................................................................... Аксиомы Эрроу ................................................................................................................ Аксиома универсальности .......................................................................................... Аксиома единогласия .................................................................................................. Аксиома независимости от несвязанных альтернатив ............................................ Аксиома полноты ......................................................................................................... Аксиома транзитивности ............................................................................................. Парадокс Эрроу (Теорема о невозможности «счастья», «торжества демократии» Эрроу) .................................................................................................... Аксиома о независимости от несвязных предпочтений .......................................... Принятие решений в малых группах.............................................................................. Метод проецирования (из факторного анализа, Математическая Статистика) ................................................................................................................... Теория полезности .............................................................................................................. Функция полезности (НУЖНО ЗНАТЬ) ............................................................................ Пример.............................................................................................................................. Аксиома первая................................................................................................................ Аксиома вторая ................................................................................................................ Аксиома третья................................................................................................................. Аксиома четвёртая (аксиома стягивания одинаковых исходов) ................................. Аксиома пятая (аксиома средней цены) ....................................................................... Аксиома шестая................................................................................................................ Теорема фон-Неймана .................................................................................................... Пример: задача про урну ................................................................................................ Парадокс Алле.................................................................................................................. Механизмы нерационального поведения .................................................................... Пример 1 ....................................................................................................................... Суждение «по одёжке» ............................................................................................... Суждение по встречаемости ....................................................................................... Суждение по точке отсчёта ......................................................................................... Сверхдоверие (своими суждениями о прошлых событиях) .................................... Стремление исключить риск ....................................................................................... Манипулируемость по переключению потери/приобретения ............................... Напутствия .................................................................................................................... Причины нерационального поведения ..................................................................... Коллективная функция полезности ............................................................................... Пример 1 ....................................................................................................................... Пример 2 ....................................................................................................................... Задачи ПР с объект-моделями ........................................................................................... Пример.............................................................................................................................. Линейные ограничения ................................................................................................... Метод Дайера-Джиофриона ( ) .................................................................................. Человеко-машинные процедуры ................................................................................... Метод оценивания векторов ...................................................................................... Поиск удовлетворяющих значений критериев ......................................................... Методы коэффициентов важности ............................................................................ ЧМП для задач ПР с субъективными моделями ........................................................... Метод стоимость/эффективность .............................................................................. Метод анализа иерархий (Analytical Hierarchy Process), Саати ............................... ELECTRE I (с франц.) (проф. Руа) .................................................................................. ELECTRE I ....................................................................................................................... Модели рефлексивного выбора..................................................................................... Рефлексия 0 ранга ........................................................................................................ Рефлексия I ранга ......................................................................................................... Непрерывная (вероятностная) модель .......................................................................... Модели рефлексии II ранга......................................................................................... Dirty Face Game ............................................................................................................ Биржа ............................................................................................................................ Два генерала ................................................................................................................ Чжуан-Цзы и Хуэй-Цзы ................................................................................................ Вступление Принятие решений – ПР. Процесс принятия решений (ППР) характеризуется составом субъекта. Субъекты ППР Лицо, принимающее решение (ЛПР) Лицо, принимающее решение, несёт ответственность за последствия. Группа, принимающая решение (ГПР) Голосования – способ коллективного принятия решения. Несут ответственность все. Фирме для проведения политики нужно принимать решения. Для этого, например, существует совет директоров. Консультанты (К) Это специалисты по принятию решений. Их особенность в том, что ЛПР и ГПР могут иметь свои предпочтения, а К – нет, ему всё равно, но от него зависит качество принятого решения. В конечном счёте, его гонорар будет зависеть от того, насколько принятое решение будет успешным. Ему всё равно, какое будет принято решение – ему важно качество принятого решения. ЛПР и ГПР могут не знать массу особенностей, не знать математику, а К всё это знает. Эксперты (Э) Особенность позиции эксперта состоит в том, что его не интересует, какое решение принято – интересует лишь правильность. Он даёт ответ лишь на локальный вопрос: «А что будет, если сделать то-то?» (то-то не есть всё решение, а есть нечто локальное). Его задача – давать экспертные оценки. Производит «экспертные оценки». Принимает роль оракула. Как сделать так, чтобы на взлётной полосе не вырос кактус? Говорят, что для того, чтобы быть экспертом, нужно, чтобы он проработал в своей области хотя бы 10 лет. Особенности экспертных знаний в том, что они не формализуемы. Они знают, как, но не знают, почему. Лоббист (Л) Лоббисты – активные группы, группы влияния. Пример: парламент, принимается законопроект. безразличных к такому решению нет. Понятно, что Лоббисты оказывают внешнее давление на тех, кто принимает решение. Лоббисты – заинтересованные группы населения, которые оказывают внешнее влияние на процесс принятия решения, но не могут в нём участвовать. Их присутствие учитывать необходимо. Если им решение не понравится, они будут «вставлять палки в колёса», пока решение реализуется. Может создаться иллюзия, что в принятии решения главное – принять решение. На самом же деле, главное – реализовать решение. Временами правильное решение может оказаться нереализуемым. Принятие решений Принятие решений – не математика, а ближе к физике. Приём эффективного управления Когда идёшь на экзамен, но знаешь не на пять баллов, нужно уверить себя, что знаешь на балл выше. Экзаменатор это почувствует и оценит. Если по студенту видно, что он претендует на троечку, то почему бы не поставить двойку? А если претендует на пять, то как ему поставить тройку? Уверить преподавателя – не поможет. Нужно уверить себя. Обобщённая задача ПР Альтернативы Чтобы принять решения, нужны какие-то варианты решения – альтернативы. – альтернативы. Варианты решений, из которых нужно сделать выбор. Альтернативы могут быть модифицируемы, множество альтернатив пополняемым, но должно быть хотя бы две альтернативы. – множество принципов оптимальности, насколько альтернатива хороша (критерии, суждения). Критерий Критерий – некоторая функция, которая позволяет сопоставить численную оценку альтернативой. – шкала. Обычно – это множество вещественных чисел. Любая функция может выступать в качестве критерия, она выражает предпочтения ЛПР – мы (консультанты) не можем накладывать каких-либо ограничений на волю ЛПР: он вправе захотеть что угодно. Предпочтение Предпочтение задаётся как бинарное альтернатив (результат парных сравнений). отношение на множестве – не хуже, чем Суждения Суждения – вербальные оценки Постановка задачи Должны быть заданы множество альтернатив и множество принципов оптимальности – тогда задача поставлена. Например У нас есть два критерия, множество альтернатив – ось , отрезок [ [ ] ]. Анализ Парето 80% работы выполняется за 20% времени – правило Парето Парето предложил в этой ситуации действовать следующим образом: не выбирать лучшее, а отбрасывать худшее. Сравнивать попарно альтернативы и отбрасывать те, что заведомо хуже. ̅̅̅̅̅ – например, альтернатива хуже по всем критериям, ( ) ( ) чем альтернатива . Definition (БО доминирования по Парето) доминирует по Парето ( ) ( ) ( ) ( ) ( ) ( ) Definition Множество Парето – множество недоминируемых альтернатив. Пример a bx B A Элементы на отрезке [ ] не сравнимы по Парето. Def (паретовское множество) Паретовское множество – множество недоминируемых по Парето альтернатив. ̅̅̅̅̅̅ Паретовские альтернативы – те, что входят в паретовское множество. Утверждение Паретовские альтернативы несравнимы по Парето. Функция выбора – предъявление, Функцией выбора (choice) называется любая функция, заданная на множестве предъявлений и обладающая следующим свойством: ( ) – выбираемые альтернативы. Анализ Слейтера Definition (БО доминирования по Слейтеру) доминирует по Слейтеру ( ) ( ) ( ) Def (Множество Слейтера) Слейтеровское множество – множество недоминируемых по Слейтеру альтернатив. ̅̅̅̅̅ Утверждение Слейторовские альтернативы несравнимы по Слейтеру. Сравнение Sle&Par ̅̅̅̅ ̅̅̅̅ Альтернатива, доминируемая по Слейтеру, автоматически доминируема по Парето. Альтернатива, недоминируемая по Парето, недоминируема по Слейтеру. Критерий доминирования по Слейтеру жёстче, а это значит, что множество доминируемых по Слейтеру альтернатив уже, чем множество доминируемых по Парето. Это значит, что множество недоминируемых по Слейтеру альтернатив шире, чем множество недоминируемых по Парето альтернатив. Поскольку множество недоминируемых по Слейтеру альтернатив – множество Слейтера, делаем вывод, что множество Слейтера шире: Бинарные отношения Бинарное отношение формализует результат парного сравнения. – в основном будем подразумевать под этим отношением, что не хуже, чем . Частные случаи: такой же, как ; лучше, чем Например, как выясняется лучший шахматист в турнире: каждый играет с каждым, а потом выясняется, кто лучше. Способы задания Перечислением Например ( ̅ )( )( )( )( ) Матрицей [ ] Пересечение строчки с столбиком – значит, , иначе ̅ Графом Свойства ̅ ̅̅̅̅ ̅ ̅ : ( ̅) ( ) Утверждение ( ( ) ) Переход к двойственному графу Переход от к : 1. Петли выбрасываем и добавляем туда, где не было 2. Однонаправленные рёбра сохраняются 3. Встречные рёбра стираются 4. Пары вершин без рёбер объединяются встречными рёбрами Операции над бинарными отношениями Бинарное отношение и Например, родственные отношения «Быть дядей», «Быть братом» и «Быть сыном»: Получим произведение из графа бинарного отношения Чтобы получить произведение бинарных отношений из матрицы, нужно выполнить булевское умножение матриц (вместо сложения будет дизъюнкция, вместо умножения – конъюнкция): Функции выбора – множество альтернатив ( ) ( ) Функция выбора называется полной, если она задана для всех предъявлений. Но в реальности она зачастую неполная. Задача пополнения решается с помощью логических средств. Способы задания Табличный ( ) Аксиоматический Если у нас есть какая-либо функция, то мы можем предъявить к ней требования в виде аксиом. Например ( ) ( ) Но не всегда удастся разумный вывод охарактеризовать логически. В частности, есть разумные функции, не удовлетворяющие этой, с виду логической, аксиоме. Процедурный (механизм выбора) Например, Паретовский анализ. Там лучшие элементы – те, что принадлежат множеству Парето, формирование которого мы можем описать процедурно: выкидываем все доминируемые элементы из множества и оставляем лишь недоминируемые. Примеры функции выбора Скалярный оптимизационный механизм Одна скалярная функция, один критерий. ( ) – критерий ( ) ( ) Условно-экстремальный механизм ( ) – критерий ( ) – ограничена ( ) – всё так же, как в прошлом случае, только условие ( ) другое Оптимизационный механизм доминирования Есть бинарное отношение ( ) ∣( ) Пример Есть , тогда механизм доминирования выбирает те вершины, из которых есть стрелки во все вершины (в себя тоже): отбирает вершины с выходными рёбрами во все вершины. ( ) Оптимизационный механизм блокировки Механизм определяется следующим образом: ( ) ) ̅ (выбор недоминируемых ∣( альтернатив) ( ) В графе отбираются вершины без петель и входящих рёбер. Упражнение: по Механизм ограничения Бинарное отношение , , ( ) ∣ В графе это все вершины, которые доминируют – те, из которых входят стрелки в , в том числе само , если оно имеет петлю. Механизм блокирующих ограничений ( ) ∣ ̅ Паретовский механизм ( ) – критерий ( ) { ∣∣ ( )( ) ( ) ( )( ) ( ) ( )} Механизм лексикографической оптимизации (ЛГО) Ранжируем ( ) по важности ( ) ( ) ( ) быстро вырождаются ЛГО с уступками Кроме вектора критериев вводится вектор уступок ( ) – вектор критериев – вектор уступок Оптимизация проводится с точностью до Главная идея лексикографической оптимизации – последовательная оптимизация. Вводится уступка Во-первых, все наши расчёты имеют какие-то уступки. – точность представления соответствующей величины. Всегда есть точность, всегда величины неточные. Во-вторых, нам может быть просто не жалко сделать какие-то уступки. Эта величина может быть вызвана тем, что нам не жалко сделать такие уступки. За счёт того, что мы введём оптимизацию с определённой ошибкой, то, возможно, следующий критерий определим лучше, потом что будем иметь гораздо больше данных. В-третьих, это может быть запас/допуск. – множество вложенных критериев. Правило экстремальных механизмов Альтернатива считается выбранной, если она лучше хотя бы по одному критерию. Мы не раздумываем, какая альтернатива лучше или хуже, если какая-то лучше по одному из критериев, а говорим, что обе хороши. ( ) { ( )} | ⋃ ( ) Турнирный механизм Как определяются победители в турнирах? Парными сравнениями. Два лба разгоняются на кобылах и сталкиваются. У кого голова крепче и кто не упал, тот победил. Это турнир с выбыванием. В футбольных кубках так же. Но бывают турниры круговые – например, шахматный турнир проходит по круговой системе: каждый встречается с каждым, за каждую игру получают очки. Лучше тот, у кого больше очков. У нас должно быть некое бинарное отношение , значащее превосходство. Зададим шкалу, которая будет оценивать очки. Возьмём шахматную шкалу: Одно очко, когда лучше , а не хуже ( победил) Пол-очка, когда никто не лучше (ничья) Ноль очков, когда не лучше , а лучше ( победил) ̅ ( ) { ̅ Количество очков игрока будет суммой всех сравнений. Как мы видим, это турнир без выбывания ( ) ( ) { ∑ | ( ) ( )} Механизм центра тяжести ( ) – множество, в котором всё происходит – множество выпуклых подмножеств Выпуклое подмножество – возьмём множество. Выпуклое множество – такое множество, любые две точки которого соединяются отрезками, входящих во множество. Например, круг – выпуклое множество, так как каждая хорда входит в круг. Предъявлениями будут как раз элементы . Тогда в качестве выбора (в качестве наилучшего из предъявлений) выбирается его центр тяжести. Значит, должна быть мера, заданная на всём . Если у нас есть мера, то мы можем интегрировать по этой меры и вычислять, где находится центр тяжести. ∑ ⃗⃗⃗ ⃗ – центр тяжести для дискретно распределённой массы ∑ ∫ ∫ – центр тяжести для множества с мерой Дальше пойдут абстрактные примеры Сильнодоминантный механизм доминирования Рассматриваем бинарное отношение , которое будет задано не там, где мы привыкли. ⟨ ⟩ То есть, надо придумать способ сравнения элемента из множества альтернатив с множеством. ( ) Сильнодоминантный механизм блокировки Напрямую перенести определение блокировки нельзя, так как структура бинарного отношения не поменяется и слева опять будет элемент, а справа множество. Поэтому сделаем справа множество с одним элементом ̅ } ( ) { | Слабодоминантный механизм доминирования Всё так же, но будет некое ослабление ( ) ( )( ) Слабодоминантный механизм блокировки ( ) ( )( ) Таким образом, ослабление в том, что сам элемент может не удовлетворять сравнению, а некая его оболочка может удовлетворять. Гипердоминантный механизм доминирования В этом механизме бинарное отношение будет легче понять. сравнивает множества, поэтому ( ) Гипердоминантный механизм блокировки ̅ ( ) Механизм голосования (мажоритарный выбор, т.е., по большинству) Это механизм для коллективного выбора решений. Самый логичный вариант – выбор большинства. Если альтернативы две, то способ логичен, потому что будет выбор будет тот, за который проголосует большая часть избирателей. Когда альтернатив больше, то это плохо, так как необязательно большинство будет за сделанный выбор. Когда большинство абсолютное, то вопросов нет, а когда нет большинства, то возникают проблемы. Есть набор критериев (избирателей) ( ) { | ∑ [ ( ) ( )] } Если альтернатива по мнению большинства лучше, то она побеждает. Классификация функций выбора Для изучения свойств выбора как таковых процедурный подход неэффективен. Поэтому лучше изучать функции выбора аксиоматическим методом – это позволяет более отчётливо изучить функции выбора. Пусть – класс всех функций выбора. – класс функций непустого выбора. То есть, функции результативного выбора – на любом непустом предъявлении функция должна хоть что-то выбрать. ( ( ) ) – класс функций однозначного выбора. ( )) ( Если функция принадлежит классу , это значит, что она хоть что-то выберет на любом непустом предъявлении. То есть, он является подмножеством класса Введём класс функций, которые называются нормальными функциями выбора. Нормальная функция выбора – такая, которая может быть задана, построена по бинарному отношению либо механизмом доминирования, либо механизмом блокировки. Она порождается механизмом доминирования или блокировки из бинарного отношения . Называется нормальной, поскольку её результат – результат парных сравнений с помощью бинарного отношения. ( ) ( ) ( ) ( ) Структура нормального выбора Утверждение 1 Для нормального выбора: если элемент не выбирается из некоторого предъявления, то он не выбирается и из расширения этого предъявления. ( ) ( ) Доказательство Раз элемент не выбирается, следовательно, его кто-то доминирует ( ) ( ) Если он уже доминируется каким-то элементом, то уже неважно, если мы добавим ещё один элемент: он уже выбывает. От того, что мы расширяем граф, стрелка, которая входит в , никуда не девается и он остаётся доминируемым. Это значит, что невыбираемость при расширении не убирается. Утверждение 2 Значение нормальной функции выбора на любом предъявлении определяется её значениями на одно- и двухэлементных предъявлениях. Представим себе граф. Вершины графа – элементы возможных предъявлений, рёбра – доминирования (если доминирует , то из него идёт стрелка в ), а нормальный выбор – когда нет входящих стрелок. Фактически одна стрелка (её направление) определяет значение функции выбора на этой паре элементов. Допустим, есть стрелка из в . Значит, доминируемо – оно пройти не может, а доминирует – оно проходит ( ) Добавим вершину , которая не соединена рёбрами ни с чем. Тогда ( ) Поскольку ни один элемент не доминируется другим. Если из будет петля, то он сам себя доминирует и выбран быть не может. Утверждение 3 Если ( ) – нормальная функция выбора, то ( ) ⋃ ⋂ ({ }) Это формула, на основании которой можно брать и вычислять значение функции выбора на любом предъявлении. Мы берём элемент и проверяем, что никакой его не доминирует. Одноэлементные предъявления тут тоже учтены – это тот случай, когда . Пример ( ) На предъявлении выбирается только . Комбинаторная оценка , – предъявление Подсчитаем количество функций выбора Традиционный расчёт можно выполнить с помощью таблицы. В левом столбике находятся предъявления, а в правой – возможные результаты функции выбора. С одноэлементными множествами выходит исходов, с двухэлементными , а для -элементных выходит . Для получения желаемого результата нужно перемножить количество всех вариантов ∏ ∑ Ещё один метод: в строчках пишем различные предъявления, в столбиках – элементы. На пересечениях пишем число вариантов выбора элемента из данного предъявления (если он не входит, то лишь один вариант, а если входит, то может выбираться или не выбираться – два варианта). Например, может быть выбран из , а может быть не выбран. не может (так как его нет в – один исход). Из множества всех элементов любой элемент может быть как выбран, так и не выбран, то у всех двойки. В строчке, соответствующей одноэлементному множеству, будет одна двойка, двухэлементному – две. В строчке, соответствующей элементам, будет двоек. Умножаем по столбцам (так удобнее) и получаем Таким способом гораздо проще посчитать количество функций выбора Теперь посчитаем количество нормальных функций выбора. Поскольку нормальный выбор определяется только выбором на одно- и двухэлементных предъявлениях, каждый элемент может: 1) Не выбираться при самопредъявлении – один вариант выбора (потому что в таком случае он больше нигде не будет выбираться) 2) Выбираться при самопредъявлении, а другие выборы определяются результатами выбора на парных предъявлениях, которых . То есть, для фиксированного элемента существует вариантов выбора. Для всех элементов нужно возвести полученное значение в степень ( ) К сожалению, не все механизмы могут быть реализованы с помощью нормальных функций – например, турнирный механизм. Свойства функций выбора А. Сен один из первых начал заниматься вопросами характеризации свойств выбора, в частности нормальными функциями выбора, начал с Непустые функции выбора Теорема о не пустоте нормального выбора. Бинарное отношение порождает непустую функцию выбора тогда и только тогда ( ), когда , рассматриваемое как отношение блокировки, ациклично. Доказательство начнём от противного. Имеет утверждение На конечных предъявлениях. Докажем сначала в одну сторону ( ): непустота влечёт ацикличность. Допустим, есть такое ацикличное, при котором выбор пустой – предъявление, ( ) Если ответ «да», то противоречие и теорема доказана. Пойдём по пути «нет»: в этом случае найдётся элемент , который доминирует элемент : ( ), то найдётся такой элемент , который доминирует : Если же И так далее. Таким образом, мы получим цепочку , которая должна либо зациклиться, либо оборваться (закончиться на каком-то элементе). Зациклиться она не может по условию, а если окончится, то будет некий элемент, на котором цепочка закончится – значит, есть какой-то никем не доминируемый элемент, который выбирается – противоречие. ( ) Теперь докажем в обратную сторону ( ): Допустим, есть цикл В таком случае каждый элемент доминируем, и никакой элемент не выбирается ( ) То есть, из цикличности следует то, что функция выбора не принадлежит . Это значит, что из принадлежности функции множеству следует ацикличность. Доказано Функции выбора с одним исходом Для был получен следующий результат Def Бинарное отношение называется слабо полным, если Айзерман и Малишевский Классы функций Класс функций наследования Класс функций наследования ( ). Свойство наследования заключается в следующем: ( ) ( ) Согласия ( ) согласия ( ) ( ) ( ) Отбрасывания ( ) отбрасывания ( ) ( ) ( ) Строгое наследование (константность) ( ) строгое наследование ( ) ( ) Нормальные функции выбора Нормальный выбор – функции, которые обладает свойствами наследования и согласия Сен: Невыбираемость при расширении – то же самое, что выбираемость при сужении. Если альтернатива недоминируема и в , и в , то в их объединении не будет элементов, которые доминируют эту альтернативу, им неоткуда взяться. Утверждение (А-М) 1. Характеристические свойства наследования (Н), согласия (С) и отбрасывания (О) независимы в совокупности 2. Свойство константности: 3. В : , – функции, обаладающие свойствами наследования (Н), согласия (С), отбрасывания (О), при этом обладая однозначностью Независимость Н, С и О в совокупности значит, что то, что выполняется или не выполняется одно из условий, не зависит от того, выполняется ли какое-либо другое. Эти отношения удобно показать в виде диаграммы ФВ Н О К С Пример ( ) Турнирный механизм тоже не удовлетворяет этим условиям А-М 1. ( ) порождается сильнодоминантным механизмом доминирования 2. ( ) порождается слабодоминантным механизмом доминирования 3. ( ) порождается гипердоминантным механизмом доминирования, выделяя из единственное множество 4. ( ) порождается бинарным отношением слабого порядка 5. ( ) реализуется скалярным оптимизационным механизмом ( ) 6. те функции выбора, которые порождаются Паретовским механизмом 7. ( ) порождается совокупно-экстремальным механизмом Декомпозиция и Агрегирование Декомпозиция Рассмотрим простые примеры декомпозиции. Разложение в ряд Тейлора – декомпозиция. ( ) Мы представляем сложную функцию через простые функции ( ) ( ) , операции умножения и сложения. Разложение в ряд Фурье и ДНФ и разложение вектора по базису тоже являются декомпозициями. Переходя к функциям выбора, мы понимаем, чего хотим ожидать: мы хотим представлять сложные функции выбора с помощью более простых функций выбора. Теоретико-множественные линейные комбинации ( ) ∑ Мы использовали это в методе линейной свёртки. Как построить линейную комбинацию множеств? Во-первых, вместо суммы берём объединение. Вместо константы берём какое-то фиксированное множество. Осталось лишь добавить пересечение с функцией выбора. ( ) ⋃ ( ) Утверждение ( ( ) )( ( ) ) ( ) ( ) ⋃ Следствие ( ) ( ) ( ) – скалярный оптимизационный механизм для -го критерия Декомпозиция нужна ещё из практических соображений. Например, ряд Тейлора позволяет вычислять сложные функции с любой наперёд заданной точностью. Если предъявляется единственный вариант, являющийся выбираемым, то он обязан выбираться ( ) ( ) Мажоритарная операция выбирает те элементы, которые принадлежат большинству ( ) [ ⋃ ] Утверждение Любая функция выбора из представима в мажоритарной операции от суперпозиции функций выбора, порождаемых произвольными бинарными отношениями (нормальными функциями выбора). ( ) ( ) ( ( ( )) ( Утверждение (альтернативная формулировка) ( ))) ( ) ( ) ⋂⋃ ( ( ) ( )) Где функция выбора порождается слабыми порядками, то есть это функции из – класса функций, реализуемых скалярным оптимизационным механизмом. : – уровень, – индекс Изобразим графически, начнём изнутри – с объединений Переходим к пересечениям Утверждение заключается в том, что любые функции можно упростить до таких пересечений и объединений ( ) ⋂⋃ ( ( ) ( )) ⋃ ⋂ Агрегирование Последовательный синтез ( ) ( ) ( ) Например, ЛГО Параллельный синтез ( ) ( ) ( ) ( ) ( ) Например, ( ) Паретовский механизм Метод линейной свёртки ∑ ∑ Коллективные решения Особенность решений в футболе, в политике заключается в том, что все разбираются, все знают как надо, но никто не знает, во сколько это обойдётся. Индивидуальные решения – это хорошо, но люди складываются в коллективы и решают коллективом. Решающие правила по большинству Если есть выборщиков и альтернатив, то побеждает та альтернатива, которая получает большинство голосов. Это хорошо, когда альтернативы две, но когда больше, то всё может быть не так хорошо. Когда альтернативы две, то победитель обычно получает больше половины голосов за исключением патовой ситуации. В таких случаях можно добавить ещё одного выборщика. – абсолютное большинство Но когда альтернатив больше двух, то часто возникает такая ситуация, что против победителя абсолютное большинство. В таких случаях вводят второй тур. (канд.) ( ) – линейный порядок -го выборщика – пример линейного порядка Найти коллективно упорядоченное множество: на ( ) – решающее правило Свойства 1. Равноправие кандидатов. Заключается в том, что функция инвариантна. То есть, для любой перестановки на получаем ( ) ( ) 2. Равноправие выборщиков. – перестановка на множестве выборщиков ( ) , то есть не зависит от 3. Правило монотонности (дополнительный голос не лишает победы) Теорема (Мэй, 1952) Решающее правило по большинству единственное, которое 1. Нейтральное (равноправие кандидатов) 2. Анонимное (равноправие выборщиков) 3. Монотонное Если ввести три эти принципа, то ничего кроме принципа большинства не остаётся Пример Допустим, выборщики упорядочили их таким образом 5 выборщиков считает 7 выборщиков считает 6 выборщиков считает Мы видим, что с помощью такой таблички (профиля предпочтений) можно сравнить любую пару кандидатов. Кондорсе Победа по Кондорсе – побеждает любого другого при парных сравнениях Контпример 23 17 2 10 8 Парадокс Кондорсе – система не работает, когда есть цикл Аристократический механизм – сравнения по парам, демократический – через механизм Решающее правило по де Борда Борда предложил начислять очки. Например, за первое место начисляем три очка, за второе два, за третье одно По Борда побеждает Контрпример 2 23 19 16 16 Большинство – Кондорсе – Кондорсе не согласуется с правилом большинства Контрпример 3 31 12 15 2 Начисляем 2 очка за первое место, 1 за второе и 0 за третье По Борда победитель , но по большинству Решающее правило называется состоятельным по Кондорсе, если оно поддерживает выбор победителя по Кондорсе. ( ) – число избир. счит. Копленд: ( ) ∑ ( Поб. ) ( ) Симпсон ( ) ( Поб. ) ( ) – победитель по Кондорсе ( ) ( ) – победитель по Кондорсе ( , ( ) ) ( ) Состоятельность Состоятельность по Кондорсе для решающего правила означает, что победитель по Кондорсе является победителем по этому правилу. Количество избирателей, считающих, что лучше, чем ( ) ( ) ∑ ( ) Пусть – победитель по Кондорсе, Давайте попробуем сравнить ( ∑ ( ∑ ( )и ( ). ) ∑ ( ) ∑ ( ) ) Идея заключается в том, чтобы доказать, что любое ( ( ), если побеждает . Гипотеза: ( ) ( ) Дальше идей нет. Попробуем разобраться с парадоксом Кондорсе ) побеждает 23 17 2 10 8 Имеет место цикл. ( ( ( ед е ег вы ед ед е р ры ы е е ) ( ) ) е ду – ед е в у – ) ( ) у взг ( ) ( ) ( ) е ув э фры . р г ы ее Метод Шульце Как можно графически определить победителя по Кондорсе? Достаточно нарисовать граф бинарного отношения, затем посмотреть того, кто выбирает всех. Метод Шульце начинается с того, что для всех рёбер указываются веса. Вес ребра – сила прямой победы. B C A D Любое ориентированное ребро определяет прямую победу. Последовательность ориентированных рёбер (маршрут) – косвенная победа. Сила пути – минимум сил рёбер. Сила победы – максимум сил путей. Прямая победа – частный случай победы. Идея победы по Шульце в том, чтобы добавить к рассмотрению ещё и косвенные победы, что добавляет обоснованности победителю. Победитель по Шульце побеждает всех остальных с учётом косвенных побед. Руководитель отдела Wikimedia и разработки Debian выбирается по методу Шульце на определённый срок. Утверждение Правило Шульце является состоятельным по Кондорсе, то есть победитель по Кондорсе является победителем по Шульце. – победитель по Кондорсе. Это значит, что любая выходящая из стрелка имеет метку связывается с . Сила победы по Шульце будет больше половины (больше, чем ), потому что один из путей уже точно, чем , а это значит, что максимум больше, чем , а значит, что по Шульце. является ещё и победителем Пример Фишберна У нас есть два основных подхода – два базовых правила: правило Кондорсе и правило Борда. Кондорсе – выбор по парным сравнением, а Борда – выбор по оценкам, выбор по критерию. Если выбор по Кондорсе достаточно жёсткий и определённый, то Борда кажется неопределённым, потому что кажется, что, манипулируя шкалой, может меняться победителя. Шкала Борда для кандидатов Обобщённая шкала Борда 1 2 2 3 По Кондорсе победитель и победитель по большинству (один из двух, т.к. тоже победитель по большинству, имея три голоса). Что даёт Борда? Давайте посчитаем оценку Борда для р в ( ) ( ) р в З У д е р ед е ед е ую ш у рд д р е ы у э ш ву резу ы е же Пример Акулина (2006, КГУ) 4 2 2 3 По Кондорсе победитель , по Борда , нестрогая шкала. Аксиомы Эрроу Аксиома универсальности Профессор Эрроу потребовал в первую очередь, чтобы решающее правило, которое должно быть, работало с любыми профилями предпочтения. То есть, решающее правило должно сработать для любых предпочтений избирателей. Аксиома: Решающее правило эффективно на любых предпочтениях избирателей. Это значит, что соответствующее правило полное как функция – определена на всех возможных предпочтениях. Аксиома единогласия Если все избиратели решают, что кандидат лучший, то решающее правило должно показать, что кандидат лучший. Аксиома: решающее правило подтверждает единогласный выбор избирателей. Аксиома независимости от несвязанных альтернатив Формулируется она следующим образом: результат попарного сравнения, о котором идёт речь дальше, не зависит от третьих кандидатов. То есть, любая пара кандидатов должна быть сравнима, а результат этого сравнения не должен зависеть от контекста, от того, что вокруг. Она кажется очевидной, потому что так всегда, когда мы имеем дело с бинарным отношением. Но когда решающее правило задаётся функцией выбора, не являющейся нормальной, то эта аксиома не будет выполняться. Если бы Эрроу это осознал, то сказал бы проще. Более простая формулировка: решающее правило задаётся нормальной функцией выбора, заданной бинарным отношением. Аксиома полноты Достаточно очевидно звучит. Аксиома: Любая пара кандидатов должна быть сравнима. Здесь неявно, но содержится очень важное обстоятельство. Видно, что надо использовать бинарные отношения Аксиома транзитивности Если мы можем сравнивать пары кандидатов, то возникает нестрогое бинарное отношение и требуется, чтобы это отношение было транзитивно. Парадокс Эрроу (Теорема о невозможности «счастья», «торжества демократии» Эрроу) Исследовав все вышесказанные аксиомы, Эрроу и получил этот парадокс. В аксиомах шла борьба за демократию и существует единственное решающее правило, удовлетворяющее всем аксиомам, и это правило – диктаторство. Решающее правило диктатора: ( ) Где диктатор – -ый избиратель. Или же консенсус – стремиться нужно к единогласию. Аксиома о независимости от несвязных предпочтений Смысл аксиомы такой: если мы сравниваем между собой две альтернативы, то результат их сравнений не зависит больше не от чего. Это и есть контекстная независимость. Результат выбора или не должен зависеть от контекста результата парного сравнения. Это означает, что решающее правило должно задаваться нормальной функцией выбора. Нормальная функция выбора должна реализовывать решающее правило выбора. По большому счёту, это есть аксиома нормализации, но в реальном мире она обычно не выполняется. Контрпримеры Посетитель в ресторане Идёт гурман в любимый ресторан, а он закрыт. Он посещает другой ресторан, берёт меню и видит блюда и , которые ему нравятся. Будь он в любимом ресторане – выбрал бы безоговорочно, но он не знает, хорошо ли делают блюдо в этом ресторане. Он решает не рисковать и выбирает блюдо . В следующий раз он видит знакомого, который уплетает блюдо , которое не относится к блюду, которое он бы стал выбирать, но знает, что оно тоже сложное, но не очень любит его. Тем не менее, за соседним столиком знакомый уплетает с аппетитом это блюдо. Из этого он делает вывод, что, если повар так хорошо сделал сложное блюдо , то он может справиться и с блюдом и заказывает его. Оказывается, что на практике человеческие решения очень зависят от контекста. Тем не менее, нормальная теория выбора активно развивается. Судейство в фигурном катании Особенности этого судейства – достаточно произвольная шкала. Когда оценка идёт за технику исполнения, то её оценивают очень чётко: 6 баллов – все элементы хорошо выполнены и так далее вниз. Когда же ставят оценку за артистичность, то всё смутно, а оценки следующих выступающих зависят от качества выступления предыдущих. Поэтому пытаются ставить фаворитов в последнюю очередь. Проблема же возникает, когда фавориты ещё не определены. Допустим, у нас в короткой программе выступающих распределили следующим образом: где-то дальше середины выступает фаворит , а после него выступает один претендент на фаворита, до него другой претендент . Допустим, претендент выступил идеально, но ожидают хорошего выступления фаворита , поэтому ему ставят оценку . Фаворит выступает с оплошностями, поэтому ему тоже ставят , претендент выступает лучше фаворита, но хуже первого претендента, и получает (так как шкала состоялась), хотя объективно он выступил хуже, чем Параллельно рассмотрим подобную ситуацию: до фаворита выступает претендент , а после него , тогда ситуация меняется с точностью до наоборот. Если же фаворит выступит раньше претендентов, то шкала уже состоится и претенденты и будут оценены объективнее. Принятие решений в малых группах Студенческую группу, семью, совет директоров фирмы можно рассматривать как малую группу. Группы, порядок численности которых не превышает сотню, мы называем малой группой. Допустим, мы имеем дело с некоторой компанией, которая столкнулась с трудностями. Спрос на товары упал, у разных членов совета директоров разные предложения, которые разбились на следующие группы: 1. Модернизация 2. Снятие с производства и выпуск новой продукции 3. Усилить рекламу Но президент фирмы – мудрый человек и понимает, что нельзя идти на поводу ни у одних, ни у других, и нужно обратиться к специалистам по принятию решений (консультанту ). Действия специалиста: 1. Разговор консультанта и президента р. Президент – человек мудрый, поэтому он не хочет, чтобы за него было принято решение – он хочет получить помощь в принятии решения, поэтому рассказывает то, что считает нужным. Таким образом консультант получает представление о ситуации. Также консультант должен не быть специалистом в области деятельности компании, чтобы не иметь субъективных предпочтений, а помочь сделать правильный выбор. 2. Метод анкет. Консультант общается с членами совета директоров, дальше проводит анкетирование. Сформирован некий набор предпочтений (альтернатив) и набор критериев, сформированных на основе того, что рассказал президент и члены совета директоров. Консультант всё это обрабатывает некоторым образом (о методе обработке будет далее) После обработки анкет консультант сообщает президенту о проделанной работе и весь совет директоров с президентом и консультантом собирается где-то на даче у президента с сауной и прочими удовольствиями (главное – изоляция). Это называется конференция. Главные условия: 1. Изоляция от общества (желательно даже отнять мобильные телефоны) 2. Консультант должен быть подготовлен 3. То, что необходимо для обработки результатов (например, электричество для ноутбука) Метод проецирования (из Математическая Статистика) факторного анализа, Есть критериальное пространство, в котором каждая точка – критерий. Поскольку избирателей много, то слишком уж много точек получается, а это неудобно. Нужно провести исследование со следующими фазами: Первый путь: Альтернативы важнее людей Альтернативы выходят на первый план, а кто и почему их выбирает, нас не должно волновать. Составляем коллективную оценку для альтернативы. У нас есть множество точек с оценками каждого представителя группы. Применяем метод центров тяжести – получаем средне взвешенную, некую обобщённую коллективную оценку. Тут наступает время, когда нужно использовать метод проецирования, чтобы уменьшить количество критериев или выполнить преобразование. Если предположим, что у нас трёхмерное пространство критериев (три критерия), то нужно спроектировать всё на такую плоскость, которая будет проходить как можно более близкой ко всем точкам (например, методом наименьших квадратов), то есть, проекции точек на эту плоскость должны быть как можно ближе к самим точкам. Таким образом, получим новые координаты (два новых существенных критерия и один несущественный, который нужно убрать). Это хорошо тем, что так можно преобразовать многомерное множество точек к плоскости или выбрать наиболее представительные двумерные сечения – кластеризировать. Свести каждый кластер к одной альтернативе математически просто (можно опять же использовать метод центров тяжести), на практике же полученная альтернатива должна быть содержательной. Таким образом, число альтернатив и критериев понизится и возникнет новая упрощённая ситуация, а консультант во время обеда сможет пересчитать ситуацию. Второй путь: люди важнее альтернатив К людям надо подходить тоньше, на вопросы надо смотреть ширше Надо приходить к консенсусу, так как в случае наличия несогласных людей, они в лучшем случае не будут помогать, в худшем случае они будут мешать, и реализация выбранного решения провалится. Берём мнения субъектов и обобщаем мнения каждого с помощью метода центров тяжести, таким образом, в критериальном пространстве точками будут мнения членов совета директоров. Таким образом, можно предложить разным людям с близкими мнениями прийти к одному решению, уменьшив таким образом количество точек в пространстве, что опять же облегчает принятие решения. В итоге все должны прийти к некоему единому решению, которое, скорее всего, будет очень сложным. Теория полезности Функция полезности (НУЖНО ЗНАТЬ) Центральное понятие – функция полезности. Если критерий – произвольная функция на множестве альтернатив (численная характеристика «качества» альтернативы), то с функцией полезности дела обстоят несколько иначе. Критерий – любое отображение из множества альтернатив на шкалу Понятие функции полезности очень близко к критерию – это тоже функция вида , но должно быть задано бинарное отношение предпочтения ( ) ( ) R – функция нестрогого предпочтения. Функция полезности должна быть согласована с бинарным отношением предпочтения. Утверждение – функция полезности – монотонно возрастающая функция Тогда ( ) – тоже функция полезности Функция полезности – единственный кусок нашей теории, который использует интегрирование дифференциальных уравнений Фон Нейман сформулировал некий набор аксиом, при выполнении которых можно утверждать существование функций полезности. Оказалось очень полезным использовать вероятностные модели. Раньше мы рассматривали как множество альтернатив, предполагая, что оно конечно, и дискретно и никаких вероятностей тут не было видно. Допустим, – исходы ( ). Лотереей с исходами и называется такая комбинация (кортеж) , где принимается с вероятностью , а принимается с вероятностью . То есть, это случайная величина { Часто лотерею представляют графически – дополненное множество альтернатив (с присоединёнными лотереями) Пример Игра: игроки поднимают левую и правую руку. Построим матрицу выигрышей для первого игрока Л П Л -1 2 П 3 0 Если игра повторяется несколько раз, то видно, что для второго игрока выгоднее выбирать правую руку, так как он ничего не будет проигрывать в этом случае. С другой стороны, первый игрок тоже может поднимать только правую руку, сведя выигрыш второго игрока на нет. Поэтому можно применить вероятностную (смешанную) стратегию. Это был пример целесообразности дополнения. Аксиома первая Существует бинарное отношение нестрогого предпочтения – отношение строгого предпочтения, – отношение безразличия (эквивалентности) Аксиома вторая Должна выполняться связность и транзитивность Аксиома третья Утверждается, что две лотереи эквивалентны (( ) )( ) Аксиома четвёртая (аксиома стягивания одинаковых исходов) ( )( ) Аксиома пятая (аксиома средней цены) ( ) Например, если есть возможность выиграть 1 монету с вероятность , есть вероятность выиграть 3 монеты с той же вероятностью, то в среднем выигрыш будет составлять 2 монеты, которые как раз находятся между экстремальными исходами. Аксиома шестая Если находится в отношении строгого предпочтения с , а тот в свою очередь строго лучше , то существует – вероятность – такая, что с её помощью можно создать эквивалентную (игрику) лотерею ( ) При этом называют детерминированным эквивалентом лотереи (ДЭЛ) ( ) Теорема фон-Неймана При выполнении шести вышеприведённых аксиом ( ) ( ) ( ) ( ) ( ) Последняя формула – формула ожидаемой полезности (математическое ожидание лотереи) Пример: задача про урну урн первого типа и урн второго типа. Первый тип – тот, в котором белых шаров и белых и чёрных. Матрица выигрышей чёрных, второй тип – I II Мы знаем, что первый тип встречается с вероятностью , а второй с вероятностью , а это значит, что ситуация становится недетерминированной. Посчитаем функцию полезности ( ) Ожидаемый выигрыш в случае выбора составляет ( ) ( ) Ожидаемый выигрыш в случае выбора составляет Теперь посмотрим, что мы фактически делаем Чтобы выбрать наиболее оптимальный выбор, нужно идти от листьев, на узлах считать функцию полезности, а на квадратиках выбирать максимум. Парадокс Алле В основе парадокса лежит реальный эксперимент. В нём рассматривается две ситуации. Есть выбор из двух альтернатив В первом случае по математическому ожиданию лучше , но в основном выбирают , так как этот выбор надёжнее. «Сытый» человек выбрал бы , «голодный» же выберет , так как он не хочет иметь риск остаться голодным. Во втором случае очевидно, что лучший выбор – . Тут появляется такой критерий, как «удовольствие от выигрыша». Рассмотрим функцию полезности ( ) ( ) ( ) ( ) Условимся, что полезность нулевого выигрыша – ноль, а полезность максимального выигрыша – 1. ( ) ( ) ( ) Рассмотрим первый случай Второй случай Получили две противоречивые оценки – это и есть парадокс. Полезность – свойство исхода, а это значит, что оно должно вести себя одинаково как в первом, так и во втором случае. Одна из особенностей нерациональности – исключение риска. И тут люди, занимающиеся математической экономикой, поняли, что нужно рассматривать нерациональные механизмы выбора. Механизмы нерационального поведения Парадокс Алле подтвердил, что рациональность не срабатывает часто. В случае рационального поведения человек вычисляет лучший выбор, в случае нерационального поведения работает эвристика. Механизмы нерационального поведения описываются через эвристику. Эвристика – отчасти неформальная процедура. Пример 1 Дивизию из 600 человек окружили, но есть два пути выхода. В первом случае выживет человек, во втором либо все с вероятностью , либо никто не спасётся Генерал выберет первый путь Но рассмотрим другую ситуацию: в первом случае погибнет человек, а на другом пути либо никто не погибнет с вероятностью , либо все погибнут с вероятностью Очевидно, что ситуации одинаковые и разное лишь описание, но генерал тут выберет второй путь, потому что «На первом пути ведь столько потерь!» Как видим, многое зависит от постановки задачи. Суждение «по одёжке» На улице живёт юристов и инженеров. Но судить о том, кто есть кто, будут по внешнему виду. Например, юристы в костюме, инженеры в джинсах и футболках. Суждение по встречаемости Если мы смотрим на слово, то в основном обращаем внимание на первую букву, так как в словаре мы привыкли искать по первой букве. Поэтому может показаться, что буква «к» встречается в русском языке чаще каких-либо других, так как больше слов начинаются на неё. Суждение по точке отсчёта Начальная информация существенно влияет на результат. Например, когда нужно срочно принять решение и некогда делать расчёты. Сверхдоверие (своими суждениями о прошлых событиях) Человек склонен переоценивать свой личный опыт: видел ситуацию со своего угла, она произвела на него неизгладимое впечатление и он всю жизнь будет оценивать определённым образом. Например, имеем цилиндр. В одной проекции мы видим круг, а в другой мы видим прямоугольник. Если показать человеку первую проекцию, то он скажет, что это шар; если показать вторую проекцию, то скажет, что это параллелепипед. Когда мы вспоминаем прошлое, то будничные вещи меньше вспоминаются, редкие явления запоминаются лучше. Редкие события кажутся более частыми, чем будничные. Стремление исключить риск Например, лучше проиграть немного, чем иметь риск потерять всё. Манипулируемость по переключению потери/приобретения Пример с генералом. Напутствия Если мы не хотим, чтобы нами манипулировали, следует придерживаться рациональной точки зрения. Как только есть возможность решение отложить, лучше отложить. Когда нужно решать «здесь и сейчас», то нужно принимать и последовательно его придерживаться, при этом неважно, какое будет решение (подробнее – у Декарта). Например, попали в лес и заблудились. Нужно выбрать одно направление и идти туда. Если начать блуждать, то никогда не выйдешь. Цель заставить решать человека «здесь и сейчас» в том, чтобы заставить человека каждый день принимать решение по-новому. Причины нерационального поведения 1. Недостаток информированности. Информации не хватает – приходится пользоваться своими соображениями или собирать информацию. Если информация стоит слишком дорого, то придётся выбирать решение «здесь и сейчас» 2. Малый опыт ЛПР 3. Недооценка многокритериальности 4. Слабая прогнозируемость ЛПР Коллективная функция полезности ( ) – индивидуальная функция полезности -го избирателя ( ) ( )) – коллективная функция полезности должна ( ( ) быть фукцнией от индивидуальных функций полезности. Например, в экономике подсчёт благосостояния населения. – благосостояние члена общества Утилитаризм (лат. utilitas – польза, выгода): благосостояние общества – сумма благосостояний его членов ∑ Решения принимаются таким образом, чтобы рос общий достаток. Например, богатые стали богаче – благосостояние (по этому определению) выросло Эгалитаризм (фр. egalitarisme – равенство): не должно быть нищих, тогда общество живёт в достатке С такой мерой решения принимаются таким образом, чтобы увеличивался уровень жизни. Пример 1 Делёжка пирога между старшим братом и младшей сестрой. Полезность равна нулю, когда пирог не достался, равна единице, когда достался весь пирог. ( ) ( ) – возрастающая и вогнутая – насыщение сестры – насыщение брата Функция вогнутая – значит, насыщение растёт медленнее, чем линейная функция Утилитаризм ( ) ( ) ( ) ( ) ( ) ( ) – убывающая ( ) ( ) То есть, сестре надо отдать большую часть. Коллективное насыщение – сумма индивидуальных насыщений. Поскольку сестра насыщается быстрее и вносит больше в коллективное насыщение, поэтому нужно дать большую часть именно ей Эгалитаризм ( ) ( ) ( ( ) ( ) ( ) ) ( ( ) ) Пример 2 Где поставить больницу? Поставить больницу в точке – там, где до ехать , а до или в , где всем одинаково неудобно. Строго между и нельзя, так как там стоит блокпост. Тогда по эгалитарному критерию лучшим будет вариант , по утилитарному – вариант . Задачи ПР с объективными моделями Модели ситуации ПР. Что нам нужно для описания ситуации? Указать множество альтернатив и множество принципов оптимальности. Пример Линейное программирование, линейных ограничениях. Система линейных неравенств { ( ) – матрица ∑ оптимизация линейных функций при – вектора – выпуклый многогранник Линейные ограничения Линейное ограничение: Каждое линейное неравенство задаёт полупространство, ограниченное плоскостью. Если этих неравенств много, то получим много плоскостей, а пересечение нескольких полуплоскостей – многогранник. Решение уравнения находится на одной или нескольких вершин многогранника. То есть, решение сводится к перебору вершин. Метод Дайера-Джиофриона ( ) Метод градиентов ( ) – критерий ) – обобщённый критерий – опорное решение ( ) – опорный критерий ( ) ЛПР: На какое значение нужно изменить ( ), чтобы компенсировать ( ) Ответ: на 2. Шаг в направлении градиента ( Человеко-машинные процедуры Метод оценивания векторов Коэффициент замещения можно ввести в случае, когда у нас есть два критерия. Если их не два, а двадцать два, то считаем попарно. Критерии могут быть любыми вычислимыми. Хотим улучшить альтернативу по критерию ( ) ( ) З З ( ) Нужно построить градиент Градиентный метод: считаем градиент функции, сдвигаемся в его сторону и снова считаем градиент, и так далее. Как и когда остановиться? Тогда, когда любой шаг дальше не улучшает оценку. Поиск удовлетворяющих значений критериев Рассмотрим процедуру под названием STEM. Используется лишь для линейных критериев. Фаза расчётов Сначала решается задача оптимизации (задача линейного программирования, ЗЛП) для каждого критерия отдельно ̅̅̅̅̅ ( ) – линейные критерии, ( ) ( ) ( ) ( ) Строим матрицу ( ) На диагонали будут единицы. Чем хороша таблица? Тем, что на неё можно смотреть. Временами это бывает полезно Метод линейной свёртки В соответствии с этим методом множество критериев заменяется на один критерий ( ) ∑ ( ) Нужно вычислить технические веса (их вычисляют эксперты). Вычисляются они весьма своеобразным способом ∑ { – среднее по строке Третий шаг { ( ) – решение ЗЛП Вычисление ( ( ) ) Фаза анализа 1 ( ) ∑ ( ) Все ли значения критериев удовлетворяют? Если удовлетворяют, то всё хорошо и завершаем работу. Если нет, то выясняем, по каким критериям не удовлетворяет 2 ( ) Теперь у нас поменялись ограничения { ( ) ( ) ∑ ( ) Методы коэффициентов важности Рассмотрим метод SIGMOP МкрЛП ( ) ∑ ( ) ( ) ( ) 1. ЛПР назначает веса и ограничения ( ) 2. Решает ЗЛП, – реш. ( ) ( ) 3. ЛПР назначает новые веса и ограничения ( ) Принцип прост: человек назначает веса, машина решает. Если какой-то критерий имеет недостаточно большое значение, нужно приподнять его вес. ЧМП для задач ПР с субъективными моделями Метод стоимость/эффективность Модели стоимости и эффективности – критерии превращаются в ограничения. Например, потребитель хочет потратить меньше денег, но получить наибольшую эффективность, а производитель хочет потратить больше денег с меньшей эффективностью. Потребитель: { Производитель: { – стоимость, – эффективность Метод анализа иерархий (Analytical Hierarchy Process), Саати Этапы 1. Структурирование задачи по иерархическим уровням: цели – критерии – альтернативы 2. Попарные сравнения элементов каждого уровня с точки зрения элементов вышестоящего уровня 3. Проверка согласованности результатов 4. Вычисление коэффициентов важности элементов каждого уровня 5. Вычисляется количественный индикатор качества альтернатив, выбирается наилучшая альтернатива Универсальная шкала Саати Шкала задумана как мультипликативная – равноценны – умеренное превосходство одной альтернативы над другой (если лучше с оценкой , то лучше с оценкой ) – превосходство – значительное превосходство – очень большое превосходство Т.е., эксперты об отношениях альтернатив должны знать только эти пять терминов: равноценность, умеренное превосходство, превосходство, значительное превосходство и очень большое превосходство Пример: Выбор проекта аэропорта Ц С1 С2 С3 – цель – стоимость строительства – время в пути от города – число человек в зоне отселения [ ] – матрица критериев В строках и столбцах сравнение критериев . Сравнение альтернатив по . В строках и столбиках Сравнение альтернатив по [ ] . В строках и столбиках Сравнение альтернатив по [ ] . В строках и столбиках [ ] Саати говорил, что нужно проверять матрицы на случайность, Колмогоров же доказал, что сложность – почти то же, что и случайность. То есть, если матрицы похожи на случайные, то это говорит лишь о сложности алгоритма их вычисления. Мы же будем проверять матрицы на ацикличность. Если где-то есть цикл, то оценки некорректны. Теперь мы должны вычислить коэффициенты важности для каждого уровня. [ [ ] – характеристический вектор для ] – веса с точки зрения Матрица, ХВ и веса с точки зрения критерия [ [ ][ ] [ ][ ] [ ][ ] ] По критерию [ ] По критерию [ ] Синтез индикатора качества (обобщённого критерия) ∑ Достоинства 1. Структурная декомпозиция задачи 2. Локальные посильные задачи экспертов 3. Процедура синтеза глобальной оценки ничего кроме комплиментов не заслуживает Недостатки 1. Грубая шкала 2. Rank Reversal (контекстная чувствительность) Были альтернативы , появилась и картина изменилась ELECTRE I (с франц.) (проф. Руа) ССПР (DSS) Саати переводили «жульническим» методом качественную информацию в количественную (с помощью шкал) Тут же всё будет несколько иначе. Дано N критериев с соответствующими шкалами. Веса критериев – целые числа ( , так как это число голосов жюри). МКА (многокритериальные альтернативы) с оценками по критериям. Требуется Найти лучшие МКА Этапы 1. На основе оценок МКА вычисляются два индекса: индекс согласия и индекс несогласия с гипотезой, что МКА лучше, чем МКА ( ) 2. Задаются уровни и , с которыми сравниваются индексы. По результатам сравнения определяется бинарное отношение. Результат сравнения определённого бинарного отношения предпочтения на МКА 3. Выделяем недоминируемые МКА (отн. БО) – первое ядро (те, что лучше по Парето). Если остаётся одна или две альтернативы, то можно завершить процесс, но такое бывает редко. 4. Ослабляются условия по уровням (фактически пересматриваем значения уровня), новое БО, выделяем второе ядро . Теперь по этому отношению отбрасываем доминируемые, оставляя недоминируемые и т.д. В итоге получаем последовательность вложенных ядер: 5. Последнее ядро – решение задачи ELECTRE I Первый этап – вес -го критерия. Критерий может либо подтверждать гипотезу , либо противоречить ей. Множество индексов делится на те, которые подтверждают гипотезу, те, что противоречат, и те, которым без разницы (для которых оценка обеих альтернатив совпала) (для фиксированных , ). ∑ ∑ – удельный вес согласия критериев (сумма весов всех индексов, что явно не противоречат, делённая на сумму весов всех индексов) – -й критерий ( ) – оценка МКА ( ) ( ) – индекс несогласия ( ) ( ) Очевидные свойства индексов 1) 2) 3) сохраняется при замене критерия несколькими с тем же суммарным весом. сохраняется при введении дополнительных детальных шкал, по которым без сум. их длин. На примере проекта строительства аэропорта ( ) ( ) ( ы е ) ( Веса: Шкалы: Сумма симметричных элементов следующей матрицы равна единице Индексы согласия Индексы несогласия БО : ( ) ( ) Значит, в первое ядро входят элементы Согласия и . Несогласия ( – ядро Значит, альтернатива лучшая ) ( ) ) Достоинства метода ELECTRE I Этапность (итеративность) выявления предпочтений в процессе ослабления уровней. Формируется неполное БО. Наличие обобщения решения в виде последовательности вложенных ядер. Недостатки метода Трудности с назначением весов (нужна грамотная процедура). При формировании БО могут возникнуть циклы. Модели рефлексивного выбора Принятие решений, когда имеет место рефлексия (reflection – отражение, reflexion.ru). Для начала рассмотрим, как человек принимает решения. Рефлексия 0 ранга В этой модели субъект не осознаёт себя, но осознаёт лишь внутренний мир Человек не понимает, что с ним делают. Будем рассматривать принятие решения одной переменной – давление внешней среды. – давление внешней среды. Будем начинать с самых простых вещей. Самые простые вещи – биполярный выбор. – добро, истина – зло, ложь ( ) {̅̅̅ – выберется лишь , либо не Рефлексия I ранга В этой модели человек осознаёт себя и внешний мир (себя в себе). Инструмент, с помощью которого работает реклама. – представление субъекта о внешнем давлении ( ) Если внешний мир хочет добра и субъект видит добро, то он выбирает добро Если субъект думает, что это зло, то он выбирает добро, потому что внешний мир сильнее Если внешний мир желает зла, а субъект видит добро, то субъект выберет зло, поскольку мир сильнее Если мир желает зла и субъект это осознаёт, то он выберет добро Постулируем это аксиоматически 1) Внешний мир давит позитивно, субъект выбирает позитив ( ) – мир сильнее, добро сильнее 2) Внешний мир давит в сторону зла – субъект способен противостоять негативному внешнему давлению ( ) ̅̅̅ Легко записать ДНФ ( ) ̅̅̅ ̅ ̅̅̅ ̅ ̅̅̅ ̅ ̅̅̅̅̅̅ ̅ ̅̅̅ Имеем формулу ( ) ̅̅̅ Интенция – склонность к той или иной альтернативе. Непрерывная (вероятностная) модель Есть переменная , описывающая вероятность того, что внешний мир склоняет к выбору . – вероятность того, что в представлении субъекта мир склоняет к . [ ] ) тоже должна лежать в этом же промежутке, так Значит, функция ( как нам нужно выяснить вероятность, с которой субъект выберет [ ] Нам нужно перейти к конъюнкциям ̅̅̅ ̅̅̅̅̅̅̅̅ ̅̅̅ ( ) У нас есть событие с вероятностью , состоящее в том, что внешний мир выбрал единицу и событие с вероятностью , состоящее в том, что субъект принял решение мира за единицу. Считаем вероятность (интенцию ) ( ) ( ) С вероятностной моделью мы можем проводить эксперименты, в том числе и для отбрасывания «шумов». Модели рефлексии II ранга В этой модели субъект осознаёт себя, внешний мир и свои желания (осознание того, что от субъекта хотят). – те же – желания субъекта ( ) ( ) Dirty Face Game Боб и Алиса едут в одном купе. Проводник сообщает, что у кого-то в купе лицо испачкано. Алиса покраснела. Допустим, лицо испачкано у Боба, а у Алисы не испачкано (или наоборот), то испачканный сразу об этом поймёт. Ситуация, где оба чистые, не рассматривается, так как проводник говорит правду. Также лицо может быть испачкано у обоих. Рассмотрим решение на консультации Биржа Есть биржа, на ней два брокера и . Есть общая компьютерная система поддержки принятия решения , а также у каждого есть своя , также есть системный администратор д . Два генерала На двух холмах две армии, в низине враг. Один генерал посылает гонца второму, чтобы сообщить о времени атаке, второй должен послать гонца в ответ, чтобы сообщить о том, что информация принята. Можно продолжать до бесконечности, чтобы подтверждать информацию о получении сообщения, но обычно ограничиваются двумя. Чжуан-Цзы и Хуэй-Цзы Стоят на мосту и Чжуан-Цзы говорит: «Посмотри, как плещется рыба! Вот, в чём счастье рыб», Хуэй-Цзы ответил: «Откуда ты можешь знать, в чём счастье рыб? Ты же не рыба», тот ответил: «Откуда ты можешь знать, знаю ли я? Ты ведь не я?» и так далее.

Модели и методы принятия решений - конспект лекций

Related documents

Products

Support

Модели и методы принятия решений - конспект лекций

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib