1Б УДК 519.83 В.Ф. Блыщик Таврический национальный университет им. В.И. Вернадского, г. Симферополь, Украина veb@land.ru Алгоритм построения классов значений платежной функции по прецедентной начальной информации В статье предложен новый алгоритм построения классов значений платежной функции в случае неполного (частичного) задания платежной матрицы антагонистической игры с булевыми стратегиями, основанный на кластеризации начальных данных. Введение Матричная игра с нулевой суммой (антагонистическая игра) является одной из наиболее применяемых в теории и практике теоретико-игровых моделей. При теоретико-игровом моделировании обычно требуется полностью определить значения всех компонент игры: множества всех чистых стратегий обоих игроков и значения всех элементов платежной матрицы игры. Но в реальных условиях не всегда имеется возможность полностью определить значения всех элементов платежной матрицы антагонистической игры, моделирующей некоторую задачу принятия решений. Проблема решения антагонистических игр, заданных в условиях частичной определенности, на настоящее время в научной литературе практически не освещена, поэтому является актуальной. Рассмотрим один из подходов решения антагонистической матричной игры с булевыми стратегиями и частично заданной псевдобулевой платежной функцией [1]. Когда задана только часть элементов платежной матрицы, можно говорить, что известна прецедентная начальная информация (выборка), которая может быть использована для восстановления не заданных элементов методом эмпирического обобщения. В этом случае начальная информация рассматривается как обучающая выборка, отражающая свойства всей (полностью не известной) матрицы. Полагая, что существует закономерность (платежная функция H), можно считать, что указанная обучающая выборка отражает эту закономерность, и решать, вообще говоря, некорректную задачу восстановления функции H [2]. Обозначим Tk = {α~1 ,..., α~k } множество наборов из B m + n , для которых заданы значения (неизвестной полностью) платежной функции H : B m +n → ℜ . Требуется найти разбиение множества Tk на число l подмножеств M1,…,Ml, чтобы для заданного ~ ε > 0 выполнялось следующее свойство: если α~ ∈ Tk ∩ M j и β ∈ Tk ∩ M j , j ∈ 1, l , то ~ значения H (α~ ) и H ( β ) отличаются не более чем на ε : H (α~ ) − H ( β ) ≤ ε . Будем называть такое свойство разбиения Tk свойством ε -диаметров классов. 10 «Искусственный интеллект» 2’2006 Алгоритм построения классов значений платежной функции… 1Б Иначе говоря, требуется выбрать некоторое аппроксимирующее отношение эквивалентности ρ ε , порождающее разбиение множества Tk, удовлетворяющее свойству ε - диаметров классов. Алгоритм APε построения разбиения множества tk, удовлетворяющий свойству ε - диаметров классов Вход: Множество Tk = {α~1 ,..., α~k } ; значения H (α~1 ,..., α~k ) ; число ε > 0 . Выход: Разбиение Tk на l подмножеств (классов) l M 1 ,..., M l : ΥM j = Tk ; M j ∩Ms = Ο /; 1≤ j < s ≤ l j =1 1. Положить число классов l = 1; M 1 := {α~1 }; t := 1 . 2. t:= t + 1; если t > k, то перейти к п. 5. 3. Пусть уже построены классы M1,…,Ml. Рассматривается очередная точка α~ ∈ Tk . Если найдется класс M j , j ∈ 1, l , такой, что для всех β ∈ M j выполняется ~ неравенство H ( β ) − H (α~ ) ≤ ε , то M := M ∪ {α~ } , в противном случае число t j классов увеличивается: l := l + 1; j t M l := {α~t } . 4. Перейти на п. 2. 5. Конец. Обозначим µ k = max H (α~i ) − H (α~ j ) и µ k = min H (α~i ) − H (α~ j ) . 1≤i < j ≤ k 1≤i < j ≤ k Очевидно, что при ε > µ k алгоритм APε построит тривиальные разбиения множества Tε на одноэлементные подмножества, а при ε < µ k – даст на выходе само множество Tk. Поэтому параметр ε алгоритма должен удовлетворять двойному неравенству µ k < ε < µ k . Укажем ряд свойств алгоритма APε : 1. APε обеспечивает разбиение множества Tk на заранее неизвестное, но зависящее от заданной точности ε число классов l = l (ε ) . ~ 2. Для любых двух элементов α~ и β из одного и того же класса выполняется неравенство ~ H ( β ) − H (α~ ) ≤ ε . 3. Алгоритм APε не определяет свойства булевых векторов, объединяемых в один класс, в терминах логических переменных x1,…, xm, y1,…, ym, осуществляя разбиение только по свойству близости значений платежной функции. Вычисление аппроксимирующего значения платежной функции в каждом классе осуществляется по формуле h j = h j (M j ) = «Штучний інтелект» 2’2006 1 Mj ∑ H (α~) . α~∈M j 11 Блыщик В.Ф. 1Б Упорядочим найденные значения: h1 < ... < h j < ...hl и соответственно построенные классы M1,…,Mj,…,Ml. Оценочные значения λ€ и h€ для величин λ = ~min H (α~ ) и h = ~max H (α~ ) будем полагать заданными (наименьшее и наибольшее m+n m+n α ∈B α ∈B возможные значения платежной функции H можно оценить по смыслу задачи: λ€ ≤ λ и h€ > h ). Алгоритм APε позволяет определить число l классов, которое используется для разбиения промежутка [λ€, h€] на l полуинтервалов, вообще говоря, не одинаковой длины: [λ€, λ1 ), [λ1 , λ 2 ),..., [λl − 2 , λl −1 ), [λl −1 , h€) , где λ j = ( ~min H (α~ ) − max H (α~ )) / 2 . ~ α ∈M J +1 α ∈M J Рисунок 1 – Разбиение промежутка [λ€, h€] на l полуинтервалов В этих интервалах лежат точки классов M1,…,Ml из множества Tk. В результате выполнения алгоритма APε строится разбиение, которое далее используется для формирования стандартной обучающей информации в виде набора пар ~ ~ ~ (α q , ω (α )), q = 1, k , где ω (α q ) – номер одного из l классов, которому принадлежит ситуация α~ . q В задачах распознавания образов по стандартной обучающей информации строится решающее правило, позволяющее для любого допустимого входного объекта определить номер класса, которому он принадлежит. В нашем случае по сформированной обучающей информации требуется построить решающее правило, определяющее номер класса значений платежной функции для любой ситуации α~ = ( ~x , ~y ) ∈ Dom( H ) , иначе говоря, доопределить разбиение, полученное алгоритмом APε на всю область Dom(H) определения платежной функции. Будем полагать, что на области Dom(H) выполняется свойство, близкое по смыслу к гипотезе «компактности», состоящее в следующем: если любые две точки ~ α~ и β из Dom(H) принадлежат одному и тому же классу значений платежной функции, то для них выполняется некоторое (одно и то же для любых пар таких точек) свойство, которое может быть найдено в процессе обучения. Отметим, что каждому классу j взаимно однозначно соответствует один из ω (α~s ) = j , то интервалов значений платежной функции, и если λ ≤ H (α~ ) < λ , j = 2, l − 1 ; (при j = 1 неравенства имеют вид λ€ ≤ H (α~ ) < λ , а при j −1 s j = l вид λ j −1 12 j s 1 ≤ H (α~s ) < h€ ). «Искусственный интеллект» 2’2006 Алгоритм построения классов значений платежной функции… 1Б Поэтому вычисление значений ω (α~ ) равносильно определению промежутка значений, в котором лежит значение H (α~ ) . Алгоритм, обученный по выборке {(α~ , ω (α~ )), q = 1, k} , которая порождается множеством T , должен обеспечивать q q k распознавание промежутка значений, в котором лежит величина H (α~ ) для произвольной игровой ситуации α~ . Заключение В статье предложен новый алгоритм построения классов значений платежной функции в антагонистической игре с булевыми переменными. Использование алгоритма на практике зависит от имеющей место начальной информации, которая характеризует вид и уровень неопределенности значений элементов платежной матрицы. Перспективным представляется разработка методов оценивания точности предложенного алгоритма на основе оценок вероятности ошибки используемого алгоритма распознавания. Литература 1. Блыщик В.Ф. Решение игр с булевыми стратегиями и неполной информацией на основе синтеза ДНФ // Искусственный интеллект. – 2000. – № 2. – С. 9-12. 2. Devroye~L., Gyorfi L., Lugosi G. A Probabilistic Theory of Pattern Recognition // Springer. – 1997. – P. 636. В.Ф. Блищик Алгоритм побудови класів значень платіжної функції по прецедентній початковій інформації У статті надається алгоритм побудови класів значень платіжної функції у разі неповного (часткового) завдання платіжної матриці антагоністичної гри з булевими стратегіями, що заснований на кластеризації початкових даних. V.F. Blyschik The Algorithm for Construction of Classes of pay Function’s Values In this article the algorithm for construction of classes of pay function’s values is offered for the case of incomplete (partial) information about the pay matrix of antagonistic game with Boolean strategies. Статья поступила в редакцию 26.04.2006. «Штучний інтелект» 2’2006 13