Статистические игры

advertisement
Статистические игры
С единичным экспериментом
Виды экспериментов



При решении статистических игр с
единичным
экспериментом
возможно
провести идеальный, либо неидеальный
эксперимент.
Идеальный – это такой эксперимент,
который полностью выясняет состояние
«природы».
Неидеальный
эксперимент
уточняет
вероятности (в смысле Байеса).
Идеальный эксперимент

Один
из
основных
вопросов
статистической игры с идеальным
экспериментом
состоит
в
определении, покроет ли эффект от
эксперимента
затраты
на
его
проведение.
Если
да
–
то
эксперимент
целесообразно
проводить, если нет – то эксперимент
не проводится.
Идеальный эксперимент


Оперирующая сторона обычно называется
статистиком,
который
располагает
возможными стратегиями x1, x2, …, xm.
Вторая сторона – «природа». Она может
находится в одном из состояний П1, П2,…,
Пn с вероятностями q1, q2,…, qn.
Можно считать, что если мы не будем
проводить эксперимент, то можем выбрать
ту стратегию, которой соответствует
n
n
j 1
j 1
i0  arg max  aij  q j , aср   aij  q j .
i
Идеальный эксперимент

Если мы проведем эксперимент, то выясним,
какое из состояний Пj будем иметь место и уже
тогда выберем
  max a .
j

ij
i
Проведение эксперимента целесообразно, если
результирующий выигрыш будет выше, чем сумма
старого выигрыша (доэкспериментального) и
стоимость эксперимента
max  aij  q j    ij  q j  C ,
i
j
j
min  q j  j  aij   C  min rср  C.
Пример



На технологическую линию может поступать сырье разного
качества. Из прошлого опыта известно, что в 60% случаев
поступает сырье с малым количеством примесей П1, в 40%
случаев - сырье с большим количеством примесей П2. На
технологической линии предусмотрены 3 режима работы.
Прибыль предприятия от реализации продукции, производимой
технологической линией, зависит от качества используемого
сырья и режима работы технологической линии.
Эта
прибыль
в
расчете на один день
работы представлена
матрицей
5 1


A   4 2
 2 3


Определить
предельную
стоимость
эксперимента,
который целесообразно проводить один раз в день с
целью точного определения качества сырья.
Неидеальный эксперимент











В случае неидеального эксперимента мы имеем следующие входные
данные:
Стратегии статистика X=(x1, x2, …, xm)
Вектор состояний природы П=(П1, П2,…, Пn)
Вектор априорных вероятностей Q=(q1, q2,…, qn)
Матрица выигрышей {aij}
Множество возможных исходов единичного эксперимента
S=(s1,s2,…,sk)
Матрица условных вероятностей W={wij=P(si/Пj}
Цена эксперимента С.
В этом случае необходимо решить 2 вопроса:
Целесообразно ли проводить эксперимент?
Если проводить эксперимент целесообразно, то определить, какая
из стратегий должна быть выбрана в качестве оптимальной
Неидельный эксперимент

Если в результате эксперимента возникает
ситуация Sℓ, то используя формулу Байеса,
можно
рассчитать
апостериорные
вероятности:
q j  wj
П

v j  P  j   k
 S 
 qs  ws
s 1

Определяем для каждой стратегии i средний
выигрыш
с
учетом
апостериорных
вероятностей:
 Условный средний выигрыш
n
от стратегии xi при условии,
ai   aij  v j .
что
эксперимент
дал
j 1
результат Sℓ.
Неидеальный эксперимент

Находим соответствующий оптимальносредний выигрыш
n
a  max ai  max  aij  v j ,
i
j 1
i  arg max ai  номер стратегии при исходе S 
i

Для усреднения этого результата по всем
возможным исходам Sℓ нужно найти вероятности
каждого исхода
h  PS     q j  wj .
j
Неидеальный эксперимент

Находим средний выигрыш при условии проведения
эксперимента
k
aэкс   a  h .
 1

Необходимо сравнить полученный результат с
n
a  max  aij  q j .
i

j 1
Очевидно, что эксперимент следует проводить при условии
aэкс  a  C.
Пример
xi\Пj П1 П2 П3 П4
x1
1
4
5
9
x2
3
8
4
3
x2
4
6
6
2
q
0.1 0.2 0.5 0.2
Sℓ\Пj П1 П2
S1
S2
S3
П3
П4
0.2 0.9 0.4
0.1 0.1 0.5
0.7 0
0.1
0.3
0.3
0.4
Download