logo
Архив WinRAR_1 / shpory_gotovye_stepin_1

37.Решение игры в смешанных стратегиях. Теорема фон Неймана.

Решить матричную (антагонистическую) игру – значит найти для игроковАиВих оптимальные стратегии.

Решение игры связано с матрицей (аij) и следующими понятиями:

Нижняя цена игры α=maxmin аij(сначала находится минимум в каждой строке, а

i j

потом из полученных минимумов находится максимум). Это гарантированный выигрыш игрока А при любой стратегии игрокаВ.

Верхняя цена игры β=minmax аij (сначала находится максимум в каждом столбце,

j i

а потом из полученных максимумов находится минимум). Это гарантированный проигрыш игрока В при любой стратегии игрокаА.

Очевидно α<= β. В случаеα=β говорят о цене игрыν=α=β. Соответствующие цене игры стратегии являются оптимальными, а сама игра естьигра с седловой точкой.

В случае, когда α<β седловой точки не существует. В этом случае решение игры ищестся в смешанных стратегиях. Доказано (Дж. Фон Нейман), что конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно в смешанных стратегиях.

Смешанная стратегиясостоит в том, что при повторении игры происходит случайный выбор стратегии из множества смешиваемых стратегий и для каждой смешиваемой стратегии указывается вероятность (частота) ее выбора. В таком случае для каждого игрока указывается вектор частот, с которым следует применить ту или иную стратегию.

Для игрока АэтоР=(р1,….рm), а для игрокаВ– этоQ=(q1,…….,qn), при этом

Σ pi=1иΣ qj=1, средний выигрыш игрокаАравенНА(Р,Q)=Σ Σ аij pi qj

Если вероятность применения стратегии отлична от нуля, то такая стратегия называется активной.

Оптимальными смешанными стратегиями Р0 иQ0 называются стратегии, если выполняется неравенство:

НА(Р,Q0)=< НА0,Q0)=< НА0,Q)

В этом случае НА0,Q0) называетсяценой игры и обозначается α=<ν=< β

Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрокВпридерживается своей оптимальной смешанной стратеги, приводит к уменьшению среднего выигрыша игрокаА. Второе из неравенств по смыслу аналогично первому с той лишь разницей что касается игрокаВ.

Решение всякой парной конечной игры с нулевой суммой может быть получено методами линейного программирования.