Архив WinRAR_1 / shpory_gotovye_stepin_1

37.Решение игры в смешанных стратегиях. Теорема фон Неймана.

Решить матричную (антагонистическую) игру – значит найти для игроковАиВих оптимальные стратегии.

Решение игры связано с матрицей (а_ij) и следующими понятиями:

Нижняя цена игры α=maxmin а_ij(сначала находится минимум в каждой строке, а

i j

потом из полученных минимумов находится максимум). Это гарантированный выигрыш игрока А при любой стратегии игрокаВ.

Верхняя цена игры β=minmax а_ij(сначала находится максимум в каждом столбце,

j i

а потом из полученных максимумов находится минимум). Это гарантированный проигрыш игрока В при любой стратегии игрокаА.

Очевидно α<= β. В случаеα=β говорят о цене игрыν=α=β. Соответствующие цене игры стратегии являются оптимальными, а сама игра естьигра с седловой точкой.

В случае, когда α<β седловой точки не существует. В этом случае решение игры ищестся в смешанных стратегиях. Доказано (Дж. Фон Нейман), что конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно в смешанных стратегиях.

Смешанная стратегиясостоит в том, что при повторении игры происходит случайный выбор стратегии из множества смешиваемых стратегий и для каждой смешиваемой стратегии указывается вероятность (частота) ее выбора. В таком случае для каждого игрока указывается вектор частот, с которым следует применить ту или иную стратегию.

Для игрока АэтоР=(р₁,….р_m), а для игрокаВ– этоQ=(q₁,…….,q_n), при этом

Σ pi=1иΣ q_j=1, средний выигрыш игрокаАравенН_А(Р,Q)=Σ Σ а_ij pi q_j

Если вероятность применения стратегии отлична от нуля, то такая стратегия называется активной.

Оптимальными смешанными стратегиями Р⁰ иQ⁰ называются стратегии, если выполняется неравенство:

Н_А(Р,Q⁰)=< Н_А(Р⁰,Q⁰)=< Н_А(Р⁰,Q)

В этом случае Н_А(Р⁰,Q⁰) называетсяценой игры и обозначается α=<ν=< β

Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрокВпридерживается своей оптимальной смешанной стратеги, приводит к уменьшению среднего выигрыша игрокаА. Второе из неравенств по смыслу аналогично первому с той лишь разницей что касается игрокаВ.

Решение всякой парной конечной игры с нулевой суммой может быть получено методами линейного программирования.

Содержание