Классификация игр

2. Классификация игр по характеру получения информации

Представление игры в развернутой и в нормальной форме.

Развернутая форма

Игра может быть представлена как совокупность всех возможных ходов и выплат (выигрышей).

Пример: Игра со спичками

На столе лежат 6 спичек. 2 игрока по очереди берут по одной или по две спички. Тот, кто возьмет последним 1 или 2 спички, тот победил. Игру можно представить в виде следующего дерева игры:

Это развернутая форма представления игры. Каждому конечному пункту, отмеченному квадратиком, соответствует один исход игры. В этой игре возможны 13 исходов. Представим в качестве примера по одной из стратегий каждого игрока.

Стратегия игрока А:

Стратегия игрока В:

Примечание: пунктирные линии обозначают возможные, но не используемые в данной стратегии ходы игрока.

Нормальная форма

В нормальной форме игра представляется в виде платежной матрицы (табл. 1)

Таблица 1

Стратегии игрока В

Стратегии игрока A

b₁

b₂

...

b_j

...

b_n

a₁

x₁₁;y₁₁

x₁₂;y₁₂

...

x_1j;y_1j

...

x_1n;y_1n

a₂

x₂₁;y₂₁

x₂₂;y₂₂

...

x_2j;y_2j

...

x_2n;y_2n

...

a_i

...

x_ij;y_ij

...

a_m

x_m1;y_m1

x_m2;y_m2

...

x_mj;y_mj

...

x_mn;y_mn

a_i - стратегии игрока А;

b_j - стратегии игрока B;

x_ij - выплаты игроку А от игрока В при сочетании стратегий a_i и b_j;

y_ij - выплаты игроку В от игрока А при сочетании стратегий a_i и b_j;

По условию оба игрока знают все параметры платежной матрицы и каждый определяет свою стратегию независимо друг от друга.

Динамические игры

До сих пор были рассмотрены игры, которые играются однократно или каждый из игроков выбирал свою стратегию однократно. В тоже время существуют игры, в которых партии повторяются. Даже, если в части игры присутствует оптимальное равновесие Нэша, у игрока тем не менее возникает вопрос выбора стратегии в соответствии со стратегиями игроков в прошлых и будущих играх. В дилемме заключенных эта проблема выгладит так: оба игрока кооперируют в первой партии игры, придерживаясь своей доминантной стратегии, и таким образом они оба выигрывают. Игрок 2 ожидает поэтому, что в следующей партии игрок 1 вновь будет кооперировать и выбирает поэтому для следующей партии вновь стратегию кооперации. Игрок 1 ожидая такое поведение игрока 2 выбирает для следующей игры стратегию некооперирования, т.е. обманывает игрока 2.

Таким образом, игрок 1 получает более высокую сумму платежа, чем при стратегии кооперирования. В третьей партии игрок 2 может попробовать «отомстить» и не кооперировать и т.д. Игроки оказываются перед проблемой выбора стратегии кооперации или не кооперации и ритма смены стратегий.

Конечное число партий

Рассмотрим игру с частичным равновесием Нэша с конечным количеством партий, которое знакомо игрокам. В данном случае для каждого из игроков будет рациональным в последней партии играть в соответствии со стратегией Нэша, т.е. не кооперировать, так как более не будет партий, в которых другой игрок мог бы «отомстить». В последней партии, т.о., все игроки не будут кооперировать. Поэтому для всех игроков также выгоднее не кооперировать уже в предпоследней игре, так, как в последней партии последует «отмщение» со стороны другого игрока. С помощью индуктивного метода можно прийти к заключению, что все игроки не будут кооперировать уже в первой партии, т.е. во всех партиях будет применяться стратегия равновесия Нэша.

Бесконечное число партий

Аргументация, приведенная выше, не может быть применена при бесконечном числе партий игры или в случае, если число партий ограничено, но неизвестно игрокам. Как в таком случае будет выглядеть оптимальная стратегия игроков? Роберт Аксельрод проводил компьютерные имитации для представленной ниже ситуации, соответствующей дилемме заключенных.

Игрок 2 Игрок 1	Кооперирование	Некооперирование
Кооперирование	3;3	0;5
Некооперирование	5;0	1;1

Он переписывался с ведущими специалистами по теории игр и просил их определить оптимальные стратегии для игры состоящей из нескольких партий, число которых неизвестно. Кроме того, Аксельрод получил множество стратегий от психологов, экономистов, политологов, математиков и социологов. Он проигрывал для каждой из стратегий 200 партий с помощью имитационной программы, причем каждая из стратегий играла против всех других и против самой себя.

Содержание