logo
Классификация игр

2. Классификация игр по характеру получения информации

Представление игры в развернутой и в нормальной форме.

Развернутая форма

Игра может быть представлена как совокупность всех возможных ходов и выплат (выигрышей).

Пример: Игра со спичками

На столе лежат 6 спичек. 2 игрока по очереди берут по одной или по две спички. Тот, кто возьмет последним 1 или 2 спички, тот победил. Игру можно представить в виде следующего дерева игры:

Это развернутая форма представления игры. Каждому конечному пункту, отмеченному квадратиком, соответствует один исход игры. В этой игре возможны 13 исходов. Представим в качестве примера по одной из стратегий каждого игрока.

Стратегия игрока А:

Стратегия игрока В:

Примечание: пунктирные линии обозначают возможные, но не используемые в данной стратегии ходы игрока.

Нормальная форма

В нормальной форме игра представляется в виде платежной матрицы (табл. 1)

Таблица 1

Стратегии игрока В

Стратегии игрока A

b1

b2

...

bj

...

bn

a1

x11;y11

x12;y12

...

x1j;y1j

...

x1n;y1n

a2

x21;y21

x22;y22

...

x2j;y2j

...

x2n;y2n

...

...

...

...

...

...

...

ai

...

...

...

xij;yij

...

...

...

...

...

...

...

...

...

am

xm1;ym1

xm2;ym2

...

xmj;ymj

...

xmn;ymn

ai - стратегии игрока А;

bj - стратегии игрока B;

xij - выплаты игроку А от игрока В при сочетании стратегий ai и bj;

yij - выплаты игроку В от игрока А при сочетании стратегий ai и bj;

По условию оба игрока знают все параметры платежной матрицы и каждый определяет свою стратегию независимо друг от друга.

Динамические игры

До сих пор были рассмотрены игры, которые играются однократно или каждый из игроков выбирал свою стратегию однократно. В тоже время существуют игры, в которых партии повторяются. Даже, если в части игры присутствует оптимальное равновесие Нэша, у игрока тем не менее возникает вопрос выбора стратегии в соответствии со стратегиями игроков в прошлых и будущих играх. В дилемме заключенных эта проблема выгладит так: оба игрока кооперируют в первой партии игры, придерживаясь своей доминантной стратегии, и таким образом они оба выигрывают. Игрок 2 ожидает поэтому, что в следующей партии игрок 1 вновь будет кооперировать и выбирает поэтому для следующей партии вновь стратегию кооперации. Игрок 1 ожидая такое поведение игрока 2 выбирает для следующей игры стратегию некооперирования, т.е. обманывает игрока 2.

Таким образом, игрок 1 получает более высокую сумму платежа, чем при стратегии кооперирования. В третьей партии игрок 2 может попробовать «отомстить» и не кооперировать и т.д. Игроки оказываются перед проблемой выбора стратегии кооперации или не кооперации и ритма смены стратегий.

Конечное число партий

Рассмотрим игру с частичным равновесием Нэша с конечным количеством партий, которое знакомо игрокам. В данном случае для каждого из игроков будет рациональным в последней партии играть в соответствии со стратегией Нэша, т.е. не кооперировать, так как более не будет партий, в которых другой игрок мог бы «отомстить». В последней партии, т.о., все игроки не будут кооперировать. Поэтому для всех игроков также выгоднее не кооперировать уже в предпоследней игре, так, как в последней партии последует «отмщение» со стороны другого игрока. С помощью индуктивного метода можно прийти к заключению, что все игроки не будут кооперировать уже в первой партии, т.е. во всех партиях будет применяться стратегия равновесия Нэша.

Бесконечное число партий

Аргументация, приведенная выше, не может быть применена при бесконечном числе партий игры или в случае, если число партий ограничено, но неизвестно игрокам. Как в таком случае будет выглядеть оптимальная стратегия игроков? Роберт Аксельрод проводил компьютерные имитации для представленной ниже ситуации, соответствующей дилемме заключенных.

Игрок 2

Игрок 1

Кооперирование

Некооперирование

Кооперирование

3;3

0;5

Некооперирование

5;0

1;1

Он переписывался с ведущими специалистами по теории игр и просил их определить оптимальные стратегии для игры состоящей из нескольких партий, число которых неизвестно. Кроме того, Аксельрод получил множество стратегий от психологов, экономистов, политологов, математиков и социологов. Он проигрывал для каждой из стратегий 200 партий с помощью имитационной программы, причем каждая из стратегий играла против всех других и против самой себя.