2. Классификация игр по характеру получения информации
Представление игры в развернутой и в нормальной форме.
Развернутая форма
Игра может быть представлена как совокупность всех возможных ходов и выплат (выигрышей).
Пример: Игра со спичками
На столе лежат 6 спичек. 2 игрока по очереди берут по одной или по две спички. Тот, кто возьмет последним 1 или 2 спички, тот победил. Игру можно представить в виде следующего дерева игры:
Это развернутая форма представления игры. Каждому конечному пункту, отмеченному квадратиком, соответствует один исход игры. В этой игре возможны 13 исходов. Представим в качестве примера по одной из стратегий каждого игрока.
Стратегия игрока А:
Стратегия игрока В:
Примечание: пунктирные линии обозначают возможные, но не используемые в данной стратегии ходы игрока.
Нормальная форма
В нормальной форме игра представляется в виде платежной матрицы (табл. 1)
Таблица 1
Стратегии игрока В Стратегии игрока A b1 b2 ... bj ... bn a1 x11;y11 x12;y12 ... x1j;y1j ... x1n;y1n a2 x21;y21 x22;y22 ... x2j;y2j ... x2n;y2n ... ... ... ... ... ... ... ai ... ... ... xij;yij ... ... ... ... ... ... ... ... ... am xm1;ym1 xm2;ym2 ... xmj;ymj ... xmn;ymn |
ai - стратегии игрока А;
bj - стратегии игрока B;
xij - выплаты игроку А от игрока В при сочетании стратегий ai и bj;
yij - выплаты игроку В от игрока А при сочетании стратегий ai и bj;
По условию оба игрока знают все параметры платежной матрицы и каждый определяет свою стратегию независимо друг от друга.
Динамические игры
До сих пор были рассмотрены игры, которые играются однократно или каждый из игроков выбирал свою стратегию однократно. В тоже время существуют игры, в которых партии повторяются. Даже, если в части игры присутствует оптимальное равновесие Нэша, у игрока тем не менее возникает вопрос выбора стратегии в соответствии со стратегиями игроков в прошлых и будущих играх. В дилемме заключенных эта проблема выгладит так: оба игрока кооперируют в первой партии игры, придерживаясь своей доминантной стратегии, и таким образом они оба выигрывают. Игрок 2 ожидает поэтому, что в следующей партии игрок 1 вновь будет кооперировать и выбирает поэтому для следующей партии вновь стратегию кооперации. Игрок 1 ожидая такое поведение игрока 2 выбирает для следующей игры стратегию некооперирования, т.е. обманывает игрока 2.
Таким образом, игрок 1 получает более высокую сумму платежа, чем при стратегии кооперирования. В третьей партии игрок 2 может попробовать «отомстить» и не кооперировать и т.д. Игроки оказываются перед проблемой выбора стратегии кооперации или не кооперации и ритма смены стратегий.
Конечное число партий
Рассмотрим игру с частичным равновесием Нэша с конечным количеством партий, которое знакомо игрокам. В данном случае для каждого из игроков будет рациональным в последней партии играть в соответствии со стратегией Нэша, т.е. не кооперировать, так как более не будет партий, в которых другой игрок мог бы «отомстить». В последней партии, т.о., все игроки не будут кооперировать. Поэтому для всех игроков также выгоднее не кооперировать уже в предпоследней игре, так, как в последней партии последует «отмщение» со стороны другого игрока. С помощью индуктивного метода можно прийти к заключению, что все игроки не будут кооперировать уже в первой партии, т.е. во всех партиях будет применяться стратегия равновесия Нэша.
Бесконечное число партий
Аргументация, приведенная выше, не может быть применена при бесконечном числе партий игры или в случае, если число партий ограничено, но неизвестно игрокам. Как в таком случае будет выглядеть оптимальная стратегия игроков? Роберт Аксельрод проводил компьютерные имитации для представленной ниже ситуации, соответствующей дилемме заключенных.
Игрок 2 Игрок 1 |
Кооперирование |
Некооперирование |
|
Кооперирование |
3;3 |
0;5 |
|
Некооперирование |
5;0 |
1;1 |
Он переписывался с ведущими специалистами по теории игр и просил их определить оптимальные стратегии для игры состоящей из нескольких партий, число которых неизвестно. Кроме того, Аксельрод получил множество стратегий от психологов, экономистов, политологов, математиков и социологов. Он проигрывал для каждой из стратегий 200 партий с помощью имитационной программы, причем каждая из стратегий играла против всех других и против самой себя.