logo search
Теоретико-игровые методы принятия решений (Еремеев А

Метод Лагранжа

Метод Лагранжа относится к точным методам решения матричных игр G(mm), т.е. имеющим квадратные матрицы (или приведенные к такому виду после упрощения).

Допустим, что игрок Aиспользует смешанную стратегиюSA = (p1, …,pm), а игрокBотвечает своей чистой стратегиейBi(i = 1, 2,,m). Цена игры в таком случае равна. Если же игрокBтакже будет применять смешанную стратегиюSB = (q1, …,qm), то итоговая цена игры будет равна

. (3.1)

Для нахождения оптимального решения необходимо максимизировать значение V при ограничениях.

Составим функцию Лагранжа L = V + 1(p1 + … + pm – 1) +2(q1 + … + qm – 1) и приравняем к нулю частные производные по всем аргументам:.

В результате получим следующую систему из (2m + 2) уравнений с (2m+ 2) неизвестными:

Решение этой системы и даёт смешанные стратегии для обоих игроков.

Нетрудно заметить, что исходная система уравнений включает две независимые подсистемы (для pi, i = 1, …,m,1иqj, j = 1, …,m,2 соответственно), состоящие из (m+ 1) уравнений с (m+ 1) неизвестными, решение которых и даст искомые вероятностиpiиqj, а также после подстановки этих вероятностей в формулу (3.1) цену игрыV.

В качестве примера рассмотрим игру G(22), представленную в общем виде табл. 3.9.

Таблица 3.10

Bj

Ai

B1

B2

A1

a11

a12

A2

a21

a22

V1 = a11p1 + a21p2, V2 = a12p1 + a22p2,

V = V1q1 + V2q2 = (a11p1 + a21p2)q1 + (a12p1 + a22p2)q2.

L=V+1(p1+p2– 1) +2(q1+q2– 1).

Приравняв к нулю частные производные функции Лагранжа по всем аргументам, получим следующую систему уравнений:

Решив данную систему получим следующие значения вероятностей:

.

Подставив полученные значения в выражение для V, получим цену игры.

Например, для игры G(22), представленной табл. 3.8, получим:

p1 = 0,6; p2 = 0,4; q1 = 0,8; q3 = 0,2; V = 3,6.

Можно также найти решение в общем виде для игры G(33) и т.д.

Приведем более универсальный и достаточно легко компьютеризируемый способ решения матричных игр методом Лагранжа.

Рассмотрим игру игры G(33) в общем виде, представленную табл. 3.10.

Таблица 3.11

Bj

Ai

B1

B2

B3

A1

a11

a12

a13

A2

a21

a22

a23

A3

a31

a32

a33

Для нахождения решения в смешанных стратегиях необходимо решить следующую систему уравнений:

Эту систему можно представить следующим образом:

.

Решением в общем виде представляется системой

Более конкретно:

Обозначив

k = – a11a22 + a11a32 + a11a23a11a33 + a21a12a21a32

a21a13 + a21a33a31a12 + a31a22 + a31a13a31a23

a12a23 + a12a33 + a22a13a22a33a32a13 + a32a23,

получим итоговое решение:

p1 = (– a21a32 + a21a33 + a31a22a31a23a22a33 + a32a23) / k

p2 = ( a11a32a11a33a31a12 + a31a13 + a12a33a32a13) / k

p3 = (– a11a22 + a11a23 + a21a12a21a13a12a23 + a22a13) / k

q1 = (– a12a23 + a12a33 + a22a13a22a33a32a13 + a32a23) / k

q2 = ( a11a23a11a33a21a13 + a21a33 + a31a13a31a23) / k

q3 = (– a11a22 + a11a32 + a21a12a21a32a31a12 + a31a22) / k

V = – |A| / |A1|,

где А— исходная матрица игры.

Данный подход легко применим для произвольной игры G(mm): строится матрицаA1, далее, используя определители, записываются выражения дляpiиqj, множитель знака для них будет равен (1)m + i + 1.