Метод Лагранжа
Метод Лагранжа относится к точным методам решения матричных игр G(mm), т.е. имеющим квадратные матрицы (или приведенные к такому виду после упрощения).
Допустим, что игрок Aиспользует смешанную стратегиюSA = (p1, …,pm), а игрокBотвечает своей чистой стратегиейBi(i = 1, 2,…,m). Цена игры в таком случае равна. Если же игрокBтакже будет применять смешанную стратегиюSB = (q1, …,qm), то итоговая цена игры будет равна
. (3.1)
Для нахождения оптимального решения необходимо максимизировать значение V при ограничениях.
Составим функцию Лагранжа L = V + 1(p1 + … + pm – 1) +2(q1 + … + qm – 1) и приравняем к нулю частные производные по всем аргументам:.
В результате получим следующую систему из (2m + 2) уравнений с (2m+ 2) неизвестными:
Решение этой системы и даёт смешанные стратегии для обоих игроков.
Нетрудно заметить, что исходная система уравнений включает две независимые подсистемы (для pi, i = 1, …,m,1иqj, j = 1, …,m,2 соответственно), состоящие из (m+ 1) уравнений с (m+ 1) неизвестными, решение которых и даст искомые вероятностиpiиqj, а также после подстановки этих вероятностей в формулу (3.1) цену игрыV.
В качестве примера рассмотрим игру G(22), представленную в общем виде табл. 3.9.
Таблица 3.10
-
Bj
Ai
B1
B2
A1
a11
a12
A2
a21
a22
V1 = a11p1 + a21p2, V2 = a12p1 + a22p2,
V = V1q1 + V2q2 = (a11p1 + a21p2)q1 + (a12p1 + a22p2)q2.
L=V+1(p1+p2– 1) +2(q1+q2– 1).
Приравняв к нулю частные производные функции Лагранжа по всем аргументам, получим следующую систему уравнений:
Решив данную систему получим следующие значения вероятностей:
.
Подставив полученные значения в выражение для V, получим цену игры.
Например, для игры G(22), представленной табл. 3.8, получим:
p1 = 0,6; p2 = 0,4; q1 = 0,8; q3 = 0,2; V = 3,6.
Можно также найти решение в общем виде для игры G(33) и т.д.
Приведем более универсальный и достаточно легко компьютеризируемый способ решения матричных игр методом Лагранжа.
Рассмотрим игру игры G(33) в общем виде, представленную табл. 3.10.
Таблица 3.11
-
Bj
Ai
B1
B2
B3
A1
a11
a12
a13
A2
a21
a22
a23
A3
a31
a32
a33
Для нахождения решения в смешанных стратегиях необходимо решить следующую систему уравнений:
Эту систему можно представить следующим образом:
.
Решением в общем виде представляется системой
Более конкретно:
Обозначив
k = – a11a22 + a11a32 + a11a23 – a11a33 + a21a12 – a21a32 –
– a21a13 + a21a33 – a31a12 + a31a22 + a31a13 – a31a23 –
– a12a23 + a12a33 + a22a13 – a22a33 – a32a13 + a32a23,
получим итоговое решение:
p1 = (– a21a32 + a21a33 + a31a22 – a31a23 – a22a33 + a32a23) / k
p2 = ( a11a32 – a11a33 – a31a12 + a31a13 + a12a33 – a32a13) / k
p3 = (– a11a22 + a11a23 + a21a12 – a21a13 – a12a23 + a22a13) / k
q1 = (– a12a23 + a12a33 + a22a13 – a22a33 – a32a13 + a32a23) / k
q2 = ( a11a23 – a11a33 – a21a13 + a21a33 + a31a13 – a31a23) / k
q3 = (– a11a22 + a11a32 + a21a12 – a21a32 – a31a12 + a31a22) / k
V = – |A| / |A1|,
где А— исходная матрица игры.
Данный подход легко применим для произвольной игры G(mm): строится матрицаA1, далее, используя определители, записываются выражения дляpiиqj, множитель знака для них будет равен (–1)m + i + 1.
- Теоретико-игровые методы принятия решений
- Isbn 5-7046-1383-7
- Введение
- Основные понятия теории игр. Классификация игровых моделей
- Основные понятия теории игр
- Классификация игровых моделей
- Контрольные вопросы к разделу 1
- Антагонистическая игра. Поиск решения на дереве игры
- Представление антагонистической игры
- Поиск решения на дереве игры
- Общие замечания
- Метод максимина
- Метод-отсечений
- Неглубокое -отсечение
- Глубокое -отсечение
- Контрольные вопросы к разделу 2
- Методы решения антагонистических игр, представленных в матричной форме
- Матричное представление антагонистической игры
- Наличие седловой точки
- Методы решения матричных игр при отсутствии седловой точки
- Смешанные стратегии
- Метод Лагранжа
- Метод линейного программирования
- Итерационный метод Брауна-Робинсона
- Практический пример
- Контрольные вопросы к разделу 3
- Игра двух лиц с произвольной суммой
- Определение игры двух лиц с произвольной суммой
- Теория Нэша для некооперативных игр
- Рефлексивная игра
- Практический пример
- Контрольные вопросы к разделу 4
- Основы теории статистических решений. Игры с «природой»
- Определение игры «с природой»
- Методы решения игр «с природой»
- Случай стохастической неопределенности
- Случай с неизвестными вероятностями состояний «природы»
- Контрольные вопросы к разделу 5
- Игры с упорядоченными исходами
- Определение игры с упорядоченными исходами при наличии ряда критериев
- Поиск решения игры с упорядоченными исходами
- Контрольные вопросы к разделу 6
- Программная система для решения антагонистических игр
- Общее описание системы
- Примеры работы с системой
- Практический пример
- Контрольные вопросы к разделу 7
- Библиографический список
- Оглавление