Теоретико-игровые методы принятия решений (Еремеев А

Итерационный метод Брауна-Робинсона

Также универсальным, но менее трудоемким по сравнению с методом линейного программирования в плане затрат вычислительных ресурсов является приближенный метод Брауна-Робинсона. Данный итерационный метод предназначен для решения любой игры G(mn), не требуя никаких ограничений на элементы матрицы игры.

Метод базируется на многократном разыгрывании игры и подсчете верхней и нижней оценок цены игры с занесением результатов в таблицу специального вида (табл. 3.11):

Таблица 3.12

k	i	B₁	…	B_n	j	A₁	…	A_m	V		V^*

Каждая строка таблицы соответствует однократному розыгрышу игры (партии игры).

Поясним записи в соответствующих позициях:

k— номер партии (итерации);
iиj— номера стратегий, выбранных соответственно игрокамиA иBв данной партии;
B_1, …, B_n— накопленный заkпартий выигрыш игрокаAпри выборе им стратегииA_i в данной партии и ответе игрокомBсоответственно стратегиямиB_1, …, B_n;
A_1, …, A_m— накопленный заkпартий выигрыш игрокаAпри выборе игрокомBстратегииB_j в данной партии и ответе игрокомAсоответственно стратегиямиA_1, …, A_m;
V—нижняя оценка цены игры (минимальный накопленный выигрыш, поделенный наk);
— верхняя оценка цены игры (максимальный накопленный выигрыш, поделенный наk);
.

В [6] доказано, что при k:V^* V, ,,

где V– цена игры,N_i иN_j–число применений соответственно стратегийА_iиB_jза kпартий,p_i иq_j – значения вероятностей в оптимальных стратегияхS_A = (p_i), i = 1, …,m, S_B = (q_j), j = 1,…,n, игроковAиB соответственно.

Проиллюстрируем метод на примере игры G(33), представленной табл. 3.12.

Таблица 3.13

B_j A_i	B₁	B₂	B₃
A₁	7	2	9
A₂	2	9	0
A₃	9	0	11

Требуется найти решение – пару оптимальных смешанных стратегий (S_A, S_B),S_A = (p₁,p₂,p₃), S_B = (q₁,q₂,q₃), и цену игрыV.

Будем искать пару смешанных стратегий S_A = (p₁,p₂,p₃), p₁+p₂+p₃= 1, S_B = (q₁,q₂,q₃), q₁+q₂+q₃= 1 и цену игрыV.

Построим табл. 3.13 для первых десяти итераций.

Таблица 3.14

k	i	B₁	B₂	B₃	j	A₁	A₂	A₃	V	V	V^*
1	3	9	0	11	2	2	9	0	0	9	4,5
2	2	11	9	11	2	4	18	0	4,5	9	6,75
3	2	13	18	11	3	13	18	11	3,67	6	4,84
4	2	15	27	11	4	22	18	22	2,75	5,5	4,13
5	1	22	29	20	3	31	18	33	4,0	6,6	5,3
6	3	31	29	31	2	33	27	33	4,84	5,5	5,17
7	1	38	31	40	2	35	36	33	4,43	5,14	4,79
8	2	40	40	40	2	37	45	33	5,0	5,61	5,30
9	2	42	49	40	3	46	45	44	4,45	5,11	4,78
10	1	49	51	49	1	53	47	53	4,90	5,30	5,1

Поясним процесс заполнения табл. 3.13.

Пусть начинает (k = 1) игрокAи выбирает на первом шаге стратегиюА₁. Его выигрыш в зависимости от выбора игрокаBможет равняться 9 (при выборе стратегииB₁), 0 (при выбореB₂) или 11 (при выбореB₃). Поскольку теперь выбор за игрокомB(а он заинтересован в минимизации выигрыша игрокаA), то выделим (жирным шрифтом) минимальный выигрыш 0, соответствующий стратегииB₂. Следовательно игрокуBвыгоднее всего ответить стратегиейB₂, что, в свою очередь, может привести к выигрышу игрокаAпри его ответе в следующей партии, равному 2 (при выборе стратегииA₁), 9 (A₂) или 0 (A₃). Так как игрокAзаинтересован в максимизации выигрыша, то выделим максимальный выигрыш 9 (дляA₂). Соответствующие значенияV,иV^*равны 0; 9 и 4,5.

Во второй партии (k = 2) игрокуA, следовательно, выгодно выбрать стратегию A₂, которая позволит ему накопить выигрыш, равный соответственно 11 (дляB₁), 9 (дляB₂) или 11 (дляB₃) и т.д. Заметим, что дляk = 4 в столбцахА₁иА₃получаются одинаковые накопленные выигрыши (22), поэтому игрокA в пятой партии может выбрать как стратегиюА₁, так иА₃.

К сожалению (что видно и по табл. 3.12), сходимость данного метода довольно слабая, но существуют методы ее ускорения. Критерием останова можно выбрать достаточную стабильность величины V^*при увеличении числа итераций.

Для рассматриваемого примера в итоге получим:

и, что соответствует точному решению, полученному, например, методом Лагранжа.

Как уже отмечалось, сравнительно невысокая трудоемкость данного метода часто делает его более предпочтительным по сравнению с методом линейного программирования (например, симплекс-методом) при решении задач линейного программирования (после их сведения к соответствующей теоретико-игровой задачи) большой размерности.

Содержание