logo
Моделирование / Lektsii_Metody_modelirovania_i_prognozirovania

5.7.2. Критерии выбора оп­тимальной стратегии

Рассмот­рим игру, заданную платежной матрицей первого игрока (матри­ца выигрышей первого игрока размера m x n) — .

1. Максиминный критерий Вальда. Это тот самый критерий, который использовался при рассмотрении игр с нулевой суммой (антагонистических) игр. Он отражает «принцип га­рантированного результата», то есть мы откладываемся на самый неблагоприятный для нас случай и пытаемся выбрать такую стратегию, которая мак­симизировала бы наш выиг­рыш в самой неблагоприятной ситуации. В математическом виде критерий записывается как

В качестве оптимальной выбирается стратегия, на которой достигает­ся значение max. Иногда этот критерий называют критерием «крайнего пессимизма».

2. Критерий максимакса. Этот критерий является в определенном смысле противоположным по своему смыслу предыдущему критерию. А именно, он предполагает рассмотрение не самого неблагопри­ятного случая (критерий Вальда), а наоборот наиболее благоприятного. Выбирается в качестве оптимальной такая стратегия, для которой этот самый благоприятный случай дает самый большой выигрыш. В математическом виде критерий записывается как

В качестве оптимальной стратегии выбирается стратегия, на которой достигается значение max. Иногда этот критерий называют критерием «крайнего оптимизма».

3. Критерий Гурвица. Этот критерий является своего рода обобщением двух предыдущих критериев. Он представляет из себя целое семейст­во критериев, зависящих от некоторого параметра α, смысл которо­го — в определении баланса между подходами «крайнего пессимиз­ма» и «крайнего оптимизма». В математическом виде критерий записывается как

В качестве оптимальной стратегии выбирается стратегия, на которой дости­гается значение max. Значение параметра выбирается из интервала 0 < α < 1. Критерий Вальда получается как частный случай при α = 0 , а критерий максимакса при α = 1. Выбор конкретного значения параметра определя­ется скорее субъективными факторами, например склонностью к риску ЛПР (лица принимающего решение). При отсутствии каких-либо явных предпочтений вполне логично, например, выбрать значение α = 0,5.

4. Критерий Сэвиджа (критерий минимаксного риска). Применение данного критерия предполагает рассмотрение некоторой производной матрицы, смысл которой состоит в том, что для каждой стратегии второго игрока определяется выигрыш в наиболее благоприятном случае (при наиболее правильном выборе стратегии первым игроком для данной ситуации), а далее вычисляются величины «недополучен­ных» выигрышей для всех остальных стратегий первого игрока при рассматриваемой стратегии второго игрока. Элементы матри­цы , которая обычно называется матрицей риска, рассчитывают как . Далее к матрице рисков применяется минимаксный подход, а именно:

В качестве оптимальной стратегии выбирается стратегия, на которой достигается min. Тем самым выбираем такую стратегию, для которой наибольшее значение «недополучения» будет иметь наименьшее значение.

5. Критерий Лапласа. Этот критерий исходит из следующего соображения. Поскольку нам ничего не известно о принципах или вероятностях применения вторым игроком своих стратегий, то мы предполагаем эти вероятности все равными .

Тогда критерий можно записать как

Таким образом, смысл данного критерия — максимизация ожидаемо­го выигрыша в предположении о равновероятности применения вторым игроком своих стратегий.