Случай с неизвестными вероятностями состояний «природы»
Если вероятности состояний «природы» не известны, то для поиска решения ЛПР может применять различные критерии оптимальности. Рассмотрим наиболее используемые критерии.
Критерий Вальда– наиболее осторожный критерий (критерий крайнего пессимизма), согласно которому оптимальной для ЛПР является стратегия, максимизирующая минимальный выигрыш:
.
Критерий Сэвиджа – также осторожный критерий, согласно которому оптимальной для ЛПР является стратегия, минимизирующая максимальный риск:
.
Компромиссный критерий Гурвица – компромиссный критерий, согласно которому в качестве оптимальной для ЛПР выбирается стратегия, максимизирующая следующее выражение:
,
где k– коэффициент осторожности (пессимизма), 0k 1. Заметим, что приk= 1 критерий Гурвица переходит в критерий Вальда, а приk= 0 имеем так называемый критерий «крайнего оптимизма», предлагающий ЛПР в качестве оптимальной стратегию, максимизирующую максимальный выигрыш.
Естественно, чем ответственнее выбор и чем меньше склонен рисковать ЛПР, тем ближе к 1 следует выбирать коэффициент k. При отсутствии у ЛПР информации для выбора или «по умолчанию» рекомендуется выбиратьk 0,6.
Если ЛПР сомневается при выборе критерия оптимальности, то рекомендуется применить несколько критериев и выбрать ту стратегию, которую рекомендует большинство из них.
В качестве примера рассмотрим игру с «природой», матрицы G(34) иR(34) которой с некоторыми дополнительными столбцами представлены соответственно табл. 5.4 и табл. 5.5.
Таблица 5.29
G(34)
Пj Ai | П1 | П2 | П3 | П4 | i | wi | hi |
A1 | 19 | 30 | 41 | 49 | 19 | 49 | 31 |
A2 | 51 | 38 | 10 | 20 | 10 | 51 | 26,4 |
A3 | 73 | 718 | 81 | 11 | 11 | 81 | 39 |
Таблица 5.30
G(34)
Пj Ai | П1 | П2 | П3 | П4 | si |
A1 | 54 | 8 | 0 | 0 | 54 |
A2 | 22 | 0 | 71 | 29 | 71 |
A3 | 0 | 30 | 40 | 38 | 40 |
Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: ,,,.
Применение соответствующих критериев приведет к следующим результатам:
согласно критерию Вальда оптимальной для ЛПР стратегией будет A1;
согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A3;
согласно критерию Гурвица (с k= 0,6) оптимальной для ЛПР стратегией будетA3.
Два критерия из трех рекомендуют ЛПР выбрать стратегию A3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегиюA1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.
Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:
в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;
аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qiсостояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.
- Теоретико-игровые методы принятия решений
- Isbn 5-7046-1383-7
- Введение
- Основные понятия теории игр. Классификация игровых моделей
- Основные понятия теории игр
- Классификация игровых моделей
- Контрольные вопросы к разделу 1
- Антагонистическая игра. Поиск решения на дереве игры
- Представление антагонистической игры
- Поиск решения на дереве игры
- Общие замечания
- Метод максимина
- Метод-отсечений
- Неглубокое -отсечение
- Глубокое -отсечение
- Контрольные вопросы к разделу 2
- Методы решения антагонистических игр, представленных в матричной форме
- Матричное представление антагонистической игры
- Наличие седловой точки
- Методы решения матричных игр при отсутствии седловой точки
- Смешанные стратегии
- Метод Лагранжа
- Метод линейного программирования
- Итерационный метод Брауна-Робинсона
- Практический пример
- Контрольные вопросы к разделу 3
- Игра двух лиц с произвольной суммой
- Определение игры двух лиц с произвольной суммой
- Теория Нэша для некооперативных игр
- Рефлексивная игра
- Практический пример
- Контрольные вопросы к разделу 4
- Основы теории статистических решений. Игры с «природой»
- Определение игры «с природой»
- Методы решения игр «с природой»
- Случай стохастической неопределенности
- Случай с неизвестными вероятностями состояний «природы»
- Контрольные вопросы к разделу 5
- Игры с упорядоченными исходами
- Определение игры с упорядоченными исходами при наличии ряда критериев
- Поиск решения игры с упорядоченными исходами
- Контрольные вопросы к разделу 6
- Программная система для решения антагонистических игр
- Общее описание системы
- Примеры работы с системой
- Практический пример
- Контрольные вопросы к разделу 7
- Библиографический список
- Оглавление