Допустимые стратегии в статистических играх
Допустим, что рассматривается смешанная стратегия:
P(x)= (a).
Возможно два случая:
Нельзя найти ’(а) — другая стратегия, когда потери:
L(V, ’) L(V, ), V Z
Если такая стратегия ’(a) существует, то стратегия (а) недопустима.
(а) a = x (a ) p(x )
Стратегия (а) — допустимая, если нельзя найти другую стратегию ’(a): L(V, ’) L(V, ) — условие допустимости стратегии (а).
Допустимая стратегия не обязательно является предпочтительной. Допустимую стратегию удобно рассматривать в рамках S-игры.
Если V=(V V ), то потери можно рассмотреть на плоскости.
Множество значений этих потерь можно сопоставить с выпуклой линейной оболочкой S*.
Рассмотрим некоторую точку S S*, проведём отрезок из начальных координат в эту точку. Очевидно, что все точки, расположенные на этом луче и множество S* будут давать потери, меньшие, чем потери S. Наименьшие потери будут а точке S , которая является пересечением луча и нижней левой границы выпуклой оболочки.
Допустимыми могут быть стратегии, принадлежащие участку линейной оболочки, который является дугой AB. Все стратегии, которые определяются точками линейного множества S*, не принадлежащие её левой нижней границе, можно исключить из рассмотрения. А точки, принадлежащие дуге АВ, в некотором смысле эквивалентны, т. к. при перемещении по этим точкам можно уменьшить потери в одном состоянии и увеличить в другом (сразу всё уменьшить невозможно).
Пример: «задача о технологической линии»
Нижняя левая граница состоит из точек C , C и С
WC +(1-W)C WC +(1-W)C
Смешанная стратегия (а) = (W, 1-W, 0), (a) = (0, W, 1-W)
Определим потери статистика для этих стратегий: L(V , ) = W*0 + 1*(1-W) = 1-W, L(V , ) = 5*W + 3(1-W) = 3 + 2W
L(V , ) = 1*W + 3(1-W) = 3 – 2W
L(V , ) = 3W + 2(1-W) = 2+ W
Рассмотрим возможные пути выбора смешанных стратегий статистика.
Принцип минимакса (min max);
Байесовский принцип.
Принцип минимакса ориентирует статистика на выбор такой смешанной стратегии (а), при которой его потери в наихудшем состоянии природы минимальны.
Применим этот принцип для выбора W в задаче.
1 случай:
В наихудшем состоянии природы эти потери определяются прямой V : W = 0 *(0 1 0), потери равны 3.
2 случай:
3 -2W = 2 + W
1 = 3W; W = 1/3
* (0 1/3 2/3); V = 7/3 (цена игры).
В наихудшем состоянии природы потери определяются верхней границей, минимум в точке О.
Иногда значение функции потерь удобно приводить к определённому нулевому уровню. Очевидно, для нахождения состояния природы L(V , a ) L(V , a )
Этот минимум определяет минимальные затраты, которые может понести статистик при каждом состоянии природы.
L’(V, ) = L(V, ) - L(V, a)
В предыдущей задаче о ПДК потери определялись бы следующим образом:
V | a1 | a2 | a3 |
V1 | 0 | 1-0=1 | 3-0=3 |
V2 | 5-2=3 | 3-2=1 | 2-2=0 |
Очевидно, что принцип минимакса можно применять и для дополнительных потерь.
Байесовский принцип направлен на принятие решения, исходя из априорных оценок вероятностей состояния природы.
q(V) (V)
Если q — априорная вероятность состояния природы, то можно говорить о потерях:
L( , ) =
Матрица потерь статистика в игре:
* =
(V ), i =
L( , ) = L(V , a ) * (a ) * (V ) min
Наилучшей стратегией будет та, при которой байесовские потери L( , ) будут минимальными. Аналогично можно применить байесовский принцип при дополнительных потерях.
Пример: (та же задача)
1 ситуация:
(V ) = 0,6. Найдём оптимальную байесовскую стратегию в этой задаче.
(V ) = 0,4
L( ) = (1-W)*0,6 + (3 + 2W)*0,4 = 1,8 + 0,2W 1,8 при W = 0.
(0, 1, 0) – нужно применять вторую технологию.
2 ситуация:
L( ) = 0,6*(3-2W) + 0,4(2 + W) = 2,6 – 0,8W min W=1
- Основные понятия теории игр
- Классификация игр
- Описание игры в развернутой форме
- Бескоалиционные игры
- Приемлемые ситуации и ситуации равновесия в игре
- Стратегическая эквивалентность игр
- Антагонистические игры. Общие сведения
- Чистые и смешанные стратегии
- Верхняя и нижняя цены игры при использовании смешанных стратегий
- Основная теорема антагонистических игр.
- Верхние и нижние цены в s-игре
- Разделительная и опорная гиперплоскость двух выпуклых множеств
- Теорема о минимаксе
- Геометрическая интерпретация минимакса
- Решение антагонистических игр. Доминирующие и полезные стратегии
- Игры с частными случаями платежных матриц
- Решение матричных игр
- Линейное программирование для решения матричных игр
- Графическое решение игр 2*n и m*2
- Бесконечные антагонистические игры
- Строго выпуклые игры на единичном квадрате
- Неантагонистические игры
- Бескоалиционные игры
- Охрана воздушного бассейна от загрязнений атмосферы
- Принципы оптимальности в бескоалиционных играх
- Принцип оптимальности по Парето
- Смешанное расширение бескоалиционной игры
- Коалиционные и кооперативные игры
- Характеристическая функция коалиционной игры
- Свойства характеристической функции
- Дележи в кооперативной игре
- Стратегическая эквивалентность кооперативных игр
- Общие сведения об играх с природой или теория статистических решений.
- Пространство стратегий природы
- Пространство стратегий статистика и функция выигрыша
- Критерии выбора решений при неопределённости
- Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- Допустимые стратегии в статистических играх
- Геометрическая интерпретация выбора байесовской стратегии
- Статистические игры с проведением единичного эксперимента Общие сведения
- Пространство выборок
- Функции риска
- Принцип выбора стратегий в играх с единичным экспериментом.
- Байесовский принцип.
- Число чистых стратегий статистика в игре с единичным экспериментом.
- Апостериорные распределения вероятности.
- Определение байесовских решений с использованием апостериорных вероятностей
- Двуальтернативная задача
- Анализ целесообразности проведения экспериментов
- Использование апостериорной вероятности для определения последовательных байесовских правил
- Правило последовательных выборок
- Функция риска при оптимальном последовательном правиле