Пространство стратегий статистика и функция выигрыша
X — множество стратегий статистика, аналогичное множеству стратегий в антагонистических играх. Если множество X — дискретное, X = (x ,…, x ), тогда можно рассматривать множество ситуаций и множество выигрышей статистика в этих ситуациях: (x , z ), i = , j =
П = (a ) m*n
Эта функция П называется функцией потерь. Значение функции потерь позволяет игроку 1 (статистику) принимать предпринимать правильные действия.
Пример: Задача о яйцах и креме
-
Состояние яйца
Действие
Z1 - хорошее
Z2- испорченное
долить в остальные 5 яиц, x1
крем из 6 яиц
крема нет, загублено 5 хороших яиц
вылить разбитое яйцо на блюдце для контроля, x2
крем из 6 яиц, но надо мыть посуду (блюдце)
крем из 5 яиц, надо мыть блюдце "с отвращением"
выбросить яйцо, не глядя, x3
крем из пяти яиц, загублено 1 яйцо
крем из 5 яиц
Если каким-либо образом оцифровать описание ситуации в виде значений функций потерь, то получим игру с природой.
В описании игры с природой наблюдается полная аналогия с антагонистической игрой. Статистик может принимать чистые стратегии x X и их вероятностные оценки p = p(x ) P, (X, P) — пространство стратегий статистика.
А = (a ), i = ; j =
X = ,…, , m — чистые стратегии статистика;
n — чистые состояния природы;
Z = ,…,
Если используются смешанные стратегии, то каждому из состояний чистой стратегии сопоставляется значение p , i = . Определим вероятность использования смешанных стратегий.
x~ ,…,
z~ ,…, — вероятность состояний природы.
Если эти вероятности известны, то можно определить сравнительные вероятности статистика в этой игре:
M[S , S ] = a *p *q
S — множество (X*P)
S — множество (Z*Q)
p = ; q =
M[S , S ] = p *A*q
Задачу статистика в этой игре можно определить как нахождение такого S , при котором его выигрыш M[S , S ] max. Эта стратегия S может быть как чистой, так и смешанной.
Исходя из этого, в матрице платежей (a ) можно рассматривать доминирующие и доминируемые стратегии.
Доминирование по строкам и доминирование по столбцам теряет смысл, т. к. природа не выиграет и не проиграет, ей безразлично её состояние.
С учётом этого матрица платежей не в полной мере характеризует достоинства и недостатки каждой стратегии X = ,…, игрока.
Используют другую форму описания игры, которая более полно отражает степень удачливости в выборе игрока. Одним из таких показателей является матрица рисков:
A =
Номер столбца матрицы совпадает с состоянием природы, номер строки характеризует стратегию игрока. B = max a — максимальный выигрыш статистика при данном состоянии природы j.
R = (r ), i = , j =
r = B - a — разница между максимальным выигрышем и выигрышем, который получит статистик, выбирая стратегию x .
Матрица рисков: R = . В матрице рисков хотя бы один из элементов в каждом столбце должен равняться нулю.
Пример: А = ; R =
Если условием выбора стратегии является максимум среднего выигрыша, то по матрице рисков R min. Если же вероятности состояния природы известны (q ), то условие максимума среднего выигрыша и условие минимума среднего риска дают одни и те же стратегии.
Если V = ; V = max V или r = ; r =min r , то решение будут одинаковыми.
Пример: Матрица платежей: А = ; q = (0,2; 0,5; 0,3)
V = 1*0,2+ 3*0,5+ 1*0,3 = 2
V = 2*0,2+ 0,5+ 1,2 = 2,1
V = 2,1; x является предпочтительной стратегией: x даёт больший средний выигрыш V .
R = r = 0,2+ 0,9 = 1,1
r = 1 x — риск минимален.
О вероятностях состояния природы в лучшем случае известны их некоторые оценки q’. На практике достоверность этих оценок является слишком низкой для того, чтобы использовать их при оценке качества выбора решений статистика.
В таких условиях лучше:
Не пользоваться этими оценками и для выбора решения использовать критерий, который не пользуется понятием вероятности состояния природы;
Cчитать все состояния природы равновероятными q = 1/n, i= .
Критерий, позволяющий принять задачу выбора решения, называется критерием выбора решений при неопределённости.
- Основные понятия теории игр
- Классификация игр
- Описание игры в развернутой форме
- Бескоалиционные игры
- Приемлемые ситуации и ситуации равновесия в игре
- Стратегическая эквивалентность игр
- Антагонистические игры. Общие сведения
- Чистые и смешанные стратегии
- Верхняя и нижняя цены игры при использовании смешанных стратегий
- Основная теорема антагонистических игр.
- Верхние и нижние цены в s-игре
- Разделительная и опорная гиперплоскость двух выпуклых множеств
- Теорема о минимаксе
- Геометрическая интерпретация минимакса
- Решение антагонистических игр. Доминирующие и полезные стратегии
- Игры с частными случаями платежных матриц
- Решение матричных игр
- Линейное программирование для решения матричных игр
- Графическое решение игр 2*n и m*2
- Бесконечные антагонистические игры
- Строго выпуклые игры на единичном квадрате
- Неантагонистические игры
- Бескоалиционные игры
- Охрана воздушного бассейна от загрязнений атмосферы
- Принципы оптимальности в бескоалиционных играх
- Принцип оптимальности по Парето
- Смешанное расширение бескоалиционной игры
- Коалиционные и кооперативные игры
- Характеристическая функция коалиционной игры
- Свойства характеристической функции
- Дележи в кооперативной игре
- Стратегическая эквивалентность кооперативных игр
- Общие сведения об играх с природой или теория статистических решений.
- Пространство стратегий природы
- Пространство стратегий статистика и функция выигрыша
- Критерии выбора решений при неопределённости
- Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- Допустимые стратегии в статистических играх
- Геометрическая интерпретация выбора байесовской стратегии
- Статистические игры с проведением единичного эксперимента Общие сведения
- Пространство выборок
- Функции риска
- Принцип выбора стратегий в играх с единичным экспериментом.
- Байесовский принцип.
- Число чистых стратегий статистика в игре с единичным экспериментом.
- Апостериорные распределения вероятности.
- Определение байесовских решений с использованием апостериорных вероятностей
- Двуальтернативная задача
- Анализ целесообразности проведения экспериментов
- Использование апостериорной вероятности для определения последовательных байесовских правил
- Правило последовательных выборок
- Функция риска при оптимальном последовательном правиле