Строго выпуклые игры на единичном квадрате
Функция φ(x) называется выпуклой, если для любых двух точек z1 и z2 из множества Z выполняется неравенство:
φ( λz1 + (1-λ)z2 ) λφ(z1) + (1- λ)φ(z2) ,
Если неравенство строгое, то и функция строго выпуклая (если неравенство выполняется строго, то вторая производная φ˝(z)>0 ).
Опр. Игра Г=<X,Y,a> называется игрой на единичном квадрате, если X=[0,1] и Y=[0,1], а целевая функция a(x,y) определена для каждой точки этого квадрата.
Опр. Игра Г на единичном квадрате называется непрерывной, если функция платежей a(x,y) непрерывна в каждой точке единичного квадрата по обеим переменным.
Опр. Непрерывная антагонистическая игра на единичном квадрате называется выпуклой, если функция a(x,y) строго выпукла по Y для всех x X. Иными словами, для функции платежей в строго выпуклой игре имеет место неравенство:
a(x, λy1 + (1-λ)y2) < λ a(x,y1) + (1- λ) a(x,y2), .
Исходя из свойств строгой выпуклости, .
Теорема. В строго выпуклой игре на единичном квадрате 2-ой игрок имеет единственную оптимальную стратегию, которая является чистой. Цена игры в этом случае v(a), где а — функция платежей.
v(a) = = , где y* — оптимальная чистая стратегия 2-го игрока.
Х* — множество стратегий 1-го игрока, состоящее из тех х* Х*, для которых выполняется условие a(x*,y*) = v(a).
х* — тоже чистые стратегии, они называются существенными стратегиями, а остальные – несущественными.
Нахождение существенных стратегий 1-го игрока основано на выполнении следующих свойств.
Если y*=1, то у 1-го игрока существует стратегия х1, для которой
.
Геометрическое истолкование:
При уменьшении y a(x,y) возрастает.
Если y*=0, то среди стратегий 1-го игрока существует такая стратегия х2, что , y=y*.
Если имеется значение стратегии 0<y*<1, то у 1-го игрока найдутся 2 существенные стратегии х1 и х2,для которых имеет место условие
, y=y* , y=y*
Оптимальной стратегией 1-го игрока является вероятностная смесь стратегий х1 и х2, причем х1 — с вероятностью р, х2 — с вероятностью (1-р).
— уравнение, позволяющее определить р.
Доказывается, что решение этого уравнения единственно и принадлежит интервалу .
Пример. Пусть имеется игра Г=<X,Y,a>, x,y [0,1], функция выигрыша a(x,y) = (x-y)2.
1). Рисуем график функции платежей (выигрыша):
2). Проверим функцию платежей на выпуклость.
Функция платежей строго выпукла по у. Имеем дело со строго выпуклой игрой на единичном квадрате.
Найдем v=v(a). Для этого рассмотрим функцию:
.
Построим таблицу:
y | 0 | 0.25 | 0.5 | 0.75 | 1 |
Ψ(y) | 1 | 0.5625 | 0.25 | 0.5625 | 1 |
y*=0.5
v(a)=0.25
Отсюда видим, что в нашем случае 0<y*<1, а следовательно, у 1-го игрока есть две существенные стратегии: х1 и х2. Для их нахождения рассмотрим зависимость
v(a)=a(x,y*)=(x-y*)2=(x-0.5)2=0.25
x1=0 , x2=1 — две существенных чистых стратегии 1-го игрока.
Проверим, что эти решения действительно являются существенными стратегиями (проверка на противоположность производных).
следовательно, оптимальная стратегия 1-го игрока есть вероятностная смесь по стратегиям х=х1 и х=х2. Найдем эти вероятности.
p=0.5
Покажем, что найденное решение является точкой равновесия. Рассмотрим проигрыши 2-ого игрока при оптимальной стратегии 1-ого:
a(x*,y) = p*(x1 - y)2 + (1-p*)(x2 - y)2 = 1/2(-y)2 + 1/2(1-y)2 , y, следовательно минимум 1/4.
a(x,y*) — выигрыш 1-ого игрока при условии, что 2-ой примет свою оптимальную чистую стратегию.
- Основные понятия теории игр
- Классификация игр
- Описание игры в развернутой форме
- Бескоалиционные игры
- Приемлемые ситуации и ситуации равновесия в игре
- Стратегическая эквивалентность игр
- Антагонистические игры. Общие сведения
- Чистые и смешанные стратегии
- Верхняя и нижняя цены игры при использовании смешанных стратегий
- Основная теорема антагонистических игр.
- Верхние и нижние цены в s-игре
- Разделительная и опорная гиперплоскость двух выпуклых множеств
- Теорема о минимаксе
- Геометрическая интерпретация минимакса
- Решение антагонистических игр. Доминирующие и полезные стратегии
- Игры с частными случаями платежных матриц
- Решение матричных игр
- Линейное программирование для решения матричных игр
- Графическое решение игр 2*n и m*2
- Бесконечные антагонистические игры
- Строго выпуклые игры на единичном квадрате
- Неантагонистические игры
- Бескоалиционные игры
- Охрана воздушного бассейна от загрязнений атмосферы
- Принципы оптимальности в бескоалиционных играх
- Принцип оптимальности по Парето
- Смешанное расширение бескоалиционной игры
- Коалиционные и кооперативные игры
- Характеристическая функция коалиционной игры
- Свойства характеристической функции
- Дележи в кооперативной игре
- Стратегическая эквивалентность кооперативных игр
- Общие сведения об играх с природой или теория статистических решений.
- Пространство стратегий природы
- Пространство стратегий статистика и функция выигрыша
- Критерии выбора решений при неопределённости
- Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- Допустимые стратегии в статистических играх
- Геометрическая интерпретация выбора байесовской стратегии
- Статистические игры с проведением единичного эксперимента Общие сведения
- Пространство выборок
- Функции риска
- Принцип выбора стратегий в играх с единичным экспериментом.
- Байесовский принцип.
- Число чистых стратегий статистика в игре с единичным экспериментом.
- Апостериорные распределения вероятности.
- Определение байесовских решений с использованием апостериорных вероятностей
- Двуальтернативная задача
- Анализ целесообразности проведения экспериментов
- Использование апостериорной вероятности для определения последовательных байесовских правил
- Правило последовательных выборок
- Функция риска при оптимальном последовательном правиле