Использование апостериорной вероятности для определения последовательных байесовских правил
Будем рассматривать только такие игры, в которых результаты отдельных испытаний являются независимыми случайными величинами.
Обозначим — вероятности исходов j-ого эксперимента при состоянии природы z.
Стоимость отдельного испытания будем считать за 1.
В качестве основы для описания плана последовательных выборок примем распределение вероятности q(z), . Причем — априорное распределение вероятности до начала испытания, — апостериорное распределение вероятности после первого испытания, - апостериорное распределение вероятности после j испытания.
Очевидно, что содержит в себе всю информацию о состоянии природы, которая была определена до начала эксперимента и накопилась в результате последовательности проведения из j испытаний.
можно рассматривать как априорное распределение вероятности перед (j+1) испытанием или апостериорное распределение вероятности после j испытания. Формально преобразование в можно описывать в виде действия некоторого оператора Т:
Развернуто это соотношение можно записать в следующем виде (по формуле Байеса):
.
Принцип получения плана последовательной выборки становится удобным, если его рассматривать на следующей выборке: , .
Обозначим: и .
Пространство Z смешанных стратегий природы будет определяться областью значений . Ясно, что при .
Если q=0,5 , то отдать предпочтение какому-либо решению нельзя, следовательно они равновесные. В этом случае необходимо провести опыт с тем, чтобы уточнить вероятность состояния природы. Предположим, что имеются: и , .
Если ;
Если .
Если , то надо продолжить эксперимент.
Подобные области значений можно сделать и для 3 состояний природы .
Для всех точек, не входящих в , принимают решение продолжить эксперимент. Ясно, что когда q — апостериорная вероятность, попадает в какой-либо из треугольников, то эксперимент прекращается, поскольку каждое испытание мы оценили в стоимость 1, то небезразлично, на какой стадии прекратить эксперимент.
При анализе ситуации интерес вызывают только будущие испытания Можно минимизировать затраты лишь на предстоящих испытаниях. При каждом испытании определяются апостериорные вероятности состояний природы и — области останова . Если проведены j испытаний, то удобно рассматривать:
, где N — число испытаний, входящих в полный единичный эксперимент. При каждом испытании для всех решений следует определять области останова. В литературе утверждается, что эти области должны быть выпуклыми и непересекающимися для каждого решения.
- Основные понятия теории игр
- Классификация игр
- Описание игры в развернутой форме
- Бескоалиционные игры
- Приемлемые ситуации и ситуации равновесия в игре
- Стратегическая эквивалентность игр
- Антагонистические игры. Общие сведения
- Чистые и смешанные стратегии
- Верхняя и нижняя цены игры при использовании смешанных стратегий
- Основная теорема антагонистических игр.
- Верхние и нижние цены в s-игре
- Разделительная и опорная гиперплоскость двух выпуклых множеств
- Теорема о минимаксе
- Геометрическая интерпретация минимакса
- Решение антагонистических игр. Доминирующие и полезные стратегии
- Игры с частными случаями платежных матриц
- Решение матричных игр
- Линейное программирование для решения матричных игр
- Графическое решение игр 2*n и m*2
- Бесконечные антагонистические игры
- Строго выпуклые игры на единичном квадрате
- Неантагонистические игры
- Бескоалиционные игры
- Охрана воздушного бассейна от загрязнений атмосферы
- Принципы оптимальности в бескоалиционных играх
- Принцип оптимальности по Парето
- Смешанное расширение бескоалиционной игры
- Коалиционные и кооперативные игры
- Характеристическая функция коалиционной игры
- Свойства характеристической функции
- Дележи в кооперативной игре
- Стратегическая эквивалентность кооперативных игр
- Общие сведения об играх с природой или теория статистических решений.
- Пространство стратегий природы
- Пространство стратегий статистика и функция выигрыша
- Критерии выбора решений при неопределённости
- Статистические игры без эксперимента. Представление игры с природой в виде s-игры
- Допустимые стратегии в статистических играх
- Геометрическая интерпретация выбора байесовской стратегии
- Статистические игры с проведением единичного эксперимента Общие сведения
- Пространство выборок
- Функции риска
- Принцип выбора стратегий в играх с единичным экспериментом.
- Байесовский принцип.
- Число чистых стратегий статистика в игре с единичным экспериментом.
- Апостериорные распределения вероятности.
- Определение байесовских решений с использованием апостериорных вероятностей
- Двуальтернативная задача
- Анализ целесообразности проведения экспериментов
- Использование апостериорной вероятности для определения последовательных байесовских правил
- Правило последовательных выборок
- Функция риска при оптимальном последовательном правиле