logo search
Теория игр

Использование апостериорной вероятности для определения последовательных байесовских правил

Будем рассматривать только такие игры, в которых результаты отдельных испытаний являются независимыми случайными величинами.

Обозначим — вероятности исходов j-ого эксперимента при состоянии природы z.

Стоимость отдельного испытания будем считать за 1.

В качестве основы для описания плана последовательных выборок примем распределение вероятности q(z), . Причем — априорное распределение вероятности до начала испытания, — апостериорное распределение вероятности после первого испытания, - апостериорное распределение вероятности после j испытания.

Очевидно, что содержит в себе всю информацию о состоянии природы, которая была определена до начала эксперимента и накопилась в результате последовательности проведения из j испытаний.

можно рассматривать как априорное распределение вероятности перед (j+1) испытанием или апостериорное распределение вероятности после j испытания. Формально преобразование в можно описывать в виде действия некоторого оператора Т:

Развернуто это соотношение можно записать в следующем виде (по формуле Байеса):

.

Принцип получения плана последовательной выборки становится удобным, если его рассматривать на следующей выборке: , .

Обозначим: и .

Пространство Z смешанных стратегий природы будет определяться областью значений . Ясно, что при .

Если q=0,5 , то отдать предпочтение какому-либо решению нельзя, следовательно они равновесные. В этом случае необходимо провести опыт с тем, чтобы уточнить вероятность состояния природы. Предположим, что имеются: и , .

Если ;

Если .

Если , то надо продолжить эксперимент.

Подобные области значений можно сделать и для 3 состояний природы .

Для всех точек, не входящих в , принимают решение продолжить эксперимент. Ясно, что когда q — апостериорная вероятность, попадает в какой-либо из треугольников, то эксперимент прекращается, поскольку каждое испытание мы оценили в стоимость 1, то небезразлично, на какой стадии прекратить эксперимент.

При анализе ситуации интерес вызывают только будущие испытания Можно минимизировать затраты лишь на предстоящих испытаниях. При каждом испытании определяются апостериорные вероятности состояний природы и — области останова . Если проведены j испытаний, то удобно рассматривать:

, где N — число испытаний, входящих в полный единичный эксперимент. При каждом испытании для всех решений следует определять области останова. В литературе утверждается, что эти области должны быть выпуклыми и непересекающимися для каждого решения.