logo
Цепи Маркова в теории вероятности и их приложения

1. Основные понятия теории марковских цепей

Условно будем говорить о некоторой физической системе, шаг за шагом меняющей свое фазовое состояние. Будем считать, что имеется лишь конечное или счетное число различных фазовых состояний е1, е2, ... Обозначим о (п) состояние системы через п шагов. Будем предполагать, что цепочка последовательных переходов

о(0) > о (1) …

зависит от вмешательства случая, причем соблюдается следующая закономерность: если на каком-либо шаге п система находится в состоянии еi, то, независимо от предшествующих обстоятельств, она на следующем шаге с вероятностью pij переходит в состояние еj

pij = Р{ о (n+1) = еi/ о (п) = еj }, i, j =1, 2, ... (2.1)

Описанная выше модель называется однородной цепью Маркова, а вероятности рij называются переходными вероятностями этой цепи. Кроме них, еше задается начальное распределение вероятностей

poi = P{о (0) = еi}, i=1, 2, ... (2.2)

Какова вероятность того, что система через п шагов будет находиться в состоянии еj?

Обозначим эту вероятность pj (n):

pj (n) = Р {о(n) = еj}. (2.3)

Через п -- 1 шагов система обязательно будет находиться в одном из состояний еk, k = 1, 2, ..., причем в еk она будет с вероятностью, обозначенной рк(п -- 1). При условии, что через п--1 шагов система будет находиться в состоянии еk, вероятность оказаться через п шагов в состоянии еj равна вероятности рkj перехода из еk в еj. Используя формулу полной вероятности, получаем, что

Это дает следующие рекуррентные соотношения для вероятностей рj(п), j=1, 2, ...:

(n=1, 2, …).

Если в начальный момент система находится в определенном состоянии еi, то начальное распределение вероятностей таково, что р0i= 1, p0k= 0 для k ? i а вероятность pi(n) совпадает с вероятностью pij(n) того, что система из состояния еi за п шагов перейдет в состояние еj.

pij(n) = Р{о(п) = еj/о(0) =еi}, i, j = 1, 2, ... (2.6)

При начальном распределении вида р0i =1, р0k = 0 для k ? i формула (2.5) дает следующие соотношения между переходными вероятностями pij(n); i,j =1, 2,... :

(n=1, 2, …)

Удобно ввести матрицу Р(п) = { pij(n)}. Согласно формуле (2.7)

Р(0)= I, Р(1) = Р, Р(2) =Р(1) Р = P2, ...,

где I -- единичная матрица, Р = {pij} ? матрица переходных вероятностей. Видно, что имеет место следующее равенство:

P(n) = Pn (n = 1, 2, …) (2.8)

Рассмотрим несколько примеров

Задача о стопке книг. На письменном столе лежит стопка из m книг. Если обозначить каждую книгу соответствующим номером, то порядок их расположения сверху вниз можно описать перестановкой из т чисел (i1, i2, … … im), где i1 -- номер книги, лежащей сверху, i2 -- номер следующей книги, ..., iт--номер последней книги, лежащей в самом низу. Предположим, что каждая книга, берется с определенной вероятностью, скажем, книга с номером k берется с вероятностью рk (к=1, ..., m), причем при возвращении она кладется сверху.

Возьмем произвольное состояние (i1, i2, …, im). На следующем шаге оно либо остается неизменным, что происходит с вероятностью при выборе лежащей сверху книги с номером i1 либо меняется на одно из m -- 1 состояний вида (ik, i1, ...), что происходит с вероятностью при выборе книги с номером ik. Перед нами цепь Маркова с состояниями, каждое из которых описывается соответствующей перестановкой (i1, i2, … … im), и указанными переходными вероятностями.

Остановимся на случае т = 2. Тогда имеется лишь два состояния: е1=(1,2) и е2 = (2, 1). Переходные вероятности имеют вид:

p11=p21=p1, p12=p22=p2

и матрица переходных вероятностей есть

Вероятности перехода за два шага суть

p11(2)=p21(2)=p1p1+p2p1=p1(p1+p2)=p1,

p12(2)=p22(2)= p1p2+p2p2=p2(p1+p2)=p2.

Видно, что Р2 = Р и вообще Рn = Р. При любом начальном распределении вероятностей имеем (n =1, 2, ...)

p1(n)= p11(n)+p21(n)=p1(+)=p1,

p2(n)= p12(n)+p2(n)=p2(+)=p2.

Задача о наилучшем выборе. Положим о0(0)=1 и обозначим: о(1) -- порядковый номер первого предмета, оказавшегося наилучшим среди всех осмотренных ранее; о(2)--порядковый номер следующего наилучшего среди всех осмотренных до него предметов и т. д. Цепочка о(0)>о(1)>о(2)... обрывается на некотором н-м шаге, если предмет с порядковым номером о(н) оказывается абсолютно наилучшим, так что и среди не осмотренных еще предметов нет лучшего. Число н является случайным, поскольку случайным является сам порядок осмотра. Введем состояния е1, е2, …еm, еm+1, охарактеризовав их следующим образом: еi при i=1, …, т означает, что предмет с порядковым номером i (т. е. i-й по счету осмотренный предмет) является наилучшим среди всех ранее осмотренных; еm+1 означает, что уже осмотрен абсолютно наилучший предмет. Если положить о(n) = еm+1, при всех п>н, то последовательность о(0)>о(1)>о(2)... образует цепь Маркова.

Найдем соответствующие переходные вероятности рij Очевидно, рij=0 при i?j, j?m, а pm+1, m+1=1. Подсчитаем вероятности pij при i<j?m. Обозначим еi событие, состоящее в том, что при случайном порядке осмотра j предметов наилучшим среди них является последний j-й предмет. Очевидно, переходные вероятности рij согласно общей формуле () совпадают с условными вероятностями

, i<j?m.

Очевидно, вероятность события еj совпадает с вероятностью того, что среди всех перестановок из j предметов будет выбрана та, при которой на последнем месте стоит наилучший предмет. Всего различных перестановок имеется j! а тех, при которых на последнем месте оказывается один и тот же фиксированный элемент, имеется (j--1)! Следовательно,

, j=1, …, m.

Вероятность события еiеj совпадает с вероятностью того, что на последнем месте стоит наилучший предмет, а на i-м месте стоит также вполне определенный предмет -- второй по качеству среди всех j предметов. Всего имеется (j -- 2)! Таких перестановок и, следовательно,

, i<j?m.

Таким образом, переходные вероятности рij суть

, i<j?m.

Переходные вероятности pi, m фактически были подсчитаны

, i=1, …, m.

Случайные блуждания. Рассмотрим случайное блуждание, связанное с неограниченными испытаниями Бернулли, когда частица блуждает по целочисленным точкам действительной прямой таким образом, что, находясь в точке i она с вероятностью р переходит на следующем шаге в соседнюю точку i + 1, а с вероятностью q=1--р -- в соседнюю точку i-1. Если обозначить о(n) положение частицы после п шагов, то последовательность о(0) >о(1)>о(2)... будет цепью Маркова с переходными вероятностями вида

Рассмотрим случайное блуждание другого типа. Частица блуждает лишь по целым неотрицательным точкам, причем из точки i она с вероятностью рi переходит на следующем шаге в соседнюю точку i+1, а с вероятностью qi=1 - pi возвращается в нулевое положение. Соответствующие переходные вероятности суть