logo
МПУР / MPUR_ekzamen_Nabatova (1)

Метод динамического программирования. Принцип оптимальности и уравнение Беллмана.

Метод, предназначенный для решения задач в условии возможности разбития задачи на несколько частей (напр по времени)

Есть управляемая система, которая под воздействием управления переходит из одного состояния в другое

Необходимо определить параметры управления U1…Un таким образом, чтобы критерий эффективности управления по совокупности достигал максимального значения

Основные предположения:

Очередное состояние системы Sk зависит только от состояние на предыдущем этапе Sk-1 и управления Uk (отсутствие последействия); Sk=µ(UkSk-1) (1)

Наша задача найти такое управление, чтобы его эффективность была максимальной

Z0=f1(S0,U1)+f2(S1,U2)+…+fn(Sn-1,Un)

Z0= (2)

Уравнение Белмана

u

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4