МПУР / MPUR_ekzamen_Nabatova (1)

Метод динамического программирования. Принцип оптимальности и уравнение Беллмана.

Метод, предназначенный для решения задач в условии возможности разбития задачи на несколько частей (напр по времени)

Есть управляемая система, которая под воздействием управления переходит из одного состояния в другое

Необходимо определить параметры управления U₁…U_n таким образом, чтобы критерий эффективности управления по совокупности достигал максимального значения

Основные предположения:

Очередное состояние системы S_k зависит только от состояние на предыдущем этапе S_k_-1 и управления U_k (отсутствие последействия); S_k=µ(U_kS_k_-1) (1)

Наша задача найти такое управление, чтобы его эффективность была максимальной

Z₀=f₁(S₀,U₁)+f₂(S₁,U₂)+…+f_n(S_n-1,U_n)

Z₀= (2)

Уравнение Белмана

Yandex.RTB R-A-252273-3

Содержание

Yandex.RTB R-A-252273-4