logo
matan

21.Общая постановка задачи динамического программирования (дп). Особенности задачи дп

ДП – метод оптимизации многошаговых операций. Такие задачи начал рассматривать Беллман в середине 20 века. Объект управления S:S0S начальное состояние – конечное состояние. Пусть это управление можно разбить на n шагов, при этом решение будет приниматься на каждом шаге. xkрешение на каждом шаге, Sk – состояние объекта управления после k шага.

Вводится показатель эффективности управления – целевая функция.

Z = f(S0,x)→opt (1); x = (x1, x2,…,xn)

Состояние системы после k шага зависит только от состояния системы на предыдущем шаге k-1 и управления. Sk=fk(Sk-1,xk)

Прибыль на k шаге зависит от xk и Sk-1. Z=fk(Sk-1,xk)

Прибыль за всю операцию составляет сумма прибыли на каждом шаге

Задача: Определить такое допустимое управление x, приводящее систему из S0 в Sп, в котором целевая функция (1) принимает свое оптимальное значение. Особенности: Каждая ЗЛП разбивается по n шагов; отсутствует обратная связь, выбор xk зависит только от xk-1; Состояние системы зависит Sk зависит от xk и Sk-1; принцип отсутствие последствия.

Yandex.RTB R-A-252273-3
Yandex.RTB R-A-252273-4