Методичка по исследованию операций

3.5. Вычислительная схема дп для обратного хода

Несмотря на единообразие моделей, любая вычислительная схема в ДП строится в зависимости от конкретной задачи. Однако при этом можно отметить некоторые общие черты такого построения:

1. Решение уравнений (4) проводят последовательно, начиная с уравнения (3), т.е. обратным ходом. Этот этап называют условной оптимизацией.

2. В результате последовательного решения n частных задач на условный оптимум определяют две последовательности функций: условные оптимумы суммарного показателя эффективности на k-м шаге {Z_k(S_k_–1)} и соответствующие им условные оптимальные управления {u_k(S_k_–1)}, k = n, n – 1,…, 1. Эти последовательности функ-ций в дискретных задачах получают в табличной форме.

3. После выполнения I этапа приступают ко II этапу – безусловной оптимизации.

Если задано единственное начальное состояние S₀, т.е. то оптимум целевой функции определяется непосредственно:opt Z = Z₁ (S₀), а затем искомое безусловное оптимальное управление определяется по цепочке: S₀  u₁  S₁  u₂  …  u_n  S_n. В этой цепочке переход от состояния к управлению (S_k_–1  u_k) проводится по последовательности {u_k(S_k_–1)}, а переход от управления к состоянию (u_k S_k) – с помощью уравнения состояний (1).

Если же задано множество начальных состояний {S₀}, т.е. то дополнительно решают еще одну задачу на оптимум:

откуда находится конкретное оптимальное S₀ и оптимальное управление u₀, а затем, как и раньше, по цепочке – безусловное оптимальное управление.

Yandex.RTB R-A-252273-3

Содержание

Yandex.RTB R-A-252273-4