logo search
Методичка по исследованию операций

3.5. Вычислительная схема дп для обратного хода

Несмотря на единообразие моделей, любая вычислительная схема в ДП строится в зависимости от конкретной задачи. Однако при этом можно отметить некоторые общие черты такого построения:

1. Решение уравнений (4) проводят последовательно, начиная с уравнения (3), т.е. обратным ходом. Этот этап называют условной оптимизацией.

2. В результате последовательного решения n частных задач на условный оптимум определяют две последовательности функций: условные оптимумы суммарного показателя эффективности на k-м шаге {Zk(Sk–1)} и соответствующие им условные оптимальные управления {uk(Sk–1)}, k nn – 1,…, 1. Эти последовательности функ-ций в дискретных задачах получают в табличной форме.

3. После выполнения I этапа приступают ко II этапу – безусловной оптимизации.

Если задано единственное начальное состояние S0, т.е. то оптимум целевой функции определяется непосредственно:opt Z = Z1 (S0), а затем искомое безусловное оптимальное управление определяется по цепочке: S0u1S1u2  …  unSn. В этой цепочке переход от состояния к управлению (Sk–1uk) проводится по последовательности {uk(Sk–1)}, а переход от управления к состоянию (uk Sk) – с помощью уравнения состояний (1).

Если же задано множество начальных состояний {S0}, т.е. то дополнительно решают еще одну задачу на оптимум:

откуда находится конкретное оптимальное S0 и оптимальное управление u0, а затем, как и раньше, по цепочке – безусловное оптимальное управление.