logo
Лекции Методы оптимальных решений

Таким образом, при выборе шагового управления необходимо учитывать:

возможные исходы предыдущего шага.

влияние управления на все оставшиеся до конца процесса шаги.

В задачах динамическою программирования первый пункт учитывают, делая на каждом шаге условные предположения о возможных вариантах окончания предыдущего шага, и проводя для каждого из вариантов условную оптимизацию. Выполнение второго пункта обеспечивается тем, что в задачах динамического программирования условная оптимизация проводится от конца процесса к началу. Сперва оптимизируется последний m-й шаг, на котором не надо учитывать возможные воздействия выбранного управления хm, на все последующие шаги, так как эти шаги просто отсутствуют. Делая предположения об условиях окончания (m-1)-го шага, для каждого из них проводят условную оптимизацию m-го шага и определяют условное оптимальное управление хm. Аналогично поступают для (m-1)-го шага, делая предположение об исходах окончания (m-2)-го шага, и, определяя условное оптимальное управление на (m-1)-ом шаге, приносящее оптимальный выигрыш на двух последних шагах - (m-1)-ом и m-ом. Так же действуют на всех остальных шагах до первого. На первом шаге, как правило, не надо делать условных предположений, т.к. состояние системы перед первым шагом обычно известно. Для этого состояния выбирают оптимальное шаговое управление, обеспечивающее оптимальный выигрыш на первом и всех последующих шагах. Это управление является, безусловно, оптимальным управлением на первом шаге и, зная его, определяются оптимальное значение выигрыша и безусловные оптимальные управления на всех ее шагах.