Математическая модель системы слежения РЛС
1.2.1 Метод динамического программирования
Для получения уравнения Беллмана и формулировки теоремы, являющейся сущностью метода динамического программирования автором данной теории были выдвинуты следующие гипотезы.
Гипотеза 1.1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x в точку x1.
Время, в течение которого осуществляется оптимальный переход из точки x в точку x1, обозначим через Т(х). И пусть
w(x) = -- T(x).
Гипотеза 1.2. Функция w(x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные
На основе этих гипотез была сформулирована и доказана теорема 1.1.
Теорема 1.1. Если для управляемого объекта, описываемого уравнением , и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1.3) и (1.4) (оптимальность понимается в смысле быстродействия).
для всех точек x x1 и u,
(1.3)
для любого оптимального процесса (u(t), x(t)). (1.4)
Эта теорема и составляет сущность метода динамического программирования.
Метод динамического программирования (1.3), (1.4) содержит некоторую информацию об оптимальных процессах и потому может быть использован для их разыскания. Однако он имеет ряд неудобств. Во-первых, применение этого метода требует нахождения не только оптимальных управлений, но и функции w(x) так как эта функция входит в соотношения (1.3), (1.4). Во-вторых, уравнение Беллмана представляет собой уравнение в частных производных относительно функции w. Указанные обстоятельства сильно затрудняют возможность пользования методом динамического программирования для отыскания оптимальных процессов в конкретных примерах. Но самым главным недостатком этого метода является предположение о выполнении гипотез 1.1 и 1.2. Ведь оптимальные управления и функция w заранее неизвестны, так что гипотезы 1.1 и 1.2 содержат предположение о неизвестной функции, и проверить выполнение этих гипотез по уравнениям движения объекта невозможно.
Далее кратко излагается сущность принципа максимума, который является значительно более удобным средством для отыскания оптимальных процессов, чем метод динамического программирования.