Математическая модель системы слежения РЛС

дипломная работа

1.2.1 Метод динамического программирования

Для получения уравнения Беллмана и формулировки теоремы, являющейся сущностью метода динамического программирования автором данной теории были выдвинуты следующие гипотезы.

Гипотеза 1.1. Какова бы ни была отличная от x1 точка x фазового пространства, существует оптимальный (в смысле быстродействия) процесс перехода из точки x в точку x1.

Время, в течение которого осуществляется оптимальный переход из точки x в точку x1, обозначим через Т(х). И пусть

w(x) = -- T(x).

Гипотеза 1.2. Функция w(x) непрерывна и всюду, кроме точки x1, имеет непрерывные частные производные

На основе этих гипотез была сформулирована и доказана теорема 1.1.

Теорема 1.1. Если для управляемого объекта, описываемого уравнением , и предписанного конечного состояния x1 выполнены гипотезы 1 и 2, то имеют место соотношения (1.3) и (1.4) (оптимальность понимается в смысле быстродействия).

для всех точек x x1 и u,

(1.3)

для любого оптимального процесса (u(t), x(t)). (1.4)

Эта теорема и составляет сущность метода динамического программирования.

Метод динамического программирования (1.3), (1.4) содержит некоторую информацию об оптимальных процессах и потому может быть использован для их разыскания. Однако он имеет ряд неудобств. Во-первых, применение этого метода требует нахождения не только оптимальных управлений, но и функции w(x) так как эта функция входит в соотношения (1.3), (1.4). Во-вторых, уравнение Беллмана представляет собой уравнение в частных производных относительно функции w. Указанные обстоятельства сильно затрудняют возможность пользования методом динамического программирования для отыскания оптимальных процессов в конкретных примерах. Но самым главным недостатком этого метода является предположение о выполнении гипотез 1.1 и 1.2. Ведь оптимальные управления и функция w заранее неизвестны, так что гипотезы 1.1 и 1.2 содержат предположение о неизвестной функции, и проверить выполнение этих гипотез по уравнениям движения объекта невозможно.

Далее кратко излагается сущность принципа максимума, который является значительно более удобным средством для отыскания оптимальных процессов, чем метод динамического программирования.

Делись добром ;)