Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина
В общем виде управляемая динамическая система описывается системой дифференциальных уравнений первого порядка вида
где xi – переменные состояния системы, uj – управляющие воздействия, fi – известные функции,
Заданы также интервал управления t = 0 ¸ T и начальное состояние системы Необходимо определить управляющий вектор
Пусть непрерывные функции fi , f0 и F непрерывно дифференцируемы по xi и uj. Если на управляющие воздействия не накладываются ограничения, то такая задача нахождения оптимального управления принадлежит классу вариационного исчисления и относится к задаче Лагранжа. Если на управляющие воздействия uj накладываются ограничения двух видов: управляющие воздействия могут изменяться в допустимых пределах ½uj½£ uдоп , управляющие воздействия могут претерпевать разрывы первого рода, - то такая задача нахождения оптимального управления может быть решена с использованием принципа максимума Понтрягина. В методе Лагранжа для решения оптимизационной задачи вводятся два вида вспомогательных функций: функция Гамильтона, определяемая по выражению
где fi – функции в выражении (П.7.1), f0 – подынтегральная функция в выражении (П.7.2), pi – присоединенные функции, определяемые в результате решения следующей системы дифференциальных уравнений:
или в векторной форме: где матрица Из (П.7.4) следует:
Уравнения (П.7.4) и (П.7.5) представляют собой каноническую или гамильтонову форму записи уравнений Эйлера-Лагранжа, играющих важную роль в классическом вариационном исчислении. В теории классического вариационного исчисления доказывается следующая теорема, определяющая необходимые условия оптимальности: при оптимальном управлении системой, описываемой (П.7.1), когда минимизируется функционал (П.7.2), обращаются в нуль частные производные
Для поиска вектора оптимального управления Если требуется минимизировать функционал вида:
то есть речь идет о минимизации линейной комбинации координат системы в конце процесса управления, то граничные условия для присоединенных функций определяются из выражения: pi(T) = - ci , i = 1 ¸ m. Если нужно минимизировать нелинейную функцию координат xi(T), а именно: J = F(xi(T)) = min, i = 1 ¸ m, где F – нелинейная функция, дважды дифференцируемая по всем аргументам xi, тогда граничные условия для присоединенных функций определяются из выражений:
Если нужно минимизировать функционал вида:
в котором терминальная функция F = 0, то граничные условия для присоединенных функций равны нулю в точке t = T, то есть: pi(T) = 0, i = 1 ¸ m. Условие трансверсальности. Часто в задачах оптимального управления задаются определенные условия для системы в конце процесса управления, в точках xi(T). Если вместе с основной задачей оптимального управления в виде функционала (35) должны выполняться условия в конце процесса управления, заданные в виде: Fj(xi(T)) = 0, j = 1 ¸ m, причем функции Fj дважды дифференцируемы по всем xi, тогда граничные значения для присоединенных функций при t = T определяются из условия трансверсальности
где
Пример 1. Динамическая система описывается системой дифференциальных уравнений вида:
Заданы также промежуток или интервал управления t = 0 ¸ 1 и начальное состояние системы x1(0) и x2(0). Необходимо найти оптимальное управление uоп, при котором достигается условие
Решение. Для данного критерия оптимального управления функция Гамильтона имеет вид:
система присоединенных функций равна:
Граничные условия для присоединенных функций в этом примере равны нулю в конце процесса управления, то есть p1(1) = 0, p2(1) = 0, так терминальная функция в функционале J равна нулю. Так как Тогда функция Гамильтона примет вид Пример 2. Динамическая система описывается системой дифференциальных уравнений вида
Задано начальное состояние системы x1(0) = 0 , x2(0) = 0. Необходимо на интервале управления системой t = 0 ¸ 1 обеспечить два условия: минимизировать интеграл
и обеспечить конечное состояние системы, заданное выражениями
Из этих выражений следуют конечные состояния координат системы x1(1) = 1, x2(1) = 1. Решение. Функция Гамильтона для этого примера примет вид:
Присоединенные функции определим из формулы (П.7.4) и получим Для определения коэффициентов с1 и с2 воспользуемся условием трансверсальности
где lj – неизвестные множители Лагранжа, обеспечивающие заданное конечное состояние системы. Из этого выражения имеем: p1(1) = - l1, p2(1) = - l2 . Тогда p1(t) = - l1, p2(t) = l1t + c2. При t = 1 имеем равенство: -l2 = l1 × 1+ c2, откуда c2 = - l1 - l2 , тогда p2(t) = l1t - l1 - l2. Подставим эти выражения в формулу для функции Гамильтона и получим:
Из условия получения оптимального управления методом Лагранжа имеем: Откуда Неизвестные множители l1 и l2 определим из условия, чтобы при t = 1 обеспечить заданное конечное состояние координат системы: x1(1) = 1, x2(1) = 1. Для этого осуществим интегрирование уравнений состояния системы с учетом ее начального состояния x1(0) = 0 и x2(0) = 0. Из второго уравнения
После интегрирования этого выражения получим:
При t = 0 x2(0) = 0, следовательно c2 = 0. Тогда Подставим это выражение в первое уравнение системы
При t = 0 x1(0) = 0, следовательно c1 = 0. При t = 1 имеем x1(1) = 1, x2(1) = 1. Подставим в уравнения для x1(t) и x2(t) эти значения при t = 1 и получим:
Решение этой системы дает искомые множители Лагранжа: Тогда окончательный результат для оптимального управления примет следующий вид:
Траектория оптимального управления uоп и координат x1оп, x2оп системы на интервале управления t = 0 ¸ 1 приведена на рис.10. Рис. П.7.1 Траектория оптимального управления для примера 2
Отличие принципа максимума Понтрягина от метода Лагранжа состоит в том, что из-за ограничений на управление и наличия в управляющих функциях разрывов первого рода условия (П.7.6) в строгом математическом смысле не выполняются. Эти условия в принципе максимума Понтрягина заменяются на другое более общее положение, а именно: чтобы управляющий вектор
Если нужно максимизировать функционал J, то указанное относительно H условие максимума заменяется условием минимума H, то есть:
Существенное преимущество принципа максимума по сравнению с классическим вариационным исчислением (метод Лагранжа) состоит в том, что он применим для любого множества U. Задачи со свободным конечным временем. В ряде задач оптимального управления конечное время t1 = T не задано, тогда говорят о задачах со свободным конечным временем. Частным случаем таких задач является задача на быстродействие, когда надо минимизировать функционал
При этом f0 º 1, тогда получим
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|