Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина
В общем виде управляемая динамическая система описывается системой дифференциальных уравнений первого порядка вида , (П.7.1) где xi – переменные состояния системы, uj – управляющие воздействия, fi – известные функции, . Заданы также интервал управления t = 0 ¸ T и начальное состояние системы . Необходимо определить управляющий вектор , при котором в определенном смысле достигается наилучший результат, например, нужно минимизировать функционал вида . (П.7.2)
Пусть непрерывные функции fi , f0 и F непрерывно дифференцируемы по xi и uj. Если на управляющие воздействия не накладываются ограничения, то такая задача нахождения оптимального управления принадлежит классу вариационного исчисления и относится к задаче Лагранжа. Если на управляющие воздействия uj накладываются ограничения двух видов: управляющие воздействия могут изменяться в допустимых пределах ½uj½£ uдоп , управляющие воздействия могут претерпевать разрывы первого рода, - то такая задача нахождения оптимального управления может быть решена с использованием принципа максимума Понтрягина. В методе Лагранжа для решения оптимизационной задачи вводятся два вида вспомогательных функций: функция Гамильтона, определяемая по выражению , (П.7.3)
где fi – функции в выражении (П.7.1), f0 – подынтегральная функция в выражении (П.7.2), pi – присоединенные функции, определяемые в результате решения следующей системы дифференциальных уравнений: , (П.7.4) или в векторной форме: где матрица разностью m ´ m. Из (П.7.4) следует: . (П.7.5)
Уравнения (П.7.4) и (П.7.5) представляют собой каноническую или гамильтонову форму записи уравнений Эйлера-Лагранжа, играющих важную роль в классическом вариационном исчислении. В теории классического вариационного исчисления доказывается следующая теорема, определяющая необходимые условия оптимальности: при оптимальном управлении системой, описываемой (П.7.1), когда минимизируется функционал (П.7.2), обращаются в нуль частные производные то есть должны выполняться условия: (П.7.6)
Для поиска вектора оптимального управления методом Лагранжа необходимо вначале определить присоединенные функции pi. Они определяются в результате решения дифференциальных уравнений (П.7.4). Для этого необходимо знать граничные условия для присоединенных функций pi. Эти граничные условия определяются в зависимости от конкретных особенностей задачи оптимального управления. Если требуется минимизировать функционал вида: , (П.7.7)
то есть речь идет о минимизации линейной комбинации координат системы в конце процесса управления, то граничные условия для присоединенных функций определяются из выражения: pi(T) = - ci , i = 1 ¸ m. Если нужно минимизировать нелинейную функцию координат xi(T), а именно: J = F(xi(T)) = min, i = 1 ¸ m, где F – нелинейная функция, дважды дифференцируемая по всем аргументам xi, тогда граничные условия для присоединенных функций определяются из выражений: . Если нужно минимизировать функционал вида: , (П.7.8)
в котором терминальная функция F = 0, то граничные условия для присоединенных функций равны нулю в точке t = T, то есть: pi(T) = 0, i = 1 ¸ m. Условие трансверсальности. Часто в задачах оптимального управления задаются определенные условия для системы в конце процесса управления, в точках xi(T). Если вместе с основной задачей оптимального управления в виде функционала (35) должны выполняться условия в конце процесса управления, заданные в виде: Fj(xi(T)) = 0, j = 1 ¸ m, причем функции Fj дважды дифференцируемы по всем xi, тогда граничные значения для присоединенных функций при t = T определяются из условия трансверсальности
где - неизвестные множители Лагранжа, определяемые из граничных условий системы в конце процесса управления.
Пример 1. Динамическая система описывается системой дифференциальных уравнений вида:
Заданы также промежуток или интервал управления t = 0 ¸ 1 и начальное состояние системы x1(0) и x2(0). Необходимо найти оптимальное управление uоп, при котором достигается условие .
Решение. Для данного критерия оптимального управления функция Гамильтона имеет вид:
система присоединенных функций равна:
Граничные условия для присоединенных функций в этом примере равны нулю в конце процесса управления, то есть p1(1) = 0, p2(1) = 0, так терминальная функция в функционале J равна нулю. Так как и то тогда , откуда так как то Но следовательно Тогда функция Гамильтона примет вид Оптимальное управление найдем из условия следовательно откуда Действительно, интеграл при и равен Пример 2. Динамическая система описывается системой дифференциальных уравнений вида
Задано начальное состояние системы x1(0) = 0 , x2(0) = 0. Необходимо на интервале управления системой t = 0 ¸ 1 обеспечить два условия: минимизировать интеграл
и обеспечить конечное состояние системы, заданное выражениями , . Из этих выражений следуют конечные состояния координат системы x1(1) = 1, x2(1) = 1. Решение. Функция Гамильтона для этого примера примет вид:
Присоединенные функции определим из формулы (П.7.4) и получим следовательно следовательно Для определения коэффициентов с1 и с2 воспользуемся условием трансверсальности
где lj – неизвестные множители Лагранжа, обеспечивающие заданное конечное состояние системы. Из этого выражения имеем: p1(1) = - l1, p2(1) = - l2 . Тогда p1(t) = - l1, p2(t) = l1t + c2. При t = 1 имеем равенство: -l2 = l1 × 1+ c2, откуда c2 = - l1 - l2 , тогда p2(t) = l1t - l1 - l2. Подставим эти выражения в формулу для функции Гамильтона и получим:
Из условия получения оптимального управления методом Лагранжа имеем: Откуда Неизвестные множители l1 и l2 определим из условия, чтобы при t = 1 обеспечить заданное конечное состояние координат системы: x1(1) = 1, x2(1) = 1. Для этого осуществим интегрирование уравнений состояния системы с учетом ее начального состояния x1(0) = 0 и x2(0) = 0. Из второго уравнения имеем . После интегрирования этого выражения получим:
При t = 0 x2(0) = 0, следовательно c2 = 0. Тогда Подставим это выражение в первое уравнение системы и после интегрирования выражения получим:
При t = 0 x1(0) = 0, следовательно c1 = 0. При t = 1 имеем x1(1) = 1, x2(1) = 1. Подставим в уравнения для x1(t) и x2(t) эти значения при t = 1 и получим:
Решение этой системы дает искомые множители Лагранжа: . Тогда окончательный результат для оптимального управления примет следующий вид:
Траектория оптимального управления uоп и координат x1оп, x2оп системы на интервале управления t = 0 ¸ 1 приведена на рис.10. Рис. П.7.1 Траектория оптимального управления для примера 2
Отличие принципа максимума Понтрягина от метода Лагранжа состоит в том, что из-за ограничений на управление и наличия в управляющих функциях разрывов первого рода условия (П.7.6) в строгом математическом смысле не выполняются. Эти условия в принципе максимума Понтрягина заменяются на другое более общее положение, а именно: чтобы управляющий вектор решил поставленную оптимизационную задачу минимизировать функционал J, необходимо существование не равного тождественно нулю вектора присоединенных функций с соответствующим граничным условием, который вместе с вектором управления на всем интервале управления обеспечивал бы максимум функции Гамильтона, то есть: . (П.7.9) Если нужно максимизировать функционал J, то указанное относительно H условие максимума заменяется условием минимума H, то есть: . (П.7.10) Существенное преимущество принципа максимума по сравнению с классическим вариационным исчислением (метод Лагранжа) состоит в том, что он применим для любого множества U. Задачи со свободным конечным временем. В ряде задач оптимального управления конечное время t1 = T не задано, тогда говорят о задачах со свободным конечным временем. Частным случаем таких задач является задача на быстродействие, когда надо минимизировать функционал .
При этом f0 º 1, тогда получим , т.е. минимизируем интервал управления.
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|