Здавалка
Главная | Обратная связь

Приложение 7. Поиск оптимального управления непрерывными детерминированными процессами методами Лагранжа-Понтрягина



 

В общем виде управляемая динамическая система описывается системой дифференциальных уравнений первого порядка вида

, (П.7.1)

где xi – переменные состояния системы,

uj – управляющие воздействия,

fi – известные функции,

.

Заданы также интервал управления t = 0 ¸ T и начальное состояние системы .

Необходимо определить управляющий вектор , при котором в определенном смысле достигается наилучший результат, например, нужно минимизировать функционал вида

. (П.7.2)

 

Пусть непрерывные функции fi , f0 и F непрерывно дифференцируемы по xi и uj. Если на управляющие воздействия не накладываются ограничения, то такая задача нахождения оптимального управления принадлежит классу вариационного исчисления и относится к задаче Лагранжа.

Если на управляющие воздействия uj накладываются ограничения двух видов:

управляющие воздействия могут изменяться в допустимых пределах ½uj½£ uдоп ,

управляющие воздействия могут претерпевать разрывы первого рода, -

то такая задача нахождения оптимального управления может быть решена с использованием принципа максимума Понтрягина.

В методе Лагранжа для решения оптимизационной задачи вводятся два вида вспомогательных функций:

функция Гамильтона, определяемая по выражению

, (П.7.3)

 

где fi – функции в выражении (П.7.1),

f0 – подынтегральная функция в выражении (П.7.2),

pi – присоединенные функции, определяемые в результате решения следующей системы дифференциальных уравнений:

, (П.7.4)

или в векторной форме:

где матрица разностью m ´ m.

Из (П.7.4) следует:

. (П.7.5)

 

Уравнения (П.7.4) и (П.7.5) представляют собой каноническую или гамильтонову форму записи уравнений Эйлера-Лагранжа, играющих важную роль в классическом вариационном исчислении. В теории классического вариационного исчисления доказывается следующая теорема, определяющая необходимые условия оптимальности:

при оптимальном управлении системой, описываемой (П.7.1), когда минимизируется функционал (П.7.2), обращаются в нуль частные производные то есть должны выполняться условия:

(П.7.6)

 

Для поиска вектора оптимального управления методом Лагранжа необходимо вначале определить присоединенные функции pi. Они определяются в результате решения дифференциальных уравнений (П.7.4). Для этого необходимо знать граничные условия для присоединенных функций pi. Эти граничные условия определяются в зависимости от конкретных особенностей задачи оптимального управления.

Если требуется минимизировать функционал вида:

, (П.7.7)

 

то есть речь идет о минимизации линейной комбинации координат системы в конце процесса управления, то граничные условия для присоединенных функций определяются из выражения:

pi(T) = - ci , i = 1 ¸ m.

Если нужно минимизировать нелинейную функцию координат xi(T), а именно:

J = F(xi(T)) = min, i = 1 ¸ m,

где F – нелинейная функция, дважды дифференцируемая по всем аргументам xi, тогда граничные условия для присоединенных функций определяются из выражений:

.

Если нужно минимизировать функционал вида:

, (П.7.8)

 

в котором терминальная функция F = 0, то граничные условия для присоединенных функций равны нулю в точке t = T, то есть:

pi(T) = 0, i = 1 ¸ m.

Условие трансверсальности. Часто в задачах оптимального управления задаются определенные условия для системы в конце процесса управления, в точках xi(T). Если вместе с основной задачей оптимального управления в виде функционала (35) должны выполняться условия в конце процесса управления, заданные в виде:

Fj(xi(T)) = 0, j = 1 ¸ m,

причем функции Fj дважды дифференцируемы по всем xi, тогда граничные значения для присоединенных функций при t = T определяются из условия трансверсальности

 

где - неизвестные множители Лагранжа, определяемые из граничных условий системы в конце процесса управления.

 

Пример 1. Динамическая система описывается системой дифференциальных уравнений вида:

 

Заданы также промежуток или интервал управления t = 0 ¸ 1 и начальное состояние системы x1(0) и x2(0). Необходимо найти оптимальное управление uоп, при котором достигается условие

.

 

Решение. Для данного критерия оптимального управления функция Гамильтона имеет вид:

 

система присоединенных функций равна:

 

 

Граничные условия для присоединенных функций в этом примере равны нулю в конце процесса управления, то есть p1(1) = 0, p2(1) = 0, так терминальная функция в функционале J равна нулю.

Так как и то тогда , откуда так как то Но следовательно

Тогда функция Гамильтона примет вид Оптимальное управление найдем из условия следовательно откуда Действительно, интеграл при и равен

Пример 2. Динамическая система описывается системой дифференциальных уравнений вида

 

Задано начальное состояние системы x1(0) = 0 , x2(0) = 0. Необходимо на интервале управления системой t = 0 ¸ 1 обеспечить два условия:

минимизировать интеграл

 

 

и обеспечить конечное состояние системы, заданное выражениями

, .

Из этих выражений следуют конечные состояния координат системы x1(1) = 1, x2(1) = 1.

Решение. Функция Гамильтона для этого примера примет вид:

 

Присоединенные функции определим из формулы (П.7.4)

и получим следовательно следовательно

Для определения коэффициентов с1 и с2 воспользуемся условием трансверсальности

 

где lj – неизвестные множители Лагранжа, обеспечивающие заданное конечное состояние системы. Из этого выражения имеем: p1(1) = - l1, p2(1) = - l2 .

Тогда p1(t) = - l1, p2(t) = l1t + c2.

При t = 1 имеем равенство: -l2 = l1 × 1+ c2, откуда c2 = - l1 - l2 , тогда p2(t) = l1t - l1 - l2.

Подставим эти выражения в формулу для функции Гамильтона и получим:

 

Из условия получения оптимального управления методом Лагранжа имеем:

Откуда

Неизвестные множители l1 и l2 определим из условия, чтобы при t = 1 обеспечить заданное конечное состояние координат системы: x1(1) = 1, x2(1) = 1.

Для этого осуществим интегрирование уравнений состояния системы с учетом ее начального состояния x1(0) = 0 и x2(0) = 0.

Из второго уравнения имеем

.

После интегрирования этого выражения получим:

 

При t = 0 x2(0) = 0, следовательно c2 = 0.

Тогда

Подставим это выражение в первое уравнение системы и после интегрирования выражения получим:

 

При t = 0 x1(0) = 0, следовательно c1 = 0.

При t = 1 имеем x1(1) = 1, x2(1) = 1. Подставим в уравнения для x1(t) и x2(t) эти значения при t = 1 и получим:

 

 

Решение этой системы дает искомые множители Лагранжа: .

Тогда окончательный результат для оптимального управления примет следующий вид:

 

 

Траектория оптимального управления uоп и координат x1оп, x2оп системы на интервале управления t = 0 ¸ 1 приведена на рис.10.

Рис. П.7.1 Траектория оптимального управления для примера 2

 

Отличие принципа максимума Понтрягина от метода Лагранжа состоит в том, что из-за ограничений на управление и наличия в управляющих функциях разрывов первого рода условия (П.7.6) в строгом математическом смысле не выполняются. Эти условия в принципе максимума Понтрягина заменяются на другое более общее положение, а именно: чтобы управляющий вектор решил поставленную оптимизационную задачу минимизировать функционал J, необходимо существование не равного тождественно нулю вектора присоединенных функций с соответствующим граничным условием, который вместе с вектором управления на всем интервале управления обеспечивал бы максимум функции Гамильтона, то есть:

. (П.7.9)

Если нужно максимизировать функционал J, то указанное относительно H условие максимума заменяется условием минимума H, то есть:

. (П.7.10)

Существенное преимущество принципа максимума по сравнению с классическим вариационным исчислением (метод Лагранжа) состоит в том, что он применим для любого множества U.

Задачи со свободным конечным временем. В ряде задач оптимального управления конечное время t1 = T не задано, тогда говорят о задачах со свободным конечным временем.

Частным случаем таких задач является задача на быстродействие, когда надо минимизировать функционал

.

 

При этом f0 º 1, тогда получим , т.е. минимизируем интервал управления.

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.