Приложение 5. Постановка задачи и критерии оптимального управления в динамических системах
Разнообразные реальные процессы, происходящие в окружающем мире, зачастую являются управляемыми, т.е. протекают различным образом в зависимости от конкретного воздействия на них управляющей стороны. При этом естественным является стремление выбрать в некотором смысле оптимальное управляющее воздействие, т.е. наилучшее по сравнению со всеми другими возможными способами управления. Исторически задачи оптимизации встречались еще в древние века, однако интерес к ним особенно вырос в последнее время, что связано, в частности, с ограниченностью природных ресурсов, развитием техники и ростом возможностей ЭВМ, благодаря которым стали осуществимы расчет и реализация сложных законов управления. Результаты первоначального развития теории оптимизации объединяются в рамках классического математического анализа и вариационного исчисления, основным предметом изучения которого является исследование гладких функций и функционалов, определенных во всем пространстве или на гладком многообразии. При этом необходимые условия экстремума записываются в виде условий стационарности (обращение в нуль производной или градиента функции, уравнение Эйлера и т.д.). Однако в процессе эволюции общества возникли новые задачи управления, в которых управляющие параметры могут принадлежать некоторому замкнутому множеству. Необходимость управлять процессом оптимально, т.е. наилучшим в определенном смысле образом, возникает в системах, характеристики которых меняются во времени под влиянием управлений. К такому классу систем относятся и экономические системы. Для того чтобы сформулировать на математическом языке задачу управления в таких системах, необходимо ввести некоторые понятия и построить соответствующую математическую модель. Важнейшими понятиями в теории оптимального управления являются понятия состояния системы и управления. Будем рассматривать системы, состояние которых может быть в любой момент времени определено вектором Так как система изменяется во времени, то ее поведение можно описать последовательностью состояний. Такую последовательность состояний системы Переменную t, которая является независимой, назовем аргументом процесса. Аргументом процесса может быть любая величина, но чаще всего – время. Переменная t может пробегать некоторый отрезок числовой прямой, если Изменение состояния системы, т.е. процесс в ней, может происходить под воздействием управляющих воздействий. Будем рассматривать системы, управляющие воздействия в которых моделируются с помощью элементов r–мерного векторного пространства U:
Управляющие воздействия могут задаваться в виде функций от t. Тем самым реализуется определенный способ управления системой. В этом случае будем говорить о задании программы управления На возможные (допустимые) состояния системы
где Вектор
где fi – известные (линейные или нелинейные) функции, Систему уравнений (П.5,1) можно записать в векторной форме в виде
или в виде
Пусть задано состояние, в котором система находилась в начальный момент t0 . Этот момент в дальнейшем для определенности примем равным нулю, а момент окончания процесса t1 равным T. Тогда аргумент процесса t изменяется в пределах 0 £ t £ T, а начальным состоянием системы будет вектор
где xi(0) – начальное значение i–той координаты вектора состояния системы. Проанализируем, каким образом модель отражает связь между управлением и состоянием системы, изменяющимся под воздействием управления. Пусть на промежутке 0 £ t £ T задано управление
Имеем систему дифференциальных уравнений относительно неизвестной вектор - функции Итак, задание управления в непрерывной модели однозначно определяет ее поведение. Задавая различные законы управления, получаем, следовательно, различные траектории системы. Модель дискретной управляемой системы имеет вид системы разностных уравнений:
В векторной форме эту модель, как и в непрерывном случае, будем записывать в виде
или в виде
Здесь t – номер цикла принимает дискретные значения t = 0, 1, 2, ¼, T - 1. Начальное значение В дискретной системе, как и в непрерывной, задание программы управления
Подставляя затем найденное значение Таким образом и в дискретном случае уравнения модели (4) позволяют однозначно определить траекторию системы Следовательно, процесс Процессы Пара Заданы начальные условия В непрерывной модели на вектор-функции Процессы Множество допустимых процессов в задачах оптимального управления представляет собой множество M допустимых элементов. Теперь для постановки оптимизационной задачи необходимо ввести в рассмотрение целевую функцию или функционал J, заданный на множестве M. Задача оптимального управления будет состоять в выборе такого элемента Функционал J, заданный на множестве допустимых процессов, описывает цель, согласно которой оптимизируется процесс, поэтому его часто называют целевой функцией. Значение J(V0), которое функционал J принимает на данном процессе V0, характеризует качество процесса и позволяет сравнить два любых процесса. Оптимальным, т.е. более предпочтительным по сравнению с любым другим процессом, будет тот, где значение функционала минимально (максимально). В задачах оптимального управления для непрерывных систем чаще всего применяются интегральные функционалы следующего вида:
где Функционал J состоит из двух частей: значения интеграла В частных случаях любое из слагаемых в (П.5.5) может отсутствовать. Тогда функционал будет иметь вид
или
Возникающие в этих случаях оптимизационные задачи могут быть сведены одна к другой и, следовательно, ни одна из них не является более общей. В литературе по оптимальному управлению оптимизационные задачи с функционалом вида (П.5.5) называют задачами Больца, с функционалом вида (П.5.6) - задачами Лагранжа, а с функционалом вида (П.5.7) - задачами Майера. Покажем, что задача Больца может быть сведена к задаче Майера. Для этого введем еще одну скалярную переменную состояния xm+1(t), определяемую соотношениями
Тогда
Поэтому функционал (П.5.5) можно записать следующим образом в виде (П.5.7)
что соответствует задаче Майера. Аналогично в случае дифференцируемости по времени функции Отметим, что если в задаче Лагранжа (П.5.6) подынтегральная функция равна единице, т.е. Такая задача, заключающаяся в минимизации времени управления T, называется задачей на быстродействие. Функционалы вида (П.5.5) охватывают широкий класс задач оптимального управления, в том числе и оптимизации экономических процессов. Для задач оптимизации в дискретных системах функционал имеет вид
К функционалу (П.5.8) относятся все замечания и комментарии, сделанные к функционалу (П.5.5). Итак, мы определили все понятия, необходимые для постановки задач оптимального управления. Поставим задачу о минимуме функционала (П.5.5) в непрерывном и (П.5.8) в дискретном случае на множестве M допустимых процессов Определить оптимальный процесс для непрерывной системы Определить минимизирующую последовательность для дискретной системы Задача оптимального управления, как правило, ставится в первом варианте. Но тогда она, как мы убедились, не всегда имеет решение. В то же время во втором варианте задача оптимального управления всегда имеет решение, если только функционал J ограничен снизу на множестве M. Последнее условие часто удается проверить достаточно просто. Например, в большом количестве экономических приложений функции В теории оптимального управления термины «состояние» и «управление» имеют наглядный содержательный смысл. Он заключается в том, что, как отмечалось выше, задавая управление Кроме того, имеются и некоторые формальные отличия: в непрерывном варианте состояние Приведем примеры, иллюстрирующие постановку задач оптимального управления. Пример 1. Рассмотрим открытую модель Леонтьева, которая описывается следующим балансовым соотношением:
Соотношение (П.5.9) показывает, как валовая продукция X распределяется на производственные затраты aX, прирост основных производственных фондов Если рассматривать развитие экономики на некотором промежутке времени Чтобы пояснить последнее, представим уравнение (П.5.9) в виде
Из (П.5.10) видно, что при задании C(t) это соотношение превращается в дифференциальное уравнение относительно X(t) с заданной правой частью, откуда величина X(t) может быть найдена. Кроме того, известны начальное состояние X(0) и ограничения на минимальную и максимальную величину потребления. Если учесть и вытекающую из экономического смысла неотрицательность переменных в рассматриваемой модели, то перечисленные ограничения можно представить в виде X(0) = X0 , Cmin £ C £ Cmax , X ³ 0. (П.5.11) Если теперь воспользоваться терминологией, введенной ранее для постановки задач управления, то соотношение (П.5.10) представляет собой уравнение процесса, C – управление, X – состояние системы. Накладываемые на процесс Таким образом, соотношения (П.5.10), (П.5.11) определяют множество допустимых в данной системе процессов. Чтобы определить наиболее эффективный путь экономического роста, т.е. выбрать из множества допустимых процессов наилучший, требуется задать функционал J, определяющий качество процесса. Отметим, что выбор критерия оптимальности развития экономической системы – самостоятельная, имеющая важное значение, проблема экономики. Критерий, предусматривающий рост потребления и возможность наращивать определенный экономический потенциал к конечному моменту времени, может быть выражен функционалом следующего вида:
Здесь первое слагаемое представляет собой суммарное взвешенное потребление на промежутке [0,T], терминальный член имеет смысл объема выпуска продукции в конечный момент времени. Весовые коэффициенты a, b говорят о приоритете, который имеет каждое из этих слагаемых. Если мы отдаем предпочтение потреблению, то a ³ b , а если предпочтение отдается накоплению производственного потенциала, то a < b. Подынтегральное выражение Итак, рассмотренная динамическая модель распределения валового продукта с учетом цели развития экономического объекта является задачей оптимального управления с функционалом J, заданным соотношением (П.5.12) и ограничениями (П.5.10), (П.5.11), которым должен удовлетворять допустимый процесс. Эта задача полностью соответствует сформулированной выше задаче оптимального управления. Отметим, что речь идет о максимизации функционала J, что эквивалентно минимизации функционала -J, т.е. функционала, взятого с противоположным знаком. Пример 2. Рассмотрим задачу оптимального распределения капитальных вложений в отрасли на заданном интервале планирования. Обозначим через K(t) величину основных производственных фондов отрасли в году t. В процессе воспроизводства основных производственных фондов их количество будет расти за счет капитальных вложений, а уменьшаться за счет физического и морального износа. Будем считать, что ввод в действие основных фондов в году t, численно равный I(t), удовлетворяет ограничениям
где минимальное
или
где Уравнение (П.5.15) является дискретной моделью роста основных фондов отрасли. Будем считать заданным начальное значение основных фондов. Учитывая естественное условие их неотрицательности, имеем
Теперь можно рассматривать в качестве характеристики происходящего в системе процесса пару Качество протекающего в системе процесса изменения основных фондов зададим функционалом
где a, b - некоторые неотрицательные числа. Выражение (П.5.17), являющееся критерием оптимальности процессов, состоит из двух слагаемых. Для того чтобы пояснить экономический смысл критерия, положим a = 1, b = 0. Тогда Таким образом в функционале (П.5.17) отражены два, вообще говоря, противоположных требования к процессу - экономии капиталовложений с одной стороны и увеличения основных производственных фондов отрасли – с другой. Числа a, b являются весовыми коэффициентами. Если a > b, то приоритет отдается первому требованию, если a < b, то второму. Таким образом, имеем задачу оптимального управления дискретным процессом, заданным уравнением (П.5.15) с функционалом (П.5,17), ограничениями на управление (П.5.13) и на состояние (П.5.16). В данной постановке задачи оптимального управления правый конец траектории K(t) является свободным, так как отсутствует ограничение на значение K(t). Вместе с тем, если положить в функционале (П.5.17) a = 1, b = 0, то при этом естественно наложить требование на значение K(t). Иначе I(t) º 0, и задача теряет экономический смысл. В рассматриваемом случае будем считать заданным K(t) = K1, где величина K1 задает наряду с функционалом J цель управления системой. Пример 3. Рассмотрим непрерывный вариант модели оптимального распределения капитальных вложений. Такая модель представляет интерес для теоретических исследований. Составим уравнение баланса основных фондов отрасли в непрерывном варианте. Величина DK прироста основных фондов на промежутке [t, t +Dt] будет равна K(t+Dt) - K(t). В отличие от введенных в дискретной модели переменных обозначим через I(t) интенсивность ввода основных фондов в момент времени t. Под интенсивностью будем понимать количество вводимых в единицу времени фондов. Тогда на рассматриваемом промежутке будет введено I(t)Dt единиц основных фондов. Обозначим через m интенсивность выбытия основных фондов. Тогда общее количество выводимых из производства за время Dt фондов будет равно mDtI(t). С учетом сказанного уравнение баланса (14) можно записать в виде
Если разделить обе части последнего уравнения на Dt и перейти к пределу при Dt®0, слева получим значение производной, а уравнение (П.5.18) перепишем следующим образом:
К этому нужно добавить начальное условие и ограничения на значения переменных:
Рассматривая данный процесс как управляемый, будем, как и в примере 2, считать K(t) состоянием процесса, I(t) – управлением. Процесс описывается уравнением (П.5.19), которое вместе с ограничениями (П.5.20) определяет множество M допустимых процессов Обобщением функционала (П.5.17) на непрерывный случай будет функционал вида
Теперь задача оптимального управления заключается в отыскании оптимального процесса Как и в примере 2, если в выражении (П.5.21) b = 0, требуется задать конечное состояние K(t) = K1. Пример 4. Рассмотрим задачу оптимального распределения капитальных вложений между отраслями. Этот пример является обобщением примеров 2 и 3 для нескольких отраслей. Как и выше, речь пойдет о распределении ограниченного объема вводимых в действие основных производственных фондов на некотором интервале времени Пусть имеются отрасли с номерами i = 1, 2, ¼, n. Если в i – ой отраcли Ki(t) – основные производственные фонды в году t, mi - коэффициент ежегодного выбытия фондов (коэффициент амортизации), Ii(t) - объем вводимых в действие в году t основных фондов, то для каждой из отраслей можно написать уравнение баланса основных фондов, аналогичное (П.5.15):
Известны основные фонды отраслей на начальный год t = 0: Ki(0) i = 1, 2, ¼, n. (П.5.23) Это будет начальным условием для системы уравнений (П.5.22). Кроме того, суммарная величина вводимых в действие основных фондов ограничена. С учетом перечисленных ограничений на переменные модели можно записать
Соотношения (П.5.22) – (П.5.24) описывают ограничения на множество допустимых процессов Обобщением на случай n отраслей функционала (П.5.17) будет
Функционал (П.5.25) вместе с ограничениями (П.5.22) – (П.5.24) определяет задачу оптимального управления. Состоянием процесса здесь является вектор Сформулированная задача оптимального управления относится к классу задач оптимизации дискретных процессов. Может быть также поставлена аналогичная задача и в непрерывном времени. Для этого необходимо заменить систему разностных уравнений (П.5.22) системой дифференциальных уравнений
а функционал (П.5.25) – выражением
Тогда получим непрерывную задачу оптимального управления, описываемую функционалом (П.5.27), уравнениями процесса (П.5.26) и ограничениями (П.5.23), (П.5.24).
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|