Приложение 8. Принцип максимума для дискретных систем
Постановка задачи. Динамика дискретных систем описывается в пространстве состояний системой из m разностных уравнений первого порядка вида:
где
Заданы начальные значения всех переменных состояние системы Необходимо на интервале управления системой n = 0 ¸ N так изменять элементы вектора управления
где F – терминальный член, характеризующий конечное состояние системы. Если конечные граничные условия системы не заданы, то есть элементы вектора
Решение. Функция Гамильтона для дискретных систем определяется по выражению:
где f0 – известная функция, входящая в выражение для целевой функции, fi – известные функции, описывающие состояние системы, pi - присоединенные функции, определяемые из разностных уравнений первого порядка следующего вида:
Запись p = p(n + 1) означает, что в выражении Принцип максимума Понтрягина–Беллмана для дискретных систем. Он формулируется так: если вектор
Тогда функция Гамильтона
Выражение (П.8.7) следует понимать и читать так: оптимальный вектор управления Если целевая функция J = max, то оптимальный вектор управления должен минимизировать функцию Гамильтона, то есть в этом случае: В отличие от сильного принципа максимума для непрерывных систем, принцип максимума Понтрягина–Беллмана для дискретных систем называют слабым принципом максимума. Причина состоит в том, что принцип максимума для дискретных систем является приближенным. Для дискретных систем доказана следующая теорема: оптимальный вектор управления
Очевидно, что чем меньше величина цикла Tц по сравнению с общим интервалом управления T, тем меньше эта погрешность. При Dt ®0 дискретные системы превращаются в непрерывные, и погрешность принципа максимума для них стремится к нулю. Пример 1. Затраты x1 первого основного цеха завода от цикла к циклу описываются разностным уравнением первого порядка вида:
а затраты x2 второго (вспомогательного) цеха описываются разностным уравнением вида:
Заданы начальное и конечное состояния системы Ставится задача: так изменять управление цехами u1 и u2 (изменять затраты), чтобы на интервале управления n = 0 ¸ N выполнялось условие минимума интегральной целевой функции
Эта функция учитывает затраты цехов x1 и x2 на каждом цикле, а также изменение затрат, вызванных величинами u1 и u2. Известно, что изменение объема производства в ту или иную сторону влечет увеличение потерь, связанных с перестройкой производства. Терминальная функция F в этой задаче равна нулю. Решение. Вначале запишем выражение для функции Гамильтона с учетом (П.8.8), (П.8.9) и (П.8.10)
Разностные уравнения, по которым вычисляются присоединенные функции pi, определяются из выражения (П.8.5)
Применим это выражение при i = 1 и i = 2 для функции H и получим искомые выражения для присоединенных функций:
Оптимальное управление цехами u1 и u2 определяется из принципа максимума (П.8.7) откуда следует формула (П.8.6), устанавливающая связь между элементами u1оп и u2оп оптимального вектора управления
Применим это выражение при i = 1 и i = 2 для функции H и получим: Из этих уравнений получим соотношения:
Подставим их в (П.8.8), (П.8.9) и получим:
Эти уравнения совместно с (П.8.11) и (П.8.12) описывают дискретную динамическую систему при оптимальном управлении. Недостатком уравнений (П.8.11), (П.8.12), (П.8.15) и (П.8.16) является то, что первые два уравнения описывают процесс от конца к началу (номер цикла n убывает), а вторые два уравнения – от начала к концу. Преобразуем их к одному виду, например, от конца к началу. В данной задаче направление безразлично, так как граничные условия переменных состояния xi заданы и в начале и в конце процесса управления. Из (П.8.16) имеем:
Вычтем (П.8.16) из (П.8.15) и получим:
Подставим в (П.8.11) значение x1(n) из (П.8.17) и получим:
Подставим в (П.8.12) значение x2(n) из (П.8.18) и получим:
Уравнения (П.8.17), (П.8.18), (П.8.19) и (П.8.20) описывают динамическую систему от конца к началу при оптимальном уравнении. В данной задаче терминальная функция F не задана, и условием трансверсальности для определения граничных значений присоединенных функций pi(N) воспользоваться нельзя. Поэтому в данной задаче необходимо найти такие значения pi(N), при которых от заданного конечного состояния системы Для этого необходимо провести преобразование над указанными уравнениями на всех циклах процесса управления от n = N – 1 до n = 0 и выразить значения pi(N) через известные значения элементов векторов Сделаем эти преобразования при конкретных численных значениях N, Пусть Тогда при n = 3 с учетом граничных условий на конце x1(4) = 4 и x2(4) = 0 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(3) = - 0,5p2(4) x2(3) = 4 - 0,5p1(4) + 0,5p2(4) p1(3) = p1(4) + 2p2(4) p2(3) = 2p1(4) - 8 - p2(4) При n = 2 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(2) = x2(3) - 0,5p2(3) x2(2) = x1(3) - x2(3) - 0,5p1(3) + 0,5p2(3) p1(2) = p1(3) + 2p2(3) - 2x2(3) p2(2) = 2p1(3) - 2x1(3) + 2x2(3) - p2(3) Подставим в эти уравнения значения x1(3), x2(3), p1(3) и p2(3), полученные при n =3 и, сделав необходимые арифметические вычисления, получим: x1(2) = 8 - 1,5p1(4) + p2(4) x2(2) = p1(4) – 2,5p2(4) - 8 p1(2) = 6p1(4) - p2(4) - 24 p2(2) = - p1(4) + 7p2(4) + 16 При n = 1 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(1) = x2(2) - 0,5p2(2) x2(1) = x1(2) - x2(2) - 0,5p1(2) + 0,5p2(2) p1(1) = p1(2) + 2p2(2) - 2x2(2) p2(1) = 2p1(2) - 2x1(2) + 2x2(2) - p2(2) Подставим в эти уравнения значения x1(2), x2(2), p1(2) и p2(2), полученные при n = 2 и, сделав необходимые арифметические вычисления, получим: x1(1) = - 1,5p1(4) - 6p2(4) - 16 x2(1) = - 6p1(4) + 7,5p2(4) + 36 p1(1) = 2p1(4) + 18p2(4) + 24 p2(1) = 18p1(4) - 16p2(4) - 96 При n = 0 вычислять значения p1 и p2 нет необходимости, поэтому определим только выражения для x1(0) и x2(0) по (П.8.17) и (П.8.18) при n = 0 с учетом результатов, полученных выше: x1(0) = - 15p1(4) + 15,5p2(4) + 84 x2(0) = 15,5p1(4) – 30,5p2(4) - 112 Так как начальные граничные условия заданы: x1(0) = -1, x2(0) = 1, то после подстановки в эти выражения значений x1(0) и x2(0) получим систему из двух уравнений: 15p1(4) - 15,5p2(4) = 85 15,5p1(4) – 30,5p2(4) = 113 Решив эту систему, получим неизвестные значения присоединенных функций на конце процесса p1(4) и p2(4). Решение этой системы дает следующие результаты: p1(4) = 3,872 p2(4) = - 1,737 Подставив эти значения в уравнения (П.8.17) ¸ (П.8.20) при известных x1(4) = 4 и x2(4) = 0, определим значение x1(3), x2(3), p1(3) и p2(3). Снова подставим эти значения в (П.8.17) ¸ (П.8.20) и определим значения x1(2), x2(2), p1(2) и p2(2). Проделав эту процедуру до n = 0, определим все значения x1(n), x2(n), p1(n) и p2(n) на всем интервале управления. Отметим, что значения x1(0) и x2(0) должны совпасть с заданными значениями вектора В таблице П.8.1 приведены результаты вычислений по описанной процедуре. Здесь же приведены значения подынтегральной функции f0 и значение целевой функции J, вычисленной по формуле (П.8.10). Таблица П.8.1
По табл. П.8.1 можно построить траектории процессов Постановка задачи оптимального управления заводом, выпускающим бетон, при известном начальном состоянии и спросе на бетон на каждом цикле. Необходимо на заданном интервале управления заводом Функция спроса бетона (в тыс. тонн) r(n) задана таблицей П.8.2. Таблица П.8.2
где n - номер цикла, например, номер дня недели, r(n) - потребный раствор бетона, (тыс. тонн) по дням недели. Процесс производства бетона описывается разностным уравнением вида: x(n + 1) = x(n) + u(n), (П.8.21) где u(n) - управление изменением объема производимого продукта. В этой задаче число m = 1. Начальное условие x(0) = 1. Конечное условие x(N) не задано, N = 5. Математически критерий оптимального управления заводом запишем в виде целевой функции, являющейся интегральной функцией потерь изготовителя и потребителей продукции:
где функция
отражает суммарные потери производителя и потребителей продукции от несовпадения спроса и предложения, когда разница x(n) - r(n) Функция y2(n) = bu2(n) (П.8.24) описывает потери производителя, связанные с изменением объема производства. Решение задачи оптимального управления бетонным заводом осуществляется следующим образом. Пусть a = 2, b = 3. Функция Гамильтона на основании (П.8.4) с учетом (П.8.24) и (П.8.22) имеет вид: H = p(x + u) - y2 - y1 , а с учетом (П.8.23) и (П.8.24) получим:
Выражение для присоединенной функции определим по формуле (П.8.5)
Выражение для оптимального управления заводом определяется по (П.8.6) р(n + 1) - 6uоп(n) = 0 , откуда
Подставим это выражение в (П.8.21) и получим:
Чтобы сделать расчеты по этому уравнению, надо знать x(N) и p(N). Для определения p(N) воспользуемся условием трансверсальности (П.8.3)
Из (П.8.22) на основании (П.8.2) и (П.8.23) следует, что в данном случае терминальный член: Тогда
Так как значение x(N) неизвестно, то определить значение p(N) аналитически не представляется возможным. В ситуациях, подобных данной, когда число граничных условий меньше числа разностных уравнений, а условием трансверсальности воспользоваться нельзя, решить задачу можно методом перебора. Суть метода в следующем. Вначале зададим наугад значение x(N). По здравому смыслу оно не должно сильно отличаться от r(N) = r(5) = 8. Затем по выражению (П.8.28) определим величину p(N) = p(5). Далее по выражению (П.8.27) определим величину x(4), а по выражению (П.8.25) определим p(4). Далее повторим этот процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 3 и определим x(3) и p(3). Далее повторим процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 2, n = 1 и n = 0. В результате определим значение x(0). Теперь сравним его с заданным начальным условием x(0). Если разница между рассчитанным и заданным значением x(0) по модулю меньше числа e ® 0, то мы угадали величину x(N). В противном случае снова вернемся к началу вычислений, зададимся другим значением x(N) и повторим процесс вычислений снова. И так до тех пор, пока не получится заданная величина x(0) с погрешностью e. После этого по (П.8.27) и (П.8.25) рассчитывается весь процесс от n = 5 до n = 0. Величину Описанную процедуру решения задачи методом перебора можно выполнить быстро, если запрограммировать разностные уравнения (П.8.28), (П.8.27) и (П.8.25) на ЭВМ. Результаты решения задачи оптимального управления бетонным заводом приведены в таблице П.8.3. Таблица П.8.3
На рис. П.8.1 приведены зависимости x(n) и r(n), построенные по табл. П.8.2 и табл. П.8.3. Рис. П.8.5. Зависимости x(n) и r(n) Из этого рисунка видно, что функция оптимального предложения товара x(n) представляет собой сглаженный процесс от функции спроса r(n).
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|