Приложение 8. Принцип максимума для дискретных систем
Постановка задачи. Динамика дискретных систем описывается в пространстве состояний системой из m разностных уравнений первого порядка вида: (П.8.1) где - вектор переменных состояний разности 1 ´ m, - вектор управления размерности 1 ´ r, - известные функции, Заданы начальные значения всех переменных состояние системы область допустимых значений вектора управления и интервал управления n = 0 ¸ N. Могут быть дополнительно заданы конечные граничные условия системы Необходимо на интервале управления системой n = 0 ¸ N так изменять элементы вектора управления чтобы обеспечился какой-либо из критериев оптимального управления, например, минимум интегральной целевой функции вида: , (П.8.2)
где F – терминальный член, характеризующий конечное состояние системы. Если конечные граничные условия системы не заданы, то есть элементы вектора неизвестны, то граничные условия для присоединенных функций определяются из условия трансверсальности: (П.8.3) Решение. Функция Гамильтона для дискретных систем определяется по выражению: (П.8.4)
где f0 – известная функция, входящая в выражение для целевой функции, fi – известные функции, описывающие состояние системы, pi - присоединенные функции, определяемые из разностных уравнений первого порядка следующего вида: (П.8.5) Запись p = p(n + 1) означает, что в выражении все переменные записываются с номером цикла n , а переменные pi с номером цикла n + 1. Принцип максимума Понтрягина–Беллмана для дискретных систем. Он формулируется так: если вектор оптимален в смысле поставленной оптимизационной задачи, то необходимым условием для этого является существование N векторов при которых частные производные (П.8.6)
Тогда функция Гамильтона в случае, если вектор лежит на границе допустимой области Uдоп. Иначе говоря, оптимальный вектор (П.8.7) Выражение (П.8.7) следует понимать и читать так: оптимальный вектор управления являющийся аргументом функции Гамильтона, такой, который максимизирует функцию Гамильтона. Если целевая функция J = max, то оптимальный вектор управления должен минимизировать функцию Гамильтона, то есть в этом случае: В отличие от сильного принципа максимума для непрерывных систем, принцип максимума Понтрягина–Беллмана для дискретных систем называют слабым принципом максимума. Причина состоит в том, что принцип максимума для дискретных систем является приближенным. Для дискретных систем доказана следующая теорема: оптимальный вектор управления в дискретных системах обращает в максимум функцию Гамильтона с погрешностью матрицы относительного дискретного времени то есть: где: - диагональная матрица,
– относительная продолжительность цикла или такта в дискретных системах. Очевидно, что чем меньше величина цикла Tц по сравнению с общим интервалом управления T, тем меньше эта погрешность. При Dt ®0 дискретные системы превращаются в непрерывные, и погрешность принципа максимума для них стремится к нулю. Пример 1. Затраты x1 первого основного цеха завода от цикла к циклу описываются разностным уравнением первого порядка вида: , (П.8.8) а затраты x2 второго (вспомогательного) цеха описываются разностным уравнением вида: (П.8.9) Заданы начальное и конечное состояния системы и и интервал управления системой n = 0 ¸ N. Ставится задача: так изменять управление цехами u1 и u2 (изменять затраты), чтобы на интервале управления n = 0 ¸ N выполнялось условие минимума интегральной целевой функции (П.8.10)
Эта функция учитывает затраты цехов x1 и x2 на каждом цикле, а также изменение затрат, вызванных величинами u1 и u2. Известно, что изменение объема производства в ту или иную сторону влечет увеличение потерь, связанных с перестройкой производства. Терминальная функция F в этой задаче равна нулю. Решение. Вначале запишем выражение для функции Гамильтона с учетом (П.8.8), (П.8.9) и (П.8.10) .
Разностные уравнения, по которым вычисляются присоединенные функции pi, определяются из выражения (П.8.5) .
Применим это выражение при i = 1 и i = 2 для функции H и получим искомые выражения для присоединенных функций: (П.8.11) (П.8.12) Оптимальное управление цехами u1 и u2 определяется из принципа максимума (П.8.7) откуда следует формула (П.8.6), устанавливающая связь между элементами u1оп и u2оп оптимального вектора управления и переменными xi и pi
Применим это выражение при i = 1 и i = 2 для функции H и получим: Из этих уравнений получим соотношения: (П.8.13) (П.8.14) Подставим их в (П.8.8), (П.8.9) и получим: (П.8.15) (П.8.16) Эти уравнения совместно с (П.8.11) и (П.8.12) описывают дискретную динамическую систему при оптимальном управлении. Недостатком уравнений (П.8.11), (П.8.12), (П.8.15) и (П.8.16) является то, что первые два уравнения описывают процесс от конца к началу (номер цикла n убывает), а вторые два уравнения – от начала к концу. Преобразуем их к одному виду, например, от конца к началу. В данной задаче направление безразлично, так как граничные условия переменных состояния xi заданы и в начале и в конце процесса управления. Из (П.8.16) имеем: . (П.8.17) Вычтем (П.8.16) из (П.8.15) и получим: . (П.8.18) Подставим в (П.8.11) значение x1(n) из (П.8.17) и получим: . (П.8.19) Подставим в (П.8.12) значение x2(n) из (П.8.18) и получим: . (П.8.20) Уравнения (П.8.17), (П.8.18), (П.8.19) и (П.8.20) описывают динамическую систему от конца к началу при оптимальном уравнении. В данной задаче терминальная функция F не задана, и условием трансверсальности для определения граничных значений присоединенных функций pi(N) воспользоваться нельзя. Поэтому в данной задаче необходимо найти такие значения pi(N), при которых от заданного конечного состояния системы надо перейти к заданному начальному состоянию системы по уравнениям (П.8.17) ¸ (П.8.20). Для этого необходимо провести преобразование над указанными уравнениями на всех циклах процесса управления от n = N – 1 до n = 0 и выразить значения pi(N) через известные значения элементов векторов и . Сделаем эти преобразования при конкретных численных значениях N, и . Пусть . Тогда при n = 3 с учетом граничных условий на конце x1(4) = 4 и x2(4) = 0 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(3) = - 0,5p2(4) x2(3) = 4 - 0,5p1(4) + 0,5p2(4) p1(3) = p1(4) + 2p2(4) p2(3) = 2p1(4) - 8 - p2(4) При n = 2 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(2) = x2(3) - 0,5p2(3) x2(2) = x1(3) - x2(3) - 0,5p1(3) + 0,5p2(3) p1(2) = p1(3) + 2p2(3) - 2x2(3) p2(2) = 2p1(3) - 2x1(3) + 2x2(3) - p2(3) Подставим в эти уравнения значения x1(3), x2(3), p1(3) и p2(3), полученные при n =3 и, сделав необходимые арифметические вычисления, получим: x1(2) = 8 - 1,5p1(4) + p2(4) x2(2) = p1(4) – 2,5p2(4) - 8 p1(2) = 6p1(4) - p2(4) - 24 p2(2) = - p1(4) + 7p2(4) + 16 При n = 1 из уравнений (П.8.17) ¸ (П.8.20) получим: x1(1) = x2(2) - 0,5p2(2) x2(1) = x1(2) - x2(2) - 0,5p1(2) + 0,5p2(2) p1(1) = p1(2) + 2p2(2) - 2x2(2) p2(1) = 2p1(2) - 2x1(2) + 2x2(2) - p2(2) Подставим в эти уравнения значения x1(2), x2(2), p1(2) и p2(2), полученные при n = 2 и, сделав необходимые арифметические вычисления, получим: x1(1) = - 1,5p1(4) - 6p2(4) - 16 x2(1) = - 6p1(4) + 7,5p2(4) + 36 p1(1) = 2p1(4) + 18p2(4) + 24 p2(1) = 18p1(4) - 16p2(4) - 96 При n = 0 вычислять значения p1 и p2 нет необходимости, поэтому определим только выражения для x1(0) и x2(0) по (П.8.17) и (П.8.18) при n = 0 с учетом результатов, полученных выше: x1(0) = - 15p1(4) + 15,5p2(4) + 84 x2(0) = 15,5p1(4) – 30,5p2(4) - 112 Так как начальные граничные условия заданы: x1(0) = -1, x2(0) = 1, то после подстановки в эти выражения значений x1(0) и x2(0) получим систему из двух уравнений: 15p1(4) - 15,5p2(4) = 85 15,5p1(4) – 30,5p2(4) = 113 Решив эту систему, получим неизвестные значения присоединенных функций на конце процесса p1(4) и p2(4). Решение этой системы дает следующие результаты: p1(4) = 3,872 p2(4) = - 1,737 Подставив эти значения в уравнения (П.8.17) ¸ (П.8.20) при известных x1(4) = 4 и x2(4) = 0, определим значение x1(3), x2(3), p1(3) и p2(3). Снова подставим эти значения в (П.8.17) ¸ (П.8.20) и определим значения x1(2), x2(2), p1(2) и p2(2). Проделав эту процедуру до n = 0, определим все значения x1(n), x2(n), p1(n) и p2(n) на всем интервале управления. Отметим, что значения x1(0) и x2(0) должны совпасть с заданными значениями вектора с допустимой погрешностью. Элементы вектора оптимального управления определяются из соотношений (П.8.13) и (П.8.14). В таблице П.8.1 приведены результаты вычислений по описанной процедуре. Здесь же приведены значения подынтегральной функции f0 и значение целевой функции J, вычисленной по формуле (П.8.10). Таблица П.8.1
По табл. П.8.1 можно построить траектории процессов . Постановка задачи оптимального управления заводом, выпускающим бетон, при известном начальном состоянии и спросе на бетон на каждом цикле. Необходимо на заданном интервале управления заводом n = 0 ¸ N так спланировать выпуск бетона при известном на него спросе, чтобы суммарные потери производителя и потребителей бетона (строительных организаций) от несовпадения спроса и предложения были минимальны. Функция спроса бетона (в тыс. тонн) r(n) задана таблицей П.8.2. Таблица П.8.2
где n - номер цикла, например, номер дня недели, r(n) - потребный раствор бетона, (тыс. тонн) по дням недели. Процесс производства бетона описывается разностным уравнением вида: x(n + 1) = x(n) + u(n), (П.8.21) где u(n) - управление изменением объема производимого продукта. В этой задаче число m = 1. Начальное условие x(0) = 1. Конечное условие x(N) не задано, N = 5. Математически критерий оптимального управления заводом запишем в виде целевой функции, являющейся интегральной функцией потерь изготовителя и потребителей продукции: , (П.8.22) где функция (П.8.23)
отражает суммарные потери производителя и потребителей продукции от несовпадения спроса и предложения, когда разница x(n) - r(n) 0, причем при x(n) < r(n) эти потери больше, чем при x(n) > r(n), т.к. простои строителей обходятся дороже. Функция y2(n) = bu2(n) (П.8.24) описывает потери производителя, связанные с изменением объема производства. Решение задачи оптимального управления бетонным заводом осуществляется следующим образом. Пусть a = 2, b = 3. Функция Гамильтона на основании (П.8.4) с учетом (П.8.24) и (П.8.22) имеет вид: H = p(x + u) - y2 - y1 , а с учетом (П.8.23) и (П.8.24) получим:
Выражение для присоединенной функции определим по формуле (П.8.5) (П.8.25)
Выражение для оптимального управления заводом определяется по (П.8.6) р(n + 1) - 6uоп(n) = 0 , откуда . (П.8.26) Подставим это выражение в (П.8.21) и получим: , откуда . (П.8.27)
Чтобы сделать расчеты по этому уравнению, надо знать x(N) и p(N). Для определения p(N) воспользуемся условием трансверсальности (П.8.3) .
Из (П.8.22) на основании (П.8.2) и (П.8.23) следует, что в данном случае терминальный член: Тогда (П.8.28)
Так как значение x(N) неизвестно, то определить значение p(N) аналитически не представляется возможным. В ситуациях, подобных данной, когда число граничных условий меньше числа разностных уравнений, а условием трансверсальности воспользоваться нельзя, решить задачу можно методом перебора. Суть метода в следующем. Вначале зададим наугад значение x(N). По здравому смыслу оно не должно сильно отличаться от r(N) = r(5) = 8. Затем по выражению (П.8.28) определим величину p(N) = p(5). Далее по выражению (П.8.27) определим величину x(4), а по выражению (П.8.25) определим p(4). Далее повторим этот процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 3 и определим x(3) и p(3). Далее повторим процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 2, n = 1 и n = 0. В результате определим значение x(0). Теперь сравним его с заданным начальным условием x(0). Если разница между рассчитанным и заданным значением x(0) по модулю меньше числа e ® 0, то мы угадали величину x(N). В противном случае снова вернемся к началу вычислений, зададимся другим значением x(N) и повторим процесс вычислений снова. И так до тех пор, пока не получится заданная величина x(0) с погрешностью e. После этого по (П.8.27) и (П.8.25) рассчитывается весь процесс от n = 5 до n = 0. Величину рассчитываем по (61). Описанную процедуру решения задачи методом перебора можно выполнить быстро, если запрограммировать разностные уравнения (П.8.28), (П.8.27) и (П.8.25) на ЭВМ. Результаты решения задачи оптимального управления бетонным заводом приведены в таблице П.8.3. Таблица П.8.3
На рис. П.8.1 приведены зависимости x(n) и r(n), построенные по табл. П.8.2 и табл. П.8.3. Рис. П.8.5. Зависимости x(n) и r(n) Из этого рисунка видно, что функция оптимального предложения товара x(n) представляет собой сглаженный процесс от функции спроса r(n).
©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.
|