Здавалка
Главная | Обратная связь

Приложение 8. Принцип максимума для дискретных систем



 

Постановка задачи.

Динамика дискретных систем описывается в пространстве состояний системой из m разностных уравнений первого порядка вида:

(П.8.1)

где - вектор переменных состояний разности 1 ´ m,

- вектор управления размерности 1 ´ r,

- известные функции,

Заданы начальные значения всех переменных состояние системы область допустимых значений вектора управления и интервал управления n = 0 ¸ N. Могут быть дополнительно заданы конечные граничные условия системы

Необходимо на интервале управления системой n = 0 ¸ N так изменять элементы вектора управления чтобы обеспечился какой-либо из критериев оптимального управления, например, минимум интегральной целевой функции вида:

, (П.8.2)

 

где F – терминальный член, характеризующий конечное состояние системы.

Если конечные граничные условия системы не заданы, то есть элементы вектора неизвестны, то граничные условия для присоединенных функций определяются из условия трансверсальности:

(П.8.3)

Решение.

Функция Гамильтона для дискретных систем определяется по выражению:

(П.8.4)

 

где f0 – известная функция, входящая в выражение для целевой функции,

fi – известные функции, описывающие состояние системы,

pi - присоединенные функции, определяемые из разностных уравнений первого порядка следующего вида:

(П.8.5)

Запись p = p(n + 1) означает, что в выражении все переменные записываются с номером цикла n , а переменные pi с номером цикла n + 1.

Принцип максимума Понтрягина–Беллмана для дискретных систем. Он формулируется так: если вектор оптимален в смысле поставленной оптимизационной задачи, то необходимым условием для этого является существование N векторов при которых частные производные

(П.8.6)

 

Тогда функция Гамильтона в случае, если вектор лежит на границе допустимой области Uдоп. Иначе говоря, оптимальный вектор

(П.8.7)

Выражение (П.8.7) следует понимать и читать так: оптимальный вектор управления являющийся аргументом функции Гамильтона, такой, который максимизирует функцию Гамильтона.

Если целевая функция J = max, то оптимальный вектор управления должен минимизировать функцию Гамильтона, то есть в этом случае:

В отличие от сильного принципа максимума для непрерывных систем, принцип максимума Понтрягина–Беллмана для дискретных систем называют слабым принципом максимума. Причина состоит в том, что принцип максимума для дискретных систем является приближенным. Для дискретных систем доказана следующая теорема: оптимальный вектор управления в дискретных системах обращает в максимум функцию Гамильтона с погрешностью матрицы относительного дискретного времени то есть:

где: - диагональная матрица,

 

 

– относительная продолжительность цикла или такта в дискретных системах.

Очевидно, что чем меньше величина цикла Tц по сравнению с общим интервалом управления T, тем меньше эта погрешность. При Dt ®0 дискретные системы превращаются в непрерывные, и погрешность принципа максимума для них стремится к нулю.

Пример 1. Затраты x1 первого основного цеха завода от цикла к циклу описываются разностным уравнением первого порядка вида:

, (П.8.8)

а затраты x2 второго (вспомогательного) цеха описываются разностным уравнением вида:

(П.8.9)

Заданы начальное и конечное состояния системы и и интервал управления системой n = 0 ¸ N.

Ставится задача: так изменять управление цехами u1 и u2 (изменять затраты), чтобы на интервале управления n = 0 ¸ N выполнялось условие минимума интегральной целевой функции

(П.8.10)

 

Эта функция учитывает затраты цехов x1 и x2 на каждом цикле, а также изменение затрат, вызванных величинами u1 и u2. Известно, что изменение объема производства в ту или иную сторону влечет увеличение потерь, связанных с перестройкой производства. Терминальная функция F в этой задаче равна нулю.

Решение. Вначале запишем выражение для функции Гамильтона с учетом (П.8.8), (П.8.9) и (П.8.10)

.

 

Разностные уравнения, по которым вычисляются присоединенные функции pi, определяются из выражения (П.8.5)

.

 

Применим это выражение при i = 1 и i = 2 для функции H и получим искомые выражения для присоединенных функций:

(П.8.11)

(П.8.12)

Оптимальное управление цехами u1 и u2 определяется из принципа максимума (П.8.7)

откуда следует формула (П.8.6), устанавливающая связь между элементами u1оп и u2оп оптимального вектора управления и переменными xi и pi

 

 

Применим это выражение при i = 1 и i = 2 для функции H и получим:

Из этих уравнений получим соотношения:

(П.8.13)

(П.8.14)

Подставим их в (П.8.8), (П.8.9) и получим:

(П.8.15)

(П.8.16)

Эти уравнения совместно с (П.8.11) и (П.8.12) описывают дискретную динамическую систему при оптимальном управлении.

Недостатком уравнений (П.8.11), (П.8.12), (П.8.15) и (П.8.16) является то, что первые два уравнения описывают процесс от конца к началу (номер цикла n убывает), а вторые два уравнения – от начала к концу.

Преобразуем их к одному виду, например, от конца к началу. В данной задаче направление безразлично, так как граничные условия переменных состояния xi заданы и в начале и в конце процесса управления.

Из (П.8.16) имеем:

. (П.8.17)

Вычтем (П.8.16) из (П.8.15) и получим:

. (П.8.18)

Подставим в (П.8.11) значение x1(n) из (П.8.17) и получим:

. (П.8.19)

Подставим в (П.8.12) значение x2(n) из (П.8.18) и получим:

. (П.8.20)

Уравнения (П.8.17), (П.8.18), (П.8.19) и (П.8.20) описывают динамическую систему от конца к началу при оптимальном уравнении. В данной задаче терминальная функция F не задана, и условием трансверсальности для определения граничных значений присоединенных функций pi(N) воспользоваться нельзя.

Поэтому в данной задаче необходимо найти такие значения pi(N), при которых от заданного конечного состояния системы надо перейти к заданному начальному состоянию системы по уравнениям (П.8.17) ¸ (П.8.20).

Для этого необходимо провести преобразование над указанными уравнениями на всех циклах процесса управления от n = N – 1 до n = 0 и выразить значения pi(N) через известные значения элементов векторов и .

Сделаем эти преобразования при конкретных численных значениях N, и .

Пусть .

Тогда при n = 3 с учетом граничных условий на конце x1(4) = 4 и x2(4) = 0 из уравнений (П.8.17) ¸ (П.8.20) получим:

x1(3) = - 0,5p2(4)

x2(3) = 4 - 0,5p1(4) + 0,5p2(4)

p1(3) = p1(4) + 2p2(4)

p2(3) = 2p1(4) - 8 - p2(4)

При n = 2 из уравнений (П.8.17) ¸ (П.8.20) получим:

x1(2) = x2(3) - 0,5p2(3)

x2(2) = x1(3) - x2(3) - 0,5p1(3) + 0,5p2(3)

p1(2) = p1(3) + 2p2(3) - 2x2(3)

p2(2) = 2p1(3) - 2x1(3) + 2x2(3) - p2(3)

Подставим в эти уравнения значения x1(3), x2(3), p1(3) и p2(3), полученные при n =3 и, сделав необходимые арифметические вычисления, получим:

x1(2) = 8 - 1,5p1(4) + p2(4)

x2(2) = p1(4) – 2,5p2(4) - 8

p1(2) = 6p1(4) - p2(4) - 24

p2(2) = - p1(4) + 7p2(4) + 16

При n = 1 из уравнений (П.8.17) ¸ (П.8.20) получим:

x1(1) = x2(2) - 0,5p2(2)

x2(1) = x1(2) - x2(2) - 0,5p1(2) + 0,5p2(2)

p1(1) = p1(2) + 2p2(2) - 2x2(2)

p2(1) = 2p1(2) - 2x1(2) + 2x2(2) - p2(2)

Подставим в эти уравнения значения x1(2), x2(2), p1(2) и p2(2), полученные при n = 2 и, сделав необходимые арифметические вычисления, получим:

x1(1) = - 1,5p1(4) - 6p2(4) - 16

x2(1) = - 6p1(4) + 7,5p2(4) + 36

p1(1) = 2p1(4) + 18p2(4) + 24

p2(1) = 18p1(4) - 16p2(4) - 96

При n = 0 вычислять значения p1 и p2 нет необходимости, поэтому определим только выражения для x1(0) и x2(0) по (П.8.17) и (П.8.18) при n = 0 с учетом результатов, полученных выше:

x1(0) = - 15p1(4) + 15,5p2(4) + 84

x2(0) = 15,5p1(4) – 30,5p2(4) - 112

Так как начальные граничные условия заданы: x1(0) = -1, x2(0) = 1, то после подстановки в эти выражения значений x1(0) и x2(0) получим систему из двух уравнений:

15p1(4) - 15,5p2(4) = 85

15,5p1(4) – 30,5p2(4) = 113

Решив эту систему, получим неизвестные значения присоединенных функций на конце процесса p1(4) и p2(4).

Решение этой системы дает следующие результаты:

p1(4) = 3,872

p2(4) = - 1,737

Подставив эти значения в уравнения (П.8.17) ¸ (П.8.20) при известных x1(4) = 4 и x2(4) = 0, определим значение x1(3), x2(3), p1(3) и p2(3). Снова подставим эти значения в (П.8.17) ¸ (П.8.20) и определим значения x1(2), x2(2), p1(2) и p2(2). Проделав эту процедуру до n = 0, определим все значения x1(n), x2(n), p1(n) и p2(n) на всем интервале управления. Отметим, что значения x1(0) и x2(0) должны совпасть с заданными значениями вектора с допустимой погрешностью. Элементы вектора оптимального управления определяются из соотношений (П.8.13) и (П.8.14).

В таблице П.8.1 приведены результаты вычислений по описанной процедуре. Здесь же приведены значения подынтегральной функции f0 и значение целевой функции J, вычисленной по формуле (П.8.10).

Таблица П.8.1

 

n
x1 -1,0035 0,23 0,455 0,8685
x2 0,9945 -0,2595 -0,923 1,1955
p1 - 0,478 0,969 0,398 3,872
p2 - 1,488 -0,031 1,481 -1,737
0,744 -0,0155 0,7405 -0,8685 -
0,239 0,4845 0,199 1,936 -
f0 2,610 0,355 1,647 6,686 J=11,2979

По табл. П.8.1 можно построить траектории процессов .

Постановка задачи оптимального управления заводом, выпускающим бетон, при известном начальном состоянии и спросе на бетон на каждом цикле.

Необходимо на заданном интервале управления заводом n = 0 ¸ N так спланировать выпуск бетона при известном на него спросе, чтобы суммарные потери производителя и потребителей бетона (строительных организаций) от несовпадения спроса и предложения были минимальны.

Функция спроса бетона (в тыс. тонн) r(n) задана таблицей П.8.2.

Таблица П.8.2

n
r(n)

где n - номер цикла, например, номер дня недели,

r(n) - потребный раствор бетона, (тыс. тонн) по дням недели.

Процесс производства бетона описывается разностным уравнением вида:

x(n + 1) = x(n) + u(n), (П.8.21)

где u(n) - управление изменением объема производимого продукта. В этой задаче число m = 1.

Начальное условие x(0) = 1. Конечное условие x(N) не задано, N = 5.

Математически критерий оптимального управления заводом запишем в виде целевой функции, являющейся интегральной функцией потерь изготовителя и потребителей продукции:

, (П.8.22)

где функция

(П.8.23)

 

 

отражает суммарные потери производителя и потребителей продукции от несовпадения спроса и предложения, когда разница x(n) - r(n) 0, причем при x(n) < r(n) эти потери больше, чем при x(n) > r(n), т.к. простои строителей обходятся дороже.

Функция y2(n) = bu2(n) (П.8.24)

описывает потери производителя, связанные с изменением объема производства.

Решение задачи оптимального управления бетонным заводом осуществляется следующим образом. Пусть a = 2, b = 3.

Функция Гамильтона на основании (П.8.4) с учетом (П.8.24) и (П.8.22) имеет вид:

H = p(x + u) - y2 - y1 ,

а с учетом (П.8.23) и (П.8.24) получим:

 

 

Выражение для присоединенной функции определим по формуле (П.8.5)

(П.8.25)

 

Выражение для оптимального управления заводом определяется по (П.8.6)

р(n + 1) - 6uоп(n) = 0 , откуда

. (П.8.26)

Подставим это выражение в (П.8.21) и получим:

, откуда

. (П.8.27)

 

Чтобы сделать расчеты по этому уравнению, надо знать x(N) и p(N).

Для определения p(N) воспользуемся условием трансверсальности (П.8.3)

.

 

Из (П.8.22) на основании (П.8.2) и (П.8.23) следует, что в данном случае терминальный член:

Тогда (П.8.28)

 

Так как значение x(N) неизвестно, то определить значение p(N) аналитически не представляется возможным.

В ситуациях, подобных данной, когда число граничных условий меньше числа разностных уравнений, а условием трансверсальности воспользоваться нельзя, решить задачу можно методом перебора. Суть метода в следующем. Вначале зададим наугад значение x(N). По здравому смыслу оно не должно сильно отличаться от r(N) = r(5) = 8. Затем по выражению (П.8.28) определим величину p(N) = p(5). Далее по выражению (П.8.27) определим величину x(4), а по выражению (П.8.25) определим p(4).

Далее повторим этот процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 3 и определим x(3) и p(3).

Далее повторим процесс вычислений по формулам (П.8.27) и (П.8.25) при n = 2, n = 1 и n = 0. В результате определим значение x(0).

Теперь сравним его с заданным начальным условием x(0). Если разница между рассчитанным и заданным значением x(0) по модулю меньше числа e ® 0, то мы угадали величину x(N). В противном случае снова вернемся к началу вычислений, зададимся другим значением x(N) и повторим процесс вычислений снова. И так до тех пор, пока не получится заданная величина x(0) с погрешностью e. После этого по (П.8.27) и (П.8.25) рассчитывается весь процесс от n = 5 до n = 0. Величину рассчитываем по (61).

Описанную процедуру решения задачи методом перебора можно выполнить быстро, если запрограммировать разностные уравнения (П.8.28), (П.8.27) и (П.8.25) на ЭВМ.

Результаты решения задачи оптимального управления бетонным заводом приведены в таблице П.8.3.

Таблица П.8.3

n  
x 1,9025 2,7402 4,1578 5,0142 6,2085
uоп 0,9025 0,8376 1,4176 0,8562 1,1943 -
f0 2,4435 2,1237 9,057 3,6178 5,3076 6,4189 J=28,9686

 

На рис. П.8.1 приведены зависимости x(n) и r(n), построенные по табл. П.8.2 и табл. П.8.3.

Рис. П.8.5. Зависимости x(n) и r(n)

Из этого рисунка видно, что функция оптимального предложения товара x(n) представляет собой сглаженный процесс от функции спроса r(n).

 

 







©2015 arhivinfo.ru Все права принадлежат авторам размещенных материалов.