Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Автоматика и телемеханика, 2024, № 12

научный журнал
Покупка
Новинка
Артикул: 852949.0001.99
Автоматика и телемеханика : научный журнал. – Москва : Наука, 2024. - № 12. – 112 с. – ISSN 0005-2310. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2197058 (дата обращения: 21.02.2025). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов




Учредители журнала:
Отделение энергетики, машиностроения, механики и процессов управления РАН,
Институт проблем управления им. В.А. Трапезникова РАН (ИПУ РАН),
Институт проблем передачи информации им. А.А. Харкевича РАН (ИППИ РАН)
Главный редактор:
Галяев А.А.
Заместители главного редактора:
Соболевский А.Н., Рубинович Е.Я., Хлебников М.В.
Ответственный секретарь:
Родионов И.В.
Редакционный совет:
Васильев С.Н., Желтов С.Ю., Каляев И.А., Кулешов А.П., Куржанский А.Б.,
Мартынюк А.А. (Украина), Пешехонов В.Г., Попков Ю.С.,
Федосов Е.А., Черноусько Ф.Л.
Редакционная коллегия:
Алескеров Ф.Т., Бахтадзе Н.Н., Бобцов А.А., Виноградов Д.В., Вишневский В.М.,
Воронцов К.В., Граничин О.Н., Губко М.В., Каравай М.Ф., Кибзун А.И.,
Краснова С.А., Крищенко А.П., Кузнецов Н.В., Кузнецов О.П., Кушнер А.Г.,
Лазарев А.А., Ляхов А.И., Маликов А.И., Матасов А.И., Меерков С.М. (США),
Миллер Б.М., Михальский А.И., Мунасыпов Р.А., Назин А.В.,
Немировский А.С. (США), Новиков Д.А., Олейников А.Я., Пакшин П.В.,
Пальчунов Д.Е., Поляков А.Е. (Франция), Рапопорт Л.Б., Рублев И.В.,
Степанов О.А., Уткин В.И. (США), Фрадков А.Л., Цыбаков А.Б. (Франция),
Чеботарев П.Ю., Щербаков П.С.
Адрес редакции: 117997, Москва, Профсоюзная ул., 65
Тел./факс: 8 (495) 198-17-20, доб. 1443
Электронная почта: redacsia@ipu.ru
Зав. редакцией Е.А. Мартехина
Москва
ФГБУ «Издательство «Наука»
c
⃝Российская академия наук, 2024
c
⃝Редколлегия журнала «Автоматика и телемеханика» (составитель), 2024


Автоматика и телемеханика, №12, 2024
Линейные системы
c
⃝2024 г.
М.В. ХЛЕБНИКОВ, д-р физ.-мат. наук (khlebnik@ipu.ru)
(Институт проблем управления им. В.А. Трапезникова РАН, Москва)
СИНТЕЗ ОБРАТНОЙ СВЯЗИ ПО ВЫХОДУ
В ДИСКРЕТНЫХ СИСТЕМАХ УПРАВЛЕНИЯ
КАК ЗАДАЧА ОПТИМИЗАЦИИ
Предлагается новый подход к решению задачи подавления неслучайных ограниченных внешних возмущений в линейных дискретных системах управления при помощи динамической обратной связи по выходу.
Подход основан на сведении проблемы к задаче матричной оптимизации,
где переменными являются матрица обратной связи и матрица наблюдателя. Выписан градиентный метод для отыскания динамической обратной связи по выходу и дано его обоснование.
Ключевые слова: линейные системы, дискретное время, внешние возмущения, обратная связь по выходу, наблюдатель, оптимизация, уравнение
Ляпунова, градиентный метод, метод Ньютона.
DOI: 10.31857/S0005231024120012, EDN: XUOEAQ
1. Введение
В работе [1] был предложен и обсужден новый подход к решению задачи подавления неслучайных ограниченных внешних возмущений в линейных
непрерывных системах управления при помощи динамической обратной связи по выходу с использованием наблюдателя Люенбергера [2, 3]. Этот подход,
восходящий к работе [4], основан на сведении проблемы к задаче матричной
оптимизации, где переменными являются матрица обратной связи и матрица
наблюдателя; далее эта задача решается градиентным методом.
Небольшой обзор литературы по соответствующей проблематике был дан
в [1] (см., например, [5], а также приведенную там обширную библиографию).
В [6] был предложен подход к решению этой же задачи путем ее сведения к
решению задачи полуопределенного программирования в терминах линейных матричных неравенств (ЛМН) [7, 8]; при этом пришлось произвести ряд
загрублений для того, чтобы линеаризовать матричные неравенства и установить окончательный результат в терминах ЛМН, что привело к излишнему
консерватизму полученных условий.
Среди идейно близких публикаций также следует отметить недавние работы [9, 10], в которых был предложен перспективный подход к решению обсуждаемой задачи, основанный на нахождении решений параметризованных
матричных уравнений Риккати.
3


Настоящая статья является непосредственным продолжением работы [1],
распространяя предложенные в ней подходы на системы управления в дискретном времени. Важной практически-ориентированной особенностью предлагаемого подхода является возможность ограничения величины матриц наблюдателя и динамического регулятора.
Всюду далее Sn – пространство симметричных матриц размера n × n с
вещественными элементами, ∥· ∥– евклидова норма вектора и спектральная
норма матрицы, ∥· ∥F – фробениусова норма матрицы, T – символ транспонирования, tr – след матрицы, ⟨·, ·⟩– скалярное произведение Фробениуса
для матриц, I – единичная матрица соответствующей размерности, λi(A) –
собственные значения матрицы A, а ρ(A) = max
i
|λi(A)| < 1 – радиус устойчивости шуровской матрицы A.
2. Постановка задачи
Рассмотрим систему управления
xk+1 = Axk + Buk + Dwk,
yk = C1xk + D1wk,
zk = C2xk,
(1)
где A ∈Rn×n, B ∈Rn×p, D ∈Rn×m, D1 ∈Rℓ×m, C1 ∈Rℓ×n, C2 ∈Rr×n, с состоянием xk ∈Rn, начальным условием x0, наблюдаемым выходом yk ∈Rℓ,
оптимизируемым выходом zk ∈Rr, управлением uk ∈Rp и внешним возмущением1 wk ∈Rm, ограниченным в каждый момент времени:
∥wk∥⩽δ
для всех k = 0, 1, 2, . . . .
Будем предполагать, что пара (A, B) управляема, а пара (A, C1) наблюдаема.
Состояние xk системы недоступно измерению и информация о системе
предоставляется ее выходом yk. Задачей является нахождение минимального (в определенном смысле) эллипсоида, содержащего оптимизируемый выход zk.
Построим наблюдатель, описываемый линейным разностным уравнением,
включающим в себя рассогласование выхода yk и его прогноза C1b
xk:
b
xk+1 = Ab
xk + Buk + L(yk −C1b
xk),
b
x0 = 0,
(2)
где L ∈Rn×ℓ– матрица наблюдателя.
Согласно (1), (2) невязка ek = xk −b
xk будет удовлетворять разностному
уравнению
ek+1 = (A −LC1)ek + (D −LD1)wk,
e0 = x0.
1 Несмотря на то, что природа возмущений в состоянии и наблюдаемом выходе системы,
вообще говоря, различна, удобно считать их одними и теми же, полагая что матрицы D
и D1 “вырезают” из вектора wk разные “куски”; общий случай также может быть рассмотрен ценой некоторого усложнения.
4


Замкнув систему (1) обратной связью с помощью динамического регулятора
получаем систему
uk = Kb
xk,
K ∈Rp×n,
(3)
(4)
xk+1 = (A + BK)xk −BKek + Dwk,
ek+1 = (A −LC1)ek + (D −LD1)wk,
zk = C2xk
с регулируемым выходом zk.
Как и в непрерывном случае, синтез статического регулятора по выходу
вида uk = Kyk не всегда возможен: матрица A + BKC1 может оказаться не
стабилизируемой выбором K, тогда как динамический регулятор (3) может
быть построен (при малоограничительных требованиях управляемости и наблюдаемости системы; подробнее см. раздел 3).
3. Подход к решению
Воспользуемся методом инвариантных эллипсоидов (подробнее см. [8, 13]).
Напомним, что эллипсоид
Ex =

x ∈Rn :
xTP −1x ⩽1
	
,
P ≻0
называется инвариантным для линейной дискретной динамической системы
xk+1 = Axk + Dwk,
∥wk∥⩽1,
zk = Cxk
(5)
с шуровской матрицей A, если любая траектория системы, исходящая из точки x0, лежащей в эллипсоиде Ex, при всех внешних возмущениях wk : ∥wk∥⩽1
в любой момент времени будет находиться в этом эллипсоиде.
Инвариантный эллипсоид обладает свойством притягиваемости: траектория системы, исходящая из точки вне инвариантного эллипсоида, стремится
к нему с течением времени.
Легко видеть, что если Ex – инвариантный эллипсоид с матрицей P, то
линейный выход zk системы (5) при x0 ∈Ex будет принадлежать эллипсоиду
Ez =

z ∈Rr :
zT(CPCT)−1z ⩽1
	
,
называемому ограничивающим (а при x0 /
∈Ex – стремиться к нему).
Оценивая влияния внешних возмущений на выход системы, естественно
интересоваться минимальными ограничивающими эллипсоидами; в качестве
критерия минимальности ограничивающего эллипсоида часто принимается
величина tr CPCT, равная сумме квадратов его полуосей. Хорошо известен
следующий результат (см., например, [8]).
5


Т е о р е м а 1. Пусть матрица A шуровская, ρ = maxi |λi(A)| < 1, пара
(A, D) управляема, а матрица P(α) ≻0, ρ2 < α < 1 удовлетворяет дискретному уравнению Ляпунова
1
αAPAT −P +
1
1 −αDDT = 0.
(6)
Тогда задача об оптимальном ограничивающем эллипсоиде для системы (5)
сводится к минимизации одномерной функции
f(α) = tr CP(α)CT
на интервале ρ2 < α < 1.
Сделаем несколько замечаний. Во-первых, если α∗– точка минимума в
задаче из теоремы 1, и x0 удовлетворяет условию xT
0 P −1(α∗)x0 ⩽1, то гарантируется очевидная равномерная оценка
∥zk∥2 ⩽∥CP(α∗)CT∥⩽tr CP(α∗)CT = f(α∗),
k = 0, 1, 2, . . . .
Во-вторых, уравнение (6) представимо в виде
 1
√αA

P
 1
√αA
T
−P +
1
1 −αDDT = 0
и согласно [8, лемма 1.2.6] имеет единственное положительно-определенное
решение тогда и только тогда, когда матрица
1
√αA шуровская, т.е.
ρ
 1
√αA

< 1.
Вернемся к системе (4); введя составной вектор
gk =
xk
ek

∈R2n,
запишем ее в матричном виде и введем в рассмотрение матрицы AK,L, DL
и C:


wk,
g0 =
x0
x0

,
˙
gk =
A + BK
−BK
0
A −LC1
gk +

D
D −LD1
(7)
gk.
|
{z
}
AK,L
|
{z
}
DL
zk =

C2 0

| {z }
C
Заключим состояние gk системы (7) в инвариантный эллипсоид
6
Eg =

g ∈R2n :
gTP −1g ⩽1
	
,


порожденный матрицей P ∈S2n, и будем минимизировать размер соответствующего ограничивающего эллипсоида
Ez =

z ∈Rr :
zT(CPCT)−1z ⩽1
	
по выходу zk с матрицей CPCT. В качестве критерия его минимальности примем критерий следа, т.е. величину tr CPCT.
Заметив, что матрица AK,L представима в виде

=
AK,L =

A + BK
−BK
0
A −LC1
,
=
A
0
0
A

+
B
0

+
0
I

K

I
−I

L

0 −C1

|
{z
}
N1
|
{z
}
N2
|
{z
}
A
| {z }
M1
|{z}
M2
в соответствии с теоремой 1 приходим к задаче минимизации функции
tr CPCT при ограничении
1
α(A + M1KN1 + M2LN2)P(A + M1KN1 + M2LN2)T−
−P +
δ2
1 −αDLDT
L = 0
(8)
относительно матричных переменных 0 ≺P ∈S2n, K ∈Rp×n, L ∈Rn×ℓи скалярного параметра α > 0.
В качестве критерия качества выберем функцию
f(K, L, α) = tr CPCT + χK∥K∥2
F + χL∥L∥2
F ,
(9)
в которой помимо компоненты, определяющей размер ограничивающего эллипсоида по критерию следа, содержатся штрафы за величину матриц регулятора и наблюдателя (при этом коэффициенты χK, χL > 0 регулируют их
важность); в то же время их наличие гарантирует коэрцитивность минимизируемой функции по K и L (см. раздел 4).
З а м е ч а н и е 1. Обратим внимание, что блочная матрица AK,L имеет те
же собственные значения, что и стоящие на ее диагонали матрицы A + BK и
A−LC1. В свою очередь, существование матриц K и L таких, чтобы матрицы
A + BK и A −LC1 были устойчивыми, вытекает из свойств управляемости
и наблюдаемости исходной системы.
В силу замечания 1 заведомо существуют матрицы K0 и L0 такие, что
матрица AK0,L0 шуровская. Матрицы (K, L), обладающие этим свойством,
будем называть стабилизирующей матричной парой.
7


4. Оптимизация функции f(K, L, α)
Итак, исходная задача синтеза динамической обратной связи при помощи
наблюдателя, подавляющей воздействие внешних возмущений на выход zk
системы (1), свелась к задаче минимизации функции f(K, L, α), определяемой соотношением (9), при ограничении
1
αAK,LPAT
K,L −P +
δ2
1 −αDLDT
L = 0
(10)
по переменным P ∈S2n, K ∈Rp×n, L ∈Rn×ℓи скалярному параметру α > 0.
Запись f(K, L, α) подчеркивает, что при заданных K, L и α матрица P находится из уравнения Ляпунова (10); тем самым независимыми переменными
являются K, L и α.
Установленные в [11] свойства функции f(α) = tr CPCT (при некоторой
фиксированной стабилизирующей паре (K, L)), могут быть полностью перенесены на рассматриваемый случай. В частности, функция f(α) определена,
положительна и строго выпукла на интервале ρ2(AK,L) < α < 1, а ее значения
стремятся к бесконечности на концах этого интервала.
Минимизацию функции f(α) можно эффективно осуществлять при помощи метода Ньютона. А именно, зададимся некоторым начальным приближением ρ2(AK,L) < α0 < 1, например α0 =

1 + ρ2(AK,L)

/2 и применим итерационный процесс
αj+1 = αj −f ′(αj)
f ′′(αj).
(11)
При этом согласно [11]
α2 AK,LPAT
K,L
f ′(α) = tr Y

δ2

,
(1 −α)2 DLDT
L −1
α3 AK,L(P −X)AT
K,L
f ′′(α) = 2 tr Y

δ2

,
(1 −α)3 DLDT
L + 1
где P, Y и X – решения дискретных уравнений Ляпунова (10),
1
αAT
K,LY AK,L −Y + CTC = 0
и
1
α2 AK,LPAT
K,L = 0
αAK,LXAT
K,L −X +
δ2
(1 −α)2 DLDT
L −1
соответственно.
Следующая теорема гарантирует глобальную сходимость алгоритма.
Т е о р е м а 2
[11]. В методе (11) справедливы оценки
|αj −α∗| ⩽
f ′′(α0)
2jf ′′(α∗)|α0 −α∗|,
|αj+1 −α∗| ⩽c|αj −α∗|2,
где c > 0 – некоторая константа (она может быть выписана явно).
8


Первая оценка гарантирует глобальную сходимость метода (быстрее, чем
геометрическая прогрессия с коэффициентом 1/2), а вторая – квадратичную
сходимость в окрестности решения.
Перейдем к минимизации функции
f(K, L) .
= min
α f(K, L, α),
предварительно исследовав ее свойства.
Л е м м а 1
[1]. Функция f(K, L) определена и положительна на множестве S стабилизирующих матричных пар.
Множество определения S функции f(K, L) может быть невыпуклым и
несвязным, причем, как и в непрерывном случае, его границы могут быть
негладкими (см. [12]).
Л е м м а 2. Функция f(K, L, α) определена при (K, L) ∈S и для ρ2(AK,L) <
< α < 1. На этом допустимом множестве она дифференцируема, причем
градиент дается выражениями
α2 AK,LPAT
K,L
∇αf(K, L, α) = tr Y

δ2

,
(1 −α)2 DLDT
L −1
αMT
1 Y AK,LPN T
1 + χKK,
(12)
1
2∇Kf(K, L, α) = 1
1
2∇Lf(K, L, α) = 1
αMT
2 Y AK,LPN T
2 −
δ2
1 −α

0 I

Y DLDT
1 + χLL,
(13)
где матрица Y является решением дискретного уравнения Ляпунова
1
αAT
K,LY AK,L −Y + CTC = 0.
(14)
Минимум функции f(K, L, α) достигается во внутренней точке допустимого множества и определяется необходимыми условиями
∇Kf(K, L, α) = 0,
∇Lf(K, L, α) = 0,
∇αf(K, L, α) = 0.
При этом f(K, L, α) как функция от α строго выпукла на ρ2(AK,L) < α < 1
и достигает минимума во внутренней точке этого интервала.
Доказательство этого и последующего утверждений приведены в Приложении.
Далее – для получения простых количественных оценок в лемме 3 – в минимизируемую функцию (9) вводится регуляризующая добавка ε следующим
образом:
f(K, L, α) = tr P(CTC + εI) + χK∥K∥2
F + χL∥L∥2
F →min
K,L,α,
0 < ε ≪1.
Требование необходимости ее введения можно существенно ослабить, но цель
сейчас состоит в получении наиболее простых и наглядных результатов.
9