Автоматика и телемеханика, 2024, № 4
научный журнал
Покупка
Новинка
Тематика:
Автоматика. Телемеханика
Издательство:
Наука
Наименование: Автоматика и телемеханика
Год издания: 2024
Кол-во страниц: 132
Дополнительно
Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Учредители журнала: Отделение энергетики, машиностроения, механики и процессов управления РАН, Институт проблем управления им. В.А. Трапезникова РАН (ИПУ РАН), Институт проблем передачи информации им. А.А. Харкевича РАН (ИППИ РАН) Главный редактор: Галяев А.А. Заместители главного редактора: Соболевский А.Н., Рубинович Е.Я., Хлебников М.В. Ответственный секретарь: Родионов И.В. Редакционный совет: Васильев С.Н., Желтов С.Ю., Каляев И.А., Кулешов А.П., Куржанский А.Б., Мартынюк А.А. (Украина), Пешехонов В.Г., Попков Ю.С., Федосов Е.А., Черноусько Ф.Л. Редакционная коллегия: Алескеров Ф.Т., Бахтадзе Н.Н., Бобцов А.А., Виноградов Д.В., Вишневский В.М., Воронцов К.В., Граничин О.Н., Губко М.В., Каравай М.Ф., Кибзун А.И., Краснова С.А., Красносельский А.М. , Крищенко А.П., Кузнецов Н.В., Кузнецов О.П., Кушнер А.Г., Лазарев А.А., Ляхов А.И., Маликов А.И., Матасов А.И., Меерков С.М. (США), Миллер Б.М., Михальский А.И., Мунасыпов Р.А., Назин А.В., Немировский А.С. (США), Новиков Д.А., Олейников А.Я., Пакшин П.В., Пальчунов Д.Е., Поляков А.Е. (Франция), Рапопорт Л.Б., Рублев И.В., Степанов О.А., Уткин В.И. (США), Фрадков А.Л., Цыбаков А.Б. (Франция), Чеботарев П.Ю., Щербаков П.С. Адрес редакции: 117997, Москва, Профсоюзная ул., 65 Тел./факс: 8 (495) 198-17-20, доб. 1443 Электронная почта: redacsia@ipu.ru Зав. редакцией Е.А. Мартехина Москва «Издательство «Наука» c ⃝Российская академия наук, 2024 c ⃝Редколлегия журнала «Автоматика и телемеханика» (составитель), 2024
Автоматика и телемеханика, №4, 2024 Линейные системы c ⃝2024 г. Д.Н. ИБРАГИМОВ, канд. физ.-мат. наук (rikk.dan@gmail.ru) (Московский авиационный институт (национальный исследовательский университет)) О ВНЕШНЕМ ОЦЕНИВАНИИ ПРЕДЕЛЬНЫХ МНОЖЕСТВ ДОСТИЖИМОСТИ И 0-УПРАВЛЯЕМОСТИ ДЛЯ ЛИНЕЙНЫХ ДИСКРЕТНЫХ СИСТЕМ С СУММАРНЫМ ОГРАНИЧЕНИЕМ НА СКАЛЯРНОЕ УПРАВЛЕНИЕ1 Рассматривается задача построения множеств достижимости и 0-управляемости для стационарных линейных дискретных систем с суммарным ограничением на скалярное управление. Для случая квадратичных ограничений и диагонализируемой матрицы системы данные множества построены явно в виде эллипсоидов. В общем случае предельные множества достижимости и 0-управляемости представлены в виде неподвижных точек сжимающего отображения в метрическом пространстве компактов. На основе метода простой итерации предложена сходящаяся процедура построения их внешних оценок с указанием априорной погрешности аппроксимации. Приведены примеры. Ключевые слова: линейная дискретная система, предельное множество управляемости, предельное множество достижимости, расстояние Хаусдорфа, принцип сжимающих отображений. DOI: 10.31857/S0005231024040018, EDN: ZHAHRC 1. Введение При исследовании динамических систем зачастую приходится учитывать различные ограничения, наложенные на управляющие воздействия, что приводит к тому, что далеко не все терминальные состояния являются достижимыми из заданного начального даже за бесконечное время. В результате классических условий управляемости Калмана оказывается недостаточно, чтобы сделать вывод о достижимости того или иного терминального состояния. В связи с этим представляется актуальной разработка методов, позволяющих формировать конструктивное описание множеств достижимости, т.е. множеств терминальных состояний, в которые можно перевести систему из начала координат, и 0-управляемости, т.е. множеств начальных состояний, из которых систему можно перевести в начало координат, за конечное число шагов, а также оценки предельных множеств достижимости 1 Работа выполнена при поддержке Российского научного фонда (проект №23-21-00293). 3
и 0-управляемости [1]. Множества 0-управляемости и достижимости могут быть использованы в ряде задач оптимального управления для формирования позиционного управления для систем с дискретным временем [2, 3]. Таким образом, при помощи предельных множеств можно судить о разрешимости данных задач в принципе. На данный момент активно развиваются методы оценивания множеств достижимости различных классов дискретных систем [4], гибридных систем [5], а также систем с различными видами неопределенностей [6]. Известны аналитические представления множеств достижимости и 0-управляемости для линейных систем с дискретным временем и ограничениями на функцию управления в смысле l∞-нормы. В частности, доказано, что в случае линейных ограничений на управление множества достижимости и 0-управляемости за конечное число шагов представляют собой многогранники [2]. Для их предельных аналогов сформулированы необходимые и достаточные условия ограниченности [7–9]. При этом большая часть работ либо сфокусирована на исследовании только общих свойств предельных множеств достижимости и 0-управляемости [8–12], либо рассматривает системы с неограниченным управлением [10–14]. Только в ряде частных случаев предложены конструктивные методы формирования внешних оценок на основе аппарата опорных полупространств [15, 16] или принципа максимума [17]. Для систем с суммарными ограничениями на управление получено описание предельных множеств достижимости и 0-управляемости в виде многогранников для случая ограничений в смысле l1-нормы [18]. При выборе lp-нормы с произвольным значением параметра p ∈(1; +∞) сформулированы и доказаны общие свойства предельных множеств достижимости и 0-управляемости [19]. В частности, доказано их представление в виде проекций суперэллипсоидальных множеств конечной [20, 21] и бесконечной размерностей, что тесно связано со строго выпуклым анализом [22, 23], выпуклым программированием [24], теорией нормированных пространств [25] и линейных операторов [26]. Зачастую в задачах управления требуется исследовать заданное начальное состояние на достижимость и управляемость, что сводится к проверке принадлежности фиксированной точки фазового пространства предельному множеству достижимости или 0-управляемости. Численно данная процедура может быть сведена к вычислению функционала Минковского, но известных результатов [19] недостаточно для его построения в явном виде. Более того, описание функционала Минковского образа выпуклого множества при линейном преобразовании в общем случае является нетривиальной задачей. По этой причине оказывается актуальной разработка методов, реализуемых программно, которые позволят вычислить точно функционал Минковского предельных множеств достижимости и 0-управляемости либо их внешних оценок сколь угодно высокого порядка точности. 4
В статье изучаются вопросы построения функционала Минковского множеств достижимости и 0-управляемости с суммарным ограничением на управление в смысле lp-нормы в случае, когда они ограничены. Удается в явном виде описать искомую функцию при квадратичных ограничениях на управление и доказать, что исследуемые множества представляют собой эллипсоиды. Для случая произвольных нормированных пространств предельные множества достижимости и 0-управляемости описываются в качестве неподвижной точки сжимающего отображения в пространстве компактов, наделенного метрикой Хаусдорфа. Это позволяет предложить сходящийся итерационный процесс построения внешних оценок данных множеств с указанием априорной погрешности в явном виде. Для ряда значений параметров результирующие оценки имеют полиэдральную структуру, что делает возможным их применение в расчетах на ЭВМ. Содержание статьи следующее. В разделе 2 производится постановка задачи. В разделе 3 обсуждаются вопросы вычисления функционала Минковского предельных множеств достижимости и 0-управляемости. Для частного случая l2-ограничений на управление и диагонализируемой матрицы системы соответствующие множества строятся в явном виде. В разделе 4 описывается аппарат сжимающих отображений, используемый для построения предельных множеств достижимости и 0-управляемости. В разделе 5 предлагается метод формирования внешних оценок данных множеств произвольного порядка точности на основе метода простой итерации. В разделе 6 демонстрируется эффективность разработанного математического аппарата на различных примерах. 2. Постановка задачи Рассматривается линейная система с дискретным временем и суммарным ограничением на скалярное управление: x(k + 1) = Ax(k) + bu(k), k ∈N ∪{0}, x(0) = x0, k=0 |u(k)|p ⩽1, (1) ∞ где x(k) ∈Rn – вектор состояния системы, u(k) ∈R – скалярное управляющее воздействие, A ∈Rn×n, b ∈Rn – матрицы системы, p > 1 – параметр, определяющий тип суммарного ограничения на управление. Обозначим для произвольного N ∈N ∪{0} через Yp(N) множество достижимости системы (1), т.е. множество тех состояний, в которые можно перевести систему (1) за N шагов из 0 посредством выбора допустимого управления: x ∈Rn: x = , N ∈N, (2) k=0 AN−k−1bu(k), k=0 |u(k)|p ⩽1 Yp(N) = N−1 N−1 ⎧ ⎪ ⎪ ⎨ {0}, N = 0. 5 ⎪ ⎪ ⎩
Через Yp,∞обозначим предельное множество достижимости системы (1), т.е. множество тех состояний, в которые систему (1) можно перевести за конечное число шагов посредством допустимого управления: Yp,∞= N=0 Yp(N). (3) ∞ Обозначим для произвольного N ∈N ∪{0} через Xp(N) множество 0-управляемости системы (1), т.е. множество тех начальных состояний, из которых можно перевести систему (1) за N шагов в 0 посредством выбора допустимого управления: Xp(N) = (4) , N ∈N, = x0 ∈Rn : −ANx0 = k=0 AN−k−1bu(k), k=0 |u(k)|p ⩽1 N−1 N−1 ⎧ ⎪ ⎪ ⎨ {0}, N = 0. ⎪ ⎪ ⎩ Через Xp,∞обозначим предельное множество 0-управляемости системы (1), т.е. множество тех начальных состояний, из которых систему (1) можно перевести в 0 за конечное число шагов посредством допустимого управления: Xp,∞= N=0 Xp(N). (5) ∞ Требуется разработать эффективный метод построения внешней оценки множеств (3) и (5) с любой наперед заданной точностью. В качестве критерия точности рассматривается расстояние Хаусдорфа ρH, а все множества предполагаются элементами полного метрического пространства (Kn, ρH) [27]: Kn = {X ⊂Rn: X – компакт}, , ρH(X, Y) = max sup x∈X inf y∈Y ∥x −y∥r; sup y∈Y inf x∈X ∥x −y∥r r , r ⩾1, i=1 |xi|r 1 ∥x∥r = n ⎧ ⎪ ⎪ ⎪ ⎨ max i=1,n |xi|, r = ∞. ⎪ ⎪ ⎪ ⎩ 3. Вопросы точного описания предельных множеств достижимости и 0-управляемости Обозначим через Ep(∞) шар единичного радиуса с центром в 0 в нормированном пространстве lp [25]: . u ∈lp : Ep(∞) = k=1 |uk|p ⩽1 ∞ 6
Также будем отождествлять последовательность B = (b1, b2, . . .) ∈ln q с линейным оператором B : lp →Rn r , действующим по правилу Bu = k=1 ukbk. ∞ Здесь предполагается, что числа p и q связаны соотношением 1 p + 1 q = 1, а пространство Rn r является нормированным пространством (Rn, ∥· ∥r). Отсюда с учетом теоремы Рисса [25] следует ограниченность оператора B, что позволяет рассматривать его как элемент нормированного пространства ln q с определенной на нем операторной нормой: ∥B∥ln q = sup u∈Ep(∞) ∥Bu∥r. Для простоты будем также отождествлять произвольную последовательность y ∈lq с порожденным ею согласно теореме Рисса линейным и ограниченным функционалом y: lp →R: (y, u) = k=1 ykuk. ∞ Существенными являются необходимые и достаточные условия ограниченности множеств (3) и (5), определяемые матрицами системы A и b. Жордановым базисом матрицы A называется набор линейно независимых векторов h1, . . . , hn ⊂Rn, который задает преобразование подобия матрицы A к ее вещественной жордановой канонической форме [28, раздел 3.4 гл. 3]. Такой базис единственен с точностью до ненулевых сомножителей и порядка векторов h1, . . . , hn, и каждый базисный вектор соответствует некоторой жордановой клетке, т.е. некоторому собственному значению матрицы A. Если разбить элементы жорданова базиса на три множества по критерию того, соответствуют ли они собственному значению матрицы A большему, равному или меньшему 1 по модулю, то получится определить следующие три инвариантных подпространства: L<1 = Lin{hi : hi соответствует собственному значению λ, |λ| < 1}, L=1 = Lin{hi : hi соответствует собственному значению λ, |λ| = 1}, L>1 = Lin{hi : hi соответствует собственному значению λ, |λ| > 1}. В [19] продемонстрировано, что Yp,∞и Xp,∞ограничены тогда и только тогда, когда справедливы следующие условия соответственно: Y∞= (b, Ab, A2b, . . .) ∈ln q или b ∈L<1, (6) X∞= (A−1b, A−2b, . . .) ∈ln q или b ∈L>1. (7) 7
В этих случаях справедливы представления: Yp,∞= Y∞Ep(∞) ∈Kn, (8) X p,∞= X∞Ep(∞) ∈Kn. (9) Согласно (8) и (9) предельные множества Yp,∞, Xp,∞представляют собой выпуклые множества, а следовательно, для их конструктивного описания посредством алгебраических неравенств может быть использован функционал Минковского [25, разд. 3, §2, гл. III]: μ(u, U) = inf{t > 0: u ∈tU}. Продемонстрируем сложность вычисления функционала Минковского множеств (3) и (5) для произвольного значения параметра p, а также приведем частный случай, когда данное описание удается построить. Л е м м а 1. Пусть L1, L2 – нормированные пространства, U ⊂L1 – выпуклое и ограниченное множество, 0 ∈int U, B : L1 →L2 – линейный, сюръективный и ограниченный оператор. Тогда μ(x, BU) = inf u∈B−1({x}) μ(u, U). Доказательство леммы 1 и всех последующих утверждений приведено в Приложении. Получим следствия леммы 1, полагая L1 = lp, L2 = Rn, U = Ep(∞). Выбор нормы в пространстве Rn несущественен, так как значение функционала Минковского не зависит от нормы, а в силу эквивалентности всех норм в конечномерном пространстве [25] оператор B будет ограничен для любой нормы в Rn. Но для краткости обозначений будем полагать Rn евклидовым со скалярным произведением, определяемым соотношением (x, y) = xTy = i=1 xiyi. n Введем нелинейный оператор Ip(u): lp →lq по формуле Ip(u) = sign(u1)|u1|p−1, sign(u2)|u2|p−1, . . . . Обратным оператором к Ip является оператор Iq. Через B∗: Rn →lq обозначим оператор, сопряженный к B. Л е м м а 2. Пусть B ∈ln q – сюръекция. Тогда для любого x ∈Rn верно, что μ(x, BEp(∞)) = ∥B∗λ∥q−1 lq , где λ ∈Rn удовлетворяет условию BIq(B∗λ) = x. (10) 8
Согласно лемме 2 и представлениям (8) и (9) вычисление функционала Минковского для предельных множеств достижимости и управляемости может быть сведено к решению системы нелинейных уравнений вида (10) при выборе в качестве B операторов Y∞и X∞соответственно, что является нетривиальной задачей в общем случае. Хотя при значении параметров p = q = 2 решение системы можно получить в явном виде. С л е д с т в и е 1. Пусть p = q = 2, B ∈ln q – сюръекция. Тогда для любого x ∈Rn верно, что xT(BB∗)−1x. μ(x, BE2(∞)) = Применение следствия 1 для построения Y2,∞и X2,∞определяется возможностью построить явно матрицу BB∗∈Rn×n, что согласно определению оператора B сводится к вычислению сходящегося ряда: BB∗= k=1 bkbT k , ∞ где B полагается равным Y∞или X∞. Л е м м а 3. Пусть A ∈Rn×n обладает n линейно независимыми собственными векторами h1, . . . , hn ∈Cn, соответствующими собственным значениям λ1, . . . , λn ∈C, Λ = diag (λ1, . . . , λn), S = (h1, . . . , hn) ∈Cn×n. Использованы следующие обозначения: H = S ⎞ ⎛ β11 . . . β1n . . . ... . . . βn1 . . . βnn ⎟ ⎠ST, ⎜ ⎝ αij ⎞ ⎛ 1 −λiλj , λiλj ̸= 1, 0, λiλj = 1. ⎧ ⎨ α11 . . . α1n . . . ... . . . αn1 . . . αnn ⎟ ⎠= S−1bbT(S−1)T, βij = ⎜ ⎝ ⎩ Тогда 1) в случае b ∈L<1 верно представление Y2,∞= {x ∈Rn : xTHY,∞x ⩽1}, где HY,∞= H−1; 2) в случае b ∈L>1 и det A ̸= 0 верно представление X 2,∞= x ∈Rn : xTHX,∞x ⩽1 , где H−1 X,∞= −H−1. 9