Применение метода продолжения решения по параметру для управления с линеаризацей обратной связью и идентификации нелинейных систем
Бесплатно
Основная коллекция
Тематика:
Прикладная математика
Издательство:
НИЦ ИНФРА-М
Автор:
Борисевич Алексей Валерьевич
Год издания: 2014
Кол-во страниц: 14
Дополнительно
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Магистратура
- 01.04.02: Прикладная математика и информатика
- 01.04.03: Механика и математическое моделирование
- 01.04.04: Прикладная математика
- 02.04.01: Математика и компьютерные науки
- 15.04.04: Автоматизация технологических процессов и производств
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Применение метода продолжения решения по параметру для управления с линеаризацей обратной связью и идентификации нелинейных систем Борисевич Алексей* Аннотация В статье дается обзор применения метода продолжения решения по параметру для управления и идентификации параметров нелинейных систем. Рассмотрены случаи как аффинных по управлению систем, так и нелинейных систем общего вида. Задача идентификации параметров также представлены в двух вариантах: с линейной и нелинейной невыпуклой параметризацией. Даны иллюстративные примеры моделирования управления в MATLAB. Введение Теория нелинейных систем является областью активных исследований, в которой существуют как устоявшиеся парадигмы, так и множество открытых очень важных и трудных вопросов. Если задачи анализа (устойчивости, чувствительности к вариации параметров) могут быть решены на достаточном для практического применения уровне, в том числе благодаря средствам имитационного моделирования (MATLAB, Ansys), то задачи синтеза регуляторов для нелинейных систем являются по-прежнему "горячей точкой"теории управления. В настоящей работе мы будем отталкиваться от метода линеаризации по обратной связи [1]. Данный метод привлекателен тем, что позволяет реализовывать регуляторы для нелинейных систем также просто, как и для линейных. Поиск линеаризующего преобразования основан на аналитическом дифференцировании уравнений состояния объекта управления и может быть легко выполнен автоматически [2]. С точки зрения практического применения, класс объектов, которые пригодны для управления с линеаризацией по обратной связи, существенно уже чем, например, для метода функции Ляпунова или скользящего управления. Основная трудность состоит в обязательном требовании постоянства порядка уравнений модели, известном как постоянство относительной степени каждого выхода. При плохо определенной относительной степени линеаризирующее преобразование координат имеет сигнулярности в компактных областях фазового пространства и управляющее воздействие становится разрывным. 1Санкт-Петербургский государственный политехнический университет, ул. Политехническая 29, Санкт-Петербург, 195251, Россия, alex.borysevych@spbstu.ru 1
В настоящей работе дается обзор нового подхода для управления нелинейными системами, который сочетает в себе концептуальную простоту методов линеаризации по обратной связи и, вместе с тем, расширяет область их применимости на нерегулярные системы с плохо определенной относительной степенью. Описываемый ниже подход основан на методе численного продолжения по параметру для решения систем нелинейных уравнений [3], который состоит в параметризованном комбинировании исходной задачи и некоторой очень простой с известным решением. Статья состоит из нескольких частей. В первой части дается определение основных понятий: моделей объекта управления, решаемых задач управления и методов. Вторая часть посвящена решению следующих задач: регулирования выхода и идентификации параметров в реальном времени (онлайн). После описания метода решения каждой задачи дается простой пример, охватывающий тот или иной метод. Материал статьи базируется на предыдущих работах автора [4, 5], но при этом все описанные ниже методы являются новыми и не опубликованными ранее. Также мы опускаем известные сведения о линеаризации обратной связью и методах продолжения решения по параметру, которые используются в настоящей работе. Заинтересованный читатель может обратиться к источникам [1] и [3]. 1 Предварительные сведения 1.1 Объект управления В настоящей работе рассматриваются многомерные системы управления с 𝑚 входами и 𝑚 выходами, реализованные в пространстве состояний размерности 𝑛: ˙𝑥 = 𝑓(𝑥, 𝑢), 𝑦 = ℎ(𝑥) (1) где 𝑥 ∈ 𝑋 ⊆ R𝑛, 𝑦 ∈ 𝑌 ⊆ R𝑚, 𝑢 ∈ 𝑈 ⊆ R𝑚, отображения 𝑓 : R𝑛 × R𝑚 → R𝑛, ℎ : R𝑛 → R𝑚 – гладкие векторные поля 𝑓, ℎ ∈ 𝐶∞. Функции 𝑓(.) и ℎ(.) считаем ограниченными на 𝑋. Одним из вариантов (1) является объект управления в аффинной форме ˙𝑥 = 𝑓(𝑥) + 𝑚 ∑︁ 𝑖=1 𝑔𝑖(𝑥)𝑢𝑖, 𝑦 = ℎ(𝑥) (2) где функции 𝑔𝑖 : R𝑛 → R𝑛 являются гладкими ограниченными на 𝑋 векторными полями. Также для задач адаптивного управления и идентификации параметров рассматриваются следующие объекты управления с параметрической неопределенностью ˙𝑥 = 𝑓(𝑥, 𝜃, 𝑢), 𝑦 = ℎ(𝑥, 𝜃) (3) ˙𝑥 = 𝑓(𝑥, 𝜃) + 𝑚 ∑︁ 𝑖=1 𝑔𝑖(𝑥, 𝜃)𝑢𝑖, 𝑦 = ℎ(𝑥, 𝜃) (4) где 𝜃 ∈ Θ ⊆ R𝑛 – неизвестный постоянный параметр, недоступный для измерения или наблюдения. 2
1.2 Задачи управления В настоящей работе рассматриваются следующие задачи управления нелинейными объектами вида (1) или (2): ∙ Стабилизация выхода объекта управления (2) в аффинной форме. ∙ Идентификация параметров нелинейного объекта (3) общего вида по выходной реакции в реальном времени (он-лайн). Дадим формальные определения задач, рассматриваемых в настоящей работе: Определение 1. Задача стабилизации или установки постоянного значения на выходе (setpoing tracking) – синтез такого закона управления 𝑢(𝑡) = 𝑢(𝑥), который асимптотически переводит выход 𝑦 объекта управления (1) в состояние ¯𝑦 = const: lim𝑡→∞ 𝑦(𝑡) = ¯𝑦. В частном случае, при ¯𝑦 = 0 управление называется обнулением выхода (output-zeroing problem). □ Без потери общности, всюду далее будем считать, что ¯𝑦 = 0 и целью решаемой задачи стабилизации является обнуление выхода. Определение 2. Задача идентификации неизвестного параметра ˆ𝜃 объекта управления в реальном времени (on-line parameter identification) состоит в том, чтобы найти алгоритм адаптации ˆ𝜃(𝑡), который бы минимизировать разность 𝑦*(𝑡)−𝑦(𝑡) между измеренной реакцией 𝑦*(𝑡) объекта управления на воздействие 𝑢(𝑡) и реакцией на это же воздействие модели объекта управления вида (3). □ Заметим, что он-лайн идентификация параметров является центральным звеном отдельного вида адаптивного управления – адаптивного управления с идентификацией параметров (Model Identification Adaptive Controllers, MIAC) [6]. 2 Основной результат 2.1 Стабилизация аффинных по управлению систем Сопоставим с (2) линейный объект управления с 𝑚-мерным вектором входов 𝑢, 𝑛-мерным вектором состояний 𝑧, 𝑚-мерным вектором выходов 𝜂 и с такой же относительной степенью каждого выхода 𝜂𝑖, как и для выхода 𝑦𝑖 системы (2), равной 𝑟𝑖: ˙𝑧 = 𝐴𝑧 + 𝐵𝑢, 𝜂 = 𝐶𝑧, 𝑑(𝑟𝑖) 𝑑𝑡(𝑟𝑖)𝜂 = 𝑢𝑖. (5) Теперь можно объединить динамику выходов (2) и (5) 𝐻 = (1 − 𝜆) · 𝜂 + 𝜆 · 𝑦 = 0. (6) где 𝜆 ∈ [0, 1] – зависящий от времени параметр, значение которого определяет относительный вклад выхода 𝜂 или 𝑦 в 𝐻. По определению относительной степени выхода 𝐻𝑖 в (6), выход должен быть продифференцирован по времени 𝑟𝑖 раз, пока он не станет явной функцией от входа 𝑢. Получаем после дифференцирования: 3
𝐻(𝑟𝑖) 𝑖 = − 𝑟𝑖−1 ∑︁ 𝑘=1 𝐶𝑘 𝑟𝑖𝜂(𝑟𝑖−𝑘) 𝑖 𝜆(𝑘) + (1 − 𝜆)𝑢𝑖 + (𝑦𝑖 − 𝜂𝑖)𝜆(𝑟𝑖) + 𝑟𝑖−1 ∑︁ 𝑘=1 𝐶𝑘 𝑟𝑖𝑦(𝑟𝑖−𝑘) 𝑖 𝜆(𝑘)+ +𝜆 (︃ ℒ𝑟𝑖 𝑓 ℎ𝑖 + 𝑚 ∑︁ 𝑘=1 ℒ𝑔𝑘ℒ𝑟𝑖−1 𝑓 ℎ𝑖 · 𝑢𝑘 )︃ = 0, (7) где 𝐶𝑘 𝑛 – биномиальные коэффициенты. Сделаем следующие обозначения Λ𝑖 = (𝜆, ˙𝜆, ¨𝜆, ..., 𝜆(𝑟𝑖−1)) 𝒜𝑖,1(𝑥, 𝑧, Λ𝑖) = (︀ 𝜆ℒ𝑔𝑘ℒ𝑟𝑖−1 𝑓 ℎ𝑖 )︀𝑇 + (1 − 𝜆) · 𝛿𝑘 𝒜𝑖,2(𝑥, 𝑧) = 𝑦𝑖 − 𝜂𝑖 ℬ𝑖(𝑥, 𝑧, Λ𝑖) = − 𝑟𝑖−1 ∑︁ 𝑘=1 𝐶𝑘 𝑟𝑖𝜂(𝑟𝑖−𝑘) 𝑖 𝜆(𝑘) + 𝑟𝑖−1 ∑︁ 𝑘=1 𝐶𝑘 𝑟𝑖𝑦(𝑟𝑖−𝑘) 𝑖 𝜆(𝑘) + 𝜆ℒ𝑟𝑖 𝑓 ℎ𝑖 (8) где 𝛿𝑘 – вектор размерности 𝑚, все компоненты которого равны 0 кроме 𝑘-го. С введенными в (8) обозначениями уравнение (7) можно записать следующим образом: 𝐻(𝑟𝑖) 𝑖 = 𝒜𝑖,1(𝑥, 𝑧, Λ𝑖) · 𝑢 + 𝒜𝑖,2(𝑥, 𝑧) · 𝜆(𝑟𝑖) + ℬ𝑖(𝑥, 𝑧, Λ𝑖), (9) Рассматривая все компоненты 𝐻𝑖 после дифференцирования в соответствии с их относительными степенями 𝑟𝑖, возможно написать алгебраическое условие (9) в векторной форме: 𝐻(𝑟) = 𝒜1(𝑥, 𝑧, Λ) · 𝑢 + 𝒜2(𝑥, 𝑧) · 𝜆(𝑟𝑚𝑎𝑥) + ℬ(𝑥, 𝑧, Λ) = 𝒜(𝑥, 𝑧, Λ) · (︂ 𝑢 𝜆(𝑟𝑚𝑎𝑥) )︂ + ℬ(𝑥, 𝑧, Λ) (10) где 𝑟𝑚𝑎𝑥 = max{𝑟𝑖}, Λ = (𝜆, ˙𝜆, ¨𝜆, ..., 𝜆(𝑟𝑚𝑎𝑥−1)). Теперь мы может сформулировать следующую теорему, которая является главным конструктивным результатом настоящего параграфа Теорема 1. Пусть rank 𝒜(𝑥, 𝑧, Λ) = 𝑚, (11) тогда для следующей обратной связи и внешнего входа управления 𝑣 (︂ 𝑢 𝜆(𝑟𝑚𝑎𝑥) )︂ = 𝛼 · 𝜏(𝒜) + 𝒜+(𝑣 − ℬ), (12) где вектор 𝜏 = 𝜏(𝒜) вычисляется таким образом, чтобы удовлетворять соотношениям 𝒜 · 𝜏 = 0, ‖𝜏‖2 = 1, det (︂𝒜 𝜏 𝑇 )︂ > 0 (13) 4
𝛼 = const ∈ R+, 𝑧(0) = 0, Λ(0) = 0 следующее может быть сформулировано: 0. Существует гладкая траектория (𝑢(𝑡), 𝜆(𝑡)), определяемая (12), которая выходит из точки (𝑢(0), 0). 1. Система (10) трансформируется обратной связью (12) в линейную 𝐻(𝑟) = 𝑣 (14) 2. Кривая (𝑢(𝑡), 𝜆(𝑡)) либо проходит через точку 𝜆 = 1 либо диффеоморфна окружности. Доказательство. Полное доказательство опущено. Утверждение 0 доказывается явным выражением вектора 𝜏(𝒜) для 𝑡 = 0. Утверждение 1 тривиально после подстановки (12) в (10). Утверждение 2 аргументируется также как аналогичное утверждение о кривой решения метода продолжения по параметру для нелинейных уравнений [3]. Замечание 1. В результате применения обратной связи (12) система с выходом (6) трансформируется в линейную (14), к которой могут быть применены известные методы управления для линейных систем (модальное управление, линейный квадратичный регулятор, и т.д.). Внешняя линейная обратная связь по выходу позволяет компенсировать неопределенность модели и является необходимым элементом практической реализации регулятора. Замечание 2. Из теоремы 7 следует, что параметр 𝛼 является отдельной степенью свободы для настройки регулятора. Чем больше его значение, тем быстрее параметр 𝜆(𝑡) сходится к конечному значению 𝜆* = 1 и, как следствие, уменьшается время регулирования. Однако, при этом численное интегрированное становится все более плохо обусловленным, а управляющие воздействия возрастают по амплитуде. При значении параметра 𝛼 меньше некоторого критического 𝛼𝑚𝑖𝑛 наблюдается сходимость 𝜆 к значению 𝜆* < 1, что недопустимо. Точная характеризация этого явления, как и оценка 𝛼𝑚𝑖𝑛, является предметом дальнейших исследований. Замечание 3. В ряде случаев, желательно варьировать скорость сходимости 𝜆(𝑡) к конечному значению параметра 𝜆* = 1 для регулирования времени переходных процессов. Введем скалярный коэффициент 𝛾 > 0, с помощью которого возможно изменение скорости изменения 𝜆(𝑡). Если 𝛾 > 1, то 𝜆(𝑡) достигает значения 𝜆* = 1 быстрее чем по сравнению с (12). В противном случае, при 𝛾 < 1 – медленнее. Модифицируем (12) следующим образом (︂ 𝑢 𝜆(𝑟𝑚𝑎𝑥) )︂ = 𝛼 · 𝛾 · 𝜏(𝒜) + 𝑄(𝒜 · 𝑄)+(𝑣 − ℬ), (15) где 𝑄 = 𝑑𝑖𝑎𝑔(1, ...1, 𝛾) – квадратная диагональная матрица, последний элемент диагонали которой равен 𝛾. Уравнение (15) получено из (12) масштабированием вектора 𝜏 и применению вместо 𝐴+ взвешенной по матрице 𝑄 псевдоинверсии. Замечание 4. Отдельного внимания требует случай 𝑟𝑖 > 1 для относительной степени выхода 𝐻. Выполнение условия 𝐻(𝑟) = 0 при 𝑟𝑖 > 1 в общем случае не влечет за собой 𝐻 = 0. Например, если ¨𝐻(𝑡) = 0 для интервала времени 𝑡 ∈ [0, 𝑇], но при этом может оказаться что изначально ˙𝐻(0) = ℎ0 ̸= 0, тогда для всего интервала времени получается ˙𝐻(𝑡) = ℎ0 и 𝐻(𝑡) = ℎ0 · 𝑡 ̸= 0. 5
В случае SISO системы с помощью выбора начальных условий для 𝜆(𝑖)(0) возможно добиться 𝐻(𝑖)(0) = 0. Для MIMO системы, в общем случае при 𝑟𝑖 > 1, подбор 𝜆(𝑖)(0) может дать только минимизацию 𝐻(𝑖) 𝑘 . Отсюда, необходимым при 𝑟𝑖 > 1 является применение внешней линейной обратной связи для регулирования 𝐻 к 0. Замечание 5. Условие (11) является стандартным допущением при использовании методов продолжения по параметру, которое соответствует требованию отсутствия точек бифуркций на траектории (𝑢(𝑡), 𝜆(𝑡)). Следует заметить, что при этом допускается существование предельных точек, в которых 𝒜1 /∈ im 𝒜2. Это важное отличие от метода линаризации обратной связью, поскольку при существовании в фазовом пространстве 𝑋 × 𝑍 точек где rank 𝒜1(𝑥, 𝑧, Λ) < 𝑚 система с выходом (6) не может быть трансформирована в линейную известными методами. Замечание 6. Условие (11) может быть ослаблено, однако это не рассматривается далее. В действительности, предложенный метод может быть применен при существовании на (𝑢(𝑡), 𝜆(𝑡)) простых точек бифуркации, где dim ker 𝒜 = 2. Этот факт является известным из теории методов продолжения по параметру при их реализации с помощью схемы предиктора-корректора (более детальный анализ привден в [3]). В общем случае, преодоление точек бифуркации где 𝒜1 ∈ im 𝒜2 возможно с помощью известных подходов, применяемых в методах продолжения по параметру (например, используя декомпозицию Ляпунова-Шмидта [3]). Замечание 7. Теорема может быть применена к неаффинным системам вида (1). Заметим, что (1) может быть преобразована к аффинному виду (2) с помощью интегрирования входов: ˙𝑥 = 𝑓(𝑥, 𝑥𝑢), ˙𝑥𝑢 = 𝑢, 𝑦 = ℎ(𝑥) (16) В результате получается новый вектор состояний (𝑥, 𝑥𝑢) и относительная степень каждого выхода увеличивается на единицу. Замечание 8. Обозначив 𝑦0 = ℎ(𝑥0), можно записать следующий частный случай (6): 𝐻 = 𝑦 + 𝑦0𝜆 − 𝑦0 = 0 (17) Преимуществом (17) по сравнению с (6) является отсутствие необходимости в системе (5) и линейность 𝐻 относительно переменных 𝑦 и 𝜆. 2.2 Иллюстративный пример управления аффинной нелинейной системой Рассмотрим следующий абстрактный пример MIMO системы, в которой изменяется относительная степень выхода: ˙𝑥1 = 𝑢1 + 𝑥3 2 ˙𝑥2 = 𝑢2 + 𝑥3 1 𝑦1 = 𝑥3 1 − 𝑥1 + 1 𝑦2 = 𝑥4 2 cos(2𝑥2) (18) с начальными состояниями 𝑥(0) = (1, 1)𝑇. Необходимо обеспечить стабилизацию системы с обнулением выхода 𝑦 → 0. 6
Дифференцируя выходы, получаем ˙𝑦1 = (︀ 3𝑥2 1 − 1 )︀ · (𝑢1 + 𝑥3 2) = 𝑎11𝑢1 + 𝑏1 ˙𝑦2 = (︀ 4𝑥3 2 cos(2𝑥2) − 2𝑥4 2 sin(2𝑥2) )︀ · (𝑢2 + 𝑥3 1) = 𝑎22𝑢2 + 𝑏2 (19) Очевидно, что система на интервале 𝑥 ∈ [0, 1]2 не может быть линеаризована обратной связью, поскольку существуют 𝑥* такие, что 𝑎11(𝑥*) = 0 или 𝑎22(𝑥*) = 0. Сопоставим с системой (18) линейный объект в виде ˙𝜂1 = 𝑢1, ˙𝜂2 = 𝑢2 (20) с начальными условиями 𝜂(0) = (0, 0)𝑇 В соответствии с уравнением (7) получаем следующие матрицы для представления ˙𝐻 и обратной связи (12) 𝒜1 = 𝜆 (︂𝑎11 0 0 𝑎22 )︂ + (1 − 𝜆)𝐸, 𝒜2 = 𝑦 − 𝜂, ℬ = 𝜆 (︂𝑏1 𝑏2 )︂ (21) Для моделирования робастности добавим к выходу 𝑦 аддитивное возмущение вида ∆𝑦 = (1, sin(20𝑡))𝑇. Внешний контур регулирования реализован как пропорциональный регулятор с коэффициентом 100. Значение параметра 𝛼 выбрано 𝛼 = 20. Модель системы управления была реализована в среде MATLAB/Simulink. Результаты моделирования представлены на рисунках 1-3. Рисунок 1. Динамика выходов 𝑦(𝑡). 7
Рисунок 2. Входные воздействия 𝑢(𝑡). Рисунок 3. Динамика параметра 𝜆. 2.3 Идентификация нелинейно параметризованных неопределенностей Пусть дана следующая нелинейная система, неопределенности которой параметризованы вектором 𝜃 ˙𝑥 = 𝑓(𝑥, 𝑢, 𝜃) (22) с начальными условиями 𝑥(0) = 𝑥0, известным управляющим воздействием 𝑢(𝑡) и измеряемым состоянием 𝑥. Для системы (22) известна модель, в которой используется оценка параметра ˆ𝜃 вместо истинного значения 𝜃: ˙ˆ𝑥 = 𝑓(ˆ𝑥, 𝑢, ˆ𝜃) (23) Предлагается следующая простая идея: периодически в дискретные моменты времени 𝑡𝑖 производится перезапуск интегрирования (23), причем в качестве начального состояния берется состояние идентифицируемого объекта ˆ𝑥(𝑡𝑖) := 𝑥(𝑡𝑖). Отсюда получается, что на интервале времени 𝑡 ∈ [𝑡𝑖, 𝑡𝑖+1) состояние ˆ𝑥(𝑡) задается интегралом: 8
ˆ𝑥(𝑡) = ∫︁ 𝑡 𝑡𝑖 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏, ˆ𝑥(𝑡𝑖) = 𝑥(𝑡𝑖) (24) На момент 𝑡𝑖+1 перед очередным перезапуском интегрирования (23) возможно определить следующий сигнал ошибки 𝑒(ˆ𝜃, 𝑡𝑖) = ∫︁ 𝑡𝑖+1 𝑡𝑖 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏 − 𝑥(𝑡𝑖+1) (25) Функция 𝑒(ˆ𝜃, 𝑡𝑖) задана в дискретные моменты времени 𝑡𝑖 и подлежит минимизации 𝑒(ˆ𝜃, 𝑡𝑖) → 0 для 𝑡𝑖 → ∞. Рассмотрим непрерывный аналог (25) для того, чтобы понять свойства задачи минимизации 𝑒(ˆ𝜃, 𝑡𝑖). В пределе при 𝑡𝑖 → 𝑡𝑖+1, можно записать ошибку идентификации как 𝑒(ˆ𝜃, 𝑡𝑖) → ¯𝑒(ˆ𝜃, 𝑡) = 𝑓(𝑥(𝑡), 𝑢(𝑡), ˆ𝜃) − 𝑓(𝑥(𝑡), 𝑢(𝑡), 𝜃) (26) Следует отметить несколько особенностей задачи поиска корня уравнения ¯𝑒(ˆ𝜃, 𝑡) = 0: - эта задача нестационарная, т.е. в общем случае ¯𝑒(ˆ𝜃, 𝑡1) ̸= ¯𝑒(ˆ𝜃, 𝑡2) для 𝑡1 ̸= 𝑡2, - положение решения 𝜃 стационарно, т.е. при ˆ𝜃 = 𝜃 выполняется ¯𝑒(𝜃, 𝑡) = 0 для любых 𝑡. Задача обнуления 𝑒(ˆ𝜃, 𝑡) → 0 может быть решена известным способом на основе линеаризации по обратной связи (метода Ньютона). Продифференцировав 𝑒(ˆ𝜃, 𝑡) по времени, получаем ˙¯𝑒 = 𝜕¯𝑒 𝜕ˆ𝜃 · ˙ˆ𝜃 + 𝜕¯𝑒 𝜕𝑡 = 𝜕𝑓 𝜕ˆ𝜃 · ˙ˆ𝜃 + 𝜕¯𝑒 𝜕𝑡 (27) Предполагая, что rank 𝜕𝑓 𝜕ˆ𝜃 = 𝑛, можно определить следующую динамику оценки параметра ˆ𝜃: ˙ˆ𝜃 = (︂𝜕𝑓 𝜕ˆ𝜃 )︂−1 · 𝑣 = − (︂𝜕𝑓 𝜕ˆ𝜃 )︂−1 · 𝑘¯𝑒 (28) где 𝑘 > 0 – коэффициент обратной связи. Подставляя (28) в (27) получаем линеаризованную динамику ˙¯𝑒 = −𝑘 · ¯𝑒 + 𝜕¯𝑒 𝜕𝑡 = −𝑘 · ¯𝑒 + ∆ (29) Теорема 2. Если rank 𝜕𝑓 𝜕ˆ𝜃 = 𝑛 (30) и |∆𝑖| < ∞ (31) то всегда возможно выбрать такой вектор 𝑘 > 0 в (28), чтобы окрестность точки ˆ𝜃 = 𝜃 была глобально асимптотически устойчива и достигалась сходимость ¯𝑒 → 𝜖 для любых ˆ𝜃(0). 9
Доказательство. Ход доказательства может быть описан следующим образом. Поскольку каждый компонент вектора ∆ = 𝜕¯𝑒/𝜕𝑡 ограничен, то всегда можно выбрать такое 𝑘 > 0, что в некоторой области 𝒪 возмущение ∆ не влияет на характер сходимости ¯𝑒. Далее анализ производится в области дополнения ¯𝒪 множества 𝒪, которое может рассматриваться как окрестность точки ˆ𝜃 = 𝜃. Разложив ¯𝑒 в окрестности ˆ𝜃 можно показать, что ˆ𝜃 = 𝜃 является локально устойчивой. 2.4 Продолжение по параметру для идентификации нелинейно параметризованных неопределенностей Описанное в (2.3) составляет базис и основную идею метода идентификации. Однако, перед тем как сформулировать практический алгоритм адаптации с продолжением по параметру необходимо проработать следующие аспекты: - дискретизация закона адаптации (28) для использования сигнала ошибки 𝑒(ˆ𝜃, 𝑡𝑖) из (25), - вычисление частной производной 𝜕𝑒/𝜕ˆ𝜃 для дискретного случая, - ослабление требования (30) – собственно применение методологии продолжения по параметру. Обозначим частную производную 𝜕𝑒/𝜕ˆ𝜃 функции 𝑒(ˆ𝜃, 𝑡𝑖), взятую в момент времени 𝑡𝑖 𝐷^𝜃𝑒(ˆ𝜃, 𝑡𝑖) = 𝜕𝑒(ˆ𝜃, 𝑡𝑖) 𝜕ˆ𝜃 (32) Из (25) можно записать 𝐷^𝜃𝑒(ˆ𝜃, 𝑡𝑖) = 𝜕 𝜕ˆ𝜃 ∫︁ 𝑡𝑖+1 𝑡𝑖 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏 − 𝑥(𝑡𝑖+1) = ∫︁ 𝑡𝑖+1 𝑡𝑖 𝜕 𝜕ˆ𝜃 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏 (33) где последний интеграл – это поэлементное интегрирование матрицы якобиана 𝑓. Алгоритм регулятора далее представляется непрерывно по времени, учитывается только дискретность сигналов 𝜕𝑒/𝜕ˆ𝜃 и 𝑒, которые приводятся к непрерывным с помощью экстраполятора нулевого порядка. Отсюда (28) может быть записано на интервале времени [𝑡𝑖, 𝑡𝑖+1) ˙ˆ𝜃 = −𝑘 (︂∫︁ 𝑡𝑖+1 𝑡𝑖 𝜕 𝜕ˆ𝜃 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏 )︂−1 · (︂∫︁ 𝑡𝑖+1 𝑡𝑖 𝑓(ˆ𝑥(𝜏), 𝑢(𝜏), ˆ𝜃)𝑑𝜏 − 𝑥(𝑡𝑖+1) )︂ (34) Рассмотрим оставшуюся подзадачу, а именно применение стратегии продолжения по параметру для задачи адаптивной идентификации в случае, когда не выполняется условие полноранговости (30). Как уже сказано выше, задача идентификации сводится к нелинейному уравнению 𝑒(ˆ𝜃, 𝑡𝑖) = 0 с возмущениями. Следовательно, материал теоремы 7 может быть непосредственно применен в предположении, что 𝑦 = 𝑒(ˆ𝜃, 𝑡𝑖), ˙ˆ𝜃 = 𝑢, ℬ = 0 и 𝑟𝑖 = 1, а также с учетом регулирования скорости сходимости используя (15). Составим гомотопическое отображение 𝐻 = 𝜆 · 𝑒 + (1 − 𝜆) · (ˆ𝜃 − ˆ𝜃0) (35) 10