Функционально устойчивые системы управления: асимптотические методы синтеза
Покупка
Основная коллекция
Тематика:
Кибернетика
Издательство:
НИЦ ИНФРА-М
Год издания: 2020
Кол-во страниц: 249
Дополнительно
Вид издания:
Монография
Уровень образования:
Дополнительное профессиональное образование
ISBN: 978-5-16-014078-0
ISBN-онлайн: 978-5-16-103311-1
Артикул: 679447.02.01
Монография посвящена применению асимптотических методов для создания функционально устойчивых систем управления. Рассматриваются также задачи анализа больших уклонений, для чего используется аппарат функционала действия и квазипотенциалы Вентцеля — Фрейдлина. В этом направлении в работе получены алгоритмы, позволяющие в реальном времени прогнозировать и предотвращать критические ситуации в управлении возмущенной системой. Разработанные методы иллюстрируются примерами их использования в системах управления подвижными объектами различного назначения.
Теоретические методы и подходы, представленные в монографии, предназначены для подготовки магистров по направлению 27.04.04 «Управление в технических системах».
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 13.03.03: Энергетическое машиностроение
- 27.03.05: Инноватика
- ВО - Магистратура
- 01.04.03: Механика и математическое моделирование
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва ИНФРА-М 2020 ФУНКЦИОНАЛЬНО УСТОЙЧИВЫЕ СИСТЕМЫ УПРАВЛЕНИЯ АСИМПТОТИЧЕСКИЕ МЕТОДЫ СИНТЕЗА Ñ.À. ÄÓÁÎÂÈÊ À.À. ÊÀÁÀÍÎÂ МОНОГРАФИЯ
Дубовик С.А. Д79 Функционально устойчивые системы управления: асимптоти ческие методы синтеза : монография / С.А. Дубовик, А.А. Кабанов. — М. : ИНФРА-М, 2020. — 249 с. — (Научная мысль). — www. dx.doi.org/10.12737/monography_5b446a985cf9a5.11626044. ISBN 978-5-16-014078-0 (print) ISBN 978-5-16-103311-1 (online) Монография посвящена применению асимптотических методов для создания функционально устойчивых систем управления. Рассматриваются также задачи анализа больших уклонений, для чего используется аппарат функционала действия и квазипотенциалы Вентцеля — Фрейдлина. В этом направлении в работе получены алгоритмы, позволяющие в реальном времени прогнозировать и предотвращать критические ситуации в управлении возмущенной системой. Разработанные методы иллюстрируются примерами их использования в системах управления подвижными объектами различного назначения. Теоретические методы и подходы, представленные в монографии, предназначены для подготовки магистров по направлению 27.04.04 «Управление в технических системах». УДК 519.71(075.4) ББК 22.18 УДК 519.71(075.4) ББК 22.18 Д79 © Дубовик С.А., Кабанов А.А., 2019 ISBN 978-5-16-014078-0 (print) ISBN 978-5-16-103311-1 (online) Р е ц е н з е н т ы: Согомонян С.В., кандидат технических наук, старший научный сотруд ник научно-исследовательской лаборатории развития систем наведения, оптико-электронных и радиотехнических систем высокоточного оружия ВМФ Черноморского высшего военно-морского училища имени П.С. Нахимова; Глеч С.Г., кандидат технических наук, доцент, доцент кафедры менедж мента Севастопольского экономико-гуманитарного института (филиал) Крымского федерального университета имени В.И. Вернадского А в т о р ы: Дубовик С.А., доктор технических наук, профессор, профессор кафедры информатики и управления в технических системах Севастопольского государственного университета; Кабанов А.А., кандидат технических наук, доцент, заведующий кафе дрой информатики и управления в технических системах Севастопольского государственного университета
ВВЕДЕНИЕ В теории управления давно и, по-видимому, надолго укоренился подход, который условно можно назвать процедурно-вычислительным. Возник он в период бурного развития вычислительной техники и привел к закреплению некоторых традиций и шаблонов, которые со временем стали тормозом во многих отраслях теории и практики проектирования систем. Вот одно из таких традиционных правил: управлять объектом должен окончательно сформированный «монолитный» регулятор и, следовательно, процедура синтеза закона управления должна строго предшествовать реализации самого процесса управления. Это правило привело к тому, что практически с момента основания кибернетики на самом деле существовали две совершенно не связанные друг с другом науки с одинаковым названием: «кибернетика». Одна из них – теория автоматического управления (ТАУ) – как раз и развивалась в рамках означенного «табу», имея целью управление динамическими объектами. Фактически, указанное ограничение очень сильно сужает возможности управления: так как наши априорные представления о любом управляемом процессе или явлении никогда в точности не совпадают с реальностью, то необходимость «продолженного синтеза» (online синтеза) становится очевидной. С другой стороны, это означает, что к началу процесса управления регулятор должен представлять собой не «монолит», а некоторый набор элементов, сеть, которая в дальнейшем реконфигурируется соответственно цели и текущим условиям и обстоятельствам управления. При этом, конечно, возникает потребность в средствах анализа такой структурированной, семантической информации. «Монолитный» регулятор не в состоянии обеспечить это важнейшее требование для автономного движения – требование функциональной устойчивости, понимаемое как способность выполнения поставленной задачи независимо от действия внешних возмущений. Другая «кибернетика», развивавшаяся под флагом «искусственного интеллекта» (ИИ), как раз и содержит в качестве ключевой идею языка и его семантики как средства построения систем, функционирующих в условиях неопределенности, на основе другой важнейшей для ИИ концепции – понятия имитации и ее декларативного представления. Здесь можно увидеть другую крайность: для ИИ часто характерно отрицание всякой априорной математики в описании объекта и замена ее процедурами обучения, асимптотически приближающими управляемую систему к имитируемым эталонам. Понятно, что далеко не всегда и не во всяком управляемом процессе управляющая сторона может позволить себе «роскошь» обучения, и именно тогда возникает идея использования априорных описаний процесса для синтеза не одного монолитного регулятора, а некоторого параметризованного семейства, сети, настройку которой (продолженный, или online, синтез) можно совершать в процессе управления в зависимости от хода последнего. И только такое устройство регулятора может гарантировать функциональную устойчивость системы
управления. Здесь мы не будем углубляться в методы этой кибернетики ИИ, но воспользуемся терминологией, вырабатывающейся в последнее время на стыке математической информатики, нейрофизиологии и психологии [1–3]. При этом оказывается, что в специальном определении этих понятий нет необходимости – их сущность, как правило, ясна из контекста, но при желании указанные термины можно уточнить в упомянутых источниках и в литературе, которая приведена в имеющихся там библиографиях. В этой книге делается попытка именно расширенного взгляда на синтез управлений, а в качестве конструктивного средства анализа используются асимптотические методы. В определенном смысле асимптотические методы позволяют соединить указанные два подхода. На первом шаге ТАУ позволяет сформулировать и решить определенную совокупность задач, возникающих в рассматриваемой проблеме управления и, как правило, содержащих некоторую группу параметров. Если удается построить асимптотики по этим параметрам, то это структурирует проблему, создает понятия, а в целом – нечто, подобное базе знаний, позволяющее выстроить верхний уровень управления и принятия решений (уже в режиме online), то есть совокупность радикалов. Именно в этом основное отличие общепринятого процедурного способа использования асимптотик от используемого в настоящей работе декларативно-когнитивного (ДК). В первом случае роль асимптотик ограничивается исключительно упрощением вычислений и сказывается только на ускорении и упрощении процедуры синтеза все того же монолитного регулятора, причем эта процедура завершается сборкой всех компонент в монолитный регулятор до начала процесса управления. Поэтому на все дальнейшие непредвиденные возмущения и изменения в объекте уже в процессе управления указанные усилия по асимптотическому анализу никак не влияют и, следовательно, ко всем этим, вполне реальным, как правило, возмущениям и вариациям никакого отношения не имеют. Во втором случае – ДК-синтеза – никакой общей сборки не производится, а из всей совокупности компонент (радикалов) выделяется некоторый априорный регулятор (из части радикалов собирается начальный системоквант). Особый случай, когда декомпозиция процесса с помощью малых параметров используется только для построения критериев качества в задачах синтеза, будем называть декларативным синтезом (D-формат), а процедуру сборки радикалов в системоквант – когнитивным синтезом (K-формат). Еще раз: важнейшая роль асимптотического анализа в системах управления вовсе не в упрощении вычислительных алгоритмов, а в возможности создавать радикалы, а затем уже в процессе управления формировать из них системокванты, реализуя тем самым концепцию «продолженного синтеза». Понятно, что этот продолженный синтез на самом деле сводится к простой реконфигурации – выведению из процедуры управления одних радикалов и введению в него (активированию) других. Решать эти задачи реконфигурации и сборки радикалов в системокванте
на основе прогноза управляемого процесса должен супервайзер, занимающий к текущему контуру управления некоторую верхнюю позицию (вторая сигнальная система). Эта идея online сборки является ключевой для управления в условиях неопределенности и для повышения функциональной устойчивости системы управления в целом. Но функциональная устойчивость может пониматься и в локальном смысле как хорошо известная робастность. Асимптотические методы и здесь оказываются полезны. Некоторые результаты в этом направлении мы приводим в главах 4 и 5. Методы асимптотического анализа давно используются для упрощения и декомпозиции в задачах и алгоритмах. Результаты, основанные на канонических представлениях систем, рассмотрены в главах 2 (D-формат) и 3 в рамках K-формата системы управления. Понятно, что для выполнения задачи и сохранения гомеостазиса [4] автономно движущийся объект (АДО) должен располагать некоторым минимальным набором радикалов, достаточным для надлежащего реагирования (в форме системокванта) на все возможные в процессе функционирования события и возмущения. В настоящей работе предлагается такой набор радикалов, который может оказаться достаточным в большом числе задач по использованию АДО: – линейный стационарный регулятор (LTI-радикал), – терминальный (гиперболический) регулятор (Т-радикал), – профиль больших уклонений (LDP-радикал). Причем первые два типа радикалов могут использоваться как в штатных, так и в антикризисных режимах управления. Главная функция верхнего уровня управления (супервайзера) в функционально устойчивой системе – прогнозирование. Глава 6 посвящена применению асимптотической теории больших уклонений Вентцеля–Фрейдлина в задачах синтеза бортовых систем прогнозирования и управления в K-формате. Показано, что грубые оценки Вентцеля–Фрейдлина позволяют построить и реализовать в реальном времени алгоритмы работы супервайзера. Разработанные здесь методы и алгоритмы, а также результаты других глав, используются в главах 7 и 8 для построения систем управления морскими, наземными транспортными средствами и летательными аппаратами, функционирующими в том числе в безэкипажном и беспилотном режимах. Авторы выражают искреннюю благодарность за внимание к работе М.Г. Дмитриеву (г. Москва), А.Т. Барабанову, Б.А. Скороходу, В.Г. Козыреву (г. Севастополь).
ГЛАВА 1 НЕКОТОРЫЕ СВОЙСТВА СИСТЕМ, ФУНКЦИОНИРУЮЩИХ В УСЛОВИЯХ ВОЗМУЩЕНИЙ. ЗАДАЧА КОМПОЗИЦИОННОГО СИНТЕЗА Рассматриваются математические методы, с помощью которых возможно осуществление декомпозиции в многомерных динамических системах. Формулируются задачи синтеза регуляторов в условиях терминального и стационарного управления. 1.1. ПРИМЕНЕНИЕ АСИМПТОТИЧЕСКИХ МЕТОДОВ ТЕОРИИ ВОЗМУЩЕНИЙ ДЛЯ СИНТЕЗА УПРАВЛЕНИЙ Современная теория управления сталкивается сегодня с теми же проблемами, что и все науки информационного направления. В первую очередь это сложность используемых математических моделей, обусловленная объективной сложностью решаемых задач, и необходимость функционирования проектируемой системы в условиях той или иной степени неопределенности наших знаний об управляемом процессе. В настоящее время существуют достаточно мощные методы, позволяющие разрабатывать алгоритмы управления для многомерных систем. Можно отметить метод функций Ляпунова [11–13], методы оптимального управления [14–21], обобщенный метод Рауса для алгебраизации критериев качества многомерных систем [22–24]. Проектирование систем управления, предназначенных для работы в условиях неопределенности, может основываться на некоторых гарантирующих принципах, ориентированных на наихудшие из возможных условий функционирования системы [16, 17, 25]. С другой стороны, если существует возможность коррекции алгоритма управления при изменении параметров возмущений, то становятся целесообразными усилия, направленные на достижение некоторых эталонных или оптимальных характеристик управления в рамках априорной модели возмущений. Здесь важно подчеркнуть, что регулятор в таком случае должен представлять дружественный интерфейс для более высоких уровней управления и контроля. Это объясняет и тот интерес к вопросам языка проектирования и методам представления и обработки семантической информации об объекте, который возникает и расширяется в последнее время в информатике и смежных с ней научных дисциплинах. Подход, предлагаемый в настоящей работе, основывается на методе возмущений, то есть на использовании малых параметров в математическом описании задачи проектирования, что позволяет получить простые и близкие к оптимальным решения, открытые для коррекции в случае изменения априорных математических моделей. Можно отметить близость предлагаемой процедуры и метода асимптотических частотных характеристик [26], существенным
элементом которого является пренебрежение малыми постоянными времени в рассматриваемом диапазоне частот. Пусть, например, задана передаточная функция T, – положительные постоянные времени. При построении асимптотической амплитудно-частотной характеристики для такого звена вся ось частот разбивается на три множества: T / 1 : 0 , / 1 / 1 : 1 T , / 1 : 2 , а передаточная функция s w представляется в виде произведения трех передаточных функций элементарных звеньев: k s w 0 , , , и затем полагают с точностью до некоторой ошибки, максимальной в частотах сопряжения, что где а – в данном случае модуль комплексной переменной . С другой стороны, рассматриваемая передаточная функция является преобразованием по Лапласу решения следующей линейной системы второго порядка: где f – входное воздействие. Точнее говоря, s w есть преобразованная по Лапласу первая координата решения этой системы, когда на входе у нее дельта-функция t t f . От этой канонической формы уравнений в пространстве состояний можно перейти к следующей эквивалентной записи, не меняя для простоты обозначений: или , 0 , ) 1 ( ) 1 ( ) ( T s Ts k s w 1 1 ) ( 1 Ts s w 1 1 ) ( 2 s s w , ), ( , ), ( , ), ( ) ( ) ( 2 2 1 1 0 0 A A A j w A ,) /( ) ( ) ( ) ( 2 0 2 Tj j w j w A ,) ( ) ( ) ( 1 0 1 j w j w A ,) ( ) ( 0 0 j w A s s , 1 , 2 1 2 2 1 f T k x T T x T x x x , 1 , 2 1 2 2 1 f T k x T T x T x x x
(1.1) Если в этой системе – малый положительный параметр, то она является сингулярно возмущенной по этому параметру [27–29] и тихоновской, то есть удовлетворяющей теореме А.Н. Тихонова [27], так как коэффициент T T при «быстрой» переменной x2 в уравнении для x2 при 0 равен ‒1, то есть отрицателен. В силу этого, полагая , будем иметь (обозначая через y решения вырожденной системы): kf y y 2 1 0 . Разрешая это уравнение относительно y2 и подставляя этот корень kf y y 1 2 в первое уравнение системы (1.1) вместо переменной x2, получим для первой координаты вырожденного решения kf y Ty 1 1 , (1.2) что дает в преобразованиях по Лапласу передаточную функцию 0 w . 1 w , аппроксимирующую w в диапазоне «средних» частот 1 . Если в (1.1) оба параметра – малые положительные, причем имеет более высокий порядок малости, чем T ( T o ), то эта система оказывается сингулярно возмущенной по двум параметрам и следует применять, соответственно, обобщенный вариант теоремы А.Н. Тихонова [27]. Условием этой последней, кроме того что названо, будет отрицательность коэффициента при y1 в уравнении (1.2), что также выполнено. Это в свою очередь дает право положить в (1.2) и получить kf z 1 0 . В оригиналах это является эквивалентом того факта, что в области «низких» частот амплитудно-частотная характеристика рассматриваемой передаточной функции аппроксимируется характеристикой усилительного звена . Наконец, аппроксимация в области 2 «высоких» частот отражает то обстоятельство, что в растянутом времени 1 система (1.1) аппроксимируется присоединенной системой и интегралом. Такая аналогия позволяет рассчитывать на метод сингулярных возмущений как на эффективный инструмент синтеза систем. Причем в отличие от классических методов частотного анализа методы теории возмущений могут использоваться для весьма широкого класса многомерных систем, хотя возможности в рамках линейной стационарной теории все же остаются более широкими. . , 2 1 2 2 1 f T k x T T x x x x T 0 0 T 0 ) (A k j w A ) ( ) ( 0 0
1.2. ЛИНЕАРИЗАЦИЯ И ДЕКОМПОЗИЦИЯ МНОГОМЕРНЫХ СИСТЕМ Кроме внутренней проблематики линейных задач, в теории проектирования систем управления существует всегда вопрос о принципиальной возможности применения линейных методов в конкретных условиях управления и необходимости использования нелинейных моделей. Объектом нашего анализа будет в самом общем случае стохастическая система (1.3) где – вектор стандартных независимых «белых шумов». В системе (1.3) – вектор управления в каждый момент является функцией от траектории . Вектор функции x U~ , y x, и x удовлетворяют условиям существования сильного решения (1.3) [30]. Среди стратегий управления особое внимание будем уделять марковским: [30, 31]. Волна над символами будет обозначать (если не оговорено иначе) зависимость решения уравнения от малых параметров, о явном вхождении которых в (1.3) укажем ниже. Предполагая стратегию управления в (1.3) марковской и подставляя в (1.3), получим уравнение автономной системы: (1.4) Все возможности линейной теории могут быть использованы для синтеза управления в (1.3), если возмущения в (1.4) или (1.3) малы в каком-либо смысле. В детерминированной теории часто вводятся возмущения, малые абсолютно при всех . Это позволяет аппроксимировать рассматриваемую систему линейной в окрестности некоторого невозмущенного решения. Если это последнее является состоянием равновесия, то в результате появляется возможность использования аппарата линейной стационарной теории. Теория случайных процессов и, в частности, стохастические дифференциальные уравнения предоставляют средства для существенного расширения таких возможностей синтеза на основе введения более универсального понятия малости возмущений. Так, если в (1.4) выделить явно малый параметр в диффузионной составляющей: (1.5) то это вовсе не будет означать абсолютной малости возмущений при всех t. В (1.5) обозначено только то, что возмущения малы в среднем по ансамблю всех их возможных реализаций. Большие и даже сколь угодно большие величины возмущений не исключаются совсем, а малыми оказываются их вероятности в сравнении с вероятностями появления , ~ , ) ~ ( ) ~ , ~ ( ~ 0 x x w x U x x t t t t t twr t U~ t t t s t x U U t s x s x ,0 ,0 ~ ~ ~ : 0 :) ~ , ( ~ t t x U U ~ ~ ~ t t x U U ~ ~ ~ , ~ , ) ~ ( ) ~ ( ~ 0 x x w x x a x t t t t t , ~ , ) ~ ( ) ~ ( ~ 0 x x w x x a x t t t t
возмущений с малыми абсолютными величинами. Это обстоятельство делает стохастические модели типа (1.5) более адекватным средством синтеза систем управления, чем соответствующие детерминированные. Практическая сторона дела состоит в том, что модели (1.5) позволяют не только осуществить локальную стабилизацию состояния равновесия невозмущенной системы, но и контролировать и прогнозировать такие состояния в системе (1.5), в окрестности которых ее движение уже не аппроксимируется линеаризованной системой, связанной со стабилизируемым состоянием равновесия. Во всем этом круге проблем ключевую роль играют методы асимптотического анализа динамических систем с малыми случайными возмущениями [32]. Мы приведем здесь те результаты этой теории, которые будут существенно использоваться в дальнейшем изложении. Начать следует с теоремы, в которой рассматривается несколько иная модель, чем (1.5). А именно, пусть задана система для n-вектора x~ : (1.6) где , – случайный процесс со значениями в R1. Прежде чем сформулировать теорему, приведем алгоритм построения коэффициентов разложения tx~ в (1.6) по степеням : . (1.7) Используя обычную технику теории возмущений, подставим это в (1.6) и разложим правую часть по степеням . Приравнивая коэффициенты при одинаковых степенях слева и справа, получим уравнения для коэффициентов разложения. Пусть – произвольный степенной ряд с коэффициентами из Rn: Рассматривая разложение правой части (1.6) Y X a , ~ , обозначим , , Будем иметь последовательно где является -матрицей производных y x a , по первому аргументу, вычисленной в точке ; является -матрицей производных y x a , по второму аргументу, вычисленной в точке y=b. , ~ ,) , ~ ( ~ 0 x x x a x t t t 0 t ) ( ) 2 ( 2 )1( ) 0 ( ~ k t k t t t t x x x x x X~ k k c c c X 1 0 ~ 0 ) , ~ ( ! 1 ) , , , , ( 1 0 k k k k k d Y X a d k Y c c c V V ,1, 0 k , ) 0, ( ) 0, ( ), 0, ( 0 1 1 0 1 0 0 Y c G c c A V c a V c x x y x a c x x d y x a d y c A j i ) , ( ) , ( ) , ( n nc x b y y y x a b y y d y x a d b c G j i ) , ( ) , ( ) , ( 1 l n