Системные методы анализа и синтеза интеллектуально-адаптивного управления.
Покупка
Основная коллекция
Тематика:
Кибернетика
Издательство:
РИОР
Авторы:
Крамаров Сергей Олегович, Смирнов Юрий Александрович, Соколов Сергей Викторович, Таран Владимир Николаевич
Год издания: 2021
Кол-во страниц: 238
Дополнительно
Вид издания:
Монография
Уровень образования:
Дополнительное профессиональное образование
ISBN: 978-5-369-01571-1
ISBN-онлайн: 978-5-16-105045-3
Артикул: 633630.02.01
В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина.
Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.03: Прикладная информатика
- 12.03.04: Биотехнические системы и технологии
- 27.03.05: Инноватика
- ВО - Магистратура
- 10.04.01: Информационная безопасность
- 20.04.01: Техносферная безопасность
- 38.04.01: Экономика
- 38.04.02: Менеджмент
- 38.04.05: Бизнес-информатика
ГРНТИ:
Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №171 Вашего печатного экземпляра.
Ввести кодовое слово
ошибка
-
ЭБС\
-
Приложение 1.pdf
-
Приложение 2.pdf
-
Приложение 3.pdf
-
Приложение 4.pdf
-
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
НАУЧНАЯ МЫСЛЬ СЕРИЯ ОСНОВАНА В 2008 ГОДУ Министерство образования и науки Российской Федерации Межрегиональная ассоциация образовательных организаций высшего образования С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, В.Н. Таран СИСТЕМНЫЕ МЕТОДЫ АНАЛИЗА И СИНТЕЗА ИНТЕЛЛЕКТУАЛЬНОАДАПТИВНОГО УПРАВЛЕНИЯ Монография онлайн znanlum.com Москва РИОР ИНФРА-М
УДК 519.7:303.732.4:330.44 ББК 32.81+22.18+65.05 К77 ФЗ Издание не подлежит маркировке № 436-ФЗ в соответствии с п. 1 ч. 2 ст. 1 Научные редакторы: Соколов Сергей Викторович — д-р техн. наук, профессор; Крамаров Сергей Олегович — д-р физ.-мат. наук, профессор Рецензенты: Колесников А.А. — д-р техн. наук, профессор, заслуженный деятель науки и техники РФ; Безуглов Д.А. — д-р техн. наук, профессор, заслуженный деятель науки РФ Крамаров С.О., Смирнов Ю.А., Соколов С.В., Таран В.Н. К77 Системные методы анализа и синтеза интеллектуально-адаптивного управ ления : монография / С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, Таран В.Н. — Москва : РИОР : ИНФРА-М, 2021. — 238 с. + Доп. материалы [Электронный ресурс]. — (Научная мысль). — DOI: https://doi.org/10.12737/19591 ISBN 978-5-369-01571-1 (РИОР) ISBN 978-5-16-012195-6 (ИНФРА-М, print) ISBN 978-5-16-105045-3 (ИНФРА-М, online) В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина. Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления. УДК 519.7:303.732.4:330.44 ББК 32.81+22.18+65.05 Материалы, отмеченные знаком , доступны в электронно-библиотечной системе ZNANIUM по адресу http://znanium.com. Ссылку для доступа вы можете получить при сканировании QR-кода, размещенного на обложке ISBN 978-5-369-01571-1 (РИОР) © Крамаров С.О., ISBN 978-5-16-012195-6 (ИНФРА-М, print) Смирнов Ю.А., ISBN 978-5-16-105045-3 (ИНФРА-М, online) Соколов С.В., Таран В.Н.
ВВЕДЕНИЕ Несмотря на бурные успехи теории адаптивного и стохастического управления за последнее тридцатилетие, создающие зачастую иллюзию ее завершенности, за рамками полного теоретического разрешения остаются еще многие вопросы управления динамическими системами в условиях неопределенности. Представленная работа предназначена для восполнения существующего пробела в направлении развития как теории управления стохастическими нелинейными объектами на основе общих форм вероятностных критериев, так и аналитического синтеза общих объективных законов процессов управления нелинейными многомерными и многосвязными системами. Это - законы обратных связей, синтезируемых на основе наиболее полных нелинейных моделей систем с непосредственным учетом их естественных закономерностей, физических (химических и др.) критериев и ограничений. Существующие подходы к синтезу стохастического и адаптивного управления формируют его в функции текущего состояния объекта управления и не учитывают его структурные изменения. Решение этой проблемы возможно только при комбинированном синтезе адаптивного управления с прогнозированием в «малом» и оптимального управления в «большом». При этом принципиально необходимо использовать текущие системные стохастические оценки состояния и управления объекта изменяемой структуры. В монографии рассмотрен системный синтез интеллектуальноадаптивного управленияна основе принципов Беллмана и Понтрягина, подробно изложены методы системного анализа, управления и оценки состояния сосредоточенных и распределенных стохастических систем по различным критериям. Изложенные в книге результаты могут найти практическое применение при создании перспективных систем управления, навигации, связи и т.д., т.е. широкого класса динамических нелинейных систем, функционирующих в условиях возмущений различной физической природы. 3
1. СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ НА ОСНОВЕ ОБОБЩЕННЫХ ВЕРОЯТНОСТНЫХ КРИТЕРИЕВ 1.1. Математическое описание объекта управления В современной теории оптимального стохастического управления основными объектами исследования являются нелинейные стохастические системы, описываемые векторными дифференциальными уравнениями вида k = f ⁽k,U, t⁾⁺ f0 ⁽k,U, t)nt> где k — N-мерный вектор состояния системы; f, f) - известные нелинейные векторная и матричная функции размер ности N и N*M соответственно; nₜ - M- мерный вектор нормированного белого гауссовского шума; U - K<N-мерный вектор управления (здесь и далее использована симметризованная форма записи уравнений). В большинстве практических случаев функция f₀ от UT не зависит, а f может быть представлена как f (k, U, t) = f (k, t) + U(k, t), т.е. система уравнений, используемая далее для описания исследуемых объектов, имеет следующий вид: k = f (k, t)+ U (k, t)+ fо (k, t) nt. (1.1) В силу теоремы Дуба вектор k является марковским [160], а плотность его распределения p(k ,t) описывается известным уравнением Фокке-ра-Планка-Колмогорова (ФПК), которое для удобства последующего использования запишем в виде: дР⁽^ = L{p(k, t)} = — div/ + U + ¹f(f))⁽V) p ■ (1.2) + — div 2 где L{U, f, f), p} =Lo{p} - div[Up] - оператор ФПК, Lo{p} = L {0,f, f ,, p}; (A)⁽V⁾ - операция преобразования матрицы A размерности n*m в вектор (A) , формируемый из ее элементов следующим образом: A )= |й 11a21'''am1a 12a22'am2'a 1 na2n■■■ amn\ , ⁽¹.³⁾ 4
div - символ операции дивергенции строки матрицы. Если возможно наблюдение управляемого вектора ^ с помощью измерителя, описываемого в общем случае нелинейным стохастическим уравнением вида Z = H($, t) + Wt, (1.4) где Z - L <N- мерный вектор выходных сигналов измерителя; H(t,t) - известная нелинейная вектор-функция наблюдения размерности L; Wₜ - белый гауссовский вектор-шум измерения размерности L с нуле вым средним и матрицей интенсивности Dw (t); то для вероятностного описания вектора состояния ^ более целесообразно использование апостериорной плотности вероятности (АПВ) pz(c,,t), задаваемой уравнением Стратоновича: ~Z^~= = L {p Z (£> t⁾}⁺[ F (£> t⁾⁻F⁽t ⁾]p Z (£> t ) = L {p Z } ⁺ S{p Z> & t }> (1.5) d t v ⁷ где ^ F (f, t ) = - 2 [Z - H (f, t)] D.' [Z - H (f, t)], F⁽t) = J F&, t р & t -^ в силу того, что энтропия апостериорного сообщения меньше энтропии априорного. Так как аналитических методов решения уравнений (1.2), (1.5) в настоящее время не существует, а реализация численных методов с использованием существующих вычислительных средств при N> 3 не представляется достаточно эффективной [147], то наибольшее распространение при анализе вероятностных характеристик вектора состояния ^ получили методы функциональной аппроксимации плотности [28]. И наиболее распространенный среди них - метод аппроксимации гауссовской плотностью р&t⁾⁼ - \—expI⁻2&⁻&)TP&⁻&)}, (j[2п) detP I ² J (1.6) где = = ((t) - математическое ожидание вектора состояния ^; P = P (t) - матрица ковариаций, позволяющий сформировать аппроксимацию решений уравнений с частными производными вида (1.2, 1.5) в виде решений систем обыкновенных дифференциальных уравнений относительно параметров £, , P искомых плотностей. 5
Наряду с традиционными достоинствами метода гауссовской аппроксимации [160], следует также отметить свойство плотности (1.6) минимизировать информационный функционал Фишера при условии существования конечной матрицы P [119]. Это, в свою очередь, позволяет решать на основе аппроксимации (1.6) задачи стохастического управления и оценивания в минимаксной постановке - искать оптимум заданного функционала при минимуме информации о векторе состояния ^ [119]. В самом распространенном на практике варианте уравнений оценки, так называемом обобщенном (расширенном) нелинейном гауссовском фильтре, уравнения оценки вектора состояния (1.1) имеют вид 1 = f + и + K (^,t)(z - H (£t)), (1.7) K ("'• t ) = P^H D-, P = P — (.f + U)T + — (.f + U) P + f 0 fT - KD,K’. ^ ^ (1.8) При аналогичной аппроксимации решения уравнения ФПК, т.е. априорной плотности вероятности, уравнения векторных параметров плотности получаются из (1.7, 1.8) при H = 0. Приведенные уравнения являются исходными при последующем синтезе оптимальных управлений. Для возможности окончательной постановки задачи синтеза рассмотрим далее виды критериев оптимальности, обеспечивающих формирование стохастических управлений в наиболее общем случае оптимизации процесса управления системой. 1.2. Критерии оптимизации Решение проблемы синтеза оптимального управления стохастическими объектами осуществляется в настоящее время на основе использования методов, изначально разработанных для детерминированных систем [1]. Данное обстоятельство неизбежно приводит к стохастическому характеру известных критериев оптимизации и функций оптимальности (Гамильтона или Беллмана) и, как следствие, к необходимости рассмотрения средних значений [1, 28]. Это, в свою очередь, определяет интегральную зависимость оптимального управления от плотности распределения вектора состояния, требуя, в конечном итоге, решения двухточечной краевой задачи для системы уже не обыкновенных дифференциальных, а интегро-дифференциальных уравнений совместно с интегро-дифференциальным уравнением в частных производных для неизвестной плотности распределения параметров состояния. Очевидные трудности решения такой систе-6
мы привели к использованию единственной на сегодняшний день возможности ее приближенного интегрирования на основе гауссовской аппроксимации функции плотности. Но подобная аппроксимация порождает ошибки не только в определении самой плотности распределения, но и требует статистической линеаризации уравнений объекта, приводящей к дополнительным ошибкам решения двухточечной краевой задачи. Кроме того, существующие подходы не позволяют использовать в качестве критериев оптимизации обобщенные формы вероятностных критериев, нелинейно зависящих непосредственно от плотности распределения (критерий минимума энтропии вектора состояния, критерий Кульбака и др.) и определенных в общем случае в замкнутой области существования параметров состояния. В связи с этим возникает проблема разработки такого подхода к синтезу оптимального управления стохастическими объектами, который, во-первых, позволял бы построить закон управления в замкнутой форме при самой общей нелинейной зависимости критерия оптимизации от плотности распределения вектора состояния, и, во-вторых, позволил бы избежать ошибок статистической линеаризации уравнений объекта. Для возможности дальнейшего решения задачи поиска подобного оптимального управления критерий оптимизации запишем в следующей наиболее общей форме: J = J J ф[р(£,t),U(£,t)]%dt = J W*(t)dt, (1.9) T T где Ф - известная нелинейная функция, учитывающая в общем случае возможные аналитические ограничения на вектор управления; T = [ 1₀, tₖ] - временной интервал оптимизации; ^« - некоторое ограниченное множество параметров состояния. На практике чаще используется более простая форма критерия оптимальности J = J |ф₁[р(^,t)]dt + J Jo2[U(£,t)]dt = J W*(t)dt, (1.10) T 5(1) T 5(2) T где Фi, i =1,2 - известные нелинейные аналитические функции; ^ i - области пространства состояний, в которых определяется оптимальное управление; достаточно адекватно отражающая естественное формирование условия, обеспечивающего оптимальность исследуемой системы как в смысле точности, так и затрат на управление. 7
При этом различные вариации вида функции Ф₁ позволяют охватить достаточно широкий класс условий оптимальности по точности: - максимума (минимума) вероятности существования вектора £ в области £,(1): Ф1(р) = ±р; - минимума отклонения искомой плотности вероятности р от заданной g: Ф1(р) = (р-g)2, Ф1(р) = |р-g, Ф1(р) = -рln^g) (критерий Куль-бака) и т.д.; - максимума информации о векторе состояния £: Ф1(р) = р д ln р д ln р д£ JL д£ (критерий Фишера) и др., а функции Ф2 - условий оптимальности по текущим затратам на регулирование (энергетическое обеспечение) процесса (как правило, функция Ф2 выбирается возрастающей положительно определенной: квадратичной Ф2(U) = UTDU или экспоненциальной Ф2(U) =exp (aTU), где D, а - матрица и вектор известных постоянных коэффициентов [147]). Наряду с критерием (1.10) далее будем использовать его модификацию, обеспечивающую синтез оптимального управления не на конечном (замкнутом) интервале времени Т, а в реальном (текущем) масштабе времени движения t J1 = |Ф1[р(£,t)]d£ +J |ф2[U(£,t)]d£dt. (1.11) £(1) 10 £( 2) Данный критерий традиционен для задач управления в реальном времени (например, подвижными объектами) и называется локальным [28] (в отличие от терминального (глобального) критерия (1.10)). Оптимальное управление U, формируемое на его основе, называется локальнооптимальным . Существенным преимуществом применения критерия (1.11) является простота синтезируемого на его основе управления, позволяющая легко реализовать алгоритмы локально-оптимального управления непосредственно на борту подвижного объекта. В заключение следует также отметить, что форма критериев (1.10), (1.11) охватывает одну из возможных постановок задачи управления процессами самоорганизации -при выборе в качестве первой составляющей критерия энтропии системы или критерия Фишера. В этом случае поиск управления, оптимизирующего энтропию системы, представляет собой, по существу, формирование ее параметров, обеспечивающих оптимальное протекание процесса самоорганизации. 8
1.3. Априорное оптимальное управление вектором состояния 1.3.1. Постановка задачи В отличие от традиционной постановки задачи синтеза стохастического оптимального управления - на основе усредненного функционала и дифференциальных моделей математического ожидания вектора состояния, использование критерия типа (1.9) предполагает поиск управления уже не самим процессом, а его плотностью распределения р(£,t). В свою очередь, функция р в отличие от вектора ^ описывается дифференциальным уравнением с частными производными (а в случае (1.5) даже интегро-дифференциальным), что требует привлечения математического аппарата синтеза управления системами уже с распределенными параметрами. Теория подобного синтеза в настоящее время разработана достаточно подробно [18] и базируется, в основном, на применении двух методов - динамического программирования и принципа максимума, обобщенных на случай распределенных систем. Для дальнейших построений используем метод динамического программирования: во-первых, в силу его более общего характера, а, во-вторых, большей универсальности и простоты синтеза оптимального управления. Кроме того, процедуру формирования оптимального управления рассмотрим в двух принципиально различных случаях - для ненаблюдаемого объекта управления (1.1) и наблюдаемого с использованием нелинейного измерителя вида (1.4), когда решение задачи синтеза является, по существу, решением проблемы дуального управления [171] в наиболее общем (замкнутом) виде. Для простоты последующего изложения управление в первом случае определим как априорное, во втором - как апостериорное. 1.3.2. Синтез априорного оптимального управления Для иллюстрации общности предложенного подхода к синтезу стохастического управления рассмотрим формирование вектора U, оптимизирующего нелинейный функционал J (1.9). Оптимальное управление будем искать в классе ограниченных непрерывных функций со значениями из открытой области U*. Для его построения используем метод динамического программирования, согласно которому задача сводится к решению функционального уравнения [18] . Гdv . 1 Л min 1--+ W* > = 0 UeU* I dt J (1.12) при конечном условии V(tK) = 0 относительно оптимального функционала V, параметрически зависящего от времени t e T и определенного на множестве функций р, удовлетворяющих уравнению (1.2). 9
Для линейных систем с распределенными параметрами, к классу которых относятся уравнения типа (1.2), функционал отыскивается в виде интегральной квадратичной формы [18] V = fv(j,{)Р2 {) dj, j откуда имеем 'V + W* =4~TP2 + 2vpL0{р}+ф[р,U]-²vpsffr-P + ui З^-'lldj> ⁽¹.¹³⁾ dt |[ dt i (dji dji )\ где индекс “ i ” используется для обозначения компонентов соответствующих векторов. Анализ полученного выражения показывает, что определение вектора U(j,t) из решения функционального уравнения (1.12) сводится к классической задаче отыскания вектор-функции, реализующей минимум определенного интеграла (1.13). При этом вектор-функция U(j,t), являющаяся решением данной задачи, должна удовлетворять системе уравнений Эйлера dr 21 дФ др -—|2vp²1- — + 2vp^ = 0 i = 1,2,..., N, dji L J dUi dj i или (1.14) В общем случае (1.14) представляет собой систему нелинейных уравнений относительно компонентов вектора управления, допускающую аналитическое разрешение только в некоторых частных случаях, например, когда функция Ф[р, U] имеет следующий вид: Ф = Ф1[р] + Ф 2 [ U ], где Ф₂(1) - аналитические функции, первые производные которых допускают обращение, или, например, ф = Ф1 [р] + [ u (j, t)- u о (j, t)]T Du (j, t)[ u (j, t)- u о (j, t)], где DU( j ,t) - известная симметричная квадратная матрица; U₀(j ,t) - известный вектор. 10