Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Системные методы анализа и синтеза интеллектуально-адаптивного управления.

Покупка
Основная коллекция
Артикул: 633630.02.01
Доступ онлайн
от 288 ₽
В корзину
В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина. Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления.

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №171 Вашего печатного экземпляра.

Системные методы анализа и синтеза интеллектуально-адаптивного управления : монография / С. О. Крамаров, Ю. А. Смирнов, С. В. Соколов, В. Н. Таран. — Москва : РИОР : ИНФРА-М, 2021. — 238 с. — (Научная мысль). - ISBN 978-5-369-01571-1. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1243846 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
    НАУЧНАЯ МЫСЛЬ

СЕРИЯ ОСНОВАНА В 2008 ГОДУ


Министерство образования и науки Российской Федерации Межрегиональная ассоциация образовательных организаций высшего образования



            С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, В.Н. Таран


СИСТЕМНЫЕ МЕТОДЫ АНАЛИЗА И СИНТЕЗА ИНТЕЛЛЕКТУАЛЬНОАДАПТИВНОГО УПРАВЛЕНИЯ





                Монография





онлайн znanlum.com

Москва РИОР ИНФРА-М

УДК 519.7:303.732.4:330.44
ББК 32.81+22.18+65.05
     К77


   ФЗ    Издание не подлежит маркировке  
№ 436-ФЗ в соответствии с п. 1 ч. 2 ст. 1

          Научные редакторы:
          Соколов Сергей Викторович — д-р техн. наук, профессор;
          Крамаров Сергей Олегович — д-р физ.-мат. наук, профессор

          Рецензенты:
          Колесников А.А. — д-р техн. наук, профессор, заслуженный деятель науки и техники РФ;
          Безуглов Д.А. — д-р техн. наук, профессор, заслуженный деятель науки РФ




       Крамаров С.О., Смирнов Ю.А., Соколов С.В., Таран В.Н.
К77       Системные методы анализа и синтеза интеллектуально-адаптивного управ       ления : монография / С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, Таран В.Н. — Москва : РИОР : ИНФРА-М, 2021. — 238 с. + Доп. материалы [Электронный ресурс]. — (Научная мысль). — DOI: https://doi.org/10.12737/19591

           ISBN 978-5-369-01571-1 (РИОР)
           ISBN 978-5-16-012195-6 (ИНФРА-М, print)
           ISBN 978-5-16-105045-3 (ИНФРА-М, online)

           В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина.
           Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления.

УДК 519.7:303.732.4:330.44
ББК 32.81+22.18+65.05







Материалы, отмеченные знаком , доступны в электронно-библиотечной системе ZNANIUM по адресу http://znanium.com.
Ссылку для доступа вы можете получить при сканировании QR-кода, размещенного на обложке






ISBN 978-5-369-01571-1 (РИОР)                 © Крамаров С.О.,
ISBN 978-5-16-012195-6 (ИНФРА-М, print) Смирнов Ю.А.,
ISBN 978-5-16-105045-3 (ИНФРА-М, online) Соколов С.В., Таран В.Н.

ВВЕДЕНИЕ
     Несмотря на бурные успехи теории адаптивного и стохастического управления за последнее тридцатилетие, создающие зачастую иллюзию ее завершенности, за рамками полного теоретического разрешения остаются еще многие вопросы управления динамическими системами в условиях неопределенности.
     Представленная работа предназначена для восполнения существующего пробела в направлении развития как теории управления стохастическими нелинейными объектами на основе общих форм вероятностных критериев, так и аналитического синтеза общих объективных законов процессов управления нелинейными многомерными и многосвязными системами. Это - законы обратных связей, синтезируемых на основе наиболее полных нелинейных моделей систем с непосредственным учетом их естественных закономерностей, физических (химических и др.) критериев и ограничений.
     Существующие подходы к синтезу стохастического и адаптивного управления формируют его в функции текущего состояния объекта управления и не учитывают его структурные изменения. Решение этой проблемы возможно только при комбинированном синтезе адаптивного управления с прогнозированием в «малом» и оптимального управления в «большом». При этом принципиально необходимо использовать текущие системные стохастические оценки состояния и управления объекта изменяемой структуры.
     В монографии рассмотрен системный синтез интеллектуальноадаптивного управленияна основе принципов Беллмана и Понтрягина, подробно изложены методы системного анализа, управления и оценки состояния сосредоточенных и распределенных стохастических систем по различным критериям.
     Изложенные в книге результаты могут найти практическое применение при создании перспективных систем управления, навигации, связи и т.д., т.е. широкого класса динамических нелинейных систем, функционирующих в условиях возмущений различной физической природы.

3

1.        СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ НА ОСНОВЕ ОБОБЩЕННЫХ ВЕРОЯТНОСТНЫХ КРИТЕРИЕВ

    1.1. Математическое описание объекта управления
     В современной теории оптимального стохастического управления основными объектами исследования являются нелинейные стохастические системы, описываемые векторными дифференциальными уравнениями вида
k = f ⁽k,U, t⁾⁺ f0 ⁽k,U, t)nt>

где k — N-мерный вектор состояния системы;
f, f) - известные нелинейные векторная и матричная функции размер        ности N и N*M соответственно;
nₜ  - M- мерный вектор нормированного белого гауссовского шума;
U - K<N-мерный вектор управления (здесь и далее использована симметризованная форма записи уравнений).
     В большинстве практических случаев функция f₀ от UT не зависит, а f может быть представлена как f (k, U, t) = f (k, t) + U(k, t), т.е. система уравнений, используемая далее для описания исследуемых объектов, имеет следующий вид:


k = f (k, t)+ U (k, t)+ fо (k, t) nt.            (1.1)


     В силу теоремы Дуба вектор k является марковским [160], а плотность его распределения p(k ,t) описывается известным уравнением Фокке-ра-Планка-Колмогорова (ФПК), которое для удобства последующего использования запишем в виде:


      дР⁽^ = L{p(k, t)} = — div/ + U + ¹f(f))⁽V) p ■

(1.2)

+ — div 2

где L{U, f, f), p} =Lo{p} - div[Up] - оператор ФПК, Lo{p} = L {0,f, f ,, p};
                         (A)⁽V⁾ - операция преобразования матрицы A размерности n*m в вектор (A) , формируемый из ее элементов следующим образом:
            A )= |й 11a21'''am1a 12a22'am2'a 1 na2n■■■ amn\ ,     ⁽¹.³⁾

4

            div - символ операции дивергенции строки матрицы.
      Если возможно наблюдение управляемого вектора ^ с помощью измерителя, описываемого в общем случае нелинейным стохастическим уравнением вида
Z = H($, t) + Wt,                     (1.4)


где Z   - L <N- мерный вектор выходных сигналов измерителя;
H(t,t) - известная нелинейная вектор-функция наблюдения размерности L;
Wₜ  - белый гауссовский вектор-шум измерения размерности L с нуле         вым средним и матрицей интенсивности Dw (t);
то для вероятностного описания вектора состояния ^ более целесообразно использование апостериорной плотности вероятности (АПВ) pz(c,,t), задаваемой уравнением Стратоновича:


~Z^~= = L {p Z (£> t⁾}⁺[ F (£> t⁾⁻F⁽t ⁾]p Z (£> t ) = L {p Z } ⁺ S{p Z> & t }> (1.5)
d t                                                         v ⁷


где

                                                                             ^
           F (f, t ) = - 2 [Z - H (f, t)] D.' [Z - H (f, t)], F⁽t) = J F&, t р & t
                                                                             -^


в силу того, что энтропия апостериорного сообщения меньше энтропии априорного.
      Так как аналитических методов решения уравнений (1.2), (1.5) в настоящее время не существует, а реализация численных методов с использованием существующих вычислительных средств при N> 3 не представляется достаточно эффективной [147], то наибольшее распространение при анализе вероятностных характеристик вектора состояния ^ получили методы функциональной аппроксимации плотности [28]. И наиболее распространенный среди них - метод аппроксимации гауссовской плотностью


    р&t⁾⁼ - \—expI⁻2&⁻&)TP&⁻&)}, (j[2п) detP   I ²          J


(1.6)

где = = ((t) - математическое ожидание вектора состояния ^;
P = P (t)  - матрица ковариаций,
позволяющий сформировать аппроксимацию решений уравнений с частными производными вида (1.2, 1.5) в виде решений систем обыкновенных дифференциальных уравнений относительно параметров £, , P искомых плотностей.


5

     Наряду с традиционными достоинствами метода гауссовской аппроксимации [160], следует также отметить свойство плотности (1.6) минимизировать информационный функционал Фишера при условии существования конечной матрицы P [119]. Это, в свою очередь, позволяет решать на основе аппроксимации (1.6) задачи стохастического управления и оценивания в минимаксной постановке - искать оптимум заданного функционала при минимуме информации о векторе состояния ^ [119].
     В самом распространенном на практике варианте уравнений оценки, так называемом обобщенном (расширенном) нелинейном гауссовском фильтре, уравнения оценки вектора состояния (1.1) имеют вид


1 = f + и + K (^,t)(z - H (£t)),                 (1.7)



                  K ("'• t ) = P^H D-,
                  P = P — (.f + U)T + — (.f + U) P + f 0 fT - KD,K’. ^                  ^


(1.8)

     При аналогичной аппроксимации решения уравнения ФПК, т.е. априорной плотности вероятности, уравнения векторных параметров плотности получаются из (1.7, 1.8) при H = 0.
     Приведенные уравнения являются исходными при последующем синтезе оптимальных управлений.
     Для возможности окончательной постановки задачи синтеза рассмотрим далее виды критериев оптимальности, обеспечивающих формирование стохастических управлений в наиболее общем случае оптимизации процесса управления системой.

1.2. Критерии оптимизации
     Решение проблемы синтеза оптимального управления стохастическими объектами осуществляется в настоящее время на основе использования методов, изначально разработанных для детерминированных систем [1]. Данное обстоятельство неизбежно приводит к стохастическому характеру известных критериев оптимизации и функций оптимальности (Гамильтона или Беллмана) и, как следствие, к необходимости рассмотрения средних значений [1, 28]. Это, в свою очередь, определяет интегральную зависимость оптимального управления от плотности распределения вектора состояния, требуя, в конечном итоге, решения двухточечной краевой задачи для системы уже не обыкновенных дифференциальных, а интегро-дифференциальных уравнений совместно с интегро-дифференциальным уравнением в частных производных для неизвестной плотности распределения параметров состояния. Очевидные трудности решения такой систе-6

мы привели к использованию единственной на сегодняшний день возможности ее приближенного интегрирования на основе гауссовской аппроксимации функции плотности. Но подобная аппроксимация порождает ошибки не только в определении самой плотности распределения, но и требует статистической линеаризации уравнений объекта, приводящей к дополнительным ошибкам решения двухточечной краевой задачи. Кроме того, существующие подходы не позволяют использовать в качестве критериев оптимизации обобщенные формы вероятностных критериев, нелинейно зависящих непосредственно от плотности распределения (критерий минимума энтропии вектора состояния, критерий Кульбака и др.) и определенных в общем случае в замкнутой области существования параметров состояния.
     В связи с этим возникает проблема разработки такого подхода к синтезу оптимального управления стохастическими объектами, который, во-первых, позволял бы построить закон управления в замкнутой форме при самой общей нелинейной зависимости критерия оптимизации от плотности распределения вектора состояния, и, во-вторых, позволил бы избежать ошибок статистической линеаризации уравнений объекта.
     Для возможности дальнейшего решения задачи поиска подобного оптимального управления критерий оптимизации запишем в следующей наиболее общей форме:

J = J J ф[р(£,t),U(£,t)]%dt = J W*(t)dt,       (1.9)
T                       T

где Ф - известная нелинейная функция, учитывающая в общем случае возможные аналитические ограничения на вектор управления;
T = [ 1₀, tₖ] - временной интервал оптимизации;
^«   - некоторое ограниченное множество параметров состояния.

     На практике чаще используется более простая форма критерия оптимальности

     J = J |ф₁[р(^,t)]dt + J Jo2[U(£,t)]dt = J W*(t)dt,       (1.10)
         T 5(1)            T 5(2)              T

где Фi, i =1,2 - известные нелинейные аналитические функции;
     ^ i    - области пространства состояний, в которых определяется
               оптимальное управление;
достаточно адекватно отражающая естественное формирование условия, обеспечивающего оптимальность исследуемой системы как в смысле точности, так и затрат на управление.


7

     При этом различные вариации вида функции Ф₁ позволяют охватить достаточно широкий класс условий оптимальности по точности:
     -        максимума (минимума) вероятности существования вектора £ в области £,(1): Ф1(р) = ±р;
     -        минимума отклонения искомой плотности вероятности р от заданной g: Ф1(р) = (р-g)2, Ф1(р) = |р-g, Ф1(р) = -рln^g) (критерий Куль-бака) и т.д.;
     -      максимума информации о векторе состояния £:

Ф1(р) = р

д ln р

д ln р

д£ JL д£

(критерий Фишера) и др.,

а функции Ф2 - условий оптимальности по текущим затратам на регулирование (энергетическое обеспечение) процесса (как правило, функция Ф2 выбирается возрастающей положительно определенной: квадратичной Ф2(U) = UTDU или экспоненциальной Ф2(U) =exp (aTU), где D, а - матрица и вектор известных постоянных коэффициентов [147]).
     Наряду с критерием (1.10) далее будем использовать его модификацию, обеспечивающую синтез оптимального управления не на конечном (замкнутом) интервале времени Т, а в реальном (текущем) масштабе времени движения t
J1 = |Ф1[р(£,t)]d£ +J |ф2[U(£,t)]d£dt.            (1.11)
               £(1)          10 £( 2)

     Данный критерий традиционен для задач управления в реальном времени (например, подвижными объектами) и называется локальным [28] (в отличие от терминального (глобального) критерия (1.10)). Оптимальное управление U, формируемое на его основе, называется локальнооптимальным . Существенным преимуществом применения критерия (1.11) является простота синтезируемого на его основе управления, позволяющая легко реализовать алгоритмы локально-оптимального управления непосредственно на борту подвижного объекта. В заключение следует также отметить, что форма критериев (1.10), (1.11) охватывает одну из возможных постановок задачи управления процессами самоорганизации -при выборе в качестве первой составляющей критерия энтропии системы или критерия Фишера. В этом случае поиск управления, оптимизирующего энтропию системы, представляет собой, по существу, формирование ее параметров, обеспечивающих оптимальное протекание процесса самоорганизации.

8

1.3.   Априорное оптимальное управление вектором состояния
1.3.1. Постановка задачи
     В отличие от традиционной постановки задачи синтеза стохастического оптимального управления - на основе усредненного функционала и дифференциальных моделей математического ожидания вектора состояния, использование критерия типа (1.9) предполагает поиск управления уже не самим процессом, а его плотностью распределения р(£,t). В свою очередь, функция р в отличие от вектора ^ описывается дифференциальным уравнением с частными производными (а в случае (1.5) даже интегро-дифференциальным), что требует привлечения математического аппарата синтеза управления системами уже с распределенными параметрами. Теория подобного синтеза в настоящее время разработана достаточно подробно [18] и базируется, в основном, на применении двух методов - динамического программирования и принципа максимума, обобщенных на случай распределенных систем. Для дальнейших построений используем метод динамического программирования: во-первых, в силу его более общего характера, а, во-вторых, большей универсальности и простоты синтеза оптимального управления.
     Кроме того, процедуру формирования оптимального управления рассмотрим в двух принципиально различных случаях - для ненаблюдаемого объекта управления (1.1) и наблюдаемого с использованием нелинейного измерителя вида (1.4), когда решение задачи синтеза является, по существу, решением проблемы дуального управления [171] в наиболее общем (замкнутом) виде.
     Для простоты последующего изложения управление в первом случае определим как априорное, во втором - как апостериорное.


1.3.2. Синтез априорного оптимального управления
     Для иллюстрации общности предложенного подхода к синтезу стохастического управления рассмотрим формирование вектора U, оптимизирующего нелинейный функционал J (1.9).
     Оптимальное управление будем искать в классе ограниченных непрерывных функций со значениями из открытой области U*. Для его построения используем метод динамического программирования, согласно которому задача сводится к решению функционального уравнения [18]


. Гdv .   1 Л
min 1--+ W* > = 0
UeU* I dt  J


(1.12)

при конечном условии V(tK) = 0 относительно оптимального функционала V, параметрически зависящего от времени t e T и определенного на множестве функций р, удовлетворяющих уравнению (1.2).


9

     Для линейных систем с распределенными параметрами, к классу которых относятся уравнения типа (1.2), функционал отыскивается в виде интегральной квадратичной формы [18]


V = fv(j,{)Р2 {) dj, j

откуда имеем


  'V + W* =4~TP2 + 2vpL0{р}+ф[р,U]-²vpsffr-P + ui З^-'lldj> ⁽¹.¹³⁾ dt |[ dt                            i (dji   dji )\


где индекс “ i ” используется для обозначения компонентов соответствующих векторов.
     Анализ полученного выражения показывает, что определение вектора U(j,t) из решения функционального уравнения (1.12) сводится к классической задаче отыскания вектор-функции, реализующей минимум определенного интеграла (1.13). При этом вектор-функция U(j,t), являющаяся решением данной задачи, должна удовлетворять системе уравнений Эйлера
              dr   21 дФ      др
-—|2vp²1- — + 2vp^ = 0        i = 1,2,..., N,
             dji L J dUi      dj i

или


(1.14)


     В общем случае (1.14) представляет собой систему нелинейных уравнений относительно компонентов вектора управления, допускающую аналитическое разрешение только в некоторых частных случаях, например, когда функция Ф[р, U] имеет следующий вид:

Ф = Ф1[р] + Ф 2 [ U ],


где Ф₂(1) - аналитические функции, первые производные которых допускают обращение,
или, например,

ф = Ф1 [р] + [ u (j, t)- u о (j, t)]T Du (j, t)[ u (j, t)- u о (j, t)],

где DU( j ,t) - известная симметричная квадратная матрица;
U₀(j ,t) - известный вектор.


10

Доступ онлайн
от 288 ₽
В корзину