Оптимальное управление в классическом вариационном исчислении
Покупка
Новинка
Автор:
Деменков Николай Петрович
Год издания: 2017
Кол-во страниц: 135
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7038-4714-5
Артикул: 841932.01.99
Приведены необходимые теоретические сведения и даны примеры решения задач оптимального управления на основе классического вариационного исчисления. Для студентов МГТУ им. Н.Э. Баумана, обучающихся по направлению «Управление в технических системах» и изучающих дисциплины «Оптимальное управление детерминированными процессами», «Алгоритмическое и программное обеспечение систем управления», «Управление в технических системах», «Основы автоматики и системы автоматического управления».
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Московский государственный технический университет имени Н.Э. Баумана Н.П. Деменков Оптимальное управление в классическом вариационном исчислении Учебное пособие 1
УДК 519.3(075.8) ББК 22.161.8 Д30 Издание доступно в электронном виде на портале ebooks.bmstu.ru по адресу: http://ebooks.bmstu.ru/catalog/200/book1678.html Факультет «Информатика и системы управления» Кафедра «Системы автоматического управления» Рекомендовано Редакционно-издательским советом МГТУ им. Н.Э. Баумана в качестве учебного пособия Рецензенты: д-р техн. наук профессор К.А. Неусыпин канд. техн. наук доцент В.А. Суханов Д30 Деменков, Н. П. Оптимальное управление в классическом вариационном исчислении : учебное пособие / Н. П. Деменков. — Москва : Издательство МГТУ им. Н. Э. Баумана, 2017. — 133, [3] с. : ил. ISBN 978-5-7038-4714-5 Приведены необходимые теоретические сведения и даны примеры решения задач оптимального управления на основе классического вариационного исчисления. Для студентов МГТУ им. Н.Э. Баумана, обучающихся по направлению «Управление в технических системах» и изучающих дисциплины «Оптимальное управление детерминированными процессами», «Алгоритмическое и программное обеспечение систем управления», «Управление в технических системах», «Основы автоматики и системы автоматического управления». УДК 519.3(075.8) ББК 22.161.8 МГТУ им. Н.Э. Баумана, 2017 Оформление. Издательство ISBN 978-5-7038-4714-5 МГТУ им. Н.Э. Баумана, 2017 2
Предисловие При управлении производственными процессами и техническими объектами приходится выбирать из всех возможных вариантов наилучший (оптимальный), что требует развития такого раздела математики, как вариационное исчисление. В данном учебном пособии рассмотрены вопросы применения классического вариационного исчисления к решению задач оптимального управления. Так как задачи оптимального управления — это задачи на условный экстремум функционала, то они похожи на задачу Лагранжа в классическом вариационном исчислении. Однако задачи оптимального управления имеют ряд существенных отличий от задач в классическом вариационном исчислении. Они заключаются в следующем. 1. Существуют ограничения на управление ( ) u t U и траекторию ( ) . x t X 2. Подынтегральная функция L в критерии качества не зависит от u , т. е. существуют первые интегралы уравнений Эйлера для переменных ( ). i u t 3. Управления ( ) i u t являются кусочно-непрерывными функциями и могут иметь точки разрыва первого рода, в то время как в классическом вариационном исчислении все неизвестные функции дважды непрерывно дифференцируемы. Методы классического вариационного исчисления не позволяют учитывать при решении задач многие ограничения, реально существующие в управляемых процессах. В силу этого математический аппарат вариационного исчисления использовался при проектировании систем управления крайне редко и давал весьма ограниченный эффект, да и то лишь в частных задачах с применением искусственных приемов. Вариационное исчисление удалось распространить на задачи оптимального управления только после опубликования принципа максимума Л.С. Понтрягина усилиями ученых разных стран. 3
Однако получаемые таким образом условия оптимальности оказываются аналогичными принципу максимума и являются по сравнению с ним более слабыми. Именно в вариационном исчислении область допустимых значений вектора управления обязательно должна удовлетворять условию связанности. В принципе максимума эта область может быть любым множеством векторного пространства, например состоять из совокупности изолированных точек. Таким образом, методами классического вариационного исчисления могут быть решены задачи оптимального управления без ограничений на траекторию и управление и некоторые задачи с ограничениями. На практике при определении оптимального управления предпочтение отдается, как правило, принципу максимума или динамическому программированию Р. Беллмана. Однако изучение вариационного исчисления как одного из методов построения оптимального управления позволяет более глубоко понять содержание математических методов теории оптимального управления и их возможности. Это и послужило основанием для написания данного учебного пособия. Цель учебного пособия состоит в изложении в доступной форме примеров решения задач оптимального управления на основе классического вариационного исчисления и в рассмотрении алгоритмов решения однокритериальной задачи оптимизации, использующих современные информационные средства с применением классического вариационного исчисления. В пособии приведены различные математические постановки задач оптимального управления непрерывными детерминированными системами и пути их решения методами классического вариационного исчисления, изложены методы повышения эффективности этих алгоритмов, представлено большое число примеров решения тестовых и практически значимых задач оптимизации. Задачи оптимального управления являются задачами минимизации на множестве функций. Поэтому в первой главе рассмотрены необходимые условия оптимальности в различных постановках. Вторая глава посвящена вычислительным аспектам, возникающим при управлении объектом с обратной связью по состоянию. 4
В классическом вариационном исчислении исследуются только гладкие траектории движения системы, в то время как во многих задачах управления область допустимых траекторий и управлений оказывается ограниченной и замкнутой. Поэтому в третьей главе изложены методы решения задач оптимизации динамических систем при наличии ограничений на траекторию. В четвертой главе рассмотрены различные математические постановки задач оптимального управления непрерывными детерминированными системами и пути их решения методами классического вариационного исчисления. В результате освоения материала учебного пособия студенты приобретут навыки и умения по расчету оптимальных систем управления методами классического вариационного исчисления. 5
Глава 1 Необходимые условия оптимальности Если математическое описание системы управления и ограничения даны в виде дифференциальных или алгебраических уравнений и функционалов типа определенных интегралов, а координаты управления и входящие в уравнения функционалы функции имеют 2п непрерывных производных (n — порядок уравнения объекта управления), то задача оптимизации в принципе может быть решена методами классического вариационного исчисления. Классическое вариационное исчисление применяется в тех случаях, когда ограничения на переменные состояния и управления отсутствуют. Это бывает, когда рассматриваются малые отклонения вектора состояния x и вектора управления u от их установившихся значений. 1.1. Необходимые условия оптимальности на фиксированном интервале времени 1.1.1. Оптимизация при отсутствии краевых условий на правом конце траектории Рассмотрим следующую задачу Больца. Определить непрерывную вектор-функцию u (t) и дифференцируемую векторфункцию x (t) со значениями из пространств Rm и Rn соответственно, доставляющие минимум функционалу k t J( x ,u ) = t L ( x ,u , t)dt + Gk [ x (tk), tk ], (1.1) 0 где L — скалярная, непрерывно дифференцируемая функция своих аргументов, при условиях 6
x = f ( x (t), u (t), t ), x (t0) = x 0, t0 t tk. (1.2) Здесь f — непрерывно дифференцируемая вектор-функция, а t0 и tk заданы. Прибавив к выражению (1.1) для J систему дифференциальных уравнений (1.2) с некоторым множителем p (t), в результате получим вспомогательный критерий качества k T t J1 = t x u t p x t u t t f x L dt + Gk [ x (tk), tk ]. (1.3) 0 , , ) ( ), ( ), ( ( ) Для удобства введем вспомогательную скалярную функцию H (гамильтониан): H( , x , u , p t) = L( , x , u t) + T p (t) f ( ( ), x t ( ), u t t). (1.4) Интегрируя по частям подынтегральное выражение в (1.3), получим J G t t t t t t x p x ) ( ) ( ) p x 1 k k k k k 0 0 T T [ ( ) ] ( ) ( , – t k T x p x H u p t t t dt ( ) ( ) , ( ) . , , (1.5) t 0 Рассмотрим вариацию критерия качества J1, соответствующую вариациям u вектора управления u (t) при фиксированных значениях t0 и tk: k H t k T T T 1 G J p x p x p x x x t 0 0 t t t tk H . (1.6) u dt u Определять непосредственно вариации x (t), вызванные заданными вариациями u (t), было бы довольно громоздко, поэтому 7
выберем множитель p (t) таким образом, чтобы коэффициенты при вариациях x (t) и x (tk) в (1.6) обратились в нуль. Тогда (1.7) T T H p p x x L f x с граничным условием (1.8) T . k k t t G p t x k В этом случае уравнение (1.6) примет вид k t T 1 0 0 . t J p t x t H udt u (1.9) 0 Выражение (1.9) для J1 называется первой вариацией критерия качества J. Из (1.9) следует, что функция p T(t0) — это градиент критерия качества J, поскольку J1 = J на решениях системы (1.2) по x (t0) при условии, что функция u (t) фиксирована (не варьируется, т. е. u (t) = 0) и удовлетворяет уравнению (1.2). Функция p (t) носит также название функции влияния на критерий J вариаций x (t) (или функции чувствительности критерия J к вариациям x (t)), поскольку она указывает на изменение критерия при изменениях (вариациях) x (t) в произвольный момент времени t = t0. Компоненты вектор-функции H/u называются импульсами или импульсными переходными (или весовыми) функциями, поскольку каждая компонента H/ui представляет собой изменение критерия J при вариации ui, равной единичной импульсной функции (функции Дирака, дельта-функции ( – t)), приложенной в момент t. При этом величина x (t0) считается фиксированной и удовлетворяющей уравнению (1.2). Если функционал J достигает экстремума, то вариация J должна быть нулем для произвольных выражений u (t). Для этого необходимо, чтобы выполнялось условие 8
0, . k t t H t u (1.10) Уравнения (1.7), (1.8) и (1.10) известны в вариационном исчислении как уравнения Эйлера — Лагранжа. Итак, для того чтобы найти вектор управления u (t), при котором критерий качества J достигает экстремального значения, нужно решить систему дифференциальных уравнений x = , ( , ) x f u t (1.11) при x (t0) = 0; x T T L p p x x f (1.12) при p (tk) = T , k G x где u (t) определяется из условия 0 u H или T T 0. L p u f u (1.13) Граничные условия для уравнений (1.11) и (1.12) разделены: x (t0) заданы при t = t0, p (tk) заданы при t = tk. Таким образом, приходим к необходимости решения двухточечной краевой задачи. Если функции L и f явно не зависят от времени t, то задача имеет первый интеграл. Действительно, T T . t u x t u H x u p f H H u H p f H H u t H H H x u Если L и f (а следовательно, и ) H не являются явными функциями от времени t, а u (t) — оптимальное управление (т. е. условие (H / u ) = 0 выполнено), то 9
H = 0 или H = const (1.14) вдоль оптимальной траектории. Для того чтобы критерий качества J достиг локального минимума, недостаточно выполнения условия H/u =0. Необходимо еще, чтобы при выполнении условия x – f ( , x , u t) = 0 слагаемое второго порядка 2J (вторая вариация J ) в выражении для J было неотрицательным для всех бесконечно малых значений u , т. е. k t k G J 2 2 T T T 1 1 2 2 x x x u x 0 2 t t t k 2 2 2 0 dt (1.15) 2 2 2 H H u x x x u H H x u u при условии, что ( x – f ) = 0, или d x f f x u x t dt x u (1.16) 0 ( ) , ( ) 0. Уравнение (1.16) определяет x через u довольно сложно. Особенность задачи со свободным концом состоит, таким образом, в том, что на правом конце траектории полностью определен вектор импульса. Это обстоятельство делает задачу со свободным концом наиболее простой среди других задач для численного решения. В качестве примера рассмотрим принцип Гамильтона в аналитической механике. Согласно принципу Гамильтона истинное (реально осуществляющееся) движение консервативной механической системы, переводящее ее из фиксированной в момент времени t0 точки 0 q в другую заданную точку k q в течение заданного промежутка времени tk — t0, отличается от всех возмож10