Математические основы теории оптимального и логического управления
Покупка
Год издания: 2011
Кол-во страниц: 600
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7038-3366-7
Артикул: 416361.02.99
В книге, состоящей из двух частей, приведен математический аппарат, используемый в теории оптимального и логического управления. В первой части рассмотрены вариационное исчисление, принцип максимума и метод динамического программирования, а также оптимальная фильтрация в непрерывных и дискретных автоматических системах. Во второй части — математический аппарат, используемый в теории автоматического управления при синтезе автоматических систем (например, систем управления роботами), работающих в условиях неопределенности внешней среды.
Изложение материала сопровождается решением основных задач теории оптимального и логического управления.
Тематика:
ББК:
УДК:
- 519: Комбинатор. анализ. Теория графов. Теория вер. и мат. стат. Вычисл. мат., числ. анализ. Мат. кибер..
- 681: Точная механика. Автоматика. Приборостроение
ОКСО:
- ВО - Бакалавриат
- 15.03.04: Автоматизация технологических процессов и производств
- 15.03.06: Мехатроника и роботехника
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Допущено Учебнометодическим объединением вузов по университетскому политехническому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 220400 «Мехатроника и робототехника» Москва 2011 им. Н.Э. Баумана МГТУ ИЗДАТЕЛЬСТВО Математические основы теории оптимального и логического управления В.А. Иванов, В.С. Медведев
УДК 519.711.3(075.8) ББК 22.161.6 И20 Издано при финансовой поддержке Федерального агентства по печати и массовым коммуникациям в рамках Федеральной целевой программы «Культура России» Рецензенты: кафедра «Проблемы управления» Московского института радиотехники, электроники и автоматики (технический университет) (зам. зав. кафедрой, д-р техн. наук, проф. В. М. Лохин); д-р техн. наук, проф. В. Л. Афонин Иванов В. А. И20 Математические основы теории оптимального и логического управления : учеб. пособие / В. А. Иванов, В. С. Медведев. –– М. : Изд-во МГТУ им. Н. Э. Баумана, 2011. –– 599, [1] с. : ил. ISBN 978-5-7038-3366-7 В книге, состоящей из двух частей, приведен математический аппарат, используемый в теории оптимального и логического управления. В первой части рассмотрены вариационное исчисление, принцип максимума и метод динамического программирования, а также оптимальная фильтрация в непрерывных и дискретных автоматических системах. Во второй части –– математический аппарат, используемый в теории автоматического управления при синтезе автоматических систем (например, систем управления роботами), работающих в условиях неопределенности внешней среды. Изложение материала сопровождается решением основных задач теории оптимального и логического управления. Содержание учебного пособия соответствует курсам лекций, которые авторы читают в МГТУ им. Н. Э. Баумана. Для студентов, обучающихся по направлению подготовки «Системы автоматического управления». Будет полезно аспирантам и инженерам, специализирующимся в данной области. УДК 519.711.3(075.8) ББК 22.161.6 ISBN 978-5-7038-3366-7 c⃝ Иванов В. А., Медведев В. С., 2011 c⃝ Оформление. Издательство МГТУ им. Н. Э. Баумана, 2011
ПРЕДИСЛОВИЕ Основой настоящего учебного пособия служат разделы специальных курсов лекций, которые авторы читают на протяжении ряда лет студентам МГТУ им. Н. Э. Баумана, специализирующимся в области управления техническими объектами. В нем приведен математический аппарат, владение которым необходимо студентам для последующего изучения соответствующих разделов курса «Теория автоматического управления». Учебное пособие является логическим продолжением трехтомного издания «Математические основы теории автоматического управления», в состав авторского коллектива которого входили и авторы настоящей книги. В части I пособия на базе теории классического вариационного исчисления и на основе принципа максимума и динамического программирования изложены методы решения задач оптимизации, т. е. поиска закона управления, обеспечивающего наилучшие показатели качества технической системы. Они и до настоящего времени являются основными математическими методами теории оптимального управления. В главе 1 приведены определения функционала и функционального пространства, дано понятие сильного и слабого экстремума функционала. Рассмотрены необходимое и достаточные условия экстремума функционала, приведены уравнения Эйлера –– Лагранжа, необходимое условие экстремума функционалов, зависящих от функций нескольких переменных. Рассмотрены задача Лагранжа на условный экстремум, изопериметрическая задача, задачи Майера и Больца. Значительное внимание уделено применению методов вариационного исчисления для синтеза оптимальных автоматических систем. В главе 2 изложен принцип максимума и его применение для синтеза управления в оптимальных автоматических системах. Приведена основная теорема принципа максимума, на ее основе построены оптимальные управления по быстродействию, расходу топлива, по квадратичному критерию качества как для непрерывных, так и дискретных систем, оптимальное управление при ограничениях фазовых координат. Глава 3 посвящена методу динамического программирования для синтеза оптимального управления дискретными и непрерыв
Предисловие ными системами. Рассмотрен принцип оптимальности Беллмана, синтез оптимального управления линейными системами по квадратичному критерию качества, синтез систем стабилизации. В главе 4 описана теория оптимальной фильтрации в системах управления при наличии случайных воздействий. Приведены необходимые и достаточные условия экстремума качества фильтрации (дисперсии ошибки фильтрации) для непрерывных и дискретных систем, рассмотрены уравнения Винера –– Хопфа для непрерывных и дискретных систем, методы решения этих уравнений, дается вывод уравнений фильтра Калмана для непрерывных и дискретных систем. В части II настоящего пособия изложены методы современной алгебры, необходимые при изучении теории логического управления. В главе 5 даны понятия абстрактного множества, функции, бинарного отношения и графа, а также основные термины абстрактной алгебры: кольцо, тело, поле, изоморфизм алгебр. В главе 6 вводятся основные понятия и законы алгебры логики, рассматривается полнота системы булевых функций и основные операции в ней. Приведены примеры реализации логических схем и методы их упрощения. В главе 7 изложены методы исчислений высказываний и предикатов. Даны основные определения, правила вывода, а также вопросы применения исчисления предикатов в математике и технических приложениях. Глава 8 содержит основные положения теории графов. Приведены основные определения этой теории, рассматриваются виды графов, методы раскраски графов. Глава 9 посвящена конечным автоматам. Даны определения конечных автоматов и их классификация, введено понятие алгоритма, рассмотрены способы задания автоматов, а также модели функционирования конечных автоматов в виде сетей Петри. В главе 10 приведены методы дискретной алгебры и их применение для решения задач управления. Для усвоения материала книги достаточно знать традиционные курсы математического анализа и линейной алгебры, читаемые студентам инженерных специальностей. Часть I книги написана В. А. Ивановым, часть II –– В. С. Медведевым. Выражаем глубокую благодарность рецензентам профессору В. Л. Афонину и коллективу кафедры «Проблемы управления» Московского института радиотехники, электроники и автоматики за многочисленные советы, которые были учтены авторами. Все замечания читателей по содержанию книги будут приняты с благодарностью.
Часть I ВАРИАЦИОННЫЕ МЕТОДЫ И ИХ ПРИМЕНЕНИЕ В ЗАДАЧАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
Гл ава 1 ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ § 1.1. Функционалы. Непрерывность и дифференцируемость функционалов 1.1.1. Функциональные пространства При синтезе оптимальных систем автоматического регулирования и управления в качестве критериев оптимизации используются различные функционалы, которые определены ниже. Вначале введем понятие функции: если задан закон, по которому каждому числу из некоторого числового множества ставится в соответствие другое число, это соответствие называется функцией. Говорят, что на некотором множестве функций задан функционал, если указан закон, по которому каждой функции из этого множества ставится в соответствие число. В математике рассматриваются три типа соответствий: функции, функционалы и операторы. Если каждой функции из некоторого множества функций ставится в соответствие некоторая другая функция из иного множества функций, это соответствие называется оператором. Примеры функционалов: 1) на плоскости всевозможные непрерывные кривые соединяют две точки A и B. Пусть тело может двигаться вдоль этих кривых, имея в каждой точке кривой скорость v(x, y). Тогда время движения тела вдоль кривой будет функционалом (рис. 1.1); Рис. 1.1
Часть I. Вариационные методы и их применение 2) длина дуги кривой, проходящей через две заданные точки, представляет собой функционал, заданный на множестве всех спрямляемых кривых ∗, проходящих через эти точки; 3) интеграл J(y) = ba F(x, y, y′) dx, (1.1) где y(x) –– непрерывная и непрерывно дифференцируемая функция, определенная на отрезке [a, b]; F(x, y, y′) –– непрерывная функция трех аргументов, также является функционалом; 4) в теории автоматического управления применяют интегральный критерий оценки качества автоматических систем J(x) = ∞0 n i=0 ai[x(i)(t)]2 dt, (1.2) который также представляет собой функционал, определенный на множестве процессов изменения регулируемой величины x(t). Здесь a0, a1, ..., an –– некоторые весовые коэффициенты; 5) в теории оптимальных систем автоматического управления при синтезе оптимальных регуляторов, как правило, в качестве критерия оптимизации применяют различные функционалы. Наибольшее распространение из них получили: а) квадратичный функционал J(x, u) = t1t0 [xтQ(t)x + uтR(t)u] dt, (1.3) где x –– вектор состояния системы; u –– вектор управления; Q(t) и R(t) –– симметрические матрицы весовых коэффициентов; б) функционал J(x, u) = t1 − t0, (1.4) характеризующий время перехода системы из начального состояния x(t0) = x0 в конечное состояние x(t1) = x1. Функционалы (1.3) и (1.4) представляют собой частный случай функционала J(x, u) = t1t0 f0(x, u, t) dt. (1.5) ∗О спрямляемой кривой см., например: Г. М. Фихтенгольц. Основы математического анализа. В 2 т. Т. 1. М.: Физматлит, 2002. С. 370.
Глава 1. Вариационное исчисление 9 Действительно, для функционала (1.3) f0(x, u, t) = xтQ(t)x + uтR(t)u, а для функционала (1.4) –– f0(x, u, t) ≡ 1. Задачей вариационного исчисления является определение наименьших и наибольших значений функционалов, а также кривых, на которых достигается экстремум функционалов. Примеры задач определения экстремумов функционалов: 1) среди всех кривых y = y(x), соединяющих на плоскости точки A и B, найти кривую, имеющую наименьшую длину; 2) найти кривую, по которой тяжелая материальная точка перейдет из положения A(x0, y0) в положение B(x1, y1) за минимальное время (задача о брахистохроне); 3) определить характеристическое уравнение системы автоматического управления, для которой квадратичный функционал J(x) = ∞0 n i=0 ai[x(i)(t)]2 dt имеет минимальное значение. Здесь x(t) –– процесс изменения управляемой величины. Каждую функцию будем рассматривать как элемент некоторого пространства. Пространства, элементами которых являются функции, называются функциональными пространствами. Функциональные пространства различны в зависимости от вида рассматриваемых функций. Для оценки близости элементов функционального пространства используют понятие нормы. Напомним, что линейное пространство R называется нормированным, если каждому элементу x ∈ R поставлено в соответствие неотрицательное число ∥x∥, называемое нормой элемента x. При этом должны выполняться следующие аксиомы: • ∥x∥ = 0 только при x = 0; • ∥ax∥ = |a|∥x∥, где a –– некоторое число; • ∥x + y∥ ⩽ ∥x∥ + ∥y∥ (неравенство треугольника). Расстояние r(x1, x2) между элементами x1 и x2 ∈ R определяется нормой ∥x1 − x2∥ = r(x1, x2). Далее рассматриваются следующие функциональные пространства: 1) пространство C[a, b], состоящее из непрерывных функций y(x), определенных на отрезке [a, b]. Для этого пространства норма
Часть I. Вариационные методы и их применение вводится следующим образом: ∥y(x)∥ = max x∈[a,b] |y(x)|; (1.6) 2) пространство C1[a, b], состоящее из непрерывных функций y(x), определенных на отрезке [a, b] и имеющих на нем непрерывную первую производную. В этом пространстве норма ∥y(x)∥1 = max x∈[a,b] |y(x)| + max x∈[a,b] |y′(x)|; (1.7) 3) пространство Cn[a, b], состоящее из функций y(x), непрерывных на отрезке [a, b] и имеющих на нем непрерывные производные до порядка n включительно. В этом пространстве норма задается формулой ∥y(x)∥n = n k=0 max x∈[a,b] |y(k)(x)|. (1.8) Нетрудно проверить, что определенные нормы (1.6) –– (1.8) элементов в различных функциональных пространствах удовлетворяют всем приведенным выше аксиомам. 1.1.2. Непрерывность функционалов. Линейные и квадратичные функционалы Введем понятие непрерывности функционала. Функционал J(y) называется непрерывным в точке y0 ∈R, если для любого числа e > 0 можно указать такое число d(y0, e) > 0, что если ∥y − y0∥ < d, то |J(y) − J(y0)| < e. Функционал J(y) называется непрерывным в области G, если он непрерывен в каждой точке этой области. Пусть R –– линейное нормированное пространство, на котором задан функционал J(y). Этот функционал называется линейным, если выполняются следующие условия: 1) для любых y1, y2 ∈ R справедливо равенство J(y1 + y2) = J(y1) + J(y2); 2) для любого числа a справедливо равенство J(ay) = aJ(y). Далее рассматриваются в основном непрерывные линейные функционалы. Примеры непрерывных и линейных функционалов: