Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Теория оптимального управления: вводный курс лекций

Покупка
Новинка
Артикул: 836532.01.99
Доступ онлайн
400 ₽
В корзину
В сжатой и доступной для экономистов и математиков форме излагаются основные понятия теории оптимального управления и вариационного исчисления. Теоретический материал иллюстрируется примерами из математической экономики. Предназначено для студентов, обучающихся по направлениям подготовки бакалавров «Прикладная математика и информатика» и «Бизнес-информатика».
Максимов, В. П. Теория оптимального управления: вводный курс лекций : учебное пособие / В. П. Максимов. - 2-е изд. - Пермь : Перм. гос. нац. исслед. ун-т, 2018. - 84 с. - ISBN 978-5-7944-3068-4. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2159895 (дата обращения: 08.09.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ 

Федеральное государственное бюджетное  
образовательное учреждение высшего образования 
«ПЕРМСКИЙ ГОСУДАРСТВЕННЫЙ 
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ» 
 
 
 
 
 
В. П. Максимов 
 
 
ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ  
 
 
ВВОДНЫЙ КУРС ЛЕКЦИЙ 
 
 
Издание 2-е, дополненное 
 
 
Допущено методическим советом 
Пермского государственного национального 
исследовательского университета в качестве 
учебного пособия для студентов, обучающихся 
по направлениям подготовки бакалавров 
«Прикладная математика и информатика» 
и «Бизнес-информатика» 
 
 
 
 

 
Пермь 2018 
 

УДК 517.983.22: 330.4 
ББК 22.18: 65.050: 22.161.8 
 
 
 
М17 
Максимов В. П. 
Теория оптимального управления: вводный курс лекций: учеб. пособие / В. П. Максимов; Перм. гос. нац. исслед. ун-т. – 2-е изд., 
доп. – Пермь, 2018. – 84 с.: ил.  

ISBN 978-5-7944-3068-4 
 
 
В сжатой и доступной для экономистов и математиков форме излагаются 
основные понятия теории оптимального управления и вариационного исчисления. Теоретический материал иллюстрируется примерами из математической 
экономики. 
Предназначено для студентов, обучающихся по направлениям подготовки 
бакалавров «Прикладная математика и информатика» и «Бизнес-информатика». 
Ил. 12. Библиогр. 7 назв. 
 
УДК 517.983.22: 330.4 
ББК 22.18: 65.050: 22.161.8 
 
 
 
Печатается по решению редакционно-издательского совета 
Пермского государственного национального исследовательского университета 
 
 
Рецензенты: кафедра дифференциальных уравнений Удмуртского государственного университета (зав. кафедрой – д-р физ.-мат. наук 
С. Н. Попова); д-р физ.-мат. наук, проф. кафедры прикладной 
математики и информатики Ижевского государственного технического университета им. М. Т. Калашникова Н. И. Калядин 
 
 
 
 

 
ISBN 978-5-7944-3068-4 

© ПГНИУ, 2018
© Максимов В. П., 2004 
© Максимов В. П., с изменениями, 2018 
 
 

ОГЛАВЛЕНИЕ 

 
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
Часть 1. Теоретический материал . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
1. Введение. Краткая историческая справка  . . . . . . . . . . . . . . . . . . . . . . 

1.1.  Древнейшие задачи на экстремум  . . . . . . . . . . . . . . . . . . . . . . . . 
1.2. Необходимое условие экстремума функции  . . . . . . . . . . . . . . . . 
1.3. Зарождение вариационного исчисления. Задача  
                    о брахистохроне . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

1.4. Зарождение теории линейного программирования  . . . . . . . . . . 
1.5. Зарождение теории оптимального управления . . . . . . . . . . . . . .  

 
2. Простейшая задача вариационного исчисления . . . . . . . . . . . . . . . . . 

2.1. Постановка задачи  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
2.2. Необходимое условие локального экстремума . . . . . . . . . . . . . . 
2.3. Случай квадратичного интегранта . . . . . . . . . . . . . . . . . . . . . . . . 
2.4. Достаточные условия экстремума . . . . . . . . . . . . . . . . . . . . . . . . . 
2.5. Решение задачи о максимизации прибыли монополиста . . . . .  . 

 
3. Принцип максимума Л. С. Понтрягина . . . . . . . . . . . . . . . . . . . . . . . . .

3.1. Постановка задачи оптимального управления со свободным 
       правым концом траектории  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
3.2. Формулировка принципа максимума . . . . . . . . . . . . . . . . . . . . . . 
3.3. Применение принципа максимума к задаче о максимизации  
       интегрального потребления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
3.4. Принцип максимума для линейных задач . . . . . . . . . . . . . . . . . . 

 
4. Достаточные условия оптимальности . . . . . . . . . . . . . . . . . . . . . . . . . 
4.1. Постановка задачи. Основная теорема . . . . . . . . . . . . . . . . . . . . .
4.2. Примеры. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
4.3. Задачи, линейные по управлению . . . . . . . . . . . . . . . . . . . . . . . . . 
4.4. Модификации основной теоремы . . . . . . . . . . . . . . . . . . . . . . . . . 

 
5. Задачи с дискретным временем  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

 
6. Задача оптимального управления для нелинейной  
    однопродуктовой модели экономики . . . .  . . . . . . . . . . . . . . . . . . . . . 

 
7. Синтез оптимального управления. Метод Гамильтона – Беллмана . 

 
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  
 

5
6
6
7
9

9

13
14

 
17
17
20
23
24
27

 
29

29 
30

32
39

 
41
41
43
51
52

 
55

57

 
64

 
69
 

Часть 2. Задачи для самостоятельной работы . . . . . . . . . . . . . . . . . . . . . 
1. Некоторые задачи о быстродействии . . . . . . . . . . . . . . . . . . . . . . . . . . 
2. Оптимизация потребления при постоянной норме накопления . . . .
3. Оптимизация потребления при кусочно-постоянной норме  
            накопления . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

4. Исследование простейших задач вариационного исчисления . . . . . . 
5. Задача оптимального управления для нелинейной модели  
            макроэкономики  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

 
Приложение  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1. Решение линейного дифференциального уравнения второго  
порядка с постоянными коэффициентами  . . . . . . .  . . . . . . . . . . . . . . . . 
2. Решение линейного дифференциального уравнения первого  
порядка  . . . .  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  . . . . . . . . . . . 
3. Решение уравнения Бернулли . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70 
70
71

72
74

75

79

79

82
82
 
 
 
 
 
 
 
 

 

 

 

 

 

 

 

ПРЕДИСЛОВИЕ 

 
       Предлагаемое издание охватывает основные вопросы  итогового экзамена 

по курсу «Теория оптимального управления», читаемому для студентов, обу
чающихся по направлениям подготовки бакалавров «Прикладная математика 

и информатика» и  «Бизнес-информатика»  (см. [1]). Теоретический материал 

дан в сжатой форме, основная часть иллюстрирующих примеров связана с 

задачами математической экономики. Изложение доступно для студентов 

других направлений с математической подготовкой в рамках стандартного 

курса «Высшая математика». Дополнительный материал, необходимый для 

понимания и практических расчетов, вынесен в приложение.  

      Настоящее второе издание учебного пособия дополнено материалом по 

принципу максимума Л. С. Понтрягина для линейных задач (векторный слу
чай), по задачам оптимального управления с дискретным временем и по ме
тоду Гамильтона – Беллмана решения задачи синтеза оптимального управле
ния. Теоретический материал в этом издании составляет содержание части 1. 

Кроме того, добавлена   часть 2, содержащая задачи, предлагаемые студентам 

для самостоятельной работы.  

Изложение в целом соответствует стандартным учебным пособиям  

[2– 7], но ограничено введением и обсуждением базовых понятий и задач. 

Для более глубокого изучения предмета студентам рекомендуются упомяну
тые учебные пособия. 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

ЧАСТЬ 1. ТЕОРЕТИЧЕСКИЙ МАТЕРИАЛ 

 
 
 1. ВВЕДЕНИЕ. КРАТКАЯ ИСТОРИЧЕСКАЯ СПРАВКА 

 

Оптимальное управление – раздел математики, изучающий широкий 

класс задач на экстремум, или задач на отыскание максимума или минимума, 

т.е. наибольших или наименьших значений величин, зависящих от конечного 

(или бесконечного) числа аргументов. Простейшие задачи на экстремум рас
сматриваются уже в школьном курсе математики (исследование функций на 

экстремум). Термин «экстремум» происходит от латинского extremum – 

«крайний» и объединяет оба понятия – максимум и минимум. Задачи на экс
тремум, или экстремальные задачи, называют еще задачами оптимизации 

(optimus  означает «наилучший», «совершенный»). 

Чтобы понять и оценить место задач оптимального управления среди 

других экстремальных задач, имеет смысл обратиться к прошлому и просле
дить за основными этапами развития методов решения задач на экстремум, 

начав с почти доисторических времен и выбирая в хронологическом порядке 

наиболее характерные для каждого этапа конкретные задачи. Условно можно 

выделить следующие этапы: экстремальные задачи античной науки, задачи 

на экстремум для функций одной или нескольких переменных, задачи клас
сического вариационного исчисления, задачи линейного программирования, 

задачи оптимального управления.   

 

 
1.1. Древнейшие задачи на экстремум 

Древнейшая из известных экстремальных задач − изопериметрическая 

задача. В современных терминах она ставится так: среди плоских замкнутых 

кривых, имеющих заданную длину, найти кривую, охватывающую наиболь
шую площадь. Еще до Аристотеля (IV в. до н. э.) было  известно, что реше
ние этой задачи – окружность, а фигура наибольшей площади – круг. 

Упоминание об этой и близких к ней задачах можно найти в легенде о 

Дидоне, приводимой в поэме «Энеида» римского поэта Вергилия, где речь 

идет о событиях 825 г. до н.э. Согласно этой легенде финикийская царевна 

Дидона, вынужденная покинуть родной город Тир с небольшим отрядом, 

нашла на средиземноморском побережье Африки удобное место для поселе
ния. Однако предводитель местных жителей согласился уступить Дидоне 

лишь клочок земли, «который можно окружить бычьей шкурой». Дидона 

решила разрезать шкуру на узкие полоски и связать их в один ремень. Таким 

образом ей удалось окружить «бычьей шкурой» достаточно территории, где 

и был заложен город Карфаген. 

Здесь можно увидеть несколько постановок задачи оптимизации. 

1. Найти оптимальную форму плоского участка земли, имеющего задан
ную длину периметра L и наибольшую площадь. Очевидно, это изоперимет
рическая задача. Запишем эту задачу в виде 

                                     
max;
.
SL
L
const
→
=
                                            (1) 

Здесь 
L
S  – площадь фигуры с периметром L (ясно, что фигур, имеющих 

один и тот же периметр, необозримо много). Ответ в этой задаче известен, 

как отмечалось выше, еще до Аристотеля: кривой надо придать форму ок
ружности, которая ограничивает круг радиуса R. При этом, как известно, 

2
L
R
π
=
. 
Таким 
образом, 
максимальная 
площадь 
равна 

(
)
π
π

π
π
4
4

2

2

2
2
max
L
L
R
S L
=
=
=
. 

2. Если считать, что Дидона хотела сохранить выход к морю, то прихо
дим к следующей задаче. Среди всех дуг длины L, содержащихся в полу
плоскости, ограниченной прямой ℓ, и с концами в точках A и B, принадле
жащих прямой ℓ, найти такую, которая вместе с отрезком AB  ограничивает 

фигуру наибольшей площади. 

Запишем эту задачу в виде 

                        
, ,
max;
, т.
, т.
.
SL A B
L
const
A
B
→
=
∈ℓ                         (2) 

Подчеркнем, что в этой записи, как и в (1), два «действующих лица» – вели
чина, подлежащая максимизации, и совокупность условий, ограни- чиваю
щих возможность выбора искомой фигуры. Важно понять сразу, что любое  

изменение как оптимизируемой величины, так и ограничений приводит к по
явлению новой задачи, имеющей, вообще говоря, другое решение. Ответом в 

этой задаче являются дуга полуокружности с длиной L, опирающаяся на от
резок AB  как на диаметр. 

3. Еще одна постановка возникает, если в предыдущую задачу добавить 

условие: точки A и B, принадлежащие прямой ℓ, заданы: 

                       
B
A
const
L
S
L A B
, т. , т.
max;
, ,
=
→
   заданы .                          (3) 

Эта   задача имеет смысл  при  условии, что длина отрезка AB  строго мень
ше L. Решение этой  задачи – дуга окружности, для  которой отрезок AB  

является хордой. 

Другие варианты задачи Дидоны и их решения с обсуждением, а также 

другие старинные задачи можно найти в книге [4, с. 12–16]. 

Отметим, что в древнейшие времена решение экстремальных задач было 

скорее искусством, уделом избранных. Не было не только специальной тео
рии, но и сколько-нибудь регулярных методов исследования.  

  
 
1.2. Необходимое условие экстремума функции 
 
Напомним, что при решении задач на экстремум без ограничений для 

дифференцируемых 
функций 
одного 
переменного
( )
(
f x → max min)
 

очень полезным оказывается необходимое условие локального экстремума – 

равенство нулю первой производной функции 
( )
f x
 в точке экстремума 

(
)
0
0
:
0
x
f
′ x
=
. Это условие было сформулировано П. Ферма в 1629 г. и 

предоставило исследователю правило для нахождения точек, «подозритель
ных» на экстремум. В настоящее время основные навыки исследования 

функций одной переменной на экстремум приобретаются в средней школе. 

1.3. Зарождение вариационного исчисления.   

Задача о брахистохроне 

 

Принято считать, что толчком к зарождению вариационного исчисления, 

изучающего определенный класс экстремальных задач, послужила следую
щая задача о кривой наискорейшего спуска. В вертикальной плоскости да
ны две точки A и B (рис. 1). Определить форму кривой (форму траектории), 

спускаясь по которой под действием силы тяжести (с нулевой начальной 

скоростью), материальная точка M  (тяжелый шарик) пройдет путь от точки 

A до точки B за наименьшее время.  

 
Рис. 1 

Постановка такой задачи была опубликована И. Бернулли в июльском 

номере научного (!) журнала «Acta Eruditorum» за 1696 г. Решение этой зада
чи было дано самим И. Бернулли, а также Г. Лейбницем, И. Ньютоном и 

Я. Бернулли. Заранее скажем, что искомой кривой наискорейшего спуска – 

«брахистохроной» – оказалась (не прямая, не дуга окружности)  дуга одной 

из замечательных кривых – циклоиды (см. ниже). 

Перейдем к формальной постановке задачи. Будем считать, что оси ко
ординат введены и расположены так, как показано на рис. 1. По физическому 

закону Галилея мгновенная скорость движения шарика по кривой 
( )
y x
 в 

точке M с координатами 
( )
(
x, y x )
 не зависит от формы кривой между точ
ками (
A 0,0)
 и 
( )
(
M x y x )
,
, а зависит только от ординаты ( )
y x
 и определя
ется равенством 

                                                 
2
( )
ds
gy x
dt =
.                                            (4) 

Здесь ds – дифференциал длины дуги кривой ( )
( )

2
:
1
y x
ds
y x
dx
′
=
+ ⎡
⎤
⎣
⎦
, 

g  – ускорение силы тяжести (
)

g ≈ 9,8 м с2
. Подставляя в (4) выраже
ние для ds, получаем для dt : 

                                          
( )
( )

2
1

2

y x
dt
dx
gy x

+ ⎡ ′
⎤
⎣
⎦
=
.                                              (5) 

Проинтегрируем обе части (5). Значение 
1x
x =
 соответствует конечному 

положению шарика (точке B с координатами 
(
)
(
1 )
1,
y x
x
, в этом положении 

шарик окажется  через время T  с.  Это время можно найти: 

( )
( )

1
2

0
0

1

2

x
T
y
x
dt
dx
gy x

+ ⎡ ′
⎤
⎣
⎦
=
∫
∫
, 

или 

( )
( )

1
2

0

1

2

x
y x
T
dx
gy x

+ ⎡ ′
⎤
⎣
⎦
= ∫
. 

Эта величина, время T , зависящая от формы кривой ( )
y x
, подлежит мини
мизации на множестве всех (достаточно гладких) кривых, соединяющих точ
ки (
0,0 )
A
 и (
B x1, y1 )
. Таким образом, формальная запись задачи принимает 

вид 

 

                    
( )
( )
( )
(
)

1
2

1
1

0

1
min;
0
0,
.
2

x
y x
T
dx
y
y x
y
gy x

+ ⎡ ′
⎤
⎣
⎦
=
→
=
=
∫
              (6) 

Подчеркнем, что в этой задаче о брахистохроне экстремум ищется на беско
нечномерном множестве, иными словами, речь идет об экстремуме функции 

бесконечного числа переменных. 

Задача (6) является типичной задачей классического вариационного ис
числения. Представление о методах решения таких задач будет дано ниже. 

Здесь же мы ограничимся описанием кривой наискорейшего спуска – цик
лоиды. Циклоида является траекторией фиксированной точки на окружности, 

которая катится без проскальзывания  по горизонтальной прямой. Если оси 

координат выбрать, как показано на рис. 2, то параметрические уравнения  

циклоиды имеют вид 

cos ,

sin ,

y

x

τ

τ
τ

=
−
⎧
⎨ =
−
⎩

R R

R
R

 
[
∞)
∈
,0
τ
.  

Здесь R  – радиус «образующей» окружности, τ  – параметр, угол поворота 

окружности (на рис. 2  R = 1). 

 

Рис. 2 

 
Заметим, что в начале координат (т.е. при 
τ = 0
) касательная к графику 

циклоиды совпадает с осью Oy . Действительно, 

( )
( )
( )

sin
1
cos
2
y t
dy
dy dt
y x
ctg
dx
dt
dx
x t
τ
τ
τ
′
=
=
⋅
=
=
=
→ +∞
−

 при 
τ → 0
.  

Для задачи о кривой наискорейшего спуска это означает, что в начальный 

момент времени (из т. A, рис.1) шарик начинает движение в направлении 

вертикально вниз. Таким образом, функция ( )
y x
, являющаяся решением за
дачи (6), не имеет в точке 
x = 0
 конечной производной  (функция 
( )
y x
 

не является непрерывно дифференцируемой на отрезке [
,0 x1 ]
). 

На рис. 3 показаны три разные траектории спуска из точки (0,0) в точку 

(1,1) и указано время Т. Наименьшее время  Т = 0,583 с соответствует движе
нию по дуге циклоиды с радиусом образующей окружности 
R= 0,573.
  

Приведем пример вариационной задачи, возникающей в математической 

экономике. 

Задача о максимизации прибыли монополиста. Рассмотрим односек
торную модель монопольного производства (производится и продается один 

товар). Пусть ( )
C x
 – функция стоимости производства (от англ. cost – стои
мость), x  – количество произведенного товара. Обозначим через ( )t
p
 цену 

товара (от англ. price – цена)  в  момент  времени  t  и  будем считать, что за
дана функция спроса товара на рынке 
(
)
,
D p p(от англ. demand – спрос), 

зависящая не только от цены, но и от скорости, с которой она меняется 

d
p
p
dt

⎛
⎞
=
⎜
⎟
⎝
⎠

. В этих предположениях прибыль в момент времени t  определя
ется равенством 

( ( ), ( ))
( ( ), ( ))
( )
[
( ( ), ( )]
L p t
p t
D p t
p t
p t
C D p t
p t
=
−
. 

 
Рис. 3 

Доступ онлайн
400 ₽
В корзину