Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Вестник Удмуртского университета. Серия 1. Математика. Механика. Компьютерные науки, 2006, № 1

Покупка
Основная коллекция
Артикул: 486155.0004.99
Вестник Удмуртского университета. Серия 1. Математика. Механика. Компьютерные науки, 2006, Вып. 1-Ижевск:Удмуртский Государственный университет,2006.-. - Текст : электронный. - URL: https://znanium.com/catalog/product/496277 (дата обращения: 04.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
ВЕСТНИК
УДМУРТСКОГО
УНИВЕРСИТЕТА
МАТЕМАТИКА
2006. № 1
МАТЕМАТИКА
УДК 517.977
В. Н. Баранов
ПОСТРОЕНИЕ ОПТИМАЛЬНОГО СИНТЕЗА В ЗАДАЧЕ
ДОЛГОДЕЙСТВИЯ 1
Исследованы некоторые свойства функции Беллмана для задачи долгодействия.
Приведены условия существования оптимального синтеза в случае дифференцируемости функции Беллмана.
Ключевые слова: выживаемость, задача долгодействия, оптимальный синтез,
функция Беллмана.
Задаче о выборе траектории дифференциального включения из множества всех траекторий, удовлетворяющих заданному начальному условию, которая максимально долго находится в заданном замкнутом множестве, посвящена работа А. З. Фазылова [1]. Эту задачу (по аналогии
с задачей о быстродействии, ее естественно называть задачей о «долгодействии») можно отнести к задаче оптимального управления с фазовыми ограничениями. В этом случае строится программное управление. В
статье Е. Л. Тонкова [2] исследуется задача о построении позиционного
управления и функции времени присутствия в задаче долгодействия. Данная работа посвящена построению позиционного управления при помощи
функции Беллмана.
Рассмотрим управляемую систему
˙
x = f(x, u),
(1)
где x ∈ Rn, u ∈ U ⊂ Rr, f : Rn ×U → Rn, функции f и ∂f
∂x непрерывны
на Rn × U, U — компакт.
Будем считать, что управление u = u(t) выбирается из U — класса
кусочно-непрерывных функций со значениями в U.
Фиксируем некоторое управление u(·) ∈ U. Будем обозначать t →
x(t, x0, u) — решение задачи Коши ˙
x = f(x, u(t)), x(0) = x0.
Пусть задано некоторое множество M ∈ Rn. Для произвольной точки
x0 ∈ M, u ∈ U введем обозначение
ϑ(x0, u) = sup{T : x(t, x0, u) ∈ M для всех t T}.
1Работа выполнена при финансовой поддержке РФФИ (гранты 03–01–00014, 06–01–
00258), Минобрнауки России (грант 34125).
В. Н. Баранов
МАТЕМАТИКА
2006. № 1
Для произвольного x0 ∈ M обозначим ϑ∗(x0) = sup
u∈U
ϑ(x0, u). Будем называть ϑ∗(x0) — временем выживания точки x0 в множестве M.
Если найдется u ∈ U такое, что ϑ(x0, u) = ϑ∗(x0), то через x будем
обозначать решение задачи Коши ˙
x = f(x, u(t)), x(0) = x0 и называть его
оптимальной траекторией. Управление u будем еще обозначать u(·, x0),
подчеркивая, что это управление, удерживающее траекторию, вышедшую
из x0 в множестве M в течение времени ϑ∗(x0).
Задача состоит в построении управления u = u(x),
x ∈ M такого,
что для всех x0 ∈ M решение задачи Коши ˙
x = f(x, u(x)), x(0) = x0
оставалось бы в множестве M в течение времени ϑ∗(x0).
В дальнейшем относительно функции ϑ∗ мы будем предполагать, что
выполнены следующие условия:
1) для всех x ∈ M существует оптимальная траектория;
2) для всех x ∈ M выполнено неравенство ϑ∗(x) < ∞, то есть оптимальная траектория, вышедшая из любой точки, покинет множество M
за конечное время;
3) функция ϑ∗(x) ∈ C1(M).
Последнее условие надо понимать следующим образом: ϑ∗(·) ∈ C1(int(M))
и для любого x ∈ ∂M и всех h ∈ TxM существует ∂ϑ∗
∂h (x) — производная
функции ϑ∗ в направлении h. При этом для всех x0 ∈ ∂M и h ∈ Tx0M
функция x → ∂ϑ∗
∂h (x) непрерывна в точке x0. Здесь и далее TxM — конус
Булигана к множеству M в точке x, см., например [3].
О п р е д е л е н и е 1. Функция ω(x) = −ϑ∗(x) называется функцией
Беллмана.
Утверждение 1. Пусть x0 — произвольная точка множества M.
Пусть x(t, x0) — оптимальная траектория, выходящая из точки x0. Тогда выполнено равенство
ω(x(t, x0)) = ω(x0) + t.
(2)
Д о к а з а т е л ь с т в о. Нам надо доказать равенство
ϑ∗(x(t, x0)) = ϑ∗(x0) − t.
Максимальное время перехода из точки x0 в точку x(t, x0) не меньше чем t (так как за время t мы точно можем перейти). Поэтому
ϑ∗(x0) ϑ∗(x(t, x0)) + t. Действительно, мы можем двигаться до точки
x(t, x0) время t, а затем под действием управления u(·, x(t, x0)) находиться в множестве M в течение времени ϑ∗(x(t, x0)). Таким образом в
Построение оптимального синтеза
5
МАТЕМАТИКА
2006. № 1
множестве M мы можем находиться по крайней мере в течение времени
ϑ∗(x(t, x0)) + t. То есть имеем неравенство
ϑ∗(x(t, x0)) ϑ∗(x0) − t.
С другой стороны, на время перехода по оптимальной траектории из
точки x0 в точку x(t, x0) тратится время t, а до выхода из множества M
тратится время ϑ∗(x0), то выйдя из точки x(t, x0), мы можем оставаться
в множестве M время ϑ∗(x0) − t. Таким образом,
ϑ∗(x(t, x0)) ϑ∗(x0) − t,
что и доказывает утверждение.
Для каждой точки x ∈ M введем обозначение
U(x) .
= {u ∈ U : f(x, u) ∈ TxM},
где TxM — конус Булигана в точке x к множеству M. Если x ∈ int(M),
то TxM = Rn и U(x) = U.
Утверждение 2. Функция ω(x) удовлетворяет уравнению Беллмана
min
v∈U(x0)
∂ω
∂x (x0)f(x0, v)
= 1
для всех x0 ∈ M.
Д о к а з а т е л ь с т в о. Пусть x0 ∈ int(M). Рассмотрим функцию
ω(t) = ω(x(t, x0, u)). Учитывая равенство (2), имеем, что
dω(t)
dt
= d
dt(ω(x0) + t) = 1.
По правилу дифференцирования сложной функции
dω(t)
dt
t=0
= ∂ω
∂x (x0) ˙
x(t, x0, u)|t=0 = ∂ω
∂x (x0)f(x0, u(0)).
То есть получаем, что нашлось u ∈ U такое, что ∂ω
∂x (x0)f(x0, u) = 1.
Теперь докажем, что для любого v ∈ U выполнено неравенство
∂ω
∂x (x0)f(x0, v) 1.
Пусть v ∈ U. Рассмотрим управление uv(t) ≡ v. Решение xv(t) =
x(t, x0, uv) задачи Коши ˙
x = f(x, uv), x(0) = x0 представимо в виде
xv(t) = x0 + f(x0, v)t + o(t)
В. Н. Баранов
МАТЕМАТИКА
2006. № 1
для всех t 0, где
lim
t→0+
o(t)
t
= 0. Из предположения о непрерывной
дифференцируемости функции ω(x) следует неравенство
ω(xv(t)) − ω(x0) = ∂ω
∂x (x0)f(x0, v)t + o(t).
(3)
По определению функции ϑ∗(x) имеем неравенство
t + ϑ∗(xv(t)) ϑ∗(x0)
для всех t 0. Действительно, если t + ϑ∗(xv(t)) > ϑ∗(x0), то мы можем под действием управления uv(t) ≡ v в течение времени t двигаться
из точки x0 в точку xv(t), а затем под действием управления u(·, xv(t))
удерживаться в множестве M в течение времени ϑ∗(xv(t)). Получается,
что нашлось управление, под действием которого траектория, выходящая
из точки x0, будет оставаться в множестве M в течение времени не меньшем t+ϑ∗(xv(t)) > ϑ∗(x0), что противоречит построению функции ϑ∗(x).
Таким образом, t−ω(xv(t)) −ω(x0), или t ω(xv(t))−ω(x0), откуда
и равенства (3) получаем, что
t ∂ω
∂x (x0)f(x0, v)t + o(t).
Разделив обе части на t и устремив t к 0, получаем требуемое неравенство
1 ∂ω
∂x (x0)f(x0, v).
Равенство
min
v∈U(x0)
∂ω
∂x (x0)f(x0, v)
= 1
для всех x0 ∈ ∂M доказывается аналогично.
Уравнение Беллмана — это уравнение в частных производных первого
порядка. Чтобы получить решение, необходимо задать начальные условия.
Для этого введем следующие обозначения. Обозначим M0 — множество
точек x ∈ ∂M выхода системы из множества M, в частности, множество
{x ∈ ∂M : f(x, U) ∩ TxM = ∅} содержится в M0;
M+ — множество
точек x ∈ ∂M входа системы в множество M, множество {x ∈ ∂M :
f(x, U)∩TxM = ∅} содержит M+. Очевидно, что функция ω(x) должна
удовлетворять начальным условиям
ω(x)|x∈M0 = 0,
ω(x)|x∈int(M)∪M+ < 0.
Построение оптимального синтеза
7
МАТЕМАТИКА
2006. № 1
Пусть некоторая функция ω(x) удовлетворяет в M уравнению Беллмана. Это значит, что для всякого x ∈ M найдется u(x) ∈ U(x) такое,
что
∂ω
∂x (x)f(x, u(x)) = 1.
Предположим, что нам удалось выделить однозначную ветвь u(x), удовлетворяющую этому уравнению.
О п р е д е л е н и е 2. Будем говорить, что функция u = u(x) определяет допустимый синтез, если система уравнений ˙
x = f(x, u(x)) имеет
решения при всех начальных x0 ∈ M, причем эти решения за конечное
время не уходят на бесконечность, то есть решения неограниченно продолжимы по времени.
Под решением задачи Коши ˙
x = f(x, u(x)), x(0) = x0 ∈ M мы будем
понимать решения в смысле А.Ф. Филиппова [4], причем такие, что для
решения x(t) = x(t, x0) при почти всех t выполнено равенство ˙
x(t) =
f
x(t), u(x(t))
.
Теорема 1. Пусть функция ω ∈ C1(M) удовлетворяет в M уравнению Беллмана
min
v∈U(x0)
∂ω
∂x (x0)f(x0, v)
= 1
(4)
и граничным условиям
ω(x)|x∈M0 = 0,
ω(x)|x∈int(M)∪M+ < 0.
(5)
Пусть, далее, существует однозначная функция u(x), удовлетворяющая
уравнению
∂ω
∂x (x)f(x, u(x)) = 1
(6)
для всех x ∈ M и определяющая допустимый синтез.
Тогда u(x) — оптимальный синтез, −ω(x) — время выживания точки x в множестве M.
Д о к а з а т е л ь с т в о. Пусть x(t) — произвольное решение системы
˙
x = f(x, u(x)). Рассмотрим функцию ω(t) = ω(x(t)). Тогда
dω
dt = ω
∂x(x(t))f(x(t), u(x(t))) ≡ 1
в силу равенства (6). Это означает, что вдоль любого решения системы
˙
x = f(x, u(x)) функция ω(t) растет со скоростью 1. То есть если
В. Н. Баранов
МАТЕМАТИКА
2006. № 1
x(t) = x(t, x0) — решение задачи Коши
˙
x = f(x, u(x)),
x(0) = x0, то
функция ω(t) обратится в 0 при t = −ω(x0) > 0. Из граничных условий
(5) следует, что ω(x) = 0 только при x ∈ M0. Таким образом, траектория, начинающаяся при t = 0 в точке x0, попадет на M0 через время
t(x0) = −ω(x0). В силу выбора множества M0 траектория, попавшая на
M0 сразу покинет множество M, то есть для всех t > t(x0) имеет место
включение x(t, x0) /
∈ M.
Покажем, что траектория, вышедшая из точки x0 не может находиться в множестве M в течение времени t > t(x0).
Рассмотрим произвольное управление
˜
u ∈ U
и функцию
˜
x(t) =
x(t, x0, ˜
u) — решение задачи Коши
˙
x = f(x, ˜
u(t)),
x(0) = x0. Пусть
˜
ω(t) = ω(˜
x(t)). По определению решения задачи Коши и в силу того, что ˜
u — кусочно-непрерывная функция, имеем, что ˜
x(t) — абсолютно
непрерывная функция, для всех t 0 существует правая производная
d+˜
x
dt (t) = f(˜
x(t), ˜
u(t+)), где ˜
u(t+) — правый предел ˜
u в точке t.
Из предположений о функции ω получаем, что
˜
ω(t) — абсолютно
непрерывная функция, и для t 0 выполнено равенство
d+˜
ω
dt
= ∂ω
∂x (˜
x(t))f(˜
x(t), ˜
u(t+)).
При этом для всех точек x ∈ int(M) ∪ M+ будет выполнено включение
d+˜
ω
dt
∈ TxM, то есть u(t+) ∈ U(x(t)). Так как ˜
u(t+) = ˜
u(t) за исключением конечного числа точек и в силу уравнения Беллмана (4) имеем
неравенство
d˜
ω
dt (t) 1
(7)
для всех t 0 за исключением конечного числа точек. Предположим, что
˜
x(t) попадет на множество точек выхода M0 в момент времени ϑ(x0, ˜
u).
Проинтегрировав неравенство (7) от 0 до ϑ(x0, ˜
u) , получаем, что
˜
ω(ϑ(x0, ˜
u)) − ˜
ω(0) = ω(˜
x(ϑ(x0, ˜
u))) − ω(x0) ϑ(x0, ˜
u).
Так как ˜
x(ϑ(x0, ˜
u)) ∈ M0, то ω(˜
x(ϑ(x0, ˜
u))) = 0 и получаем, что выполнено неравенство ϑ(x0, ˜
u) −ω(x0). То есть траектория ˜
x(t) будет
находиться в множестве M не дольше времени −ω(x0). Таким образом,
получаем равенство
ϑ∗(x0) = −ω(x0),
что и доказывает теорему.
Построение оптимального синтеза
9
МАТЕМАТИКА
2006. № 1
П р и м е р 1. Рассмотрим управляемую систему
˙
x1
=
1 + u1,
˙
x2
=
1 + u2,
(8)
где (u1, u2) ∈ U
U = {(u1, u2) : u2
1 + u2
2 1}. В качестве множества M
рассмотрим M .
= {(x1, x2) ∈ R2 : x1 0, x2 0, x1 + x2 1}.
Из вида системы (8) получаем, что ˙
x1 0,
˙
x2 0, причем обе компоненты вектора скорости не могут быть одновременно равны 0. Поэтому
все траектории системы всегда будут двигаться «вправо-вверх» и покинут
множество M за конечное время.
При этом множество
M0 = {(x1, x2) ∈ R2 : x1 0, x2 0, x1 + x2 = 1}
будет множеством точек выхода, так как для всех x = (x1, x2) ∈ M0 таких,
что x1 > 0, x2 > 0 множество TxM имеет вид TxM = {(h1, h2) : h1 +
h2 0} и, следовательно, f(x, U) /
∈ TxM, так как f1(x, U) + f2(x, U) =
{2 + u1 + u2 : u2
1 + u2
2 1} ⊂ R+.
Для точки x = (1, 0) касательный конус к множеству M имеет вид
TxM = {(h1, h2) : h2 0, h1+h2 0}. Нетрудно проверить, что выполнено
f(x, U) /
∈ TxM.
Для точки x = (0, 1) касательный конус к множеству M имеет вид
TxM = {(h1, h2) : h1 0, h1+h2 0}. Нетрудно проверить, что выполнено
f(x, U) /
∈ TxM.
Множество M = {(x1, x2) ∈ R2 : x1 0, x2 0, x1 + x2 < 1} локально
компактно и удовлетворяет условию теоремы Нагумо для включений, то
есть для всех x ∈ M выполнено равенство f(x, U)∩Tx M = ∅. Это значит,
что множество M — локально инвариантное множество и, следовательно,
множество
M+ = {(x1, x2) ∈ ∂M : x1 = 0, x2 < 1} ∪ {(x1, x2) ∈ ∂M : x1 < 1, x2 = 0}
будет множеством точек входа. Получили, что ∂M = M0 ∪ M+.
Будем искать функцию ω как решение уравнения Беллмана
min
v∈U
∂ω
∂x (x0)f(x0, v)
= 1,
(9)
удовлетворяющее граничным условиям
ω(x)|x∈M0 = 0,
ω(x)|x∈int(M)∪M+ < 0.
(10)
В. Н. Баранов
МАТЕМАТИКА
2006. № 1
Учитывая систему (8) получаем, что в каждой точке x0 ∈ int(M)
функция ω должна удовлетворять уравнению Беллмана
min
u∈U
∂ω
∂x (x0)f(x0, u) =
min
u2
1+u2
21
∂ω
∂x1
(x0)(1 + u1) + ∂ω
∂x2
(x0)(1 + u2)
=
= ∂ω
∂x1
(x0) + ∂ω
∂x2
(x0) +
min
u2
1+u2
21
u1
∂ω
∂x1
(x0) + u2
∂ω
∂x2
(x0)
= 1.
При фиксированных
∂ω
∂x1 (x0) и
∂ω
∂x2 (x0) минимум скалярного произведения векторов u = (u1, u2) и
∂ω
∂x1 (x0), ∂ω
∂x2 (x0)
достигается на окружности u2
1 + u2
2 1, когда вектор u противоположно направлен вектору
∂ω
∂x1 (x0), ∂ω
∂x2 (x0)
и его длина равна единице. Другими словами,
u1 = −
∂ω
∂x1 (x0)
∂ω
∂x1 (x0)
2
+
∂ω
∂x2 (x0)
2 , u2 = −
∂ω
∂x2 (x0)
∂ω
∂x1 (x0)
2
+
∂ω
∂x2 (x0)
2 ,
и
min
u2
1+u2
21
u1
∂ω
∂x1
(x0) + u2
∂ω
∂x2
(x0)
=
= −
∂ω
∂x1 (x0)
2
∂ω
∂x1 (x0)
2
+
∂ω
∂x2 (x0)
2 −
∂ω
∂x2 (x0)
2
∂ω
∂x1 (x0)
2
+
∂ω
∂x2 (x0)
2 =
= −
∂ω
∂x1
(x0)
2
+
∂ω
∂x2
(x0)
2
.
Тогда уравнение Беллмана запишется в виде
∂ω
∂x1
(x0)(1 + u1) + ∂ω
∂x2
(x0)(1 + u2) =
= ∂ω
∂x1
(x0) + ∂ω
∂x2
(x0) −
∂ω
∂x1
(x0)
2
+
∂ω
∂x2
(x0)
2
= 1.
Таким образом, уравнение Беллмана в множестве int(M) примет вид
∂ω
∂x1
+ ∂ω
∂x2
−
∂ω
∂x1
2
+
∂ω
∂x2
2
= 1.
Построение оптимального синтеза
11
МАТЕМАТИКА
2006. № 1
Перенесем корень в правую часть, единицу в левую и возведем в квадрат
∂ω
∂x1
2
+
∂ω
∂x2
2
+ 1 + 2 ∂ω
∂x1
∂ω
∂x2
− 2 ∂ω
∂x1
− 2 ∂ω
∂x2
=
∂ω
∂x1
2
+
∂ω
∂x2
2
.
Сократив подобные и разложив на множители, получаем
1 − ∂ω
∂x1
1 − ∂ω
∂x2
= 1
2.
При этом должны быть выполнены граничные условия (10).
Решением этой задачи будет функция
ω(x) =
1 − 1
√
2
(x1 + x2 − 1).
В качестве u возьмем
u1(x) = −
∂ω
∂x1
∂ω
∂x1
2
+
∂ω
∂x2
2 =
= −
1 −
1
√
2
1 −
1
√
2
2
+
1 −
1
√
2
2 = − 1
√
2.
Аналогично, u2(x) = − 1
√
2.
Согласно теореме 1 получаем, что оптимальный синтез имеет вид
u =
− 1
√
2, − 1
√
2
. То есть из любой точки x ∈ M надо двигаться по кратчайшему расстоянию до прямой x + y = 1, но с наименьшей скоростью
˙
x1 = 1 −
1
√
2,
˙
x2 = 1 −
1
√
2.
П р и м е р 2. Рассмотрим систему как в предыдущем примере, а множество M в виде
M = {(x1, x2) ∈ R2 : x1 0, x2 0, αx1 + βx2 1},
α, β > 0. Аналогично предыдущему примеру получаем уравнение Беллмана
1 − ∂ω
∂x1
1 − ∂ω
∂x2
= 1
2
и граничные условия
ω(x)|x∈M0 = 0,
ω(x)|x∈int(M)∪M+ < 0,
В. Н. Баранов
МАТЕМАТИКА
2006. № 1
где M0 = {(x1, x2) ∈ ∂M : αx1 + βx2 = 1}, M+ = {(x1, x2) ∈ ∂M : x1 =
0, x2 < 1/β} ∪ {(x1, x2) ∈ ∂M : x1 < 1/α, x2 = 0}. Будем искать ω в виде
ω(x) = c(αx1 + βx2 − 1), где c > 0. Подставив в уравнение Беллмана,
получим 2αβc2 − 2(α + β)c + 1 = 0. Получим, что c = α+β+√
α2+β2
2αβ
.
Тогда ω(x) = α+β+√
α2+β2
2αβ
(αx1 + βx2 − 1).
Вектор u получаем из равенства
u1(x) = −
∂ω
∂x1
∂ω
∂x1
2
+
∂ω
∂x2
2 =
= −
α+β+√
α2+β2
2β
α+β+√
α2+β2
2β
2
+

α+β+√
α2+β2
2α
2 = −
α
α2 + β2 .
Аналогично получаем, что u2(x) = −
β
√
α2+β2 . То есть получаем, что из
любой отчки x ∈ M надо двигаться с постоянным вектором скорости
˙
x1 = 1 −
α
√
α2+β2 ,
˙
x2 = 1 −
β
√
α2+β2 . Геометрически, это вектор, симметричный относительно биссектрисы угла первой четверти вектору, перпендикулярному прямой αx1 + βx2 = 1.
В обоих рассмотренных примерах оптимальные траектории попадают
на границу множества M только в точках выхода, то есть не возникает
случая, когда оптимальная траектория движется по границе множества
M положительное время. В этом случае возникает проблема, связанная
с определением решения задачи Коши ˙
x = f(x, u(x)), если построенный
оптимальный синтез не является непрерывной функцией и имеет разрыв
в точках, лежащих на границе M. В этом случае мы продолжим наш
оптимальный синтез на некоторую окрестность множества M.
Теорема 2. Пусть Mε — ε-окрестность множества M0. Пусть функция ω ∈ C1(M) удовлетворяет в M ∪ Mε уравнению Беллмана
min
v∈U(x0)
∂ω
∂x (x0)f(x0, v)
= 1
(11)
и граничным условиям
ω(x)|x∈M0 = 0,
ω(x)|x∈int(M)∪M+ < 0.
(12)
Построение оптимального синтеза
13
МАТЕМАТИКА
2006. № 1
Пусть, далее, существует однозначная функция x → u(x), x ∈ M ∪ Mε,
удовлетворяющая уравнению
∂ω
∂x (x)f(x, u(x)) = 1
(13)
для всех x ∈ M ∪ Mε и определяющая допустимый синтез. При этом
для всех точек x0 ∈ Mε\M решение x(t, x0, u) задачи
˙
x = f(x, u(x)),
x(0) = x0 удовлетворяет условию ρ(x(t, x0, u), M) ρ(x(t, x0, u), M) для
всех u ∈ U.
Тогда u(x) — оптимальный синтез, −ω(x) — время выживания точки x в множестве M.
П р и м е р 3. Рассмотрим систему
˙
x1
=
u1,
˙
x2
=
u2,
(14)
где (u1, u2) ∈ U
U = {(u1, u2) : u2
1 + u2
2 = 1, x1 0, x2 0}. В качестве множества M рассмотрим M
.
= {(x1, x2) ∈ R2 : x1 0, x2 0, max{x1, x2} 1}.
В этом случае M0
состоит из единственной точки выхода M0 =
{(1, 1)}. Уравнение Беллмана будет иметь вид
min
u10,u20
u2
1+u2
2=1
∂ω
∂x1
(x0)u1 + ∂ω
∂x2
(x0)u2
= 1.
Из свойств функции ω можно предположить, что
∂ω
∂xi 0,
i = 1, 2.
Тогда u1(x) = 1, u2(x) = 0, если ∂ω
∂x2 > ∂ω
∂x1 , u1(x) = 0, u2(x) = 1, если
∂ω
∂x1 > ∂ω
∂x2 , u1(x) + u2(x) = 1, если ∂ω
∂x1 = ∂ω
∂x2 .
Решением уравнения Беллмана будет функция ω(x) = x1 + x2 − 2.
Получаем, что для всех точек x ∈ M выполнено равенство u1(x)+u2(x) =
1. Для точек x ∈ ∂M\M0 таких, что x1 = 1 имеет место равенство
TxM = {(0, h) : h ∈ R}, следовательно U(x) = {(0, 1)}. Аналогично для
точек x ∈ ∂M\M0 таких, что x2 = 1 имеет место равенство TxM =
{(h, 0) : h ∈ R}, следовательно U(x) = {(1, 0)}. Тогда u(x) = (0, 1) для
x ∈ ∂M\M0 таких, что x1 = 1 и u(x) = (1, 0) для x ∈ ∂M\M0 таких,
что x2 = 1. Таким образом, u(x) не может быть непрерывной функцией.
Рассмотрим множество Mε = M1
ε ∪ M2
ε , где M1
ε
.
= {(x1, x2) : 0 1 <
x1 < 1 + ε, 0 < x2 < 1}, M2
ε
.
= {(x1, x2) : 0 < x1 < 1, 0 1 < x2 < 1 + ε}.
Нетрудно видеть, что решая уравнение Беллмана в множестве M ∪ Mε,