Методы оптимизации : алгоритмические основы задач оптимизации
Покупка
Издательство:
Издательский Дом НИТУ «МИСиС»
Автор:
Смирнов Александр Петрович
Год издания: 2014
Кол-во страниц: 135
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-87623-781-1
Артикул: 752985.01.99
В курсе лекций рассматриваются классические методы оптимизации. Особое внимание уделено построению алгоритмов поиска экстремума, что позволит студентам самостоятельно разрабатывать соответствующие программные средства в случаях, когда использование стандартных пакетов программ невозможно. Для сложных алгоритмов приведены подробные примеры решения задач. В этих примерах показана вся процедура построения алгоритма, поясняющая переход от исходного текста к ее описанию в виде алгоритма, а затем численная реализация алгоритма, обеспечивающая решение задачи. Курс лекций предназначен для студентов, обучающихся по направлениям подготовки 09.03.01, 09.03.02, 09.03.03, а также для магистров, изучающих курсы моделирования, оптимизации и управления в технологических и информационных системах.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.02: Информационные системы и технологии
- 09.03.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» № 2335 Кафедра автоматизированных систем управления А.П. Смирнов Методы оптимизации Алгоритмические основы задач оптимизации Курс лекций Рекомендовано редакционно-издательским советом университета Москва 2014
УДК 004 С50 Р е ц е н з е н т канд. экон. наук, доц. И.П. Ильичев Смирнов А.П. С50 Методы оптимизации : алгоритмические основы задач оптимизации : курс лекций / А.П. Смирнов. – М. : Изд. Дом МИСиС, 2014. – 135 с. ISBN 978-5-87623-781-1 В курсе лекций рассматриваются классические методы оптимизации. Особое внимание уделено построению алгоритмов поиска экстремума, что позволит студентам самостоятельно разрабатывать соответствующие программные средства в случаях, когда использование стандартных пакетов программ невозможно. Для сложных алгоритмов приведены подробные примеры решения задач. В этих примерах показана вся процедура построения алгоритма, поясняющая переход от исходного текста к ее описанию в виде алгоритма, а затем численная реализация алгоритма, обеспечивающая решение задачи. Курс лекций предназначен для студентов, обучающихся по направлениям подготовки 09.03.01, 09.03.02, 09.03.03, а также для магистров, изучающих курсы моделирования, оптимизации и управления в технологических и информационных системах. УДК 004 ISBN 978-5-87623-781-1 © А.П. Смирнов, 2014
ОГЛАВЛЕНИЕ Предисловие..............................................................................................5 1. Основные понятия и проблемы оптимизации ...................................6 1.1. Задача оптимизации ......................................................................6 1.2. Геометрическое представление процесса поиска экстремума ............................................................................................7 1.3. Условия существования минимума .............................................9 1.4. Общий вид алгоритма поиска минимума функции..................10 1.5. Методы одномерного поиска в заданном направлении...........11 1.6. Оценка производных...................................................................13 Контрольные вопросы........................................................................14 2. Методы безусловной оптимизации...................................................15 2.1. Классификация методов безусловной оптимизации................15 2.2. Методы нулевого порядка ..........................................................16 2.2.1. Симплексный метод .............................................................16 2.2.2. Метод сопряженных направлений......................................19 2.2.3. Методы случайного поиска .................................................23 2.2.4. Метод покоординатного спуска ..........................................25 2.3. Методы первого порядка ............................................................26 2.3.1. Метод градиента ...................................................................26 2.3.2. Метод наискорейшего спуска..............................................27 2.3.3. Метод сопряженных градиентов.........................................29 2.4. Методы второго порядка ............................................................32 2.4.1. Метод Ньютона.....................................................................32 2.4.2. Метод «тяжелого шарика»...................................................33 Контрольные вопросы........................................................................34 3. Методы условной оптимизации........................................................35 3.1. Задача условной оптимизации....................................................35 3.2. Нелинейное программирование.................................................35 3.2.1. Методы возможных направлений.......................................37 3.2.2. Метод Лагранжа....................................................................37 3.2.3. Метод штрафных функций..................................................40 3.2.4. Метод множителей ...............................................................41 3.2.5. Иллюстрация работы методов для функции одного аргумента............................................................................44 3.2.6. Пример применения условий Куна – Таккера для функции двух переменных .....................................................50 3.2.7. Пример задачи невыпуклого программирования..............56
3.3. Линейное программирование.....................................................59 3.3.1. Общая характеристика задачи.............................................59 3.3.2. Геометрия задачи ЛП ...........................................................60 3.3.3. Стандартная и каноническая форма задачи ЛП.................61 3.3.4. Симплекс-метод....................................................................63 3.3.5. Методы получения начального ДБР...................................68 3.3.6. Пример постановки и решения задачи ЛП.........................69 Контрольные вопросы........................................................................76 4. Алгоритмы дискретной оптимизации ..............................................77 4.1. Общие сведения о задачах..........................................................77 4.2. Динамическое программирование (ДП)....................................79 4.2.1. Описание задачи ДП.............................................................79 4.2.2. Постановка задачи ДП .........................................................80 4.2.3. Формальная терминология задачи ДП ...............................80 4.2.4. Описание алгоритма ДП ......................................................81 4.2.5. Примеры решения задач ДП................................................83 4.2.6. Алгоритм ДП.........................................................................92 4.2.7. Типичные задачи ДП – распределение ресурсов...............94 4.3. Метод ветвей и границ................................................................95 4.4. Дискретное (целочисленное) линейное программирование ...96 4.4.1. Постановка задачи................................................................96 4.4.2. Решение задачи ЦЛП методом ветвей и границ................97 4.4.3. Решение задачи ЦЛП методом Гомори............................101 4.5. Задачи оптимизации на графах и сетях ...................................104 4.5.1. Выбор на графе замкнутого пути с минимальной стоимостью («задача коммивояжера»).......................................104 4.5.2. Задача о максимальном потоке в сети..............................112 Контрольные вопросы......................................................................120 Библиографический список.................................................................122 Приложения ..........................................................................................123
Предисловие В курсе лекций представлены наиболее распространенные методы оптимизации, используемые при решении задач моделирования и управления. При изложении методов безусловной оптимизации использована классическая последовательность методов. При изложении методов условной оптимизации, в отличие от классического порядка, вначале рассматриваются задачи нелинейного программирования, а затем линейное программирование, что позволяет более логично преподнести проблему линейного программирования. Логика подачи материала усовершенствована также и в самой теме нелинейного программирования. В сложных случаях подробно рассмотрены решения соответствующих задач. Кроме задач поиска экстремума функций на непрерывном множестве значений аргументов изложены проблемы дискретной оптимизации. Показаны принципы построения и реализация алгоритма динамического программирования, основных алгоритмов дискретного линейного программирования и алгоритмов оптимизации на графах и сетях. Последовательность изложения материала позволит учащимся легко переходить от простых проблем к более сложным. Учебный материал представлен в виде четырех разделов. В первом разделе рассмотрены общие проблемы поиска экстремума функций. Во втором разделе представлены классические методы безусловной оптимизации – поиск экстремума функций без ограничений, накладываемых на область определения аргументов. В третьем разделе изложены методы условной оптимизации. Этот раздел имеет два подраздела, посвященных нелинейному и линейному программированию. Названия связаны с соответствующей формой целевой функции и уравнений-ограничений. Четвертый раздел посвящен изложению алгоритмов дискретной оптимизации, применяемых в случаях, когда возможные значения аргументов целевых функций заданы на дискретном множестве.
1. ОСНОВНЫЕ ПОНЯТИЯ И ПРОБЛЕМЫ ОПТИМИЗАЦИИ 1.1. Задача оптимизации При разработке проектов систем различного рода возникает необходимость наилучшего в определенном смысле выбора параметров системы. При этом имеются задачи двух основных типов. Задача первого типа ставится следующим образом: имеется система A с фиксированным входным вектором x(t), управляемым входным вектором u(t), выходным вектором z(t), связанным с векторами x(t) и u(t) некоторым оператором (рис. 1.1), где t – время. A F x(t) u(t) z(t) y Рис. 1.1. Структура модели динамической оптимизации Определен некоторый целевой функционал y = F(x(t), u(t), z(t)). Требуется найти такую векторную функцию u(t), которая обеспечивает экстремум y. Такие задачи обычно рассматриваются в курсе теории управления. Они относятся к классу задач динамической оптимизации. Имеется обширный класс задач исследования и проектирования систем, которые можно отнести ко второму типу. В этих задачах входные и выходные векторные переменные не зависят от времени. При этом обычно говорят, что рассматривается статическая модель системы, представленная на рис. 1.2. A F x z y Рис. 1.2. Структура модели статической оптимизации x(t)
В рамках такой модели бывает определена целевая функция y = F(x, z). При этом считается, что все входные переменные x системы могут выбираться из некоторой заданной области, а все неизменяемые входные параметры включены в оператор A. Переменные z при этом могут рассматриваться как функции z(x), и тогда y является функцией только x. Требуется выбрать значения x, соответствующие экстремуму функции y = F(x). Такая задача называется задачей статической оптимизации. Если область, из которой можно выбирать значения x, составляет все пространство значений переменных (выбор не ограничен), соответствующая задача называется задачей безусловной оптимизации. В противном случае область выбора ограничена с помощью некоторой системы неравенств. В частности, это могут быть равенства. В этом случае говорят, что имеется задача условной оптимизации, понимая под условиями соответствующие уравнения или неравенства, ограничивающие область выбора. 1.2. Геометрическое представление процесса поиска экстремума Процесс функционирования алгоритмов поиска экстремума функции удобно иллюстрировать с помощью изображения траектории поиска в плоскости линий уровня функции двух переменных y = f(x1, x2). Заметим предварительно, что если рассматривается алгоритм поиска минимума функции, то для поиска максимума с помощью того же алгоритма достаточно изменить знак функции на обратный. Поэтому в дальнейшем при изложении курса все алгоритмы будут конструироваться для поиска минимума и отдельных оговорок об их изменении для поиска максимума не будет. Линией уровня функции двух переменных называется ортогональная проекция сечения поверхности функции плоскостью, параллельной плоскости (x1, x2) и лежащей на некотором расстоянии c от нее (рис. 1.3). В случае функции n переменных понятие линии уровня сохраняется (вместо секущей плоскости имеется в виду соответствующая гиперплоскость), однако изображение теряет наглядность. Уравнение линий уровня функции y = f(x1, x2) записывается следующим образом: 1 2 ( , ) . f x x c =
Рис. 1.3. Построение линий уровня Если из этого уравнения можно выразить x2, то уравнение линии уровня можно записать в явном виде: 2 1 ( , ). x V x c = Проекции линий уровня на плоскость, определяемую координатами x1 и x2, образуют семейство линий уровня на этой плоскости. Алгоритмы поиска минимума обеспечивают пошаговое движение к минимуму начиная от некоторой произвольной начальной точки в области определения функции. Пример такого движения на плоскости линий уровня показан на рис.1.4. Траектория поиска заканчивается в районе точки минимума х*. Рис. 1.4. Типовая траектория поиска минимума функции x2 x0 x* x1
В алгоритмах поиска минимума часто используется понятие градиента функции. Напомним, что градиентом называется вектор, компонентами которого являются частные производные функции по ее аргументам. Для функции двух переменных (прил. 1) этот вектор перпендикулярен касательной к линии уровня в рассматриваемой точке и указывает направление максимального возрастания функции, т.е. максимальное значение приращения функции Δf при фиксированном модуле вектора Δx. 1.3. Условия существования минимума Запишем разложение функции f(x) в ряд Тейлора в окрестности точки x* с точностью до малых 3-го порядка (заметим, что под x и dx везде будут подразумеваться векторы за исключением отдельно оговариваемых случаев, а ΔxT означает операцию транспонирования вектора): * * * 1 ( ) ( ) ( ) ( ) ( ), 2 T T f x f x G x x x H x x O x Δ Δ Δ Δ = + + + (1.1) где G(x*) – вектор-градиент в точке x*, H(x*) – матрица вторых производных (матрица Гессе); O(Δx) – бесконечно малые компоненты. Напомним, что условие стационарности точки x* есть равенство нулю градиента: G(x*) = 0. В точке минимума приращение функции Δf(x) = f(x) – f(x*) должно быть больше нуля при любом векторе x, удовлетворяющем условию ║x – x*║< ε . Это условие записывают также следующим образом: x принадлежит sph(x*, ε), т.е. точка x принадлежит множеству точек сферы радиуса ε с центром в точке x*. Тогда из соотношения (1.1) следует положительность квадратичной формы: * ( ) 0. Tx H x x Δ Δ > (1.2) Последнее выражение означает положительную определенность матрицы Н в точке x*. Заметим, что при построении алгоритмов поиска минимума должно быть введено условие останова. Это условие для гладких функций обычно состоит в проверке близости модуля градиента к нулю. С другой стороны, алгоритмы поиска должны быть рассчита
ны на то, что в точке минимума градиент может не существовать. Тогда правило останова должно быть реализовано в виде непосредственной проверки условия Δf(x) > 0. 1.4. Общий вид алгоритма поиска минимума функции Алгоритм поиска минимума некоторой функции f(x) в общем виде представляет собой итерационную процедуру вида ( ) ( ) ( ) ( ), 1 x x S k k k k α = + + (1.3) где x(k) – предыдущая точка в пространстве переменных; x(k + 1) – следующая точка; S(k) – вектор направления перемещения; α(k) – скалярный множитель, определяющий величину шага в направлении S(k); k – номер итерации. Операции алгоритма могут быть представлены следующим образом. 1. Задать k = 0 и начальную точку x(0). 2. Вычислить значение функции f(x(k)). 3. Вычислить направление S(k) из условия уменьшения функции f(x). 4. Вычислить очередную точку x(k + 1) = x(k) + α(k) S(k). 5. Вычислить значение f(x(k + 1)). 6. Вычислить и проверить выполнение условия останова. Если условие выполнено, идти к 9. 7. k = k + 1. 8. Идти к 3. 9. Вывод результатов. STOP. Методы поиска минимума отличаются один от другого: – способом вычисления направления; – способом вычисления множителя α(k); – условиями останова. Наиболее общим условием останова является сравнение нормы разности Δx(k) = x(k + 1) – x(k) с заданным числом εx. Останов алгоритма в общем случае еще не означает, что найдена точка минимума. Чтобы это утверждать, нужно проверить классическое условие минимума: