Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Введение в автоматизированное машинное обучение (AutoML)

Покупка
Артикул: 832705.01.99
Доступ онлайн
1 499 ₽
В корзину
Ошеломляющий успех коммерческих приложений машинного обучения (ma hine learning - ML) и быстрый рост этой отрасли создали высокий спрос на готовые методы ML, которые можно легко использовать без специальных знаний. Однако и сегодня успех практического применения в решающей степени зависит от экспертов - людей, которые вручную выбирают подходящие архитектуры и их гиперпараметры. Методы AutoML нацелены на устранение этого узкого места путем построения систем ML, способных к автоматической оптимизации и самонастройке независимо от типа входных данных. В этой книге впервые представлен всеобъемлющий обзор базовых методов автоматизированного машинного обучения (AutoML). Издание послужит отправной точкой для изучения этой быстро развивающейся области; тем, кто уже использует AutoML в своей работе, книга пригодится в качестве справочника.
Хуттер, Ф. Введение в автоматизированное машинное обучение (AutoML) / Ф. Хуттер, Л. Коттхофф, Х. Ваншорен. - Москва : ДМК Пресс, 2023. - 257 с. - ISBN 978-5-93700-196-2. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2150537 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Франк Хуттер 
Ларс Коттхофф 
Хоакин Ваншорен

Введение  
в автоматизированное  
машинное обучение  
(AutoML)

Frank Hutter • Lars Kotthoff • Joaquin Vanschoren

Automated  
Machine Learning

Франк Хуттер • Ларс Коттхофф • Хоакин Ваншорен

Введение 
в автоматизированное 
машинное обучение 
(AutoML)

Москва, 2023

УДК 004.4
ББК 32.972
Х98

Хуттер Ф., Коттхофф Л., Ваншорен Х.
Х98  Введение в автоматизированное машинное обучение (AutoML) / пер. с англ. 
В. С. Яценкова. – М.: ДМК Пресс, 2023. – 256 с.: ил. 

ISBN 978-5-93700-196-2

Ошеломляющий успех коммерческих приложений машинного обучения 
(machine learning – ML) и быстрый рост этой отрасли создали высокий спрос на 
готовые методы ML, которые можно легко использовать без специальных знаний. 
Однако и сегодня успех практического применения в решающей степени зависит 
от экспертов – людей, которые вручную выбирают подходящие архитектуры и их 
гиперпараметры. Методы AutoML нацелены на устранение этого узкого места 
путем построения систем ML, способных к автоматической оптимизации и самонастройке независимо от типа входных данных. В этой книге впервые представлен всеобъемлющий обзор базовых методов автоматизированного машинного 
обучения (AutoML). 
Издание послужит отправной точкой для изучения этой быстро развивающейся 
области; тем, кто уже использует AutoML в своей работе, книга пригодится в качестве справочника.

УДК 004.4
ББК 32.972

This book is licensed under the terms of the Creative Commons Attribution 4.0 International 
License (http://creativecommons.org/licenses/by/4.0/), which permits any noncommercial use, 
sharing, adaptation, distribution and reproduction in any medium or format, as long as you 
give appropriate credit to the original author(s) and the source, provide a link to the Creative 
Commons licence and indicate if changes were made.

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения 
владельцев авторских прав.

ISBN 978-1-80181-497-3 (англ.)  
©  Hutter F., Kotthoff L., Vanschoren J., 2019. 
This book is an open access publication
ISBN 978-5-93700-196-2 (рус.)  
©  Перевод, оформление, издание,  
ДМК Пресс, 2023

Содержание

От издательства ....................................................................................................10

Предисловие ..........................................................................................................11

Введение ..................................................................................................................13

ЧАСТЬ I. МЕТОДЫ AutoML  ..........................................................................17

Глава 1. Оптимизация гиперпараметров .................................................18

1.1. Введение ...............................................................................................................18
1.2. Постановка задачи ..............................................................................................20
1.2.1. Альтернативы оптимизации: ансамблирование  
и маргинализация .................................................................................................21
1.2.2. Оптимизация по нескольким целям ........................................................22
1.3. Оптимизация гиперпараметров методом черного ящика ...........................22
1.3.1. Оптимизация методом черного ящика без моделей .............................22
1.3.2. Байесовская оптимизация ..........................................................................24
1.3.2.1. Краткое введение в байесовскую оптимизацию .............................25
1.3.2.2. Суррогатные модели ............................................................................26
1.3.2.3. Описание пространства конфигурации ............................................28
1.3.2.4. Ограниченная байесовская оптимизация ........................................29
1.4. Методы оптимизации с переменной точностью ...........................................30
1.4.1. Прогнозирование на основе кривой обучения для ранней  
остановки ................................................................................................................31
1.4.2. Методы выбора алгоритма на основе приближений .............................32
1.4.3. Адаптивный выбор точности .....................................................................35
1.5. Применение оптимизации гиперпараметров в AutoML ..............................36
1.6. Проблемы и перспективные направления исследований ............................38
1.6.1. Бенчмарки и сопоставимость результатов ..............................................38
1.6.2. Оптимизация на основе градиента ..........................................................40
1.6.3. Масштабируемость ......................................................................................40
1.6.4. Переобуче ние и обобщение .......................................................................41
1.6.5. Построение конвейера произвольного размера .....................................42
1.7. Литература ............................................................................................................43

 Содержание

Глава 2. Метаобучение ......................................................................................54

2.1. Введение ...............................................................................................................54
2.2. Обуче ние на основе оценок моделей ...............................................................55
2.2.1. Независимые от задачи рекомендации ...................................................56
2.2.2. Построение пространства конфигураций ................................................57
2.2.3. Перенос конфигурации ...............................................................................58
2.2.3.1. Относительные ориентиры ................................................................58
2.2.3.2. Суррогатные модели ............................................................................58
2.2.3.3. Многозадачное обуче ние с теплым стартом ....................................59
2.2.3.4. Другие методы ......................................................................................60
2.2.4. Кривые обуче ния .........................................................................................60
2.3. Обучение на основе свойств задачи.................................................................61
2.3.1. Метапризнаки ..............................................................................................61
2.3.2. Обуче ние метапризнаков ...........................................................................64
2.3.3. Оптимизация с теплым стартом на основе схожих задач .....................64
2.3.4. Метамодели ..................................................................................................66
2.3.4.1. Ранжирование .......................................................................................66
2.3.4.2. Прогнозирование производительности ...........................................67
2.3.5. Синтез конвейера ........................................................................................68
2.3.6. Настраивать или не настраивать? .............................................................69
2.4. Обучение на основе предыдущих моделей .....................................................69
2.4.1. Трансферное обучение ................................................................................69
2.4.2. Метаобучение в нейронных сетях .............................................................70
2.4.3. Обуче ние на ограниченных данных .........................................................71
2.4.4. За рамками обуче ния с учителем ..............................................................73
2.5. Заключение ..........................................................................................................74
2.6. Литература ...........................................................................................................75

Глава 3. Поиск нейронной архитектуры ..................................................85

3.1. Введение ...............................................................................................................85
3.2. Пространство поиска ..........................................................................................87
3.3. Стратегия поиска ................................................................................................90
3.4. Стратегия оценки производительности ..........................................................93
3.5. Перспективные направления ............................................................................96
3.6. Литература ...........................................................................................................98

ЧАСТЬ II. СИСТЕМЫ AutoML....................................................................103

Глава 4. Auto-WEKA: автоматический выбор модели 
и оптимизация гиперпараметров в WEKA ...........................................104

4.1. Введение .............................................................................................................105
4.2. Предварительные условия ...............................................................................106
4.2.1. Выбор модели .............................................................................................106

Содержание  7

4.2.2. Оптимизация гиперпараметров .............................................................107
4.3. Одновременный выбор алгоритмов и оптимизация  
гиперпараметров (CASH) ........................................................................................108
4.3.1. Последовательный алгоритм конфигурации по модели (SMAC) .......109
4.4. Auto-WEKA .........................................................................................................110
4.5. Экспериментальная оценка ............................................................................112
4.5.1. Эталонные методы ....................................................................................113
4.5.2. Результаты производительности, определенные перекрестной 
проверкой .............................................................................................................115
4.5.3. Результаты тестирования производительности ...................................115
4.6. Заключение ........................................................................................................117
4.6.1. Популярность Auto-WEKA в сообществе ................................................117
4.7. Литература ..........................................................................................................118

Глава 5. Проект Hyperopt-sklearn ..............................................................120

5.1. Введение .............................................................................................................120
5.2. Оптимизация с помощью Hyperopt ...............................................................121
5.3. Выбор модели в scikit-learn как задача поиска ............................................123
5.4. Пример использования ....................................................................................124
5.5. Эксперименты ...................................................................................................128
5.6. Текущее состояние и перспективные направления исследований ...........130
5.7. Заключение.........................................................................................................133
5.8. Литература .........................................................................................................134

Глава 6. Auto-sklearn – эффективное и надежное 
автоматизированное машинное обучение ..........................................136

6.1. Введение .............................................................................................................137
6.2. AutoML как задача CASH ..................................................................................138
6.3. Новые методы повышения эффективности и надежности AutoML ..........139
6.3.1. Поиск перспективных вариантов при помощи метаобуче ния ..........140
6.3.2. Автоматизированное построение ансамбля моделей,  
оцененных во время оптимизации ..................................................................141
6.4. Практическая система автоматизированного машинного обучения .......142
6.5. Сравнение Auto-sklearn с Auto-WEKA и Hyperopt-sklearn ..........................146
6.6. Оценка предложенных улучшений AutoML  ..................................................148
6.7. Детальный анализ компонентов Auto-sklearn ..............................................150
6.8. Обсуждение результатов и заключение ........................................................151
6.8.1. Обсуждение результатов ..........................................................................151
6.8.2. Практическое применение .......................................................................155
6.8.3. Расширения в PoSH Auto-sklearn .............................................................155
6.8.4. Заключение и будущие исследования ....................................................156
6.9. Литература .........................................................................................................157

 Содержание

Глава 7. На пути к автоматически настраиваемым глубоким 
нейронным сетям ..............................................................................................160

7.1. Введение .............................................................................................................160
7.2. Auto-Net 1.0 ........................................................................................................162
7.3. Auto-Net 2.0 ........................................................................................................164
7.4. Эксперименты ....................................................................................................170
7.4.1. Первичная оценка Auto-Net 1.0 и Auto-sklearn .....................................170
7.4.2. Результаты для наборов данных конкурса AutoML ..............................171
7.4.3. Сравнение AutoNet 1.0 и 2.0 .....................................................................173
7.5. Заключение.........................................................................................................174
7.6. Литература ..........................................................................................................174

Глава 8. TPOT: инструмент оптимизации конвейеров  
на основе деревьев для автоматизации  машинного  
обучения ................................................................................................................179

8.1. Введение .............................................................................................................180
8.2. Базовые принципы TPOT .................................................................................180
8.2.1. Конвейерные операторы машинного обучения ...................................181
8.2.2. Построение конвейеров на основе деревьев .........................................182
8.2.3. Оптимизация конвейеров на основе деревьев .....................................182
8.2.4. Эталонные данные ....................................................................................183
8.3. Результаты ..........................................................................................................183
8.4. Выводы и перспективные направления исследований ..............................187
8.5. Литература .........................................................................................................188

Глава 9. Проект Automatic Statistician ....................................................190

9.1. Введение .............................................................................................................190
9.2. Базовые принципы Automatic Statistician .....................................................192
9.2.1. Похожие исследования .............................................................................193
9.3. Automatic Statistician и данные временных рядов ......................................193
9.3.1. Грамматика операций над ядрами .........................................................194
9.3.2. Процедура поиска и оценки .....................................................................195
9.3.3. Генерация описаний на естественном языке ........................................196
9.3.4. Сравнение с людьми..................................................................................198
9.4. Другие системы автоматической статистики ...............................................198
9.4.1. Основные компоненты .............................................................................199
9.4.2. Проблемы и задачи ....................................................................................200
9.4.2.1. Взаимодействие с пользователем ....................................................200
9.4.2.2. Отсутствующие и беспорядочные данные .....................................200
9.4.2.3. Распределение ресурсов ....................................................................200
9.5. Заключение ........................................................................................................201
9.6. Литература .........................................................................................................201

Содержание  9

ЧАСТЬ III. ПРОБЛЕМЫ AutoML ..............................................................205

Глава 10. О чем говорят результаты конкурсов 
AutoML Challenge? ............................................................................................206

10.1. Введение ...........................................................................................................207
10.2. Формализация задачи и обзор условий.......................................................210
10.2.1. Предметная область задачи ...................................................................210
10.2.2. Выбор полной модели .............................................................................211
10.2.3. Оптимизация гиперпараметров ...........................................................213
10.2.4. Стратегии поиска моделей .....................................................................214
10.3. Данные ..............................................................................................................218
10.4. Протокол конкурса ..........................................................................................221
10.4.1. Бюджет времени и вычислительные ресурсы .....................................222
10.4.2. Метрики подсчета баллов .......................................................................222
10.4.3. Раунды и этапы в конкурсе 2015/2016  .................................................225
10.4.4. Этапы конкурса 2018 года ......................................................................226
10.5. Результаты ........................................................................................................227
10.5.1. Оценки, полученные в конкурсе 2015/2016 .........................................227
10.5.2. Результаты, полученные в конкурсе 2018 года ...................................230
10.5.3. Сложность наборов данных/задач ........................................................230
10.5.4. Оптимизация гиперпараметров ...........................................................236
10.5.5. Метаобуче ние ...........................................................................................238
10.5.6. Методы, использованные в конкурсах .................................................239
10.6. Обсуждение ......................................................................................................245
10.7. Заключение.......................................................................................................246
10.8. Литература .......................................................................................................249

Предметный указатель ...................................................................................254

От издательства

Отзывы и пожелания

Мы всегда рады отзывам наших читателей. Расскажите нам, что вы ду маете 
об этой книге – что понравилось или, может быть, не понравилось. Отзывы 
важны для нас, чтобы выпускать книги, которые будут для вас максимально 
полезны.
Вы можете написать отзыв на нашем сайте www.dmkpress.com, зайдя на 
страницу книги и оставив комментарий в разделе «Отзывы и рецензии». 
Также можно послать письмо главному редактору по адресу dmkpress@gmail.
com; при этом укажите название книги в теме письма. 
Если вы являетесь экспертом в какой-либо области и заинтересованы в написании новой книги, заполните форму на нашем сайте по адресу http://
dmkpress.com/authors/publish_book/ или напишите в издательство по адресу 
dmkpress@gmail.com.

Список опечаток

Хотя мы приняли все возможные меры для того, чтобы обеспечить высокое качество наших текстов, ошибки все равно случаются. Если вы найдете 
ошибку в одной из наших книг, мы будем очень благодарны, если вы сообщите о ней главному редактору по адресу dmkpress@gmail.com. Сделав это, 
вы избавите других читателей от недопонимания и поможете нам улучшить 
последующие издания этой книги. 

Нарушение авторских прав

Пиратство в интернете по-прежнему остается насущной проблемой. Издательство «ДМК Пресс» очень серьезно относится к вопросам защиты авторских прав 
и лицензирования. Если вы столкнетесь в интернете с незаконной публикацией 
какой-либо из наших книг, пожалуйста, пришлите нам ссылку на интернет-ресурс, чтобы мы могли применить санкции.
Ссылку на подозрительные материалы можно прислать по адресу элект
ронной почты dmkpress@gmail.com.
Мы высоко ценим любую помощь по защите наших авторов, благодаря 
которой мы можем предоставлять вам качественные материалы.

Доступ онлайн
1 499 ₽
В корзину