Введение в автоматизированное машинное обучение (AutoML)
Покупка
Тематика:
Прикладное программное обеспечение
Издательство:
ДМК Пресс
Перевод:
Яценков Валерий Станиславович
Год издания: 2023
Кол-во страниц: 257
Дополнительно
Вид издания:
Монография
Уровень образования:
Профессиональное образование
ISBN: 978-5-93700-196-2
Артикул: 832705.01.99
Ошеломляющий успех коммерческих приложений машинного обучения (ma hine learning - ML) и быстрый рост этой отрасли создали высокий спрос на готовые методы ML, которые можно легко использовать без специальных знаний. Однако и сегодня успех практического применения в решающей степени зависит от экспертов - людей, которые вручную выбирают подходящие архитектуры и их гиперпараметры. Методы AutoML нацелены на устранение этого узкого места путем построения систем ML, способных к автоматической оптимизации и самонастройке независимо от типа входных данных. В этой книге впервые представлен всеобъемлющий обзор базовых методов автоматизированного машинного обучения (AutoML). Издание послужит отправной точкой для изучения этой быстро развивающейся области; тем, кто уже использует AutoML в своей работе, книга пригодится в качестве справочника.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.03: Прикладная информатика
- ВО - Магистратура
- 09.04.01: Информатика и вычислительная техника
- 09.04.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Франк Хуттер Ларс Коттхофф Хоакин Ваншорен Введение в автоматизированное машинное обучение (AutoML)
Frank Hutter • Lars Kotthoff • Joaquin Vanschoren Automated Machine Learning
Франк Хуттер • Ларс Коттхофф • Хоакин Ваншорен Введение в автоматизированное машинное обучение (AutoML) Москва, 2023
УДК 004.4 ББК 32.972 Х98 Хуттер Ф., Коттхофф Л., Ваншорен Х. Х98 Введение в автоматизированное машинное обучение (AutoML) / пер. с англ. В. С. Яценкова. – М.: ДМК Пресс, 2023. – 256 с.: ил. ISBN 978-5-93700-196-2 Ошеломляющий успех коммерческих приложений машинного обучения (machine learning – ML) и быстрый рост этой отрасли создали высокий спрос на готовые методы ML, которые можно легко использовать без специальных знаний. Однако и сегодня успех практического применения в решающей степени зависит от экспертов – людей, которые вручную выбирают подходящие архитектуры и их гиперпараметры. Методы AutoML нацелены на устранение этого узкого места путем построения систем ML, способных к автоматической оптимизации и самонастройке независимо от типа входных данных. В этой книге впервые представлен всеобъемлющий обзор базовых методов автоматизированного машинного обучения (AutoML). Издание послужит отправной точкой для изучения этой быстро развивающейся области; тем, кто уже использует AutoML в своей работе, книга пригодится в качестве справочника. УДК 004.4 ББК 32.972 This book is licensed under the terms of the Creative Commons Attribution 4.0 International License (http://creativecommons.org/licenses/by/4.0/), which permits any noncommercial use, sharing, adaptation, distribution and reproduction in any medium or format, as long as you give appropriate credit to the original author(s) and the source, provide a link to the Creative Commons licence and indicate if changes were made. Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. ISBN 978-1-80181-497-3 (англ.) © Hutter F., Kotthoff L., Vanschoren J., 2019. This book is an open access publication ISBN 978-5-93700-196-2 (рус.) © Перевод, оформление, издание, ДМК Пресс, 2023
Содержание От издательства ....................................................................................................10 Предисловие ..........................................................................................................11 Введение ..................................................................................................................13 ЧАСТЬ I. МЕТОДЫ AutoML ..........................................................................17 Глава 1. Оптимизация гиперпараметров .................................................18 1.1. Введение ...............................................................................................................18 1.2. Постановка задачи ..............................................................................................20 1.2.1. Альтернативы оптимизации: ансамблирование и маргинализация .................................................................................................21 1.2.2. Оптимизация по нескольким целям ........................................................22 1.3. Оптимизация гиперпараметров методом черного ящика ...........................22 1.3.1. Оптимизация методом черного ящика без моделей .............................22 1.3.2. Байесовская оптимизация ..........................................................................24 1.3.2.1. Краткое введение в байесовскую оптимизацию .............................25 1.3.2.2. Суррогатные модели ............................................................................26 1.3.2.3. Описание пространства конфигурации ............................................28 1.3.2.4. Ограниченная байесовская оптимизация ........................................29 1.4. Методы оптимизации с переменной точностью ...........................................30 1.4.1. Прогнозирование на основе кривой обучения для ранней остановки ................................................................................................................31 1.4.2. Методы выбора алгоритма на основе приближений .............................32 1.4.3. Адаптивный выбор точности .....................................................................35 1.5. Применение оптимизации гиперпараметров в AutoML ..............................36 1.6. Проблемы и перспективные направления исследований ............................38 1.6.1. Бенчмарки и сопоставимость результатов ..............................................38 1.6.2. Оптимизация на основе градиента ..........................................................40 1.6.3. Масштабируемость ......................................................................................40 1.6.4. Переобуче ние и обобщение .......................................................................41 1.6.5. Построение конвейера произвольного размера .....................................42 1.7. Литература ............................................................................................................43
Содержание Глава 2. Метаобучение ......................................................................................54 2.1. Введение ...............................................................................................................54 2.2. Обуче ние на основе оценок моделей ...............................................................55 2.2.1. Независимые от задачи рекомендации ...................................................56 2.2.2. Построение пространства конфигураций ................................................57 2.2.3. Перенос конфигурации ...............................................................................58 2.2.3.1. Относительные ориентиры ................................................................58 2.2.3.2. Суррогатные модели ............................................................................58 2.2.3.3. Многозадачное обуче ние с теплым стартом ....................................59 2.2.3.4. Другие методы ......................................................................................60 2.2.4. Кривые обуче ния .........................................................................................60 2.3. Обучение на основе свойств задачи.................................................................61 2.3.1. Метапризнаки ..............................................................................................61 2.3.2. Обуче ние метапризнаков ...........................................................................64 2.3.3. Оптимизация с теплым стартом на основе схожих задач .....................64 2.3.4. Метамодели ..................................................................................................66 2.3.4.1. Ранжирование .......................................................................................66 2.3.4.2. Прогнозирование производительности ...........................................67 2.3.5. Синтез конвейера ........................................................................................68 2.3.6. Настраивать или не настраивать? .............................................................69 2.4. Обучение на основе предыдущих моделей .....................................................69 2.4.1. Трансферное обучение ................................................................................69 2.4.2. Метаобучение в нейронных сетях .............................................................70 2.4.3. Обуче ние на ограниченных данных .........................................................71 2.4.4. За рамками обуче ния с учителем ..............................................................73 2.5. Заключение ..........................................................................................................74 2.6. Литература ...........................................................................................................75 Глава 3. Поиск нейронной архитектуры ..................................................85 3.1. Введение ...............................................................................................................85 3.2. Пространство поиска ..........................................................................................87 3.3. Стратегия поиска ................................................................................................90 3.4. Стратегия оценки производительности ..........................................................93 3.5. Перспективные направления ............................................................................96 3.6. Литература ...........................................................................................................98 ЧАСТЬ II. СИСТЕМЫ AutoML....................................................................103 Глава 4. Auto-WEKA: автоматический выбор модели и оптимизация гиперпараметров в WEKA ...........................................104 4.1. Введение .............................................................................................................105 4.2. Предварительные условия ...............................................................................106 4.2.1. Выбор модели .............................................................................................106
Содержание 7 4.2.2. Оптимизация гиперпараметров .............................................................107 4.3. Одновременный выбор алгоритмов и оптимизация гиперпараметров (CASH) ........................................................................................108 4.3.1. Последовательный алгоритм конфигурации по модели (SMAC) .......109 4.4. Auto-WEKA .........................................................................................................110 4.5. Экспериментальная оценка ............................................................................112 4.5.1. Эталонные методы ....................................................................................113 4.5.2. Результаты производительности, определенные перекрестной проверкой .............................................................................................................115 4.5.3. Результаты тестирования производительности ...................................115 4.6. Заключение ........................................................................................................117 4.6.1. Популярность Auto-WEKA в сообществе ................................................117 4.7. Литература ..........................................................................................................118 Глава 5. Проект Hyperopt-sklearn ..............................................................120 5.1. Введение .............................................................................................................120 5.2. Оптимизация с помощью Hyperopt ...............................................................121 5.3. Выбор модели в scikit-learn как задача поиска ............................................123 5.4. Пример использования ....................................................................................124 5.5. Эксперименты ...................................................................................................128 5.6. Текущее состояние и перспективные направления исследований ...........130 5.7. Заключение.........................................................................................................133 5.8. Литература .........................................................................................................134 Глава 6. Auto-sklearn – эффективное и надежное автоматизированное машинное обучение ..........................................136 6.1. Введение .............................................................................................................137 6.2. AutoML как задача CASH ..................................................................................138 6.3. Новые методы повышения эффективности и надежности AutoML ..........139 6.3.1. Поиск перспективных вариантов при помощи метаобуче ния ..........140 6.3.2. Автоматизированное построение ансамбля моделей, оцененных во время оптимизации ..................................................................141 6.4. Практическая система автоматизированного машинного обучения .......142 6.5. Сравнение Auto-sklearn с Auto-WEKA и Hyperopt-sklearn ..........................146 6.6. Оценка предложенных улучшений AutoML ..................................................148 6.7. Детальный анализ компонентов Auto-sklearn ..............................................150 6.8. Обсуждение результатов и заключение ........................................................151 6.8.1. Обсуждение результатов ..........................................................................151 6.8.2. Практическое применение .......................................................................155 6.8.3. Расширения в PoSH Auto-sklearn .............................................................155 6.8.4. Заключение и будущие исследования ....................................................156 6.9. Литература .........................................................................................................157
Содержание Глава 7. На пути к автоматически настраиваемым глубоким нейронным сетям ..............................................................................................160 7.1. Введение .............................................................................................................160 7.2. Auto-Net 1.0 ........................................................................................................162 7.3. Auto-Net 2.0 ........................................................................................................164 7.4. Эксперименты ....................................................................................................170 7.4.1. Первичная оценка Auto-Net 1.0 и Auto-sklearn .....................................170 7.4.2. Результаты для наборов данных конкурса AutoML ..............................171 7.4.3. Сравнение AutoNet 1.0 и 2.0 .....................................................................173 7.5. Заключение.........................................................................................................174 7.6. Литература ..........................................................................................................174 Глава 8. TPOT: инструмент оптимизации конвейеров на основе деревьев для автоматизации машинного обучения ................................................................................................................179 8.1. Введение .............................................................................................................180 8.2. Базовые принципы TPOT .................................................................................180 8.2.1. Конвейерные операторы машинного обучения ...................................181 8.2.2. Построение конвейеров на основе деревьев .........................................182 8.2.3. Оптимизация конвейеров на основе деревьев .....................................182 8.2.4. Эталонные данные ....................................................................................183 8.3. Результаты ..........................................................................................................183 8.4. Выводы и перспективные направления исследований ..............................187 8.5. Литература .........................................................................................................188 Глава 9. Проект Automatic Statistician ....................................................190 9.1. Введение .............................................................................................................190 9.2. Базовые принципы Automatic Statistician .....................................................192 9.2.1. Похожие исследования .............................................................................193 9.3. Automatic Statistician и данные временных рядов ......................................193 9.3.1. Грамматика операций над ядрами .........................................................194 9.3.2. Процедура поиска и оценки .....................................................................195 9.3.3. Генерация описаний на естественном языке ........................................196 9.3.4. Сравнение с людьми..................................................................................198 9.4. Другие системы автоматической статистики ...............................................198 9.4.1. Основные компоненты .............................................................................199 9.4.2. Проблемы и задачи ....................................................................................200 9.4.2.1. Взаимодействие с пользователем ....................................................200 9.4.2.2. Отсутствующие и беспорядочные данные .....................................200 9.4.2.3. Распределение ресурсов ....................................................................200 9.5. Заключение ........................................................................................................201 9.6. Литература .........................................................................................................201
Содержание 9 ЧАСТЬ III. ПРОБЛЕМЫ AutoML ..............................................................205 Глава 10. О чем говорят результаты конкурсов AutoML Challenge? ............................................................................................206 10.1. Введение ...........................................................................................................207 10.2. Формализация задачи и обзор условий.......................................................210 10.2.1. Предметная область задачи ...................................................................210 10.2.2. Выбор полной модели .............................................................................211 10.2.3. Оптимизация гиперпараметров ...........................................................213 10.2.4. Стратегии поиска моделей .....................................................................214 10.3. Данные ..............................................................................................................218 10.4. Протокол конкурса ..........................................................................................221 10.4.1. Бюджет времени и вычислительные ресурсы .....................................222 10.4.2. Метрики подсчета баллов .......................................................................222 10.4.3. Раунды и этапы в конкурсе 2015/2016 .................................................225 10.4.4. Этапы конкурса 2018 года ......................................................................226 10.5. Результаты ........................................................................................................227 10.5.1. Оценки, полученные в конкурсе 2015/2016 .........................................227 10.5.2. Результаты, полученные в конкурсе 2018 года ...................................230 10.5.3. Сложность наборов данных/задач ........................................................230 10.5.4. Оптимизация гиперпараметров ...........................................................236 10.5.5. Метаобуче ние ...........................................................................................238 10.5.6. Методы, использованные в конкурсах .................................................239 10.6. Обсуждение ......................................................................................................245 10.7. Заключение.......................................................................................................246 10.8. Литература .......................................................................................................249 Предметный указатель ...................................................................................254
От издательства Отзывы и пожелания Мы всегда рады отзывам наших читателей. Расскажите нам, что вы ду маете об этой книге – что понравилось или, может быть, не понравилось. Отзывы важны для нас, чтобы выпускать книги, которые будут для вас максимально полезны. Вы можете написать отзыв на нашем сайте www.dmkpress.com, зайдя на страницу книги и оставив комментарий в разделе «Отзывы и рецензии». Также можно послать письмо главному редактору по адресу dmkpress@gmail. com; при этом укажите название книги в теме письма. Если вы являетесь экспертом в какой-либо области и заинтересованы в написании новой книги, заполните форму на нашем сайте по адресу http:// dmkpress.com/authors/publish_book/ или напишите в издательство по адресу dmkpress@gmail.com. Список опечаток Хотя мы приняли все возможные меры для того, чтобы обеспечить высокое качество наших текстов, ошибки все равно случаются. Если вы найдете ошибку в одной из наших книг, мы будем очень благодарны, если вы сообщите о ней главному редактору по адресу dmkpress@gmail.com. Сделав это, вы избавите других читателей от недопонимания и поможете нам улучшить последующие издания этой книги. Нарушение авторских прав Пиратство в интернете по-прежнему остается насущной проблемой. Издательство «ДМК Пресс» очень серьезно относится к вопросам защиты авторских прав и лицензирования. Если вы столкнетесь в интернете с незаконной публикацией какой-либо из наших книг, пожалуйста, пришлите нам ссылку на интернет-ресурс, чтобы мы могли применить санкции. Ссылку на подозрительные материалы можно прислать по адресу элект ронной почты dmkpress@gmail.com. Мы высоко ценим любую помощь по защите наших авторов, благодаря которой мы можем предоставлять вам качественные материалы.