Трехмерное глубокое обучение на Python
Покупка
Новинка
Тематика:
Программирование и алгоритмизация
Издательство:
ДМК Пресс
Перевод:
Логунов А. В.
Год издания: 2023
Кол-во страниц: 228
Дополнительно
Вид издания:
Практическое пособие
Уровень образования:
Дополнительное образование взрослых
ISBN: 978-5-93700-202-0
Артикул: 855982.01.99
В этом руководстве исследуется современное трехмерное глубокое обучение: приводятся пошаговые объяснения базовых понятий и концепций, а также практические примеры, на основе которых вы сможете создавать собственные модели. Вы научитесь обрабатывать 3D-данные с использованием облаков точек, полигональных сеток; работать с 3D-геометрией, моделями камеры, системами координат; разбираться в понятиях отрисовки, затенения и др.; применять современные продвинутые модели трехмерного глубокого обучения, такие как NeRF, SynSin, Mesh R-CNN.
Издание предназначено для практиков машинного обучения от начального до среднего уровня, исследователей данных, а также инженеров машинного и глубокого обучения, которые хотят изучить и применять методы трехмерного компьютерного зрения.
- Полная коллекция по информатике и вычислительной технике
- ДМК Пресс. Информационные системы и технологии
- ДМК Пресс. ИТ-технологии для профессионалов
- Интермедиатор. Информационные системы и технологии (сводная)
- Интермедиатор. ИТ-технологии для профессионалов (сводная)
- Программирование и алгоритмизация
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.02: Информационные системы и технологии
- 09.03.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Ксудонг Ма, Вишах Хегде, Лилит Йольан Трехмерное глубокое обучение на Python
Xudong Ma, Vishakh Hegde, Lilit Yolyan 3D Deep Learning with Python Design and develop your computer vision model with 3D data using PyTorch3D and more BIRMINGHAM—MUMBAI
Ксудонг Ма, Вишах Хегде, Лилит Йольан Трехмерное глубокое обучение на Python Разрабатывайте модели компьютерного зрения с использованием 3D-данных с помощью библиотеки PyTorch3D и других инструментов Москва, 2023
УДК 004.04 ББК 32.372 М12 Ма К., Хегде В., Йольан Л. М12 Трехмерное глубокое обучение на Python / пер. с англ. А. В. Логунова. – М.: ДМК Пресс, 2023. – 226 с.: ил. ISBN 978-5-93700-202-0 В этом руководстве исследуется современное трехмерное глубокое обучение: приводятся пошаговые объяснения базовых понятий и концепций, а также практические примеры, на основе которых вы сможете создавать собственные модели. Вы научитесь обрабатывать 3D-данные с использованием облаков точек, полигональных сеток; работать с 3D-геометрией, моделями камеры, системами координат; разбираться в понятиях отрисовки, затенения и др.; применять современные продвинутые модели трехмерного глубокого обучения, такие как NeRF, SynSin, Mesh R-CNN. Издание предназначено для практиков машинного обучения от начального до среднего уровня, исследователей данных, а также инженеров машинного и глубокого обучения, которые хотят изучить и применять методы трехмерного компьютерного зрения. УДК 004.04 ББК 32.372 First published in the English language under the title ‘3D Deep Learning with Pythonʼ – (9781803247823). Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. ISBN 978-1-80324-782-3 (англ.) © 2022 Packt Publishing ISBN 978-5-93700-202-0 (рус.) © Перевод, оформление, издание, ДМК Пресс, 2023
Посвящается моей жене и семье, за их поддержку и вдохновение на всех этапах работы – Вишах Хегде Посвящается моей семье и друзьям, чья любовь и поддержка были моей самой большой мотивацией – Лилит Йольан
Содержание От издательства.....................................................................................................10 Об авторах...............................................................................................................11 О рецензентах........................................................................................................12 Предисловие...........................................................................................................14 Часть I. Основы обработки 3D-данных.....................................................18 Глава 1. Введение в обработку 3D-данных............................................19 Технические требования............................................................................................20 Настройка среды разработки....................................................................................20 Представление 3D-данных........................................................................................21 Представление в виде облака точек.....................................................................22 Представление в виде полигональной сетки.....................................................22 Представление в виде воксела..............................................................................23 Формат файла 3D-данных – файлы PLY..................................................................24 Формат файла 3D-данных – файлы OBJ..................................................................29 Понятие системы 3D-координат..............................................................................37 Понятие модели камеры............................................................................................39 Пример программирования моделей камеры и систем координат...................40 Резюме..........................................................................................................................43 Глава 2. Введение в трехмерное компьютерное зрение и геометрию............................................................................................................44 Технические требования............................................................................................45 Ознакомление с базовыми понятиями отрисовки, растеризации и затенения..................................................................................................................45 Понятие барицентрических координат..............................................................47 Модели источника света........................................................................................48 Концепция модели затенения по Ламберту.......................................................48 Концепция модели освещения по Фонгу............................................................49
Содержание 7 Пример программирования 3D-отрисовки............................................................50 Использование разнородных пакетов данных в библиотеке PyTorch3D и оптимизаторов PyTorch..........................................................................................57 Пример программирования разнородных мини-пакетов...............................59 Понятия трансформации и поворота......................................................................63 Примеры программирования трансформации и поворота.............................65 Резюме..........................................................................................................................66 Часть II. Трехмерное глубокое обучение с использованием библиотеки PyTorch3D..............................................68 Глава 3. Подгонка деформируемых сеточных моделей к необработанным облакам точек..............................................................69 Технические требования............................................................................................70 Задача подгонки полигональных сеток к облакам точек.....................................70 Формулирование задачи подгонки деформируемой полигональной сетки в задачу оптимизации.....................................................................................73 Функции потери для регуляризации.......................................................................74 Функция потери с учетом лапласианова сглаживания полигональной сетки.........................................................................................................................74 Функция потери с учетом согласованности нормалей полигональной сетки.........................................................................................................................75 Функция потери с учетом длин ребер полигональной сетки..........................75 Реализация подгонки полигональной сетки с помощью библиотеки PyTorch3D.....................................................................................................................76 Эксперимент без использования каких-либо регуляризационных функций потери......................................................................................................80 Эксперимент с использованием только одной функции потери – потери с учетом длин ребер полигональной сетки...........................................81 Резюме..........................................................................................................................82 Глава 4. Обнаружение и отслеживание позы объекта с помощью дифференцируемой отрисовки...........................................83 Технические требования............................................................................................85 Зачем нужна дифференцируемая отрисовка..........................................................85 Как сделать отрисовку дифференцируемой...........................................................86 Какие задачи можно решать с использованием дифференцируемой отрисовки.................................................................................................................89 Задача оценивания поз объекта...............................................................................90 Как это программируется..........................................................................................93 Пример оценивания позы объекта для подгонки силуэта и подгонки текстуры.................................................................................................................100 Резюме........................................................................................................................107
8 Содержание Глава 5. Понятие дифференцируемой объемометрической отрисовки...............................................................................................................109 Технические требования..........................................................................................110 Общий обзор объемометрической отрисовки.....................................................110 Понятие отбора лучей..............................................................................................112 Применение отбора объемов..................................................................................115 Обследование лучевого маршировщика...............................................................116 Дифференцируемая объемометрическая отрисовка..........................................118 Реконструкция 3D-моделей по многоракурсным изображениям................118 Резюме........................................................................................................................123 Глава 6. Обследование нейронных полей яркости излучения (NeRF)...............................................................................................124 Технические требования..........................................................................................125 Концепция нейронных полей яркости излучения (NeRF)..................................125 Что такое поле яркости излучения?...................................................................126 Представление полей яркости излучения с помощью нейронных сетей.....127 Тренировка модели NeRF........................................................................................128 Понимание архитектуры модели NeRF.................................................................136 Понимание объемной отрисовки с использованием полей яркости излучения...................................................................................................................142 Проецирование лучей на сцену..........................................................................143 Накопление цвета луча........................................................................................143 Резюме........................................................................................................................144 Часть III. Современное трехмерное глубокое обучение с использованием библиотеки PyTorch3D............................................145 Глава 7. Обследование контролируемых нейронных полей признаков.................................................................................................146 Технические требования..........................................................................................147 Концепция синтеза изображений на основе GAN-сети......................................147 Введение в композиционный 3D-информированный синтез изображений..............................................................................................................149 Генерирование полей признаков...........................................................................152 Отображение полей признаков в изображения...................................................153 Обследование контролируемой генерации сцен.................................................155 Обследование контролируемой генерации автомобилей..............................156 Обследование контролируемой генерации лиц..............................................158 Тренировка модели GIRAFFE..................................................................................160 Начальное расстояние Фреше.............................................................................161 Тренировка модели..............................................................................................161 Резюме........................................................................................................................162
Содержание 9 Глава 8. Моделирование человеческого тела в 3D...........................164 Технические требования..........................................................................................165 Постановка задачи 3D-моделирования.................................................................165 Определение подходящего представления......................................................166 Концепция техники линейно-переходного кожного покрова...........................168 Концепция модели SMPL.........................................................................................170 Определение модели SMPL.................................................................................170 Форма и шаблонная полигональная сетка в зависимости от позы..........171 Суставы в зависимости от формы..................................................................171 Применение модели SMPL......................................................................................172 Оценивание позы и формы человека в 3D с помощью метода SMPLify..........174 Определение целевой функции оптимизации................................................175 Обследование метода SMPLify................................................................................176 Выполнение исходного кода...............................................................................177 Обследование исходного кода............................................................................178 Резюме........................................................................................................................182 Глава 9. Сквозной синтез ракурсов с помощью модели SynSin.......................................................................................................................183 Технические требования..........................................................................................184 Общий обзор синтеза ракурсов..............................................................................184 Сетевая архитектура модели SynSin......................................................................185 Сети пространственных признаков и глубин...................................................186 Нейронный отрисовщик облака точек..............................................................187 Модуль уточнения и дискриминатор................................................................190 Тренировка и тестирование модели на практике................................................191 Резюме........................................................................................................................201 Глава 10. Модель Mesh R-CNN.....................................................................202 Технические требования..........................................................................................203 Общий обзор полигональных сеток и вокселов...................................................203 Архитектура модели Mesh R-CNN..........................................................................204 Графовые свертки.................................................................................................207 Предсказатель полигональной сетки................................................................209 Демонстрация модели Mesh R-CNN с помощью PyTorch3D...............................212 Демонстрационный пример...............................................................................212 Резюме........................................................................................................................220 Тематический указатель.................................................................................221
От издательства Отзывы и пожелания Мы всегда рады отзывам наших читателей. Расскажите нам, что вы ду-маете об этой книге – что понравилось или, может быть, не понравилось. Отзывы важны для нас, чтобы выпускать книги, которые будут для вас максимально полезны. Вы можете написать отзыв на нашем сайте www.dmkpress.com, зайдя на страницу книги и оставив комментарий в разделе «Отзывы и рецензии». Также можно послать письмо главному редактору по адресу dmkpress@gmail. com; при этом укажите название книги в теме письма. Если вы являетесь экспертом в какой-либо области и заинтересованы в написании новой книги, заполните форму на нашем сайте по адресу http:// dmkpress.com/authors/publish_book/ или напишите в издательство по адресу dmkpress@gmail.com. Список опечаток Хотя мы приняли все возможные меры для того, чтобы обеспечить высокое качество наших текстов, ошибки все равно случаются. Если вы найдете ошибку в одной из наших книг, мы будем очень благодарны, если вы сообщите о ней главному редактору по адресу dmkpress@gmail.com. Сделав это, вы избавите других читателей от недопонимания и поможете нам улучшить последующие издания этой книги. Нарушение авторских прав Пиратство в интернете по-прежнему остается насущной проблемой. Издательство «ДМК Пресс» очень серьезно относится к вопросам защиты авторских прав и лицензирования. Если вы столкнетесь в интернете с незаконной публикацией какой-либо из наших книг, пожалуйста, пришлите нам ссылку на интернет-ресурс, чтобы мы могли применить санкции. Ссылку на подозрительные материалы можно прислать по адресу электронной почты dmkpress@gmail.com. Мы высоко ценим любую помощь по защите наших авторов, благодаря которой мы можем предоставлять вам качественные материалы.