Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Трехмерное глубокое обучение на Python

Покупка
Новинка
Артикул: 855982.01.99
Доступ онлайн
1 299 ₽
В корзину
В этом руководстве исследуется современное трехмерное глубокое обучение: приводятся пошаговые объяснения базовых понятий и концепций, а также практические примеры, на основе которых вы сможете создавать собственные модели. Вы научитесь обрабатывать 3D-данные с использованием облаков точек, полигональных сеток; работать с 3D-геометрией, моделями камеры, системами координат; разбираться в понятиях отрисовки, затенения и др.; применять современные продвинутые модели трехмерного глубокого обучения, такие как NeRF, SynSin, Mesh R-CNN. Издание предназначено для практиков машинного обучения от начального до среднего уровня, исследователей данных, а также инженеров машинного и глубокого обучения, которые хотят изучить и применять методы трехмерного компьютерного зрения.
Ма, К. Трехмерное глубокое обучение на Python : практическое руководство / К. Ма, В. Хегде, Л. Йольан ; пер. с англ. А. В. Логунова. – Москва : ДМК Пресс, 2023. - 228 с. – ISBN 978-5-93700-202-0. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2204234 (дата обращения: 05.04.2025). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Ксудонг Ма, Вишах Хегде, Лилит Йольан
Трехмерное  
глубокое обучение  
на Python


Xudong Ma, Vishakh Hegde, Lilit Yolyan
3D Deep Learning  
with Python 
Design and develop  
your computer vision model  
with 3D data using PyTorch3D  
and more
BIRMINGHAM—MUMBAI


Ксудонг Ма, Вишах Хегде, Лилит Йольан
Трехмерное  
глубокое обучение  
на Python
Разрабатывайте модели  
компьютерного зрения с использованием 
3D-данных с помощью библиотеки PyTorch3D 
и других инструментов
Москва, 2023


УДК	 004.04
ББК 32.372
М12
Ма К., Хегде В., Йольан Л.
М12 	 Трехмерное глубокое обучение на Python / пер. с англ. А. В. Логунова. – М.: 
ДМК Пресс, 2023. – 226 с.: ил. 
ISBN 978-5-93700-202-0
В этом руководстве исследуется современное трехмерное глубокое обучение: 
приводятся пошаговые объяснения базовых понятий и концепций, а также 
практические примеры, на основе которых вы сможете создавать собственные 
модели. Вы научитесь обрабатывать 3D-данные с использованием облаков точек, 
полигональных сеток; работать с 3D-геометрией, моделями камеры, системами 
координат; разбираться в понятиях отрисовки, затенения и др.; применять современные продвинутые модели трехмерного глубокого обучения, такие как 
NeRF, SynSin, Mesh R-CNN.
Издание предназначено для практиков машинного обучения от начального 
до среднего уровня, исследователей данных, а также инженеров машинного 
и глубокого обучения, которые хотят изучить и применять методы трехмерного 
компьютерного зрения.
УДК  004.04
ББК  32.372
First published in the English language under the title ‘3D Deep Learning with Pythonʼ – 
(9781803247823).
Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения 
владельцев авторских прав.
ISBN 978-1-80324-782-3 (англ.) 	
©  2022 Packt Publishing
ISBN 978-5-93700-202-0 (рус.) 	
©  Перевод, оформление, издание,  
ДМК Пресс, 2023


Посвящается моей жене и семье,  
за их поддержку и вдохновение на всех этапах работы 
– Вишах Хегде
Посвящается моей семье и друзьям,  
чья любовь и поддержка были моей самой большой мотивацией 
– Лилит Йольан


Содержание
От издательства.....................................................................................................10
Об авторах...............................................................................................................11
О рецензентах........................................................................................................12
Предисловие...........................................................................................................14
Часть I. Основы обработки 3D-данных.....................................................18
Глава 1. Введение в обработку 3D-данных............................................19
Технические требования............................................................................................20
Настройка среды разработки....................................................................................20
Представление 3D-данных........................................................................................21
Представление в виде облака точек.....................................................................22
Представление в виде полигональной сетки.....................................................22
Представление в виде воксела..............................................................................23
Формат файла 3D-данных – файлы PLY..................................................................24
Формат файла 3D-данных – файлы OBJ..................................................................29
Понятие системы 3D-координат..............................................................................37
Понятие модели камеры............................................................................................39
Пример программирования моделей камеры и систем координат...................40
Резюме..........................................................................................................................43
Глава 2. Введение в трехмерное компьютерное зрение 
и геометрию............................................................................................................44
Технические требования............................................................................................45
Ознакомление с базовыми понятиями отрисовки, растеризации  
и затенения..................................................................................................................45
Понятие барицентрических координат..............................................................47
Модели источника света........................................................................................48
Концепция модели затенения по Ламберту.......................................................48
Концепция модели освещения по Фонгу............................................................49


Содержание    7
Пример программирования 3D-отрисовки............................................................50
Использование разнородных пакетов данных в библиотеке PyTorch3D  
и оптимизаторов PyTorch..........................................................................................57
Пример программирования разнородных мини-пакетов...............................59
Понятия трансформации и поворота......................................................................63
Примеры программирования трансформации и поворота.............................65
Резюме..........................................................................................................................66
Часть II. Трехмерное глубокое обучение  
с использованием библиотеки PyTorch3D..............................................68
Глава 3. Подгонка деформируемых сеточных моделей 
к необработанным облакам точек..............................................................69
Технические требования............................................................................................70
Задача подгонки полигональных сеток к облакам точек.....................................70
Формулирование задачи подгонки деформируемой полигональной  
сетки в задачу оптимизации.....................................................................................73
Функции потери для регуляризации.......................................................................74
Функция потери с учетом лапласианова сглаживания полигональной  
сетки.........................................................................................................................74
Функция потери с учетом согласованности нормалей полигональной  
сетки.........................................................................................................................75
Функция потери с учетом длин ребер полигональной сетки..........................75
Реализация подгонки полигональной сетки с помощью библиотеки 
PyTorch3D.....................................................................................................................76
Эксперимент без использования каких-либо регуляризационных  
функций потери......................................................................................................80
Эксперимент с использованием только одной функции потери –  
потери с учетом длин ребер полигональной сетки...........................................81
Резюме..........................................................................................................................82
Глава 4. Обнаружение и отслеживание позы объекта  
с помощью дифференцируемой отрисовки...........................................83
Технические требования............................................................................................85
Зачем нужна дифференцируемая отрисовка..........................................................85
Как сделать отрисовку дифференцируемой...........................................................86
Какие задачи можно решать с использованием дифференцируемой 
отрисовки.................................................................................................................89
Задача оценивания поз объекта...............................................................................90
Как это программируется..........................................................................................93
Пример оценивания позы объекта для подгонки силуэта и подгонки 
текстуры.................................................................................................................100
Резюме........................................................................................................................107


8    Содержание
Глава 5. Понятие дифференцируемой объемометрической 
отрисовки...............................................................................................................109
Технические требования..........................................................................................110
Общий обзор объемометрической отрисовки.....................................................110
Понятие отбора лучей..............................................................................................112
Применение отбора объемов..................................................................................115
Обследование лучевого маршировщика...............................................................116
Дифференцируемая объемометрическая отрисовка..........................................118
Реконструкция 3D-моделей по многоракурсным изображениям................118
Резюме........................................................................................................................123
Глава 6. Обследование нейронных полей яркости  
излучения (NeRF)...............................................................................................124
Технические требования..........................................................................................125
Концепция нейронных полей яркости излучения (NeRF)..................................125
Что такое поле яркости излучения?...................................................................126
Представление полей яркости излучения с помощью нейронных сетей.....127
Тренировка модели NeRF........................................................................................128
Понимание архитектуры модели NeRF.................................................................136
Понимание объемной отрисовки с использованием полей яркости  
излучения...................................................................................................................142
Проецирование лучей на сцену..........................................................................143
Накопление цвета луча........................................................................................143
Резюме........................................................................................................................144
Часть III. Современное трехмерное глубокое обучение 
с использованием библиотеки PyTorch3D............................................145
Глава 7. Обследование контролируемых нейронных  
полей признаков.................................................................................................146
Технические требования..........................................................................................147
Концепция синтеза изображений на основе GAN-сети......................................147
Введение в композиционный 3D-информированный синтез  
изображений..............................................................................................................149
Генерирование полей признаков...........................................................................152
Отображение полей признаков в изображения...................................................153
Обследование контролируемой генерации сцен.................................................155
Обследование контролируемой генерации автомобилей..............................156
Обследование контролируемой генерации лиц..............................................158
Тренировка модели GIRAFFE..................................................................................160
Начальное расстояние Фреше.............................................................................161
Тренировка модели..............................................................................................161
Резюме........................................................................................................................162


Содержание    9
Глава 8. Моделирование человеческого тела в 3D...........................164
Технические требования..........................................................................................165
Постановка задачи 3D-моделирования.................................................................165
Определение подходящего представления......................................................166
Концепция техники линейно-переходного кожного покрова...........................168
Концепция модели SMPL.........................................................................................170
Определение модели SMPL.................................................................................170
Форма и шаблонная полигональная сетка в зависимости от позы..........171
Суставы в зависимости от формы..................................................................171
Применение модели SMPL......................................................................................172
Оценивание позы и формы человека в 3D с помощью метода SMPLify..........174
Определение целевой функции оптимизации................................................175
Обследование метода SMPLify................................................................................176
Выполнение исходного кода...............................................................................177
Обследование исходного кода............................................................................178
Резюме........................................................................................................................182
Глава 9. Сквозной синтез ракурсов с помощью модели  
SynSin.......................................................................................................................183
Технические требования..........................................................................................184
Общий обзор синтеза ракурсов..............................................................................184
Сетевая архитектура модели SynSin......................................................................185
Сети пространственных признаков и глубин...................................................186
Нейронный отрисовщик облака точек..............................................................187
Модуль уточнения и дискриминатор................................................................190
Тренировка и тестирование модели на практике................................................191
Резюме........................................................................................................................201
Глава 10. Модель Mesh R-CNN.....................................................................202
Технические требования..........................................................................................203
Общий обзор полигональных сеток и вокселов...................................................203
Архитектура модели Mesh R-CNN..........................................................................204
Графовые свертки.................................................................................................207
Предсказатель полигональной сетки................................................................209
Демонстрация модели Mesh R-CNN с помощью PyTorch3D...............................212
Демонстрационный пример...............................................................................212
Резюме........................................................................................................................220
Тематический указатель.................................................................................221


От издательства
Отзывы и пожелания
Мы всегда рады отзывам наших читателей. Расскажите нам, что вы ду-маете 
об этой книге – что понравилось или, может быть, не понравилось. Отзывы 
важны для нас, чтобы выпускать книги, которые будут для вас максимально 
полезны.
Вы можете написать отзыв на нашем сайте www.dmkpress.com, зайдя на 
страницу книги и оставив комментарий в разделе «Отзывы и рецензии». 
Также можно послать письмо главному редактору по адресу dmkpress@gmail.
com; при этом укажите название книги в теме письма. 
Если вы являетесь экспертом в какой-либо области и заинтересованы в написании новой книги, заполните форму на нашем сайте по адресу http://
dmkpress.com/authors/publish_book/ или напишите в издательство по адресу 
dmkpress@gmail.com.
Список опечаток
Хотя мы приняли все возможные меры для того, чтобы обеспечить высокое качество наших текстов, ошибки все равно случаются. Если вы найдете 
ошибку в одной из наших книг, мы будем очень благодарны, если вы сообщите о ней главному редактору по адресу dmkpress@gmail.com. Сделав это, 
вы избавите других читателей от недопонимания и поможете нам улучшить 
последующие издания этой книги. 
Нарушение авторских прав
Пиратство в интернете по-прежнему остается насущной проблемой. Издательство «ДМК Пресс» очень серьезно относится к вопросам защиты авторских прав 
и лицензирования. Если вы столкнетесь в интернете с незаконной публикацией 
какой-либо из наших книг, пожалуйста, пришлите нам ссылку на интернет-ресурс, чтобы мы могли применить санкции.
Ссылку на подозрительные материалы можно прислать по адресу электронной почты dmkpress@gmail.com.
Мы высоко ценим любую помощь по защите наших авторов, благодаря 
которой мы можем предоставлять вам качественные материалы.


Похожие

Доступ онлайн
1 299 ₽
В корзину