Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Глубокое обучение в биологии и медицине

Покупка
Артикул: 769047.02.99
Доступ онлайн
524 ₽
В корзину
Глубокое обучение добилось впечатляющих успехов во многих отраслях. Сейчас оно все глубже проникает в прикладные научные исследования, в частности в биологию и смежные дисциплины. Эта книга рассказывает о применении глубокого обучения в геномике, химии, биофизике, микроскопии, медицине и других направлениях современных исследований всего, что связано с живыми организмами. Представленные в книге стандартные архитектуры глубоких сетей идеально подходят для программистов-разработчиков и ученых, работающих над созданием новых лекарств или ведущих исследования в области биологии и генетики. Книга содержит множество практических примеров, включая полный цикл поиска нового лекарства - одну из самых сложных научно-прикладных задач на стыке физики, химии, биологии и медицины. Издание будет полезно широкому кругу специалистов, связанных с анализом данных в химии, биологии и медицине, а также разработчикам программного обеспечения для них и студентам вузов.
Глубокое обучение в биологии и медицине : монография / Б. Рамсундар, П. Истман, П. Уолтерс, В. Панде. - Москва : ДМК Пресс, 2020. - 200 с. - ISBN 978-5-97060-791-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/1934041 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Бхарат Рамсундар, Питер Истман, Патрик Уолтерс и Виджай Панде

Глубокое обучение  
в биологии и медицине

Bharath Ramsundar, Peter Eastman, Patrick Walters, and Vijay Pande

Deep Learning  
for the Life Sciences

 
Beijing • Boston • Farnham • Sebastopol • Tokyo

Бхарат Рамсундар, Питер Истман, Патрик Уолтерс и Виджай Панде

Глубокое обучение 
в биологии и медицине

Москва, 2020

УДК 004.891 
ББК 32.972.13
Р21

Рамсундар Б., Истман П., Уолтерс П., Панде В.
Р21 
Глубокое обучение в биологии и медицине / пер. с анг. В. С. Яценкова. – М.: 
ДМК Пресс, 2020. – 200 с.: ил. 

ISBN 978-5-97060-791-6

Глубокое обучение добилось впечатляющих успехов во многих отраслях. Сейчас 
оно все глубже проникает в прикладные научные исследования, в частности биологию 
и смежные дисциплины. Эта книга рассказывает о применении глубокого обучения 
в геномике, химии, биофизике, микроскопии, медицине и других направлениях современных исследований всего, что связано с живыми организмами.
Издание будет полезно широкому кругу специалистов, связанных с анализом 
данных в химии, биологии и медицине, а также разработчикам ПО для них и студентам вузов.

УДК 004.891 
ББК.32.972.13

Original English language edition published by O’Reilly Media, Inc., 1005 Gravenstein Highway 
North, Sebastopol, CA 95472. Copyright © 2019 Bharath Ramsundar, Peter Eastman, Patrick Walters, 
and Vijay Pande. Russian-language edition copyright © 2020 by DMK Press. All rights reserved.

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой 
бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав.

ISBN 978-1-492-03983-9 (анг.) 
 Copyright © 2019 Bharath Ramsundar,  
Peter Eastman, Patrick Walters, and Vijay Pande
ISBN 978-5-97060-791-6 (рус.) 
© Оформление, издание, перевод, ДМК Пресс, 2020

Содержание

Предисловие .............................................................................................................8

Об авторах ...............................................................................................................11

Глава 1. Глубокое обучение и науки о жизни .................................................13
Почему все говорят о глубоком обучении? ..............................................................13
Современные науки о жизни – это науки о данных ...............................................14
О чем эта книга? ........................................................................................................15

Глава 2. Введение в глубокое обучение ...........................................................19
Линейные модели ......................................................................................................20
Многослойные персептроны ....................................................................................21
Обучение модели .......................................................................................................24
Проверка модели .......................................................................................................26
Регуляризация ............................................................................................................27
Оптимизация гиперпараметров...............................................................................28
Другие типы моделей ................................................................................................29
Сверточные нейронные сети ................................................................................30
Рекуррентные нейронные сети ............................................................................31
Дополнительное чтение ............................................................................................32

Глава 3. Машинное обучение с DeepChem ......................................................33
Наборы данных DeepChem ........................................................................................34
Обучение модели для предсказания токсичности молекул ...................................35
Пример: обучение модели MNIST ............................................................................42
Набор данных распознавания цифр MNIST ........................................................42
Сверточная архитектура для набора MNIST ........................................................43
Заключение ................................................................................................................47

Глава 4. Машинное обучение и молекулы.......................................................48
Что такое молекула? ..................................................................................................48
Что такое внутримолекулярные связи? ...................................................................50
Ковалентные связи ................................................................................................51
Нековалентные связи ............................................................................................51
Молекулярные графы ................................................................................................52
Конформации молекулы ...........................................................................................53
Хиральность молекул ............................................................................................54
Фичеризация молекулы ........................................................................................55
Строки SMILES и пакет RDKit ...............................................................................55
Расширенные отпечатки связей ...........................................................................56
Молекулярные дескрипторы ....................................................................................57
Графовые свертки ......................................................................................................57

 Содержание

Обучение модели для прогнозирования растворимости .......................................58
MoleculeNet ................................................................................................................60
Строки SMARTS ..........................................................................................................60
Заключение ................................................................................................................63

Глава 5. Глубокое обучение и биофизика ........................................................64
Белковые структуры ..................................................................................................65
Белковые последовательности .............................................................................67
Общие принципы связывания с белками ............................................................70
Биофизическая фичеризация ...................................................................................71
Координатная фичеризация .................................................................................71
Атомная фичеризация ..........................................................................................76
Пример использования PDBBind ..............................................................................76
PDBBind Dataset .....................................................................................................76
Представление набора данных PDBBind ..............................................................79
Заключение ................................................................................................................82

Глава 6. Глубокое обучение и геномика ...........................................................85
ДНК, РНК и белки .......................................................................................................85
Реальное положение дел ...........................................................................................87
Сайты связывания и факторы транскрипции .........................................................90
Сверточная модель связывания TF ......................................................................90
Доступность хроматина ............................................................................................93
РНК-интерференция .................................................................................................95
Заключение ................................................................................................................98

Глава 7. Машинное обучение и микроскопия .................................................99
Краткое введение в микроскопию .........................................................................101
Современная оптическая микроскопия ............................................................102
Дифракционный предел .........................................................................................104
Электронная и атомно-силовая микроскопия ..................................................105
Микроскопия сверхвысокого разрешения ........................................................107
Глубокое обучение и дифракционный предел ..................................................109
Подготовка биологических препаратов для микроскопии ..................................109
Окрашивание .......................................................................................................109
Фиксация препаратов .........................................................................................110
Секционирование препаратов ...........................................................................111
Флуоресцентная микроскопия ...........................................................................111
Артефакты пробоподготовки .............................................................................113
Применение глубокого обучения в микроскопии .................................................114
Подсчет клеток .....................................................................................................114
Клеточная сегментация ......................................................................................117
Вычислительные анализы...................................................................................121
Заключение ..............................................................................................................121

Глава 8. Глубокое обучение в медицине ........................................................123
Компьютерная диагностика ....................................................................................123
Вероятностные диагнозы с байесовскими сетями ................................................124

Содержание  7

Данные электронных медицинских карт ..............................................................126
В чем опасность больших баз данных ЭМК пациентов?...................................128
Глубокая радиология ...............................................................................................129
Рентгенография и компьютерная томография .................................................131
Гистология ............................................................................................................133
Магниторезонансная томография .....................................................................133
Модель глубокого обучения в качестве лечебного средства ................................134
Диабетическая ретинопатия...................................................................................135
Перспективы глубокого обучения в медицине .....................................................139
Этические соображения ......................................................................................139
Потеря работы .....................................................................................................140
Заключение ..............................................................................................................140

Глава 9. Генеративные модели .........................................................................141
Вариационные автоэнкодеры .................................................................................141
Генеративные состязательные сети .......................................................................143
Применение генеративных моделей в науках о жизни ........................................144
Генерация новых идей для соединений-прототипов .......................................144
Разработка белков ...............................................................................................145
Инструменты для научного поиска ....................................................................145
Будущее генеративного моделирования ...........................................................146
Работа с генеративными моделями .......................................................................146
Анализ вывода генеративной модели ...............................................................148
Заключение ..............................................................................................................151

Глава 10. Интерпретация глубоких моделей ................................................154
Как объяснить предсказания? ................................................................................154
Оптимизация входов ...............................................................................................158
Прогнозирование неопределенности ....................................................................161
Интерпретируемость, объяснимость и последствия для реального мира ..........165
Заключение ..............................................................................................................165

Глава 11. Практический пример виртуального скрининга ........................166
Подготовка набора данных для прогнозного моделирования .............................167
Обучение прогностической модели .......................................................................172
Подготовка набора данных для прогнозирования................................................177
Применение прогностической модели ..................................................................180
Заключение ..............................................................................................................186

Глава 12. Ожидания и перспективы ................................................................188
Медицинская диагностика ......................................................................................188
Персонализированная медицина ...........................................................................190
Фармацевтические исследования ..........................................................................191
Биологические исследования .................................................................................193
Заключение ..............................................................................................................194

Колофон ..................................................................................................................195

Предметный указатель .......................................................................................196

Предисловие

Настало время, когда науки о жизни и данных соединились. Достижения в области робототехники и автоматики позволяют химикам и биологам получать огромное количество данных. Современный ученый за один день может сгенерировать 
больше данных, чем его предшественники два десятка лет назад могли бы собрать 
за всю карьеру. Эта способность быстро генерировать данные создала ряд новых 
научных проблем. Осталась позади эпоха, когда мы обрабатывали данные, загружая их в электронную таблицу и создавая пару графиков. Чтобы извлечь научные 
знания из новых огромных наборов данных, мы должны уметь выявлять и использовать неочевидные связи.
Одним из мощных инструментов для выявления закономерностей и взаимо
связей в данных является глубокое обучение, класс алгоритмов, которые произвели революцию в ряде областей, включая анализ изображений, языковой перевод 
и распознавание речи. Алгоритмы глубокого обучения превосходно зарекомендовали себя при выявлении и использовании шаблонов в больших наборах данных. 
По этим причинам глубокое обучение широко применяется во всех дисциплинах 
науки о жизни. В этой книге представлен обзор применения глубокого обучения 
в ряде областей, включая генетику, поиск лекарств и медицинскую диагностику. 
Обзор сопровождается примерами кода, которые помогают применить новые 
знания на практике и дают читателю отправную точку для будущих исследований 
и разработок.

Условные обозначения и соглашения, принятые в книге

В книге используются следующие типографские соглашения.
Курсив – используется для смыслового выделения важных положений, новых 
терминов, имен команд и утилит, а также имен и расширений файлов и каталогов.
Моноширинный шрифт – используется для листингов программ, а также в обычном 
тексте для обозначения имен переменных, функций, типов, объектов, баз данных, 
переменных среды, операторов, ключевых слов и других программных конструкций и элементов исходного кода.
Моноширинный полужирный шрифт – используется для обозначения команд или фрагментов текста, которые пользователь должен ввести дословно без изменений.
Моноширинный курсив – используется для обозначения в исходном коде или в командах шаблонных меток-заполнителей, которые должны быть заменены соответствующими контексту реальными значениями.

 Такая пиктограмма обозначает совет или рекомендацию.

 Такая пиктограмма обозначает указание или примечание общего характера.

 Эта пиктограмма обозначает предупреждение или особое внимание к  потенциально опасным объектам.

Благодарности  9

отзывы и пожелания

Мы всегда рады отзывам наших читателей. Расскажите нам, что вы думаете об 
этой книге – что понравилось или, может быть, не понравилось. Отзывы важны 
для нас, чтобы выпускать книги, которые будут для вас максимально полезны.
Вы можете написать отзыв прямо на нашем сайте www.dmkpress.com, зайдя на 
страницу книги, и оставить комментарий в разделе «Отзывы и рецензии». Также 
можно послать письмо главному редактору по адресу dmkpress@gmail.com, при 
этом напишите название книги в теме письма. 
Если есть тема, в которой вы квалифицированы, и вы заинтересованы в написании новой книги, заполните форму на нашем сайте по адресу http://dmkpress.
com/authors/publish_book/ или напишите в издательство по адресу dmkpress@
gmail.com.

скачивание исходного кода примеров

Скачать файлы с дополнительной информацией для книг издательства «ДМК 
Пресс» можно на сайте www.dmkpress.com или www.дмк.рф на странице с описанием соответствующей книги. 

список опечаток

Хотя мы приняли все возможные меры для того, чтобы удостовериться в качестве 
наших текстов, ошибки все равно случаются. Если вы найдете ошибку в одной из 
наших книг — возможно, ошибку в тексте или в коде, — мы будем очень благодарны, если вы сообщите нам о ней. Сделав это, вы избавите других читателей от 
расстройств и поможете нам улучшить последующие версии этой книги. 
Если вы найдете какие-либо ошибки в коде, пожалуйста, сообщите о них главному редактору по адресу dmkpress@gmail.com, и мы исправим это в следующих 
тиражах.

нарУшение авторских прав

Пиратство в интернете по-прежнему остается насущной проблемой. Издательства «ДМК Пресс» и O'Reilly очень серьезно относятся к вопросам защиты авторских прав и лицензирования. Если вы столкнетесь в интернете с незаконно выполненной копией любой нашей книги, пожалуйста, сообщите нам адрес копии 
или веб-сайта, чтобы мы могли применить санкции.
Пожалуйста, свяжитесь с нами по адресу электронной почты dmkpress@gmail.
com со ссылкой на подозрительные материалы.
Мы высоко ценим любую помощь по защите наших авторов, помогающую нам 
предоставлять вам качественные материалы. 

благодарности

Авторы хотели бы поблагодарить Николь Таш (Nicole Tache), нашего редактора 
в O’Reilly, а также технических рецензентов и бета-рецензентов за их ценный 

 Предисловие

вклад в книгу. Кроме того, мы хотели бы поблагодарить Карла Лесвинга (Karl 
Leswing) и Чжэньциня (Майкла) Ву (Zhenqin/Michael Wu) за их вклад в код, а также 
Джонни Израэли (Johnny Israeli) за ценные советы для главы по геномике.
Бхарат благодарит свою семью за поддержку и ободрение в течение многих 
долгих выходных и ночей, проведенных в работе над этой книгой.
Питер хотел бы поблагодарить свою жену за ее постоянную поддержку, а также 
многих коллег, от которых он так много узнал о машинном обучении.
Патрик благодарен своей жене Андреа и дочерям Эли и Мэдди за их любовь 
и поддержку. Он также благодарит прошлых и настоящих коллег из Vertex Pharmaceuticals и Relay Therapeutics, у которых он многому научился.
Наконец, мы хотим поблагодарить сообщество разработчиков программного 
обеспечения DeepChem за поддержку и консультации на протяжении работы над 
книгой.

Доступ онлайн
524 ₽
В корзину