Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

NGS: высокопроизводительное секвенирование

Покупка
Артикул: 486210.04.99
Рассмотрены различные варианты и особенности современных методов определения структуры нуклеиновых кислот (методов секвенирования второго и третьего поколений). Описаны принципы наиболее популярных технологий высокопроизводительного секвенирования (NGS). Дана классификация высокопроизводительных методов секвенирования по нескольким параметрам. Приведены основные элементы первичного анализа данных масштабного секвенирования. Отдельные главы посвящены применению NGS для решения различных биологических задач: секвенирования прокариотических и эукариотических геномов и транскриптомов, метагеномного секвенирования, а также использованию NGS в медицинской практике. Для сотрудников генно-инженерных и медицинских диагностических лабораторий, а также для преподавателей и студентов, специализирующихся в области молекулярной биологии и биотехнологии.
NGS: высокопроизводительное секвенирование : монография / Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина, В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. - 3-е изд. - Москва : Лаборатория знаний, 2020. - 235 с. - ISBN 978-5-00101-654-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1200533 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
3-е издание, электронное

Москва
Лаборатория знаний
2020

Под редакцией
д-ра биол. наук Д. В. Ребрикова

NGS

ВЫСОКОПРОИЗВОДИТЕЛЬНОЕ
СЕКВЕНИРОВАНИЕ

УДК 577.21+616
ББК 28.04

Р31

А в т о р ы:
Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина,
В. В. Ильинский
Ребриков Д. В.

Р31
NGS: высокопроизводительное секвенирование /
Д. В. Ребриков,
Д. О. Коростин,
Е. С. Шубина,
В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. —
3-е
изд.,
электрон. — М.
:
Лаборатория
знаний,
2020. — 235 с. — Систем.
требования:
Adobe
Reader XI ; экран 10". — Загл. с титул. экрана. —
Текст : электронный.
ISBN 978-5-00101-654-0

Рассмотрены различные варианты и особенности современных
методов определения структуры нуклеиновых кислот (методов
секвенирования второго и третьего поколений). Описаны принципы наиболее популярных технологий высокопроизводительного
секвенирования (NGS). Дана классификация высокопроизводительных методов секвенирования по нескольким
параметрам.
Приведены
основные
элементы
первичного
анализа
данных
масштабного
секвенирования.
Отдельные
главы
посвящены
применению NGS для решения различных биологических задач:
секвенирования прокариотических и эукариотических геномов
и
транскриптомов,
метагеномного
секвенирования,
а
также
использованию NGS в медицинской практике.
Для сотрудников генно-инженерных и медицинских диагностических лабораторий, а также для преподавателей и студентов,
специализирующихся в области молекулярной биологии и биотехнологии.
УДК 577.21+616
ББК 28.04

Деривативное издание на основе печатного аналога: NGS: высокопроизводительное секвенирование / Д. В. Ребриков, Д. О. Коростин, Е. С. Шубина, В. В. Ильинский ; под общ. ред. Д. В. Ребрикова. — 3-е изд. — М. : Лаборатория знаний, 2020. — 232 с. :
ил. — ISBN 978-5-00101-255-9.

В
соответствии
со
ст. 1299
и
1301
ГК
РФ
при
устранении
ограничений,
установленных
техническими
средствами
защиты
авторских прав, правообладатель вправе требовать от нарушителя
возмещения убытков или выплаты компенсации

ISBN 978-5-00101-654-0
c○ Лаборатория знаний, 2015

2

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ Е. Д. СВЕРДЛОВА . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

ПРЕДИСЛОВИЕ М. С. ГЕЛЬФАНДА . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8

ПРЕДИСЛОВИЕ АВТОРОВ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9

ПЕРЕЧЕНЬ КОМПАНИЙ, УПОМЯНУТЫХ В ТЕКСТЕ . . . . . . . . . . . . . . . . . . . . . . . 11

СПИСОК СОКРАЩЕНИЙ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

ГЛАВА 1. Обзор методов определения последовательности 
нуклеиновых кислот . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

 1.1. Методы, основанные на детекции сигнала 
от множества одинаковых молекул ДНК (методы 
с предварительной амплификацией фрагментов ДНК) . . 14

 1.2. Методы, основанные на детекции сигнала  
от одной молекулы ДНК (секвенирование 
одиночных молекул ДНК) . . . . . . . . . . . . . . . . . . . . . . . . . . 34

 1.3. Другие методы секвенирования . . . . . . . . . . . . . . . . . . . . . 40

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

ГЛАВА 2. Технологии создания библиотек фрагментов ДНК 
для NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

 2.1. Очистка нуклеиновых кислот для NGS . . . . . . . . . . . . . . . 45
 2.2. Оценка концентрации нуклеиновых кислот 
и полногеномная амплификация (WGA) . . . . . . . . . . . . . . 46

 2.3. Способы разрушения ДНК для приготовления 
библиотеки  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

 2.4. Оценка длин фрагментов ДНК . . . . . . . . . . . . . . . . . . . . . . 51
  2.5. Присоединение адаптеров . . . . . . . . . . . . . . . . . . . . . . . . . . 52
 2.6. Предварительная амплификация библиотеки. . . . . . . . . . 53
 2.7. Отбор фракции фрагментов нужной длины 
(size-select) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

 2.8. Мечение смешиваемых образцов специфичными 
адаптерами («штрих-кодирование») . . . . . . . . . . . . . . . . . . 56

  2.9. Клональная амплификация фрагментов ДНК  . . . . . . . . . 57
2.10. Типы библиотек фрагментов ДНК для NGS . . . . . . . . . . . 60

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Оглавление

ГЛАВА 3. Коммерческие технологии высокопроизводительного 
секвенирования  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .66

  3.1. Технология 454 Life Sciences компании Roche  
(эмульсионная ПЦР + пиросеквенирование)  . . . . . . . . . . 66

  3.2. Технология SOLiD компании Life Technologies Thermo 
Fisher Scientific (эмульсионная ПЦР +  
секвенирование лигированием) . . . . . . . . . . . . . . . . . . . . . . 69

  3.3. Illumina Genome Analyser компании Illumina  
(мостиковая ПЦР + секвенирование синтезом) . . . . . . . . 71

  3.4. Платформы Ion PGM и Ion Proton компании Life  
Technologies Thermo Fisher Scientific (эмульсионная  
ПЦР + полупроводниковое секвенирование)  . . . . . . . . . . 74

  3.5. Платформа PacBio компании Pacific Biosciences 
(секвенирование синтезом одиночных молекул)  . . . . . . . 78

  3.6. Платформа Heliscope компании Helicos Biosciences 
(секвенирование синтезом одиночных молекул)  . . . . . . . 80
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

ГЛАВА 4. Общие принципы обработки данных NGS  . . . . . . . . . . . . 85

  4.1. Оценка качества первичных данных . . . . . . . . . . . . . . . . . 85
  4.2. Сборка геномов de novo . . . . . . . . . . . . . . . . . . . . . . . . . . . .89
  4.3. Алгоритмы сборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
  4.4. Аппаратные и биологические особенности  
данных NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

  4.5. Объединение контигов в скэффолды . . . . . . . . . . . . . . . . . 97
  4.6. Вариации в близкородственных геномах  . . . . . . . . . . . . 100
  4.7. Картирование прочтений при повторном  
секвенировании . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

  4.8. Поиск однонуклеотидного полиморфизма (SNP) . . . . . . 104
  4.9. Поиск структурных вариаций: протяженных вставок, 
делеций, инверсий и транслокаций . . . . . . . . . . . . . . . . . 105

4.10. Аннотация обнаруженных вариаций  
с использованием баз данных . . . . . . . . . . . . . . . . . . . . . . 106

4.11. Предсказание функциональных и клинически  
значимых изменений белка на основе  
обнаруженных мутаций . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

ГЛАВА 5. Оборудование и программные решения  
для обработки данных NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

  5.1. Локальные центры обработки данных NGS:  
архитектура и программные решения . . . . . . . . . . . . . . . 112

  5.2. Программное обеспечение для локального центра 
обработки данных NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

Оглавление

  5.3. Сетевые сервисы и простые решения  
для обработки данных NGS  . . . . . . . . . . . . . . . . . . . . . . . 117

  5.4. Специализированные проекты по обработке  
данных NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

ГЛАВА 6. Планирование эксперимента  
с использованием NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

  6.1. Общие принципы планирования биологических 
экспериментов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

  6.2. Рандомизация в NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
  6.3. Повторности в NGS  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
  6.4. Основные типы ошибок при секвенировании . . . . . . . . . 125
  6.5. Варианты применения NGS  . . . . . . . . . . . . . . . . . . . . . . . 126

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

ГЛАВА 7. Секвенирование индивидуальных геномов  
и транскриптомов прокариот  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

  7.1. Роль NGS в микробиологии  . . . . . . . . . . . . . . . . . . . . . . . 128
  7.2. История секвенирования бактериальных геномов . . . . . 129
  7.3. Определение полной последовательности  
бактериального генома de novo . . . . . . . . . . . . . . . . . . . . .130

  7.4. Пример протокола секвенирования образца  
бактериальной ДНК . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

  7.5. Анализ данных геномного секвенирования  
бактерий  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

  7.6. Секвенирование транскриптома прокариот . . . . . . . . . . . 142

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

ГЛАВА 8. Исследование микробных сообществ  
методами NGS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

  8.1. Очистка ДНК для метагеномных исследований . . . . . . . 147
  8.2. Анализ микробного сообщества секвенированием 
ампликонов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

  8.3. Метагеномное секвенирование  . . . . . . . . . . . . . . . . . . . . . 151
  8.4. Биоинформатический анализ данных метагеномного 
секвенирования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

  8.5. Комбинированный алгоритм анализа  
таксономического состава сообщества . . . . . . . . . . . . . . . 154

  8.6. Сравнение метагеномов между собой . . . . . . . . . . . . . . . . 155
  8.7. Метатранскриптом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Оглавление

ГЛАВА 9. Секвенирование геномов эукариот . . . . . . . . . . . . . . . . . . . 162

  9.1. Общие аспекты секвенирования сложных геномов . . . . 162
  9.2. Секвенирование эукариотических геномов de novo . . . .164
  9.3. Повторное секвенирование (ресеквенирование)  . . . . . . . 166
  9.4. Фазирование при ресеквенировании диплоидных  
геномов  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

  9.5. Секвенирование генома отдельной клетки . . . . . . . . . . . 171

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

ГЛАВА 10. Секвенирование транскриптомов эукариот . . . . . . . . . . 176

10.1. Применение NGS для исследования РНК . . . . . . . . . . . . 176
10.2. Общие моменты очистки РНК и синтеза кДНК  . . . . . . 178
10.3. Ферменты для обратной транскрипции . . . . . . . . . . . . . . 180
10.4. Подготовка библиотеки кДНК для NGS . . . . . . . . . . . . . 182

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

ГЛАВА 11. Повышение концентрации определенных 
последовательностей в библиотеке для NGS 
(таргетное секвенирование) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

11.1. Параметры методов целевого обогащения . . . . . . . . . . . . 191
11.2. Обогащение библиотеки фрагментов ДНК только  
на основе ПЦР  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

11.3. Обогащение библиотеки фрагментов ДНК  
при помощи гибридизации с пробой . . . . . . . . . . . . . . . . 198

11.4. Обогащение при помощи гибридизации в растворе  
с отбором методом ПЦР (инвертированные  
молекулярные пробы)  . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

11.5. Обогащение библиотеки белок-связывающими 
последовательностями хроматина (ChIP-Seq) . . . . . . . . . 203
Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

ГЛАВА 12. Применение высокопроизводительного  
секвенирования в медицинской практике  . . . . . . . . . . . . . . . . . . . . 207

12.1. Генетическое тестирование с использованием NGS . . . . 207
12.2. Исследование патогенов и микробиома человека  . . . . . 220

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222

ГЛАВА 13. Перспективы высокопроизводительного  
секвенирования  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

Список литературы  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227

Предметный указатель  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

ПРЕДИСЛОВИЕ Е. Д. СВЕРДЛОВА

Нельзя не заметить, что методы молекулярной биологии 
со временем становятся все сложнее и дороже, и, вместе с тем, 
теряют в разнообразии. Многие задачи на этапе планирования эксперимента сводятся к типовым методическим шагам, 
выполняемым по принципу «заказа услуг на стороне». Уход 
сложных и дорогостоящих методов в сервисные центры, наряду с очевидными преимуществами такой специализации, имеет и ряд негативных последствий. Поверхностное знание методов исследования, провал между биологическим материалом 
и данными в компьютере приводят к непониманию границы 
возможностей используемых методик.
Стремительное развитие методов секвенирования в последние годы привело к ощущению, что с их помощью можно 
решить любые задачи генетики. Тем не менее высокопроизводительное секвенирование, как и любой другой метод, имеет 
ряд ограничений. Так, вопреки распространенному мнению, 
NGS не является панацеей при исследовании мультифакторных заболеваний и лишь помогает чуть быстрее выполнить 
определенные методические шаги.
Данная книга пытается сдержать растущий провал между 
объектом и анализируемыми данными, подробно и с практическими рекомендациями, перечисляя все этапы технологии 
NGS. 

Е. Д. Свердлов,
академик РАН и РАСХН, советник РАН

ПРЕДИСЛОВИЕ М. С. ГЕЛЬФАНДА

Как говорил один известный политический деятель, это 
«очень своевременная книга». Современные секвенаторы, наконец, начали появляться в российских лабораториях. Некоторые исследователи заранее знали, что они собираются 
изучать при помощи этих приборов, и готовились к их появлению, многие – лишь заполучив чудесную машинку, задумались, к чему же ее применить, третьи – только рассматривают 
возможность закупки в приложении к своим текущим задачам. Книга будет полезна исследователям из всех трех категорий. Первым – как набор ссылок на современные методы анализа данных и подготовки материалов, третьим – как пособие 
по выбору адекватной платформы и сборник практических советов, вторым же (если им вообще что-то может помочь) – как 
намек на то, что интересное можно было бы сделать.
Книга хорошо сбалансирована. В ней есть история методов 
секвенирования, биофизические и биохимические основы современных технологий, сравнение возможностей и недостатков платформ, описаны основы пробоподготовки, сведения о 
методах биоинформатического анализа получаемых данных, 
типичные задачи, решаемые при помощи таких приборов. 
Описания лаконичные, но точные, а обильные ссылки дадут 
возможность заинтересованному читателю глубже изучить 
конкретные проблемы. Книга глубоко погружена в современный российский контекст, и в ней имеются советы, которые не 
встретишь в стандартном обзоре: от необходимости проверить 
надежность энергоснабжения научного учреждения до правильной планировки серий экспериментов с целью экономии 
расходных материалов и организации совместной работы экспериментаторов и биоинформатиков и т. п.
Думаю, что эта книга необходима в каждой молекулярнобиологической лаборатории. В духе авторов добавлю, что желательно в нескольких экземплярах, один из которых будет 
храниться в сейфе завлаба и выдаваться под расписку.

Михаил Гельфанд, д-р биол. наук, 
профессор, член Academia Europaea

ПРЕДИСЛОВИЕ АВТОРОВ

Учителю
Льву Абрамовичу Остерману
посвящается

Развитие науки базируется на методах исследования. Создание новых технологий всегда приводило к прорыву в определенной области знаний. Причем зачастую развитие какогото методического направления неожиданно дает эффект в 
иной (даже не смежной) научной области. Бурное развитие 
цитологии в какой-то момент стало следствием прогресса в 
области изготовления стеклянных линз. Появление методов 
высокопроизводительного секвенирования (next generation 
sequencing, NGS) стало возможно благодаря развитию компьютерной индустрии, технологий изготовления микропроцессоров и цифровых носителей информации. Оказалось, что 
эти же элементы могут быть использованы в совершенно ином 
назначении: для работы с биологическими макромолекулами. 
Так синтез микроэлектроники и биохимии дал новый метод 
исследования живых систем – секвенирование второго поколения. Вместе с тем вовремя подоспели адекватные вычислительные мощности для обработки получаемых данных.
Следует отметить, что кроме использования наработок из 
микроэлектроники технологии NGS включают в себя и ряд 
предшествующих молекулярно-биологических методик, в 
частности полимеразную цепную реакцию (ПЦР) и гибридизацию на микрочипах.
Изобретение и внедрение в практику технологий высокопроизводительного секвенирования вывело на новый уровень 
такие направления науки, как генетика, молекулярная биология, дало стимулы для становления персонализированной медицины. Сегодня область высокопроизводительного секвенирования объединяет широкую гамму различных технологий, 
базирующихся на разных принципах и разработанных более 
или менее независимо. В этой книге коллектив авторов, имеющих собственный опыт работы с технологиями NGS, излагает 
принципы основных современных методов высокопроизводи
Предисловие авторов

тельного секвенирования. Рассмотрены особенности наиболее 
популярных технологий секвенирования, формат типовых задач для NGS, варианты обработки биоинформатических данных, стандартные ошибки каждого из этапов исследования. 
Авторы постарались структурировать и систематизировать 
существующие подходы, сделав акцент на общих принципах 
и существенных отличиях.
Несколько слов о терминах. В 2011 году, в предисловии к 
переводу девятого издания книги Б. Льюина «Гены» редактор 
отечественного издания сказал по этому поводу, что «…по прошествии 3–5 лет в зоне.ру килобазы вытеснят т. п. н., а последовательность нуклеотидов окончательно превратится в сиквенс». Пожалуй, наступил тот момент, когда написать книгу 
об NGS, не используя термин «секвенирование», сложнее, чем 
согласиться с его появлением в русском языке. Однако не все 
позиции сданы авторами без боя, «т. п. н-ы» пока остались, 
а при выборе между «штрих-кодом» и «бар-кодом» предпочтение отдано первому варианту. 
Отдельно следует сказать о термине «NGS». В лабораторной практике строжайше запрещено указывать на емкости с 
реагентом «new», ввиду неинформативности данного обозначения. Авторы сочли некорректным использование термина 
«секвенирование следующего поколения» – буквального перевода с английского (next generation sequencing) – для обозначения современных технологий секвенирования, прямо указывая на поколение методов или обозначая их как высокопроизводительные (что, безусловно, тоже относительно).
Авторы выражают благодарность коллегам, помогавшим 
на разных этапах подготовки рукописи: Дмитрию Алексееву 
(ФГБУН НИИ ФХМ, Москва), Андрею Гаража (ООО «Первый 
онкологический научно-консультационный центр», Москва), 
Игнатию Клесниченко (ООО «Бином», Москва), Николаю 
Равину (Центр «Биоинженерия» РАН, Москва), Владиславу 
Трошину (ООО «Троицкий инженерный центр», Троицк), Сергею Науменко (МГУ имени М.В. Ломоносова, Москва), Петру 
Шаталову (ООО «Генотек», Москва).