Математический анализ генетического кода
Покупка
Тематика:
Математическое моделирование
Издательство:
Лаборатория знаний
Автор:
Козлов Николай Николаевич
Год издания: 2023
Кол-во страниц: 226
Дополнительно
Вид издания:
Монография
Уровень образования:
ВО - Магистратура
ISBN: 978-5-93208-617-9
Артикул: 620405.03.99
В монографии на основе изучения генов установлены новые свойства генетического кода и вычислены важнейшие его интегральные характеристики; выделены две группы таких характеристик. Установлена взаимосвязь
полученных характеристик в этих группах. Проанализирован известный к настоящему времени набор генов, в том числе человеческого генома; получен ряд неизвестных ранее эффектов. Для научных работников, преподавателей и студентов, специализирующихся в области математического моделирования в науках о живом.
Тематика:
ББК:
УДК:
- 519: Комбинатор. анализ. Теория графов. Теория вер. и мат. стат. Вычисл. мат., числ. анализ. Мат. кибер..
- 573: Общая и теоретическая биология
- 575: Общая генетика. Общая цитогенетика. Иммуногенетика. Эволюционное учение. Видообразование. Филогенез
ОКСО:
- ВО - Магистратура
- 01.04.01: Математика
- 01.04.02: Прикладная математика и информатика
- 01.04.04: Прикладная математика
- 06.04.01: Биология
- ВО - Специалитет
- 06.05.01: Биоинженерия и биоинформатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва Лаборатория знаний 2023 МАТЕМАТИЧЕСКИЙ АНАЛИЗ ГЕНЕТИЧЕСКОГО КОДА Н.Н. Козлов 4е издание, электронное МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 575+573+519.8 ББК 28.04+22.18 К59 С е р и я о с н о в а н а в 2009 г. Козлов Н. Н. К59 Математический анализ генетического кода / Н. Н. Козлов. — 4-е изд., электрон. — М. : Лаборатория знаний, 2023. — 226 с. — (Математическое моделирование). — Систем. требования: Adobe Reader XI ; экран 10". — Загл. с титул. экрана. — Текст : электронный. ISBN 978-5-93208-617-9 В монографии на основе изучения генов установлены новые свойства генетического кода и вычислены важнейшие его интегральные характеристики; выделены две группы таких характеристик. Установлена взаимосвязь полученных характеристик в этих группах. Проанализирован известный к настоящему времени набор генов, в том числе человеческого генома; получен ряд неизвестных ранее эффектов. Для научных работников, преподавателей и студентов, специализирующихся в области математического моделирования в науках о живом. УДК 575+573+519.8 ББК 28.04+22.18 Деривативное издание на основе печатного аналога: Математический анализ генетического кода / Н. Н. Козлов. — М. : БИНОМ. Лаборатория знаний, 2010. — 215 с. : ил., [8] с. цв. вкл. — (Математическое моделирование). — ISBN 978-5-9963-0119-5. Первый тираж осуществлен при финансовой поддержке Российского фонда фундаментальных исследований по проекту № 09-01-07047 В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами защиты авторских прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации ISBN 978-5-93208-617-9 © Лаборатория знаний, 2015
ПРЕДИСЛОВИЕ Монография Н. Н. Козлова «Математический анализ генетического кода» посвящена оригинальным исследованиям в области биоматематики. Круг научных интересов автора чрезвычайно широк. Ранее мы совместно выполнили ряд работ по анализу космических траекторий и эволюции структур, начиная с изучения движения ИС Луны и галактик до математического моделирования процесса структуризации вторичных структур РНК. Последняя тема относится к биоматематике, автор приступил к работе над ней после того, как я предложил ему обратиться к задачам молекулярной биологии. Задача, о которой идет речь в монографии, была впервые поставлена автором позднее и активно мною поддерживалась. На основе 15 работ автора в ДАН, которые были опубликованы вплоть до 2008 г., была написана данная монография. Используя большой опыт исследования сложных природных дискретных систем различных типов, автор нашел свой оригинальный подход к решению поставленных задач. Исследование начиналось с анализа перекрывающихся генов, которые представлялись одним из типов сложных взаимосвязанных систем. Однако исследование показало, что такие гены являются хорошей площадкой для анализа свойств генетического кода. Было доказано (теорема для генетического кода), что структура генетического кода содержит феноменальные возможности для построения генетических перекрытий различных типов. Полученные результаты привели к постановке задачи о взаимосвязи генетических перекрытий и вариабельности кода, а также к исследованию неперекрывающихся генов. В конечном итоге возник новый подход в изучении больших геномов, в том числе генома человека. Была изучена также установленная автором математическая аналогия между генетическими перекрытиями и стеблями вторичной структуры матричных РНК. Интегральные характеристики генетического кода, введенные автором, позволяют с новых позиций изучать структуру кода. Открытие новых, неизвестных ранее свойств генетического кода с неожиданной стороны осветили проблему происхождения кода и его эволюции. Сказанное свидетельствует о глубине проникновения автора в суть
Предисловие рассматриваемых фундаментальных проблем. При этом полученные оригинальные результаты не имеют аналогов в зарубежных исследовательских работах. В связи со сказанным выше считаю исключительным важной публикацию данной монографии. Академик Т. М. Энеев, 9 сентября 2009 г.
ПРЕДИСЛОВИЕ АВТОРА В каждой естественной науке заключено столько истины, сколько в ней математики. И. Кант Автора могут упрекнуть в том, что, как математик, он не вправе указывать биологам, что же таится в структуре генетического кода. Однако, оглядываясь назад, на всю историю открытия такого феномена, как генетический код, можно сказать, что именно неспециалисты внесли решающий вклад в постановку задачи о существовании кода, его структуре и свойствах. У истоков проблемы стоял Г. Мендель (ученик Доплера!), который в 1866 г. установил, что передача наследственных признаков потомству определяется независимыми факторами, которые позже получили название генов. Практически через 80 лет физик Э. Шредингер, а позднее астрофизик Г. Гамов и физик Ф. Крик внесли решающий вклад в постановку задачи и прояснение принципиальных аспектов, связанных с проблемой генетического кода (см. работы [1–5]). Было выяснено, что ДНК является носителем генетической информации, в 1953 г. определена пространственная структура ДНК, доказано существование первичной структуры у белка (см. п. 4 из монографии [6], а также работы [7, 8]), после чего был экспериментально установлен генетический код. Практически в ходе проведения всех названных исследований возникала новая наука — молекулярная биология. После завершения гигантского международного проекта по геному человека (1990–2003 гг.) в ней наступила постгеномная эпоха. Как известно, стоимость этого проекта оценивалась в 3 млрд долларов, а его завершение было приурочено к 50-летию классической работы [7]. Впервые объединенная коллекция статей по человеческому геному была представлена в журнале «Nature» в 2006 г.; она составлена по публикациям 2001 г. для отдельных хромосом, с включением последующих комментариев [9]. К настоящему времени расшифровано относительно небольшое число других больших геномов. Ситуация существенным образом изменится в ближайшие годы в связи с внедрением новейших методов расшифровки. В конце 2006 г. был объявлен конкурс на премию в 10 млн долларов, которая будет вручена создателям быстрого и дешевого метода расшифровки (см. статью [10]). Среди условий конкурса — возможность
Предисловие автора расшифровать 100 любых человеческих геномов за 10 дней. Создание такого метода приведет к резкому возрастанию числа геномов больших размеров, которые будут расшифрованы уже в ближайшие годы. Принципиально важно, что создание такого метода откроет возможность расшифровать геномы, которые по оценкам генетиков на порядок и более превосходят человеческий. Математический анализ огромных объемов подобной информации приобретает особую актуальность. При этом наиболее значимыми становятся исследования, связанные с поиском новых постановок, которые ранее не обсуждались. Именно такие постановки позволят по-новому подойти к изучению громадной по объему и невероятно таинственной информации, которой мы уже обладаем. Результаты одного из таких исследований представлены в данной монографии. Итак, к настоящему времени молекулярная биология уже стала производителем гигантских по объему экспериментальных данных, осмысление которых невозможно без математических методов и алгоритмов. Многолетний опыт математического моделирования с применением ЭВМ от легендарной «Стрелы» вплоть до самых современных супер-ЭВМ позволяет сформулировать важный вывод. Принципиально новые результаты при работе с гигантской генетической информацией могут быть получены только при использовании новых подходов, которые в своей основе учитывают сущность генетической информации, ее отличие от сугубо физической или химической информации. Именно такой подход оказался с успехом примененным к решению задач, о которых идет речь в данной монографии. Кратко опишем его. В основе исследования лежат экспериментальные данные по необычным способам записи генетической информации, так называемым перекрывающимся генам, когда один и тот же участок ДНК кодирует два белка. К началу данного цикла исследований уже были экспериментально установлены все пять случаев парных генетических перекрытий, которые разрешаются структурой ДНК. Пониманию этого феномена во многом способствовало то, что уже к 1992 г. объем публикаций по перекрытиям генов был значительным и все более и более увеличивался. Это были публикации в журналах Nature, Cell, J. Mol. Biol., J. Virol., Genetics, The J. Biological Chemistry, J. Vol. Evol. и др. Первоначально в исследовании речь не шла о свойствах генетического кода. Вопрос был поставлен только о потенциальных позициях молчащих мутаций, которые могут иметь место в областях, занятыми перекрывающимися генами. Было установлено значительное (на порядок и более) сужение спектра подобных позиций по сравнению с генами без перекрытий. При анализе этого спектра для сотен генетических перекрытий были обнаружены ряд геномов, в которых перекрытия требовали участия всех смысловых кодонов. Стало ясно, что из перекрытий можно каким-то
Предисловие автора 7 образом выявить неизвестное свойство структуры генетического кода. Была поставлена задача изучения потенциала генетического кода, который использован природой для всех пяти случаев перекрытий. Главный результат был представлен теоремой для стандартного (первоначальное название — универсального) генетического кода (см. работы [11, 12]). Биологические следствия из нее позволили обратиться к анализу экспериментальных данных по всем девиантным генетическим кодам, или кодам, отклоненным от стандартного. Однако в рамках генетических перекрытий не удалось объяснить функциональную значимость всех переосмысленных кодонов, или кодонов, которые изменили свой смысл по сравнению со стандартным кодом. Путей дальнейших исследований было несколько. Требуемое решение было найдено при исследовании областей ДНК, где гены не перекрываются, а подчиняются принципу, сформулированному как предположение в 1941 г.: один ген отвечает за один белок (см. работу [13]). Таких генов — подавляющее большинство; на сегодня это миллиардные нуклеотидные последовательности больших геномов (в том числе человека). Как видим, на всех этапах исследования наши математические утверждения подтверждались или дополнялись разнообразными экспериментальными данными, а именно: многими случаями перекрытий пар генов, в том числе записанными нестандартными кодами, полным набором природных нестандартных кодов, полными кодирующим областями больших геномов, в том числе генома человека. В ходе проведения данного исследования был использован наш опыт проведения более ранних работ по изучению эволюции и структуры сложных природных и технических дискретных систем с большим числом взаимодействующих элементов. Представим кратко эти исследования, в которых я принимал участие. Из этого представления станет ясно, что перекрывающиеся гены, с которых были начаты наши исследования, есть еще одна достаточно сложная система, состоящая из большого числа взаимозависимых элементов. Перед представлением первой из таких задач следует отметить, что именно это исследование в итоге привело нас к биологической проблематике. Речь идет об изучении гравитационного взаимодействия галактик по компьютерной программе, созданной первоначально для изучения движения искусственного спутника Луны в поле тяготения, где помимо центрального тела учитывались масконы — вкрапления некоторого количества тел, которые были установлены экспериментально в статье [15]. Результаты изложены в работе [14] по космическим исследованиям, в которых заметное место занимали исследования по оптимизации процесса траекторных измерений в случае ИС Марса (см. также статьи [16–20] и рис. В.1).
Предисловие автора Рис. В.1. Оптимальные сеансы измерений радиальной скорости на одном обороте ИС Марса [17]. Приводятся решения для наилучшего определения минимального расстояния до Марса. Сеансы располагаются по времени (спектры) и по истинной аномалии (на орбитах). Время 1, 2, 4, 12 — допустимое время измерений в часах, период обращения спутника — 24 часа
Предисловие автора 9 ГРАВИТАЦИОННОЕ ВЗАИМОДЕЙСТВИЕ ГАЛАКТИК При близком пролете массивного тела мимо галактики, как показали численные эксперименты, возникают специфические приливные эффекты, появляются спиральные ветви, значительные отклонения от плоскости диска, искажения поля скоростей вещества, падение газа на плоскость галактик. Качественный анализ и численный эксперимент позволили выявить основные эффекты, возникающие при характерных вариантах гиперболического пролета массивного тела относительно галактик: перпендикулярно ее плоскости, над плоскостью и в плоскости по направлению и против направления вращения галактики. Анализировалось поведение до 2000 невзаимодействующих между собой точек-спутников, двигавшихся первоначально по круговым кеплеровским орбитам вокруг центральных областей галактики и возмущаемых при близком пролете массивного тела (см. статьи [21–26]). На основе расчетов в 1973 г. был создан компьютерный кинофильм продолжительностью около 15 минут. Оценка этой работы дана Президентом АН СССР, академиком М. В. Келдышем на торжественном заседании, посвященном двадцатилетию созданного им ИПМ. Приводим выдержку из его доклада[27]. «Ярким примером успешного применения машинных расчетов к классической задаче является работа по гравитационному взаимодействию галактик. Изготовленный вычислительной машиной кинофильм наглядно показывает образование у галактик спиральной структуры. По-видимому, именно таким путем возникла спиральная структура нашей собственной галактики» На рис. В.2 представлены 6 кадров из около 2000 кадров одного из вариантов такого пролета. Все 7 эпизодов пролета (по 6 кадров в каждом) представлены в статье [25]. Создание наиболее полной версии кинофильма было приурочено к чрезвычайной сессии МАС, посвященной 500-летию Коперника, проходившей в 1973 г.. Первоначальным местом проведения этой сессии бала выбрана Австралия, где в заседала галактическая секция. Однако затем некоторые секции были перенесены на родину Коперника, где на секциях небесной механики и астрофизики, и был впервые показан этот кинофильм. Лишь много лет спустя зарубежным специалистам была представлена только цифровая копия фильма на конференции Dynamics of Galaxies. (Санкт-Петербург, 2007 г.) МОДЕЛЬ АККУМУЛЯЦИОННОГО ПРОЦЕССА ФОРМИРОВАНИЯ ПЛАНЕТНЫХ СИСТЕМ Рассматривалась эволюция плоского протопланетного облака, состоящего из большого числа гравитационно взаимодействующих и объединяющихся при контактах тел (протопланет), движущихся в поле цен
Предисловие автора Рис. В.2. Фрагменты кинофильма (ИПМ, 1973 г.) относятся к варианту пролета тела с массой равной массе галактики, пролетающего вблизи галактического диска (с параметрами порядка нашей галактики), перпендикулярно его плоскости с удвоенной параболической скоростью. Время Т дается в миллиардах лет, момент T = 0 соответствует моменту наибольшего сближения (см. статьи [24, 25])