Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Компьютерное моделирование строения и реакционной способности молекул

Покупка
Артикул: 828299.01.99
Доступ онлайн
262 ₽
В корзину
Рассматриваются различные аспекты применения современных методов компьютерного моделирования в химии и вопросы представления химической информации в цифровой форме; экспериментальные подходы, применяемые для получения сведений о пространственной структуре молекул; способы оптимизации геометрии и конформационного анализа молекул; методы компьютерного моделирования белков, а также технологии, используемые при проведении масштабных скрининговых исследований in silico. Книга предназначена для широкого круга студентов, аспирантов, научных сотрудников, интересующихся применением компьютерного моделирования для анализа свойств молекул.
Диченко, Я. В. Компьютерное моделирование строения и реакционной способности молекул : монография / Я. В. Диченко ; Национальная академия наук Беларуси, Институт биоорганической химии. - Минск : Беларуская навука, 2023. - 137 с. - ISBN 978-985-08-2970-2. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2142984 (дата обращения: 21.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов

                                    
УДК [577.1+547]:004.42

Диченко, Я. В. Компьютерное моделирование строения и реакционной 

способности молекул / Я. В. Диченко ; Национальная академия наук Беларуси, Институт биоорганической химии. – Минск : Беларуская навука, 
2023. – 137 с. – ISBN 978-985-08-2970-2.

Рассматриваются различные аспекты применения современных методов компьютер
ного моделирования в химии и вопросы представления химической информации в цифровой форме; экспериментальные подходы, применяемые для получения сведений о пространственной структуре молекул; способы оптимизации геометрии и конформационного анализа молекул; методы компьютерного моделирования белков, а также технологии, 
используемые при проведении масштабных скрининговых исследований in silico.

Книга предназначена для широкого круга студентов, аспирантов, научных сотрудни
ков, интересующихся применением компьютерного моделирования для анализа свойств 
молекул.

Табл. 7. Ил. 52. Библиогр.: 125 назв.

Р е ц е н з е н т ы:

доктор химических наук, доцент А. М. Андрианов,
кандидат химических наук, доцент Я. В. Фалетров

ISBN 978-985-08-2970-2
© Диченко Я. В., 2023
© Оформление. РУП «Издательский дом 

«Беларуская навука», 2023

ПРЕДИСЛОВИЕ

В настоящее время компьютерное моделирование широко использует
ся в различных областях знаний и позволяет решать разнообразные задачи 
в физике, химии, биологии, экономике, метеорологии и др. Во многом это 
связано с тем, что ученые получают огромные объемы экспериментальных 
данных, которые просто невозможно обрабатывать вручную. Кроме того, 
часто компьютерный эксперимент является разумной заменой реальному 
эксперименту, например, в случае недостатка экспериментальных данных 
или невозможности их получить в силу объективных причин. Существующие методы моделирования развились настолько, что в настоящее время 
адекватно построенная модель вполне способна с достаточной точностью 
описать интересующий исследователя объект. Причем позволить себе работать с такими моделями уже достаточно давно могут не только крупные 
научные центры, но и небольшие лаборатории.

Данное издание ориентировано в первую очередь на студентов химиче
ских и биологических факультетов университетов, а также на всех интересующихся применением современных методов компьютерного моделирования в химии.

В книге рассматриваются основные способы представления химиче
ской информации в компьютере (глава 1); экспериментальные подходы, 
применяемые для получения информации о пространственной структуре 
молекул (глава 2); вопросы, касающиеся оптимизации геометрии (глава 3) 
и конформационного анализа молекул (глава 4); методы компьютерного 
моделирования белков (глава 5); а также технологии, используемые при 
проведении масштабных скрининговых исследований in silico (глава 6).

Насколько это возможно, автор пытался упрощать изложение материа
ла, минимально используя теорию и математический аппарат, так как цель 
данной книги – формирование у читателя представления о существующих 
способах компьютерного моделирования строения и реакционной способности молекул. Автор надеется, что знания, полученные в результате изучения представленных материалов, будут достаточными для того, чтобы 
самостоятельно разбираться в соответствующей научной литературе и совершенствоваться в данной области.

ВВЕДЕНИЕ

Как известно, модель – это мысленно представляемая или материаль
но реализованная система, которая, отображая или воспроизводя объект 
исследования, способна заменить его так, что ее изучение дает новую информацию об этом объекте. Моделирование – процесс создания и использования модели. По сравнению с «реальным» химическим экспериментом 
компьютерное моделирование обладает несколькими значительными преимуществами [1]:

экономичность – исследователю не нужно тратить ресурсы на покупку 

дорогостоящих реактивов (кроме того, исследуя модель, можно понять, какие направления работы являются более перспективными или, наоборот, 
тупиковыми, что также позволяет значительно экономить ресурсы, как, 
например, в случае рациональной разработки новых высокоэффективных 
лекарственных соединений);

возможность моделирования гипотетических объектов для прогнози
рования способов их получения, изучения их свойств;

возможность анализа работы объекта в опасных или трудновоспроиз
водимых условиях;

возможность масштабирования времени.
Однако при всем этом следует помнить, что при построении модели, 

как правило, учитываются только некоторые важные для данного конкретного исследования черты объекта-оригинала. Поэтому любая модель не 
является полной, т. е. она ни в коем случае не тождественна оригиналу. 
В связи с этим при построении модель обязательно должна быть проверена на соответствие заменяемому ей объекту и способность воспроизводить 
его свойства, а при использовании исследователь должен избегать абсолютизации результатов, получаемых посредством анализа модели, и помнить, 
что она описывает объект лишь с определенной точностью.

Использование математических моделей в химии началось еще 

в XVIII в. В то время это были в основном простые алгебраические и арифметические подходы, при помощи которых ученые объясняли наблюдаемые закономерности. В конце XIX в. появляются первые работы, связанные с установлением количественных соотношений структура–активность 

(КССА) [2]: прогнозирование свойств химических соединений на основании знания их структуры. Так, в 1869 г. B. J. Richardson обнаружил, что 
в гомологических рядах спиртов жирного ряда концентрации веществ, 
вызывающих наркоз у животных, уменьшаются пропорционально увеличению количества атомов углерода в их молекулах [3]. В 80-е годы XIX в. 
S. Binz выявил эффект возрастания наркотического действия с увеличением количества атомов хлора в ряду производных метана [4]. В начале 
XX в. E. Overton были получены линейные зависимости между наркотической активностью и липофильностью коммерчески доступных органических соединений [5], а J. Holt и W. Moore показали, что токсичность паров 
жидкостей прямо пропорциональна температуре кипения [6–9]. Первое количественное свидетельство аддитивности вкладов отдельных структурных фрагментов в активность молекулы относится к 1903–1904 гг., когда 
H. Fühner при исследовании биологических свойств одноатомных жирных 
спиртов обнаружил, что среди гомологов каждый следующий член ряда 
действует приблизительно втрое сильнее, чем предыдущий [10, 11].

Работы по установлению количественных характеристик структура–

активность для различных классов соединений продолжались в течение 
XX в. и не потеряли своей актуальности и привлекательности вплоть до 
сегодняшнего дня. Годом рождения современной методологии КССА условно считается 1964 г., когда C. Hansch опубликовал в журнале Американского химического общества работы: «ρ-σ-π анализ. Метод корреляции 
биологической активности и химической структуры» [12] и «Новая константа заместителя π, определяемая с использованием коэффициентов распределения» [13], в которых он предложил подход для оценки активности 
химических соединений исходя из их электронных, стерических и гидрофобных свойств. В конце 60-х годов XX в. также появляется первая работа 
по фармакофорному моделированию [14], а в 1971 г. L. Kier предложил термин «фармакофор» [15].

В середине XX в. в связи с началом внедрения компьютерных расче
тов для проведения рутинных научных исследований, в рамках работы над 
проектами в области ядерной физики N. Metropolis с соавторами опубликовали новый метод компьютерного моделирования, получивший название «метод Монте-Карло» [16]. Приблизительно в это же время появляются работы, касающиеся применения метода молекулярной динамики (МД) 
для анализа сложных систем, и в 1957 г. B. Alder впервые опубликованы 
результаты анализа с использованием данного подхода фазовых переходов 
в системе твердых шаров [17]. Следует отметить, что в ходе этого исследования группой ученых совместно с B. Alder специально была разработана 
первая компьютерная программа для проведения МД – STEP, однако несовершенство алгоритма расчета не позволило ученым описать изучаемую 
систему достаточно точно.

Дальнейшее развитие методов компьютерного моделирования в химии 

позволило уже в 1964 г. A. Rahman опубликовать расчеты МД для жидкого аргона (длительность траектории составляла около 1 пс) [18]. В данном 
исследовании размер системы составлял 864 атома, а при расчетах учитывалось не только взаимодействие частиц в результате соударений, но также 
и ван-дер-ваальсовы взаимодействия.

Применение метода МД нашло свое продолжение в работах L. Verlet: 

в 1967 г. на основании данных компьютерного моделирования он рассчитал фазовую диаграмму для жидкого аргона и определил ряд параметров, 
согласующихся с разработанной ранее теорией. Заслугой L. Verlet также 
по праву считается создание активно применяемого в настоящее время эффективного алгоритма численного интегрирования уравнений движения, 
позволяющего существенно экономить время при расчете МД [19].

Вообще 60-е годы XX в. знаменуются прорывом в изучении реальных 

молекулярных систем с использованием метода МД: в середине десятилетия S. Lifson была предложена идея самосогласованного поля (CFF – 
consistent force field), согласно которой потенциальная энергия молекулы 
представляется в виде суммы отдельных членов, описывающих определенные взаимодействия атомов: энергия деформации валентных связей 
и углов, торсионных углов, энергия невалентных и электростатических 
взаимодействий [20]. В 1967 г. M. Levitt, взяв за основу эту концепцию, разработал компьютерную программу CFF для расчета энергии и силы в любой молекулярной системе и провел первые в мире расчеты потенциальной 
энергии белков [21].

В дальнейшем программа M. Levitt была значительно оптимизирована 

и доработана B. Gelin из лаборатории M. Karplus, что позволило провести 
первый расчет молекулярной динамики белка [22]. Результаты этого эксперимента были опубликованы в 1977 г. В качестве объекта исследования 
выступал белок БПТИ (бычий панкреатический трипсиновый ингибитор), 
состоящий из 58 аминокислотных остатков, а моделирование осуществляли в течение около 10 пс в отсутствие растворителя при температуре 
295 К. Несмотря на несовершенство модели, в этой работе авторы смогли 
сделать несколько значительных выводов, имевших большое значение для 
развития теоретических представлений о принципах организации молекулы белка. Код, написанный B. Gelin, в дальнейшем лег в основу популярных программ для моделирования молекулярной динамики (CHARMM, 
AMBER и др.), а M. Levitt и M. Karplus совместно с A. Warshel стали 
в 2013 г. лауреатами Нобелевской премии по химии «за создание многомасштабных сложных химических систем».

Дальнейшее развитие алгоритмов и методов молекулярной динами
ки привело к тому, что уже в 90-х годах прошлого века стало возможным 

осуществлять моделирование на временном промежутке 1 нс и более, 
а в 2010 г. ученые смогли перешагнуть рубеж в 1 мс (правда, моделирование при этом осуществлялось на суперкомпьютере Anton) [23].

В 60–70 годах XX в. также появляются первые работы, связанные с ана
лизом аминокислотных и нуклеотидных последовательностей. Причина 
этому, во-первых, увеличение доступности ЭВМ для среднестатистического ученого, а во-вторых, создание и внедрение в практику биохимических 
методов для изучения первичной структуры белков и нуклеиновых кислот. 
Пионером в области теоретического анализа последовательностей является M. O. Dayhoff. Результатом ее исследований стала одна из первых баз 
аминокислотных последовательностей белков [24].

Применение компьютера для анализа биологической информации 

в дальнейшем выделилось в отдельную область знания и получило название «биоинформатика». Традиционно биоинформатику делят на геномную 
и структурную. К геномной биоинформатике относятся различные методы 
анализа последовательностей и их использование на практике. Целью же 
структурной биоинформатики является предсказание пространственных 
структур макромолекул и их комплексов друг с другом, а также с низкомолекулярными лигандами.

В настоящее время методы компьютерного моделирования активно 

развиваются и находят самое широкое применение при проведении эксперимента в химии. Они позволяют интерпретировать наблюдаемые результаты, объяснять и прогнозировать реакционную способность соединений, 
разрабатывать методы синтеза веществ с заданными свойствами, прогнозировать химические и биологические свойства соединений и многое другое. Соответствующие области знаний определены в качестве приоритетных в большинстве развитых стран.

Глава 1

ПРЕДСТАВЛЕНИЕ ХИМИЧЕСКОЙ ИНФОРМАЦИИ 

В КОМПЬЮТЕРЕ

1.1. Форматы данных,  

используемые при работе с химической информацией

При проведении компьютерного эксперимента в химии данные, соот
ветствующие исследуемой молекуле (как и любые другие), хранятся в памяти компьютера в виде структуры определенного формата. Она может 
содержать координаты атомов химического соединения, аминокислотную 
(нуклеотидную) последовательность, описание различных свойств молекулы (растворимость, заряды на атомах, температура плавления), а также дополнительную информацию, необходимую пользователю (тривиальное название молекулы, синонимичные названия, выходные данные статьи, в которой было исследовано данное соединение). Понятно, что такая структура 
может быть записана в файл и сохранена на жестком диске компьютера. 

Для абсолютного большинства используемых форматов в сети Интер
нет в свободном доступе есть опубликованные спецификации, в которых 
приводятся их подробное описание, а также то, каким образом программы, 
используемые для компьютерного моделирования, должны кодировать 
и декодировать данные для записи в файл и чтения из файла.

Одну и ту же молекулу можно представить в виде 

структур различного формата. Современные программы для моделирования часто содержат встроенные модули для конверсии из одного формата в другой. Помимо этого, существуют специальные инструменты для 
решения задач такого рода. Например, бесплатная программа с открытым кодом OpenBabel, способная распознавать 98 различных форматов файлов, используе
мых в настоящее время при проведении эксперимента in silico. OpenBabel 
распространяется как в виде готового к использованию набора инструментов, так и в виде библиотек, написанных с использованием популярных 
языков программирования (C++, Python, Perl), чтобы ее функционал можно 
было применять при разработке собственных сценариев и программ.

Полное описание всех возможных форматов данных, используемых 

при проведении компьютерного эксперимента в химии, выходит за рамки 
данной книги, поэтому кратко рассмотрим наиболее часто используемые 
из них. 

1.1.1. Формат FASTA

Данный формат был разработан в 1985 г. [25] и ис
пользовался в одноименном программном обеспечении, 
созданном для выравнивания последовательностей нуклеиновых кислот или белков.

В формате FASTA при помощи стандартного од
нобуквенного кода кодируется аминокислотная или 
нуклеотидная последовательность молекулы. Запись 
состоит из двух частей (рис. 1.1) – строка описания, 
начинающаяся с символа «>», и строки, содержащие последовательность 
молекулы. Исторически сложилось, что длина строк лежит в диапазоне от 
80 до 120 символов, но современные программы позволяют записывать последовательность и целиком – в одну строку.

Рис. 1.1. Пример записи аминокислотной последовательности белка в формате FASTA

Строка описания может иметь произвольную форму, однако для уни
фикации представления данных Национальным центром биотехнологической информации США разработаны правила ее создания. Согласно им 
в описании указывается идентификатор источника данных (база данных 
(sp – Swiss-Prot, gb – GenBank, pdb – Protein Data Bank), патент – pat и др.), 
идентификатор молекулы, относящийся к источнику данных (номер в базе 
данных, страна выдачи патента, номер заявки), название молекулы, название организма и другие данные. Такая запись, несомненно, облегчает работу пользователя, так как позволяет быстрее проводить анализ представленной информации.

1.1.2. Форматы SMILES и SMARTS

Одним из возможных представлений молекулы в компьютере явля
ется представление в виде графа. Как известно из математического анализа, граф – это абстрактный объект, представляющий собой множество 
вершин и ребер (связей) между ними. Очевидно, что атомы химического 
соединения соответствуют вершинам графа, а ребра – связям между отдельными атомами. Такое представление весьма удобно, так как позволяет 

исследовать молекулы с использованием математического аппарата теории 
графов. В результате чего можно не только описывать структуру вещества, но и прогнозировать его свойства, предсказывать пути протекания 
и рассчитывать кинетические параметры химической реакции. С одной 
стороны, такой подход является привлекательным, так как он позволяет 
получать достаточно точные результаты и в то же время расчет не требует 
сложных экспериментальных определений, не используются ресурсоемкие 
методы, свойства молекулы вычисляются непосредственно из структурной 
формулы соединений. С другой стороны, такое представление химических 
соединений является довольно абстрактным и не позволяет учесть все особенности молекулярного строения. Кроме того, что не менее важно, часто 
бывает сложно дать рассчитанным величинам молекулярного графа удовлетворительную физико-химическую интерпретацию.

Представление молекулы в виде графа позволяет 

сохранять данные о ее структуре в формате SMILES. 
Формат SMILES (Simplified Molecular Input Line Entry 
Specification – спецификация упрощенного представления молекул в строке ввода) представляет собой систему правил для описания состава и структуры молекулы химического вещества с использованием строки 
печатных символов ASCII [26].

Молекула в формате SMILES представляет собой строку текста, полу
ченную путем вывода символов вершин молекулярного графа в порядке, 
соответствующем их обходу в глубину (т. е., говоря простыми словами, 
выбирается наиболее длинная цепочка связанных атомов). Атомы, не принадлежащие основной цепи, воспринимаются как боковые группы и записываются в круглых скобках (рис. 1.2). 

Рис. 1.2. Примеры записи молекул в формате SMILES

Доступ онлайн
262 ₽
В корзину