Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Российская академия наук БИОХИМИЯ том 89 № 8 2024 август Журнал основан А.Н. БАХОМ в 1936 г. Выходит 12 раз в год ISSN 0320-9725 Издается под научно-методическим руководством Отделения биологических наук РАН Журнал включен в библиографические базы данных Biochemistry and Biophysics Citation Index, Biological Abstracts, BIOSIS Database, Chemical Abstracts, Chemical Title, Current Contents/Life Science, Excerpta Medica, Index Internacional de Cardiologie, Index Medicus (MEDLINE), International Abstracts of Biological Sciences, The ISI Alerting Services, Science Citation Index, Science Citation Index Expanded, SCOPUS, Compendx Электронная почта: biochem@pran.ru Москва ФГБУ «Издательство «Наука» © Российская академия наук, 2024 © Редколлегия журнала «Биохимия» (составитель), 2024 Главный редактор О.А. ДОНЦОВА (Москва) Редакционная коллегия: А.А. БАЙКОВ (Москва), Д. БАЛТИМОР (Нью-Йорк), А.А. БОГДАНОВ (Москва), Е.А. БОНЧ-ОСМОЛОВСКАЯ (Москва), В.И. БУНИК (Москва), А.В. БУРАКОВ (Москва), А.Б. ВАРТАПЕТЯН (Москва), С.Д. ВАРФОЛОМЕЕВ (Москва), А.В. ВОРОТНИКОВ (Москва), А.Г. ГАБИБОВ (Москва), А. ГАЛКИН (Нью-Йорк), В.А. ГВОЗДЕВ (Москва), Н.В. ГНУЧЕВ (Москва), Н.В. ГУЛЯЕВА (Москва), Н.Б. ГУСЕВ (Москва), С.Е. ДМИТРИЕВ (зам. главного редактора, Москва), А.В. ЖЕРДЕВ (Москва), А.А. ЗАМЯТНИН (Москва), Р.А. ЗИНОВКИН (Москва), О.В. КАРПОВА (Москва), Ю.А. КНИРЕЛЬ (Москва), П.Б. КОПНИН (Москва), А. КОТЛЯР (Тель-Авив), Д.В. КУПРАШ (Москва), В. МАРШАНСКИЙ (Бостон), С.А. МОШКОВСКИЙ (Геттинген, Германия), Х. МИХЕЛЬ (Франкфурт-на-Майне), Р.Д. ОЗРИНА (отв. секретарь, Москва), Е.Ю. ПЛОТНИКОВ (Москва), В.О.ПОПОВ (Москва), С.В. РАЗИН (Москва), А. СТАРКОВ (Нью-Джерси), В.И. ТИШКОВ (Москва), Б.В. ЧЕРНЯК (Москва), Р. ЮСЕФИ (Шираз) Редакция: Зав. редакцией А.Е. ЕВСТИГНЕЕВА Научные редакторы А.И. СОРОЧКИНА, Е.Р. ШУВАЛОВА
СОДЕРЖАНИЕ Том 89, № 8, 2024 Ультрабыстрая протеомика (мини-обзор) И.И. Федоров, С.А. Протасов, И.А. Тарасова, М.В. Горшков 1307 Функциональный анализ генов канальных родопсинов зеленых водорослей Беломорского бассейна О.В. Карпова, Е.Н. Виноградова, А.М. Мойсенович, О.Б. Пустовит, А.А. Рамонова, Д.В. Абрамочкин, Е.С. Лобакова 1322 IGF-Сигнальный путь в сердце в норме и при развитии патологических состояний (обзор) Д.А. Адашева, Д.В. Серебряная 1334 Эпигенетический феномен парамутации у растений и животных (обзор) Д.А. Куликова, А.В. Беспалова, Е.С. Зеленцова, М.Б. Евгеньев, С.Ю. Фуников 1364 Методы молекулярного моделирования в разработке аффинных и специфичных белок-связывающих систем (обзор) Ш.Ш. Насаев, А.Р. Муканов, И.В. Мишкорез, И.И. Кузнецов, И.В. Лейбин, В.А. Долгушева, Г.А. Павлюк, А.Л. Манасян, А.В. Веселовский 1386 РНК-Редактирование аденозиндезаминазами ADAR в клеточных моделях болезней экспансии CAG-повторов: значимый эффект дифференцировки из стволовых клеток в органоиды мозга при отсутствии существенного влияния числа повторов на уровень редактирования В.В. Кудрявский, А.О. Гончаров, А.В. Еремеев, Е.С. Ручко, В.А. Веселовский, К.М. Климина, А.Н. Богомазова, М.А. Лагарькова, С.А. Мошковский, А.А. Ключникова 1412 NMDA-Рецепторы и показатели энергетического обмена в эритроцитах: недостающее звено для оценки эффективности кислородтранспортной системы при гепатоэнцефалопатии Г.А. Алилова, Л.А. Тихонова, Е.А. Косенко 1430 Сверхэкспрессия нейротрофического фактора мозга (BDNF) во фронтальной коре усиливает социальный интерес у мышей линии BTBR – модели аутизма Я.П. Каминская, Т.В. Ильчибаева, А.И. Щербакова, Э.Р. Аллаярова, Н.К. Попова, В.С. Науменко, А.С. Цыбко 1451 Фермент CYP74B34 моркови (Daucus carota) с двойной активностью гидропероксидлиазы и эпоксиалкогольсинтазы: выявление и биохимические свойства Я.Ю. Топоркова, С.С. Горина, Т.М. Ильина, Н.В. Ланцова, А.Н. Гречкин 1462
CONTENTS Vol. 89, Issue 8, 2024 Ultrafast Proteomics (Mini-Review) I. I. Fedorov, S. A. Protasov, I. A. Tarasova, and M. V. Gorshkov 1307 Functional Analysis of the Channel Rhodopsin Genes from the Green Algae of the White Sea Basin O. V. Karpova, E. N. Vinogradova, A. M. Moisenovich, O. B. Pustovit, A. A. Ramonova, D. V. Abramochkin, and E. S. Lobakova 1322 IGF-Signaling Pathway in the Heart Innormal and Pathological Conditions (Review) D. A. Adasheva and D. V. Serebryanaya 1334 Epigenetic Phenomenon of Paramutation in Plants and Animals (Review) D. A. Kulikova, A. V. Bespalova, E. S. Zelentsova, M. B. Evgen’ev, and S. Yu. Funikov 1364 Current Methods of Molecular Modeling in the Development of Affine and Specific Agents Binding Proteins (Review) Sh. S. Nasaev, A. R. Mukanov, I. V. Mishkorez, I. I. Kuznetsov, I. V. Leibin, V. A. Dolgusheva, G. A. Pavlyuk, A. L. Manasyan, and A. V. Veselovsky 1386 RNA Editing by ADAR Adenosine Deaminases in Cell Models of CAG Repeat Expansion Diseases: A Significant Effect of Differentiation from Stem Cells into Brain Organoids in Absence of a Substantial Influence of CAG Repeats on the Level of Editing V. V. Kudriavskii, A. O. Goncharov, A. V. Eremeev, E. S. Ruchko, V. A. Veselovsky, K. M. Klimina, A. N. Bogomazova, M. A. Lagarkova, S. A. Moshkovskii, and A. A. Kliuchnikova 1412 NMDA Receptors and Indices of Energy Exchange in Erythrocytes: The Missing Link to the Assessment of the Efficiency of Oxygen Transport in Hepatic Encephalopathy G. A. Alilova, L. A. Tikhonova, and E. A. Kosenko 1430 Overexpression of Brain-Derived Neurotrophic Factor (BDNF) in the Frontal Cortex Enhances Social Interest in BTBR Mice, a Model of Autism Y. P. Kaminskaya, T. V. Ilchibaeva, A. I. Shcherbakova, E. R. Allayarova, N. K. Popova, V. S. Naumenko, and A. S. Tsybko 1451 The CYP74B34 Enzyme of Carrot (Daucus carota) with Double Hydroperoxyde Lyase/Epoxyalcohol Synthase Activity: Identification and Biochemical Properties Y. Y. Toporkova, S. S. Gorina, T. M. Iljina, N. V. Lantsova, and A. N. Grechkin 1462
БИОХИМИЯ, 2024, том 89, вып. 8, с. 1307 – 1321 1307 УДК 57.088 УЛЬТРАБЫСТРАЯ ПРОТЕОМИКА Мини-обзор © 2024 И.И. Федоров1,2, С.А. Протасов1,2, И.А. Тарасова2, М.В. Горшков2* 1 Московский физико-технический институт (национальный исследовательский университет), 141700 Долгопрудный, Московская обл., Россия 2 Федеральный исследовательский центр химической физики имени Н.Н. Семенова РАН, Институт энергетических проблем химической физики имени В.Л. Тальрозе, 119334 Москва, Россия; электронная почта: mike.gorshkov@gmail.com Поступила в редакцию 23.05.2024 После доработки 21.06.2024 Принята к публикации 24.06.2024 Современный этап развития протеомных исследований в области биологии, медицины, разработки новых лекарств, популяционного скрининга или персонализированных подходов к терапии диктует необходимость анализа больших выборок образцов с наименьшими затратами экспериментального времени. До недавнего времени технологии масс-спектрометрических измерений в протеомике относились к уникальным для идентификации и количественного определения белкового состава, но также были низкопроизводительными, с многочасовым анализом одного образца. Это входило в противоречие с динамикой изменений биологических систем на уровне всего клеточного протеома под воздействием внешних и внутренних факторов. Так, низкая скорость полнопротеомного анализа является основным фактором, ограничивающим развитие функциональной протеомики, где требуется аннотировать участие белков во внутриклеточных процессах не только в широком диапазоне условий жизнедеятельности клетки, но и на протяжении длительного времени. Огромный уровень гетерогенности клеток тканей или новообразований даже одного типа диктует необходимость анализа биологической системы на уровне индивидуальных клеток. В этих исследованиях речь идёт о получении молекулярных характеристик уже для десятков, если не сотен тысяч индивидуальных клеток, в том числе их полного протеомного профиля. Развитие технологий масс-спектрометрии высокого разрешения и точности измерения масс, предсказательной хроматографии, новых методов разделения ионов пептидов в газовой фазе и обработки протеомных данных на основе алгоритмов искусственного интеллекта открыли перспективу существенно, если не радикально, увеличить производительность полнопротеомного анализа и привели к реализации концепции ультракороткой протеомики. В работах буквально последних нескольких лет были продемонстрированы производительности полнопротеомного анализа на уровне нескольких сотен образцов в сутки при глубине анализа в несколько тысяч белков, что было немыслимо ещё буквально три-четыре года назад. В обзоре рассматриваются предпосылки развития, а также основные современные методы и подходы в реализации ультракороткого полнопротеомного анализа. КЛЮЧЕВЫЕ СЛОВА: протеомика, масс-спектрометрия, пептиды, белки, ультракороткий анализ, количественная протеомика. DOI: 10.31857/S0320972524080011 EDN: KEERFQ * Адресат для корреспонденции. ВВЕДЕНИЕ В настоящее время полнопротеомный анализ широко используется в различных областях биологии и медицины [1, 2]. Основным методом такого анализа является масс-спектрометрия, позволяющая получать количественную информацию об изменении белкового состава клеток, подверженных тому или иному воздействию. Среди основных начальных этапов становления количественной протеомики следует отметить реализацию концепций поиска по базам данных и/или спектральным библиотекам [3] и идентификации белков по уникальному набору масс
ФЕДОРОВ и др. 1308 БИОХИМИЯ том 89 вып. 8 2024 Принятые сокращения: AMT tags – метки точных масс и времён элюирования пептидов; DDA – метод информационно зависимого полнопротеомного анализа; DIA – метод информационно независимого полнопротеомного анализа; DirectMS1 – метод прямой хроматомасс-спектрометрической идентификации белков; DISPA – метод протеомного анализа на основе прямой подачи протеолитической смеси в источник ионизации, минуя стадию жидкостно-хроматографического разделения; МС/МС – тандемная масс-спектрометрия, МС1 – масс-спектры первого уровня ионов-предшественников; PMF – пептидные отпечатки белков. их протеолитических (как правило, триптических) пептидов (пептидные отпечатки белков – Peptide Mass Fingerprint, PMF [4]). Если говорить об используемых типах масс-анализаторов, то первые протеомы модельных организмов были идентифицированы на радиочастотных квадрупольных ионных ловушках и времяпролётных масс-спектрометрах [5]. В этих результатах, как правило, отсутствовал контроль доли ложноположительных идентификаций (FDR, False Discovery Rate) [6, 7], концепция которого появилась в протеомике в 2007 г. с реализацией подхода на основе ложных или «бессмысленных» (декойных) последовательностей [7]. Ранее, начиная с работ Смита и др., появилось понимание необходимости использования для полнопротеомного анализа масс-спектрометрии высокого разрешения, представленной на начальных этапах исключительно масс-анализаторами ионного циклотронного резонанса с преобразованием Фурье (ИЦР ПФ) в сочетании с нанопотоковыми режимами разделения и ионизации пептидов [8, 9]. Появление более производительных по сравнению с ИЦР ПФ массанализаторов высокого разрешения Орбитрэп (Orbitrap) позволило к 2015 г. выйти на уровень идентификации до половины и более всех белков простых организмов в рамках одночасового, «однопрогонного» эксперимента ВЭЖХ–МС/МС (МС/МС – тандемная масс-спектрометрия) [10]. В настоящее время для протеомов клеток человека идентифицируется 5000–6000 белков в однопрогонном двухчасовом эксперименте [11]. Дальнейшее увеличение глубины полнопротеомного анализа достигается либо дополнительным фракционированием проб на уровне белков или пептидов [12–14], либо увеличением длительности градиента ВЭЖХ до нескольких часов и использованием длинных хроматографических колонок [12, 15]. Так, например, комбинация фракционирования протеолитических смесей и многочасовых градиентов ВЭЖХ-разделения на капиллярных колонках длиной 40 см и более позволила идентифицировать более половины кодируемого протеома человека [16]. Хотя достижение такого уровня покрытия протеома представляет значительный интерес, полное затраченное инструментальное время в цитируемых выше экспериментах составило 288 часов, что делает такой анализ уникальным, но нецелесообразным для многих задач химической, клинической или популяционной протеомики, предполагающих рутинный поток из сотен образцов в сутки. Одновременный анализ нескольких меченых образцов, объединённых в один пул (мультиплексинг образцов) [17, 18], в настоящее время реализуемый с использованием ТМТ-(Tandem Mass Tag) меток [19], частично решает проблему инструментальных затрат на полнопротеомный количественный анализ в пересчёте на один образец. Однако связанные с его использованием проблемы увеличения аналитической сложности образцов и необходимости использования фракционирования не переводят его в разряд методов ультракороткой протеомики, которую можно определить как анализ 200 и более образцов в сутки. Действительно, как показали недавние исследования на примере клеточных линий глиобластомы, обработанных интерфероном, количественный 40-минутный анализ с использованием 10-плексного набора ТМТ--меток (что примерно соответствует производительности в 200 протеомных анализов в сутки) даёт довольно скудную картину по количеству идентификаций интерферон-регулируемых белков [20]. После значительного промежутка времени, прошедшего с момента первых демонстраций количественного полнопротеомного анализа на основе меток точных масс и времён элюирования пептидов (ATM, Accurate Mass and Time tags) в минутном диапазоне градиентов разделения, в последние годы возобновился интерес к этому направлению, которое можно условно назвать «ультрабыстрой протеомикой». В её основе лежит реализация новых методов масс-спектрометрии высокого разрешения в сочетании с ультракоротким разделением смесей пептидов (включая разделения ионов пептидов в газовой фазе), таких как информационно независимый полнопротеомный анализ (DIA, Data Independent Acquisition) [13] и прямая хроматомасс-спектрометрическая идентификация белков (DirectMS1) [20]. Эти методы позволяют полуколичественно анализировать протеомы с производительностью более 200 образцов в сутки. В данном обзоре рассматриваются развиваемые в последние несколько лет новые подходы ультрабыстрой протеомики и кратко обсуждаются перспективы их дальнейшего развития.
УЛЬТРАКОРОТКАЯ ПРОТЕОМИКА 1309 БИОХИМИЯ том 89 вып. 8 2024 ПРЕДЫСТОРИЯ УЛЬТРАКОРОТКОЙ ПРОТЕОМИКИ Одной из первых реализаций идеи ультракороткого протеомного анализа являлся подход на основе пептидных отпечатков белков (PMF) [4, 21, 22]. Этот подход заключается в предварительном разделении белков с помощью гель-электрофореза или жидкостной хроматографии, специфическом гидролизе белковых фракций на протеолитические пептиды (обычно используется фермент трипсин), что образует уникальный для каждого белка набор масс его пептидных фрагментов, и регистрации масс-спектров ионов пептидов. Для идентификации белков экспериментально полученные массы ионов пептидов сравниваются с теоретическими, полученными на основе имеющихся баз данных последовательностей белков протеома соответствующего организма, что схематично представлено на рис. 1 [23]. Масс-спектрометрия на основе матричноактивированной лазерной десорбции/ионизации (MALDI-MS, Matrix-Assisted Laser Desorption and Ionization Mass Spectrometry) является наиболее часто используемым методом для реализации PMF-подхода [4, 24]. Понятно, что такой подход не является в буквальном смысле ультракоротким, поскольку он требует предварительного разделения белков на большое количество фракций – как правило, с использованием электрофореза SDS-PAGE (Sodium Dodecyl Sulfate–Polyacrylamide Gel Electrophoresis) [21] – каждая из которых подвергается гидролизу и анализу. Также довольно быстро пришло понимание того, что метод PMF неэффективен при анализе сложных смесей [25], в которых представлены гидролизаты десятков белков, не говоря уже о тех, которые содержат тысячи белков протеома. В настоящее время он используется практически исключительно в анализе и подтверждении индивидуальных, как правило, предварительно выделенных белков. С прогрессом в разработке масс-анализаторов высокого разрешения, таких как масс-спектрометры ионного циклотронного резонанса, идея идентификации белков на основе измерения массспектров ионов пептидов как способ быстрого полнопротеомного анализа была воплощена в методе точных массовых меток (Accurate Mass Tags, AMT) [26]. Метод заключается в предварительном МС/МС-анализе объединённого образца (пула) с идентификацией и составлением списка пептидов, потенциально присутствующих в анализируемых пробах. Последующая идентификация белков в каждом образце пула осуществляется на основе сопоставления этого «пул»-специфичного списка масс идентифицированных пептидов с массами пептидов, регистрируемых в отдельном анализе каждого из образцов. Базовая идея подхода состоит в том, что если молекулярную массу одного пептида можно измерить с достаточно высокой точностью, так, чтобы его масса была уникальной среди всех возможных пептидов, предсказанных на основе полногеномного секвенирования, то её можно было бы использовать в качестве «точной массовой метки» для идентификации белков. Соответственно, генерация списка таких AMT позволяет анализировать продукты гидролиза белков всего протеома (например, в результате расщепления трипсином) с большей скоростью и чувствительностью. Более того, последующий анализ можно проводить без использования фрагментации пептидов, т.е. подход потенциально является беcфрагментационным и, соответственно, совместимым с короткими градиентами разделения протеолитических смесей. Довольно быстро стало понятно, что использование дополнительных к точной массе комплементарных данных, таких как времена Рис. 1. Схема реализации метода PMF. Поскольку массы пептидов не специфичны относительно аминокислотной последовательности, то в сложных смесях на одну и ту же измеренную массу или набор масс может попадать несколько, в некоторых случаях десятки возможных белков, что затрудняет их идентификацию
ФЕДОРОВ и др. 1310 БИОХИМИЯ том 89 вып. 8 2024 Рис. 2. Схема реализации метода AMT на основе точных масс ионов пептидов и нормализованных времён элюирования, NET. Нормализация времён осуществляется в диапазон [0, 1]. Предсказанные NET рассчитываются для используемых условий разделения с помощью либо простых линейных преобразований, либо на основе нейронных сетей [27] элюирования пептидов, существенно повышает уникальность такой комбинации для аминокислотной последовательности пептидов. Соответственно, дальнейшим развитием этого подхода явилось добавление нормализованных времён элюирования пептидов, что превратило его в метод меток точных масс и времён (AMTtags) [26]. Уже в первых демонстрациях метода AMT-tags была продемонстрирована возможность полнопротеомного анализа для относительно небольших протеомов, в частности Deinococcus radiodurans [27]. Более того, поскольку метод не требует фрагментации пептидов для их идентификации (за исключением стадии составления списка AMT-меток), такой полнопротеомный анализ был впервые продемонстрирован в минутном диапазоне времён. Стандартная реализация метода AMT содержит 2 основных этапа (рис. 2): (1) создание «пул»специфичной базы данных меток AMT пептидов для пулов образцов контрольной и тестовой групп с использованием глубокого (как правило, на основе фракционирования) полнопротеомного МС/МС-анализа; и (2) быстрый анализ ВЭЖХ-МС1 образцов (МС1 – масс-спектры первого уровня ионов-предшественников) с идентификацией белков на основе созданной на первом этапе «пул»специфичной базы данных меток AMT. На первом этапе с каждым из идентифицированных пептидов сопоставляется его точная масса в пределах ошибки измерения и нормализованное время выхода (NET, Normalized Elution Time). Затем следует этап ВЭЖХ-МС1-анализа большой когорты нефракционированных образцов, результатом которого является получение списка экспериментальных точных масс и зарядовых состояний пептидов, а также времён элюирования. Последние приводятся к нормализованной шкале времён, в наиболее простом исполнении – линейным преобразованием. Также могут использоваться NET, предсказанные на основе нейронных сетей и ранее полученных экспериментальных наборов данных идентифицированных пептидов [27]. Идентификация пептидов проанализированного образца осуществляется на основе сравнения экспериментальных наборов данных с базой меток AMT, после чего осуществляется идентификация белков и их количественный анализ. Количественные характеристики идентифицированных белков определяются на основе интенсивностей ионов пептидов в масс-спектрах. В то время как метод AMT продемонстрировал возможность ультракороткого количественного анализа протеомов ряда организмов [28, 29], его более широкое применение в протеомике затруднено отсутствием контроля FDR. Также проблемами являются выравнивание времён элюирования пептидов для расчёта NET между различными экспериментами и различными хроматографическими условиями. В первую очередь речь идёт об условиях, при которых создавалась база меток AMT, и условиях, при которых проводился последующий быстрый протеомный анализ [30]. Одним из решений последней из перечисленных
УЛЬТРАКОРОТКАЯ ПРОТЕОМИКА 1311 БИОХИМИЯ том 89 вып. 8 2024 проблем стало использование различных моделей предсказания времён элюирования пептидов [31, 32] и создание стандартизированных и/или универсальных баз данных времён элюирования пептидов для AMT-меток на их основе [33]. По мере внедрения полнопротеомного анализа с использованием информационно зависимого подхода (DDA, Data Dependent Acquisition) на основе гибридных масс-спектрометров с ионной ловушкой высокого разрешения Орбитрэп [34–36] в лабораторную практику метод AMT перестал широко использоваться. При этом сама концепция DDA, в котором ионы пептидов, детектируемые в спектрах МС1, последовательно изолируются в радиочастотной ионной ловушке гибридного масс-спектрометра и накапливаются до количества, достаточного для получения полноценного спектра фрагментации, подразумевает использование длинных градиентов ВЭЖХ. Даже в случае многочасовых разделений гидролизатов протеомов, доходящих до 10 часов в отдельных экспериментах [37], идентифицируется только малая часть регистрируемых в МС1 и доступных для анализа пептидов [38–40]. Тем не менее DDA стал основным методом количественного полнопротеомного анализа в последние годы с глубиной покрытия протеома, достигающей в ряде работ 10 000 и более белковых идентификаций [16, 37, 41, 42]. Несмотря на очевидную важность получения как можно большей глубины анализа протеома, нельзя также не указать и на очевидную проблему: огромные затраты инструментального времени для анализа одного образца, особенно в случае использования интенсивного префракционирования анализируемых смесей [41, 43–47]. МЕТОД ИНФОРМАЦИОННО НЕЗАВИСИМОГО АНАЛИЗА В УЛЬТРАБЫСТРОЙ ПРОТЕОМИКЕ Одним из наиболее очевидных методов ультракороткой протеомики стал метод информационно независимого анализа (DIA) [13]). В отличие от DDA, в этом методе отсутствует стадия последовательного отбора ионов-предшественников по точной измеренной массе МС1 для последующей изоляции, накопления и фрагментации, которая является одной из основных причин использования длинных градиентов разделения. Вместо этого в DIA накопление и фрагментация ионов осуществляются в широком окне масс с последующим перестроением накопительного устройства на соседнее окно и т.д. (рис. 3). В результате практически все прекурсорные ионы, присутствующие в МС1, фрагментируются в серии таких окон (стандартно, размером в 20–25 Тh), покрывающих весь диапазон m/z детектирования ионов пептидов. Понятно, что спектры фрагментации в таких окнах являются смешанными (или, как ещё говорят, обладают высоким уровнем мультиплексности), с одновременным присутствием фрагментов от десятков ионов пептидов, что ставит перед экспериментаторами непростую задачу их интерпретации (деконволюции). Каждой серии таких окон соответствует предварительно зарегистрированный масс-спектр МС1 и время элюирования. Последнее является также одним из ключевых параметров для последующей деконволюции спектров фрагментации и идентификации пептидов. Размер окон и, соответственно, эффективность деконволюции спектров фрагментации определяется характеристиками масс-анализатора. Так, комбинация масс-анализатора Орбитрэп и анализатора Astral (ASymmetric TRAck Lossless) позволила уменьшить окна фрагментации до 2 Th, что фактически стирает границу между методами DIA и DDA в полнопротеомном анализе [48, 49]. Описанная выше схема DIA является его наиболее широко используемой реализацией, называемой SWATH-MS (Sequential Window Acquisition of All THeoretical Mass Spectra [50]). Основным преимуществом этого метода является преодоление проблемы стохастичности данных в стандартном подходе на основе DDA, связанной с выбором ограниченного количества наиболее интенсивных в данном масс-спектре ионов-предшественников для селективного накопления и фрагментации. Результатом является существенно меньший уровень пропущенных значений интенсивностей пептидов, что делает DIA альтернативой DDA в количественной протеомике [51]. Одновременно, поскольку в DIA происходит фрагментация всех ионов прекурсоров в ограниченном числе окон, этот метод позволяет работать с более короткими градиентами ВЭЖХ [52]. Дальнейшая оптимизация окон изоляции позволила увеличить глубину анализа протеомов с использованием ультракоротких градиентов разделения [53, 54]. Дополнительное разделение ионов пептидов по ионной подвижности продемонстрировало возможность идентифицировать в 5 нг гидролизата HeLa более 1000 белков в режиме DIA и 5-минутных градиентов ВЭЖХ [55]. Одним из сдерживающих факторов в развитии DIA в качестве рутинно используемого метода ультрабыстрого полнопротеомного анализа являлся высокий уровень мультиплексности массспектров фрагментации, что требует сложных алгоритмов обработки данных и деконволюции спектров. Стандартным решением этой проблемы являлось использование библиотек спектров фрагментации для анализируемого пула образцов. Такие библиотеки создавались с использованием
ФЕДОРОВ и др. 1312 БИОХИМИЯ том 89 вып. 8 2024 Рис. 3. Схема работы метода DIA. Вместо изолирования для последующей фрагментации отдельных ионовпредшественников, регистрируемых в масс-спектрах первого уровня, МС1, весь диапазон масс делится на широкие окна, в которых осуществляется накопление и фрагментация всех присутствующих в них ионов. Таким образом, DIA позволяет получить спектры фрагментации для всех ионов-предшественников, потенциально присутствующих в образце глубокого полнопротеомного анализа методом DDA, что, в свою очередь, делало DIA не в полной мере информационно независимым. Помимо очевидных затрат инструментального времени на получение таких библиотек, что превращает DIA в условно быстрый метод протеомного анализа, использование экспериментальных библиотек существенно сдерживало использование DIA в межлабораторных и клинических исследованиях. Наконец, остаётся базовая проблема такого подхода – невозможность идентифицировать пептиды, спектры фрагментации которых в библиотеке отсутствуют. Прогресс в разработке алгоритмов на основе машинного обучения для предсказания спектров фрагментации и времён удерживания пептидов in silico позволил решить эту проблему [56–58]. Тем не менее крайне высокий уровень мультиплексности спектров в результате интерференции спектров фрагментации от разных одновременно элюируемых ионов-предшественников существенно усиливается в случае использования коротких градиентов разделения. До недавнего времени это делало невозможным извлечение сколь-либо значимого количества идентификаций в таких спектрах и ограничивало использование DIA в приложениях, требующих анализа больших выборок образцов. Эти проблемы были учтены в недавней разработке алгоритма DIA-NN, основанного на использовании нейронных сетей для различения сигналов ионов фрагментов и шума в масс-спектрах, а также использующего новые стратегии для извлечения количественной информации и выравнивания хроматограмм по идентифицируемым пептидам образца [59]. В ходе работы алгоритма DIA-NN каждый пик элюирования ионов-предшественников описывается набором индексов, и через процедуру итераций на основе линейного классификатора определяется наилучший кандидат на пик элюирования того или иного иона. Ключевым этапом работы алгоритма является присвоение статистической значимости (q-value) идентифицированным предшественникам, которая рассчитывается для целевых и ложных кандидатов на основе характеристик соответствующих пиков элюирования с использованием глубокой нейронной сети. Возможности алгоритма DIA-NN для использования в ультракоротком полнопротеомном анализе в полной мере были продемонстрированы на примере реализации метода ScanningSWATH [60, 61]. Технически этот метод заключается в замене последовательного выбора окон изоляции пептидов, в которых осуществляется фрагментация, непрерывным сканированием в широком окне m/z первого изолирующего ионы радиочастотного квадруполя масс-спектрометра по всему диапазону масс с одновременной фрагментацией поступающих из него ионов-предшественников в столкновительном радиочастотном квадруполе. Таким образом, создаётся дополнительная размер
УЛЬТРАКОРОТКАЯ ПРОТЕОМИКА 1313 БИОХИМИЯ том 89 вып. 8 2024 ность для сопоставления спектров фрагментации и кандидатов-предшественников в последующей деконволюции сильно интерферирующих тандемных масс-спектров и идентификации пептидов алгоритмом DIA-NN. В недавней совместной работе создателей метода ScanningSWATH и разработчиков алгоритма DIA-NN была продемонстрирована ранее недостижимая возможность его использования в режиме ультракоротких, порядка 0,5–5 мин, градиентов ВЭЖХ-разделения протеолитических смесей пептидов при глубине анализа протеомов клеточных линий человека, достигающей нескольких тысяч белков [61]. Следует отметить, что для работы метода в режиме ультракоротких градиентов с целью сохранения разрешающей способности хроматографического разделения сложных смесей необходимо использование микропотоковой ВЭЖХ (порядка нескольких сотен мкл/мин), что, в свою очередь, приводит к большим затратам образца (до нескольких мкг гидролизата протеомов клеточных линий человека). Реализация метода DIA в режиме ультракороткого разделения наиболее естественна для времяпролётных масс-анализаторов, которые в настоящее время позволяют получать масс-спектры в широком диапазоне m/z с разрешением пиков в спектрах 50 000 и выше и частотой сканирования порядка 100 Гц, что на порядок превосходит производительность масс-анализаторов высокого разрешения на основе ионных ловушек. Одним из примеров использования времяпролётного масс-анализатора высокого разрешения для ультракороткого полнопротеомного анализа является комбинация дополнительного разделения ионов-предшественников по ионной подвижности в режиме удерживания ионов в градиенте электрического поля (TIMS, Trapped Ion Mobility Spectrometry [62, 63]) с методом параллельного накопления и последовательной фрагментации ионов пептидов (PASEF, Parallel Accumulation SErial Fragmentation [64]). В TIMS ионы пептидов, элюируемых с колонки ВЭЖХ и ионизируемых в источнике ионизации, поступают в дрейфовую камеру, в которой удерживаются в радиальном направлении постоянным электрическим полем, компенсирующим их дрейф в столкновениях с молекулами газа-носителя, и, соответственно, разделяются по ионной подвижности. Вместо выбора массы одного иона-предшественника для фрагментации реализуется синхронизированное с работой камер ионной подвижности изменение параметров радиочастотного квадруполя для изолирования и фрагментации ионов с выделенными значениями или диапазоном m/z. Один шаг изменения напряжённости удерживающего электрического поля в камере TIMS длительностью 50 мс позволяет получить спектры фрагментации нескольких ионов пептидов. PASEF многократно увеличивает скорость наработки спектров фрагментации без потери чувствительности анализа [65]. Реализация комбинации TIMS-TOP/ PASEF в режиме DIA-анализа (dia-PASEF), а также использование алгоритма DIA-NN для обработки данных продемонстрировало возможность осуществления полнопротеомного анализа с глубиной в несколько тысяч идентифицированных белков клеточных линий человека со скоростью до 400 образцов в сутки инструментального времени (3 минуты градиента ВЭЖХ) [66]. МЕТОД ПРЯМОГО ВВОДА ОБРАЗЦА DISPA Одним из логичных шагов в развитии методов ультракороткой протеомики и упрощения инструментальной составляющей самого анализа является отказ от хроматографического разделения протеолитических смесей в реальном времени. Сам подход, конечно, не является чем-то уникальным и использовался в практике анализа протеомов более полутора десятков лет [67]. Однако его ранние реализации осуществлялись на масс-анализаторах низкого разрешения и точности измерения масс при отсутствии как развитых инструментов поиска идентификаций, так и каких-либо возможностей дополнительного разделения ионов, например, по ионной подвижности. Несколько лет назад с развитием масс-спектрометрических технологий, появлением масс-анализаторов высокого разрешения, а также методов быстрого разделения ионов в газовой фазе по ионной подвижности концепция прямой подачи протеолитической смеси в источник ионизации без предварительного хроматографического разделения приобрела новое звучание в методе скорострельного протеомного анализа на основе прямого ввода (DISPA, Direct Infusion Shotgun Proteomic Analysis) [68]. Технически реализация метода довольно проста: протеолитическая смесь подаётся в нанопотоковом режиме напрямую со шприца с пробой в источник ионизации масс-спектрометра. В качестве дополнительной размерности используется разделение ионов по ионной подвижности. Сам анализ осуществляется методом DIA. Понятно, что мультиплексность спектров фрагментации в этом случае более чем на порядок выше, чем в случае разделения ВЭЖХ, что, соответственно, ограничивает достижимую глубину анализа протеома. Так, в указанной работе удалось достичь глубины порядка 500 белков для протеома клеточной линии человека. Однако эта глубина была достигнута за несколько минут экспериментального времени, что позволило