Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Вопросы языкознания, 2024, № 2

научный журнал
Покупка
Новинка
Артикул: 849448.0001.99
Доступ онлайн
1 455 ₽
В корзину
Вопросы языкознания : научный журнал. - Москва : Наука, 2024. - № 2. - 166 с. - ISSN 0373-658X. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2186100 (дата обращения: 03.01.2025). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
РОССИЙСКАЯ АКАДЕМИЯ НАУК
Отделение историко-филологических наук
ВОПРОСЫ
ЯЗЫКОЗНАНИЯ
Журнал основан в январе 1952 года
Выходит 6 раз в год
2
 
МАРТ — АПРЕЛЬ
Москва
2024


Главный редактор:
В. А. Пี฽ือ้ื 
д. ф. н., проф., академик РАН, Институт русского языка им. В. В. Виноградова 
РАН; Московский государственный университет им. М. В. Ломоносова
Зам. главного редактора:
Н. Б. Вส฿฼าื 
д. ф. н., проф., чл.-корр. РАН, Европейский университет в Санкт-Петербурге; 
Институт лингвистических исследований РАН
В. И. Пุฮีฯ฻฻ิส้ 
д. ф. н., проф., Институт языкознания РАН
Редколлегия:
В. М. Аีูส฼ุฬ 
д. ф. н., проф., академик РАН, Институт языкознания РАН
Ю. Д. Аฺูฯ฻้ื 
д. ф. н., проф., академик РАН, Институт проблем передачи информации 
им. А. А. Харкевича РАН; Институт русского языка им. В. В. Виноградова РАН
И. М. Бุอ฽฻ีสฬ฻ิาำ 
д. ф. н., проф., Институт проблем передачи информации им. А. А. Харкевича 
РАН; Мадридский политехнический университет, Испания
М. Д. Вุฯำิุฬส 
д. ф. н., Институт лингвистических исследований РАН
В. З. Дฯึๆ้ืิุฬ 
д. ф. н., проф., Институт языкознания РАН
Д. О. Дุหฺุฬุีๆ฻ิาำ д. ф. н., проф., Институт русского языка им. В. В. Виноградова РАН; Институт 
языкознания РАН; Стокгольмский университет, Швеция
А. Ф. Ж฽ฺสฬีผฬ 
д. ф. н., Институт славяноведения РАН; Московский государственный университет им. М. В. Ломоносова
П. В. Иุ฻สฮ 
Ph.D., Эдинбургский университет, Великобритания
Н. Н. Кสัสื฻ิาำ 
д. ф. н., проф., академик РАН, Институт лингвистических исследований РАН
В. И. Кาึึฯีๆึสื 
Ph.D., Бергенский университет, Норвегия
Г. И. К฽฻฼ุฬส 
д. ф. н., проф., Институт русского языка им. В. В. Виноградова РАН
А. М. Мุีฮุฬสื 
д. ф. н., академик РАН, Институт русского языка им. В. В. Виноградова РАН
М. С. Пุีาื฻ิส้ 
Ph.D., проф., Мэрилендский университет, США
Е. В. Рส฿าีาืส 
д. ф. н., проф., Национальный исследовательский университет «Высшая школа 
экономики»; Институт русского языка им. В. В. Виноградова РАН
Я. Г. Тฯ฻฼ฯีฯเ 
д. ф. н., проф., Российский государственный гуманитарный университет; Институт языкознания РАН
Л. А. Яืฮส  
Ph.D., проф., Университет Тромсё — Норвежский aрктический университет, 
Норвегия
Зав. редакцией: Н. В. Гสืื฽฻
Зав. отделами: А. С. К฽ีฯฬส, А. Д. Пุฮอฺุืส้
Отдел рецензий: М. И. Сส฼าืส
Статьи отбираются редколлегией журнала на основе анонимного независимого рецензирования.
Индексируется в: Российский индекс научного цитирования (РИНЦ); Brill Linguistic Bibliography (Online); Cambridge University Press Language Teaching (Online); De Gruyter Saur Dietrich’s Index Philosophicus; EBSCOhost 
MLA International Bibliography (Modern Language Association); Elsevier BV Scopus; European Reference Index for 
the Humanities and Social Sciences (ERIH PLUS); Gale MLA International Bibliography (Modern Language Association); ProQuest Linguistics and Language Behavior Abstracts (Online), Core; ProQuest MLA International Bibliography (Modern Language Association); Russian Science Citation Index (RSCI); Web of Science Core Collection’s 
Emerging Sources Citation Index (ESCI); Wiley-Blackwell Publishing Ltd. Linguistics Abstracts (Online).
 
Адрес редакции: 119019, Москва, ул. Волхонка, 18/2, Институт русского языка 
им. В. В. Виноградова РАН, редакция журнала «Вопросы языкознания»
 
Телефон: +7 495 637-25-16
 
E-mail: voprosy@mail.ru
 
Сайт: https://vja.ruslang.ru
© Российская академия наук, 2024
© Составление. Редколлегия журнала «Вопросы 
 
языкознания», 2024
ISSN 0373-658X


RUSSIAN ACADEMY OF SCIENCES
Department of History and Philology
VOPROSY
JAZYKOZNANIJA
(TOPICS IN THE STUDY OF LANGUAGE)
Founded in January 1952
6 issues per year
2
 
MARCH — APRIL
Moscow
2024


Editor-in-chief:
Vladimir A. Pඅඎඇ඀ංൺඇ 
Vinogradov Russian Language Institute (RAS); Lomonosov Moscow State 
University, Moscow, Russia
Assistant editors:
Vera I. Pඈൽඅൾඌඌ඄ൺඒൺ 
Institute of Linguistics (RAS), Moscow, Russia
Nikolai B. Vൺ඄ඁඍංඇ 
European University at St. Petersburg; Institute for Linguistic Studies (RAS), 
St. Petersburg, Russia
Editorial board:
Vladimir M. Aඅඉൺඍඈඏ 
Institute of Linguistics (RAS), Moscow, Russia
Yury D. Aඉඋൾඌඃൺඇ 
Kharkevich Institute for Information Transmission Problems (RAS); Vinogra 
dov 
Russian Language Institute (RAS), Moscow, Russia
Igor M. Bඈ඀ඎඌඅൺඏඌ඄ඒ 
Kharkevich Institute for Information Transmission Problems (RAS), Moscow, 
Russia; Universidad Politécnica de Madrid, Spain
Valery Z. Dൾආඒൺඇ඄ඈඏ 
Institute of Linguistics (RAS), Moscow, Russia
Dmitrij O. Dඈൻඋඈඏඈඅ’ඌ඄ංඃ Vinogradov Russian Language Institute (RAS); Institute of Linguistics (RAS), 
Moscow, Russia; Stockholm University, Sweden
Pavel Iඈඌൺൽ 
University of Edinburgh / Oilthigh Dhùn Èideann, UK
Laura A. Jൺඇൽൺ  
Universitetet i Tromsø: Norges arktiske universitet, Tromsø, Norway
Nikolai N. Kൺඓൺඇඌ඄ඒ 
Institute for Linguistic Studies (RAS), St. Petersburg, Russia
Vadim Kංආආൾඅආൺඇ 
University of Bergen, Norway
Galina I. Kඎඌඍඈඏൺ 
Vinogradov Russian Language Institute (RAS), Moscow, Russia
Aleksandr M. Mඈඅൽඈඏൺඇ Vinogradov Russian Language Institute (RAS), Moscow, Russia
Maria Pඈඅංඇඌ඄ඒ 
University of Maryland, College Park, USA
Ekaterina V. Rൺ඄ඁංඅංඇൺ 
HSE University; Vinogradov Rus 
sian Language Institute (RAS), Moscow, 
Russia
Yakov G. Tൾඌඍൾඅൾඍඌ 
Russian State University for the Humanities; Institute of Linguistics (RAS), 
Moscow, Russia
Maria D. Vඈൾං඄ඈඏൺ 
Institute for Linguistic Studies (RAS), St. Petersburg, Russia
Anatoly F. Zඁඎඋൺඏඅൾඏ 
Institute of Slavic Studies (RAS); Lomonosov Moscow State University, Moscow, Russia
Managing editor: Natalia V. Gൺඇඇඎඌ
Editorial staff: Anna S. Kඎඅൾඏൺ, Anastasia D. Pඈൽ඀ඈඋඇൺංൺ
Review editor: Maria I. Sൺඍංඇൺ
Articles are selected by the editorial board on the basis of anonymous double-blind independent peer review process.
Abstracting / Indexing: Brill Linguistic Bibliography (Online); Cambridge University Press Language Teaching (Online); De Gruyter Saur Dietrich’s Index Philosophicus; EBSCOhost MLA International Bibliography (Modern Language Association); Elsevier BV Scopus; European Reference Index for the Humanities and Social Sciences (ERIH 
PLUS); Gale MLA International Bibliography (Modern Language Association); ProQuest Linguistics and Language 
Behavior Abstracts (Online), Core; ProQuest MLA International Bibliography (Modern Language Association); Rossiiskii indeks nauchnogo tsitirovaniya (RINTs); Russian Science Citation Index (RSCI); Web of Science Core Collection’s Emerging Sources Citation Index (ESCI); Wiley-Blackwell Publishing Ltd. Linguistics Abstracts (Online).
 
Address: “Voprosy Jazykoznanija”, editorial office, Vinogradov Russian Language 
Institute (RAS), Volkhonka street, 18/2, Moscow, 119019, Russia
 
Tеlephone: +7 495 637-25-16
 
E-mail: voprosy@mail.ru
 
Website: https://vja.ruslang.ru
ISSN 0373-658X


2024. № 2 
В О П Р О С Ы  Я З Ы К О З Н А Н И Я  
5
Содержание
С. О. Сสฬแ฽ิ, Т. А. Аฺ฿สือฯีๆ฻ิาำ, А. А. Бุืแ-О฻ึุีุฬ฻ิส้, О. В. Дุืาืส, 
Ю. Н. К฽ัืฯเุฬส, О. Н. Л้โฯฬ฻ิส้, Б. В. Оฺฯ฿ุฬ, М. В. Пุฮฺ้ฮแาิุฬส. Национальный корпус русского языка 2.0: новые возможности и перспективы развития  
 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
7
N. A. Zൾඏൺ඄ඁංඇൺ, A. A. Sඁർඁංඉ඄ඈඏൺ. Asymmetry in Russian metalinguistic comparatives: Corpus and experimental evidence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
В. И. Пุฮีฯ฻฻ิส้. Скажем так: дискурсивные маркеры, восходящие к глаголам 
речи в русском языке  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
М. А. Кฺุือส฽ั. Чередование а и о в основе и прагматика распределения вариантов   . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Ю. А. Лสืฮฯฺ, Ш. Ш. Уืสฺุิุฬส. Принципы выделения местоименных серий 
(на материале адыгейских демонстративов)  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
И. А. Зาหฯฺ. Чукотские сонорные согласные в типологической перспективе . . . . . . . . 122
Обзоры
Ю. В. Нาิุีสฯฬส. «Язык и семиотика тела». Исследования Г. Е. Крейдлина по воплощенной семиотике  
 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Рецензии
Т. А. Мสำ฻สิ [Рец. на:] L. Johanson. Code Copying. The strength of languages in takeover and carry-over roles. Leiden: Brill, 2023   . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159


V O P R O S Y J A Z Y K O Z N A N I J A 
2024. № 2
Contents
Svetlana O. Sൺඏർඁඎ඄, Timofey Aඋ඄ඁൺඇ඀ൾඅඌ඄ංඒ, Anastasiya A. Bඈඇർඁ-Oඌආඈඅඈඏඌ඄ൺඒൺ, 
Ol’ga V. Dඈඇංඇൺ, Yuliya N. Kඎඓඇൾඍඌඈඏൺ, Ol’ga N. Lඒൺඌඁൾඏඌ඄ൺඒൺ, Boris V. Oඋൾ඄ඁඈඏ, 
Mariya V. Pඈൽඋඒൺൽർඁං඄ඈඏൺ. Russian National Corpus 2.0: New opportunities and 
development prospects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 
7
Natalia A. Zൾඏൺ඄ඁංඇൺ, Alina A. Sඁർඁංඉ඄ඈඏൺ. Asymmetry in Russian metalinguistic comparatives: Corpus and experimental evidence  
 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Vera I. Pඈൽඅൾඌඌ඄ൺඒൺ. Skažem tak: Discourse markers originating from verbs of speech 
in Russian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Maxim A. Kඋඈඇ඀ൺඎඓ. The alternation of stem-internal a and o and pragmatic mechanisms of alternant distribution  
 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Yuri A. Lൺඇൽൾඋ, Shamset Sh. Uඇൺඋඈ඄ඈඏൺ. Defi
 ning pronominal series: Demonstratives 
in West Circassian   . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Inna A. Sංൾൻൾඋ. Chukchi sonorant consonants in a typological perspective . . . . . . . . . . . . . 122
Overviews
Yulia V. Nං඄ඈඅൺൾඏൺ. “Language and body semiotics”. Grigory E. Kreidlin’s research 
on embodied semiotics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Reviews
Timur A. Mൺංඌൺ඄ [Review of:] L. Johanson. Code Copying. The strength of languages 
in take-over and carry-over roles. Leiden: Brill, 2023   . . . . . . . . . . . . . . . . . . . . . . . . . . 159


2024. № 2 
В О П Р О С Ы  Я З Ы К О З Н А Н И Я  
С. / Pp. 7–34
 
Voprosy Jazykoznanija
Национальный корпус русского языка 2.0:
новые возможности и перспективы развития
© 2024
Светлана Олеговна Савчук
Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; savsvetlana@mail.ru
Тимофей Александрович Архангельский
Университет Гамбурга, Гамбург, Германия; timarkh@gmail.com
Анастасия Александровна Бонч-Осмоловская
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; 
Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия;
abonch@gmail.com
Ольга Валерьевна Донина
Воронежский государственный университет, Воронеж, Россия; olga-donina@mail.ru
Юлия Николаевна Кузнецова
Московский государственный университет имени М. В. Ломоносова, Москва, Россия;
Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия;
kuznetsova.yn@gmail.com
Ольга Николаевна Ляшевская
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; 
Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; olesar@yandex.ru
Борис Валерьевич Орехов
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; 
nevmenandr@gmail.com
Мария Владимировна Подрядчикова
независимый исследователь; mpodr2015@gmail.com
Аннотация: В статье подводятся итоги проекта фундаментальной реконструкции и модернизации 
платформы Национального корпуса русского языка, осуществленного в 2020–2023 гг. В фокусе 
статьи новые возможности, которые открываются для лингвистов и более широкой аудитории, 
в частности, улучшение репрезентативности имеющихся корпусов, создание новых корпусов, 
новая разметка, полученная с помощью применения нейросетевых моделей, новые интерфейсные решения. Более детально рассматриваются три ярких новых компонента: ресурсный —  
новый корпус «Социальные сети», поисковый —  
Панхронический корпус, объединяющий поиск 
по корпусам разных периодов, и аналитический —  
функциональный комплекс статистики и визуализации данных.
Ключевые слова: квантитативная лингвистика, корпусная лингвистика, русский язык
Благодарности: Исследование проводилось в рамках работ, поддержанных грантом Министерства науки и высшего образования № 075-15-2020-793. Авторы выражают свою признательность 
за ценную помощь и плодотворное сотрудничество Д. В. Сичинаве, А. Н. Дышканту, С. Ю. Толдовой, Н. С. Горбунову, Д. А. Фурсиной, А. А. Маховой, С. В. Пискуновой, Н. Н. Буйловой, 


Вопросы языкознания 
2024. № 2
Д. Г. Бородиной, А. Д. Козеренко, И. И. Виноградовой, С. А. Гладилину, Д. А. Морозову, В. Г. Сизову, П. В. Дяченко, А. О. Казенникову, Н. А. Власовой, А. В. Глазковой, С. С. Столярову, Т. А. Гарипову, И. А. Смалю.
Для цитирования: Савчук С. О., Архангельский Т. А., Бонч-Осмоловская А. А., Донина О. В., Кузнецова Ю. Н., Ляшевская О. Н., Орехов Б. В., Подрядчикова М. В. Национальный корпус русского 
языка 2.0: новые возможности и перспективы развития. Вопросы языкознания, 2024, 2: 7–34.
DOI: 10.31857/0373-658X.2024.2.7-34
Russian National Corpus 2.0:
New opportunities and development prospects
Svetlana O. Savchuk
Vinogradov Russian Language Institute, Russian Academy of Sciences, Moscow, Russia;
savsvetlana@mail.ru
Timofey Arkhangelskiy
Hamburg University, Hamburg, Germany; timarkh@gmail.com
Anastasiya A. Bonch-Osmolovskaya
HSE University, Moscow, Russia; Kharkevich Institute for Information Transmission Problems,
Russian Academy of Sciences, Moscow, Russia; abonch@gmail.com
Ol’ga V. Donina
Voronezh State University, Voronezh, Russia; olga-donina@mail.ru
Yuliya N. Kuznetsova
Lomonosov Moscow State University, Moscow, Russia; Kharkevich Institute for Information 
Transmission Problems, Russian Academy of Sciences, Moscow, Russia; kuznetsova.yn@gmail.com
Ol’ga N. Lyashevskaya
HSE University, Moscow, Russia; Vinogradov Russian Language Institute,
Russian Academy of Sciences, Moscow, Russia; olesar@yandex.ru
Boris V. Orekhov
HSE University, Moscow, Russia; nevmenandr@gmail.com
Mariya V. Podryadchikova
independent researcher; mpodr2015@gmail.com
Abstract: The paper provides an overview of the results of the fundamental reconstruction and modernization project of the National Corpus of the Russian Language platform, carried out from 2020 to 2023. The 
focus of the paper is on the new opportunities that are opening up for linguists and a wider audience. This 
includes improving the representativeness of existing corpora, creating new corpora, new annotation obtained through the application of neural network models, and new interface solutions. Three notable new 
components are examined in more detail: a resource-related one, which is the new Social Networks corpus, a search-related one, which is the Panchronic corpus that combines searches across corpora from different periods, and an analytical one, which is the functional complex of statistics and data visualization.
Keywords: corpus linguistics, quantitative linguistics, Russian


 
 
С. О. Савчук, Т. А. Архангельский, А. А. Бонч-Осмоловская, О. В. Донина и др. 
9
Acknowledgements: The current research was a part of research work supported by the Ministry of Science and Higher Education grant No. 075-15-2020-793. The authors express their gratitude for the valuable assistance and fruitful cooperation to D. V. Sichinava, A. N. Dyshkant, S. Y. Toldova, N. S. Gorbunov, D. A. Fursina, A. A. Makhova, S. V. Piskunova, N. N. Builova, D. G. Borodina, A. D. Kozerenko, 
I. I. Vinogradova, S. A. Gladilin, D. A. Morozov, V. G. Sizov, P. V. Dyachenko, A. O. Kazennikov, 
N. A. Vlasova, A. V. Glazkova, S. S. Stolyarov, T. A. Garipov, I. A. Smal’.
For citation: Savchuk S. O., Arkhangelskiy T., Bonch-Osmolovskaya A. A., Donina O. V., Kuznetsova Yu. N., Lyashevskaya O. N., Orekhov B. V., Podryadchikova M. V. Russian National Corpus 2.0: 
New opportunities and development prospects. Voprosy Jazykoznanija, 2024, 2: 7–34.
DOI: 10.31857/0373-658X.2024.2.7-34
Введение
Национальный корпус русского языка был открыт для публичного использования 
в 2004 г. [Сичинава 2005]. За прошедшее время корпус увеличился многократно и по своим 
объемам, и по разнообразию представленных данных и типов аннотации, однако к 2020 г. 
стало понятно, что дальнейшее развитие Национального корпуса тормозится из-за накопившихся нерешенных технологических проблем: отсутствия универсальной платформы 
для развертывания лингвистических корпусов, медленной индексации и нерегулярных обновлений, ограниченности поисковых возможностей, негибкого, плохо адаптируемого интерфейса взаимодействия с корпусной базой. Кроме технологических сложностей, была 
еще и концептуальная сложность, заключавшаяся в изолированном существовании разных 
корпусов в составе НКРЯ, из-за этого процессы подготовки и загрузки данных требовали 
дополнительных усилий программистов. Накопилось и «содержательное» отставание, проявлявшееся в недостаточной репрезентативности диахронических данных основного корпуса, и явная недостаточность статистического функционала относительно современных 
стандартов корпусной лингвистики. Иными словами, в результате более чем 15 лет своего 
плодотворного развития, Национальный корпус русского языка оказался в той точке, когда 
критическим образом стали необходимы глубокие системные и концептуальные решения 
о том, как должна быть в дальнейшем организована экосистема корпуса, которая бы обеспечивала возможности по его поддержке, обновлению и внедрению современных корпусных 
технологий. В 2020 г. началась работа научного коллектива, созданного на базе консорциума пяти научных институтов и вузов и поддержанная субсидией Министерства науки и образования. Глобальной целью проекта стало создание компьютерно-лингвистической платформы нового поколения, ядром которой является Национальный корпус русского языка 
(НКРЯ). Работы по проекту были сгруппированы в три взаимосвязанных направления:
 
— инфраструктурное направление, в рамках которого была заложена программно-технологическая основа для создаваемой компьютерно-лингвистической платформы;
 
— ресурсное направление, обеспечивавшее развитие и пополнение всех корпусов платформы;
 
— научно-исследовательское направление, в котором созданная платформа была апробирована в конкретных лингвистических исследованиях.
Цель настоящей статьи —  
очертить наиболее значимые изменения, связанные с новым 
этапом развития Национального корпуса русского языка. В фокусе статьи будут в первую 
очередь новые возможности, которые открываются для лингвистов и для более широкой 
аудитории. В части 1 представлен общий краткий обзор модернизации НКРЯ, части 2, 3 
и 4 посвящены наиболее интересным и многообещающим обновлениям: новому корпусу 
«Социальные сети» (2), Панхроническому корпусу (3) и инструментам статистического 
анализа и визуализации данных (4).


Вопросы языкознания 
2024. № 2
1. Общий обзор изменений 
Национального корпуса русского языка
Работа над так называемым «Корпусом 2.0» —  
технологически и концептуально обновленным (а в части архитектуры даже пересобранным) Национальным корпусом русского 
языка —  
велась в нескольких направлениях: технической модернизации программной 
архитектуры, ресурсного пополнения и обновления данных и разметки. Эти направления тесно взаимосвязаны: без технологической перестройки корпусной платформы невозможно было выстроить процесс оперативного пополнения корпусов (каждый корпус 
раньше существовал изолированно и требовал сложной настройки), устаревшая модель 
интерфейса ограничивала возможности по развитию разметки корпусов, добавлению новых типов метаданных и новых поисковых возможностей. Принципиально важна и обратная связь —  
данные, подготовленные с помощью нового инструмента автоматической 
разметки и снятия омонимии, позволили внедрить инструменты статистического анализа. 
Таким образом, Корпус 2.0 стал мощным аналитическим инструментом и на уровне отдельных лемм (портрет слова), и на уровне их сочетаний (простых частотностей и коллокаций), и на уровне отбираемых пользователем подкорпусов (портрет подкорпуса). Ниже мы 
кратко перечислим наиболее значимые изменения, произошедшие в Корпусе на этапе 2.0.
1.1. Пополнение корпусов, новые корпуса
К концу 2022 г. общий объем коллекций текстов НКРЯ превысил 2 млрд словоупотреблений. Благодаря увеличению базы текстов корпуса на сотни миллионов слов Корпус 2.0 
теперь представляет собой наиболее полную и разнообразную коллекцию текстов на русском языке, собранную в одном месте и объединенную удобным интерфейсом.
Особое внимание было уделено улучшению показателей репрезентативности в области жанров и периодов, ранее мало представленных в Корпусе. Так, коллекции нехудожественной прозы и публицистики Основного корпуса были пополнены текстами научных 
трудов XVIII —  
начала XIX в., были добавлены документы, научные работы, описания 
путешествий, подборки мемуаров, публицистика (в том числе из журналов «Сын отечества», «Московский наблюдатель», «Вестник Европы»), тексты дневников и воспоминаний 
XIX–XXI вв. из проекта «Прожито» и др. С другой стороны, увеличена представленность 
образцов современного языка, в частности была добавлена проза XX —  
начала XXI в., 
коллекция современных путеводителей, собрание современных научных текстов разных 
жанров (тезисы, программы, учебные пособия, задачи, конспекты), коллекция производственно-технических инструкций и пособий. Коллекции Газетного корпуса расширили 
временной охват: теперь они включают хронологический диапазон с 1983 по 2021 г. Газетный корпус достиг более 800 млн словоупотреблений.
Существенно были расширены коллекции корпусов со специальной разметкой, причем принципиально важным является не только увеличение объема, но и качественные 
характеристики источников, расширение репрезентативности по параметрам, определяемым спецификой корпуса. Так, в Диалектный корпус были добавлены тексты из различных регионов и диалектных зон: северные говоры (Архангельская область), среднерусские 
(Тверская область), южнорусские (Смоленская, Тамбовская области), говоры позднего формирования (Поволжье, Урал, Сибирь). Расширение Параллельных корпусов коснулось 
не только существенного увеличения имеющихся коллекций и жанрового разнообразия 
представленных в них текстов, но и создания новых языковых пар, таких, например, как 
сербско-русская, румынско-русская, корейско-русская, хинди-русская. В Древнерусский 
корпус были добавлены знаменитые памятники русской литературы, такие как «Сказание 


Доступ онлайн
1 455 ₽
В корзину