Вопросы языкознания, 2024, № 2
научный журнал
Покупка
Новинка
Тематика:
Общие вопросы. Лингвистика
Издательство:
Наука
Наименование: Вопросы языкознания
Год издания: 2024
Кол-во страниц: 166
Дополнительно
Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
РОССИЙСКАЯ АКАДЕМИЯ НАУК Отделение историко-филологических наук ВОПРОСЫ ЯЗЫКОЗНАНИЯ Журнал основан в январе 1952 года Выходит 6 раз в год 2 МАРТ — АПРЕЛЬ Москва 2024
Главный редактор: В. А. Пีือ้ื д. ф. н., проф., академик РАН, Институт русского языка им. В. В. Виноградова РАН; Московский государственный университет им. М. В. Ломоносова Зам. главного редактора: Н. Б. Вส฿าื д. ф. н., проф., чл.-корр. РАН, Европейский университет в Санкт-Петербурге; Институт лингвистических исследований РАН В. И. Пุฮีฯิส้ д. ф. н., проф., Институт языкознания РАН Редколлегия: В. М. Аีูสุฬ д. ф. н., проф., академик РАН, Институт языкознания РАН Ю. Д. Аฺูฯ้ื д. ф. н., проф., академик РАН, Институт проблем передачи информации им. А. А. Харкевича РАН; Институт русского языка им. В. В. Виноградова РАН И. М. Бุอีสฬิาำ д. ф. н., проф., Институт проблем передачи информации им. А. А. Харкевича РАН; Мадридский политехнический университет, Испания М. Д. Вุฯำิุฬส д. ф. н., Институт лингвистических исследований РАН В. З. Дฯึๆ้ืิุฬ д. ф. н., проф., Институт языкознания РАН Д. О. Дุหฺุฬุีๆิาำ д. ф. н., проф., Институт русского языка им. В. В. Виноградова РАН; Институт языкознания РАН; Стокгольмский университет, Швеция А. Ф. Жฺสฬีผฬ д. ф. н., Институт славяноведения РАН; Московский государственный университет им. М. В. Ломоносова П. В. Иุสฮ Ph.D., Эдинбургский университет, Великобритания Н. Н. Кสัสืิาำ д. ф. н., проф., академик РАН, Институт лингвистических исследований РАН В. И. Кาึึฯีๆึสื Ph.D., Бергенский университет, Норвегия Г. И. Кุฬส д. ф. н., проф., Институт русского языка им. В. В. Виноградова РАН А. М. Мุีฮุฬสื д. ф. н., академик РАН, Институт русского языка им. В. В. Виноградова РАН М. С. Пุีาืิส้ Ph.D., проф., Мэрилендский университет, США Е. В. Рส฿าีาืส д. ф. н., проф., Национальный исследовательский университет «Высшая школа экономики»; Институт русского языка им. В. В. Виноградова РАН Я. Г. Тฯฯีฯเ д. ф. н., проф., Российский государственный гуманитарный университет; Институт языкознания РАН Л. А. Яืฮส Ph.D., проф., Университет Тромсё — Норвежский aрктический университет, Норвегия Зав. редакцией: Н. В. Гสืื Зав. отделами: А. С. Кีฯฬส, А. Д. Пุฮอฺุืส้ Отдел рецензий: М. И. Сสาืส Статьи отбираются редколлегией журнала на основе анонимного независимого рецензирования. Индексируется в: Российский индекс научного цитирования (РИНЦ); Brill Linguistic Bibliography (Online); Cambridge University Press Language Teaching (Online); De Gruyter Saur Dietrich’s Index Philosophicus; EBSCOhost MLA International Bibliography (Modern Language Association); Elsevier BV Scopus; European Reference Index for the Humanities and Social Sciences (ERIH PLUS); Gale MLA International Bibliography (Modern Language Association); ProQuest Linguistics and Language Behavior Abstracts (Online), Core; ProQuest MLA International Bibliography (Modern Language Association); Russian Science Citation Index (RSCI); Web of Science Core Collection’s Emerging Sources Citation Index (ESCI); Wiley-Blackwell Publishing Ltd. Linguistics Abstracts (Online). Адрес редакции: 119019, Москва, ул. Волхонка, 18/2, Институт русского языка им. В. В. Виноградова РАН, редакция журнала «Вопросы языкознания» Телефон: +7 495 637-25-16 E-mail: voprosy@mail.ru Сайт: https://vja.ruslang.ru © Российская академия наук, 2024 © Составление. Редколлегия журнала «Вопросы языкознания», 2024 ISSN 0373-658X
RUSSIAN ACADEMY OF SCIENCES Department of History and Philology VOPROSY JAZYKOZNANIJA (TOPICS IN THE STUDY OF LANGUAGE) Founded in January 1952 6 issues per year 2 MARCH — APRIL Moscow 2024
Editor-in-chief: Vladimir A. Pඅඎඇංൺඇ Vinogradov Russian Language Institute (RAS); Lomonosov Moscow State University, Moscow, Russia Assistant editors: Vera I. Pඈൽඅൾඌඌൺඒൺ Institute of Linguistics (RAS), Moscow, Russia Nikolai B. Vൺඁඍංඇ European University at St. Petersburg; Institute for Linguistic Studies (RAS), St. Petersburg, Russia Editorial board: Vladimir M. Aඅඉൺඍඈඏ Institute of Linguistics (RAS), Moscow, Russia Yury D. Aඉඋൾඌඃൺඇ Kharkevich Institute for Information Transmission Problems (RAS); Vinogra dov Russian Language Institute (RAS), Moscow, Russia Igor M. Bඈඎඌඅൺඏඌඒ Kharkevich Institute for Information Transmission Problems (RAS), Moscow, Russia; Universidad Politécnica de Madrid, Spain Valery Z. Dൾආඒൺඇඈඏ Institute of Linguistics (RAS), Moscow, Russia Dmitrij O. Dඈൻඋඈඏඈඅ’ඌංඃ Vinogradov Russian Language Institute (RAS); Institute of Linguistics (RAS), Moscow, Russia; Stockholm University, Sweden Pavel Iඈඌൺൽ University of Edinburgh / Oilthigh Dhùn Èideann, UK Laura A. Jൺඇൽൺ Universitetet i Tromsø: Norges arktiske universitet, Tromsø, Norway Nikolai N. Kൺඓൺඇඌඒ Institute for Linguistic Studies (RAS), St. Petersburg, Russia Vadim Kංආආൾඅආൺඇ University of Bergen, Norway Galina I. Kඎඌඍඈඏൺ Vinogradov Russian Language Institute (RAS), Moscow, Russia Aleksandr M. Mඈඅൽඈඏൺඇ Vinogradov Russian Language Institute (RAS), Moscow, Russia Maria Pඈඅංඇඌඒ University of Maryland, College Park, USA Ekaterina V. Rൺඁංඅංඇൺ HSE University; Vinogradov Rus sian Language Institute (RAS), Moscow, Russia Yakov G. Tൾඌඍൾඅൾඍඌ Russian State University for the Humanities; Institute of Linguistics (RAS), Moscow, Russia Maria D. Vඈൾංඈඏൺ Institute for Linguistic Studies (RAS), St. Petersburg, Russia Anatoly F. Zඁඎඋൺඏඅൾඏ Institute of Slavic Studies (RAS); Lomonosov Moscow State University, Moscow, Russia Managing editor: Natalia V. Gൺඇඇඎඌ Editorial staff: Anna S. Kඎඅൾඏൺ, Anastasia D. Pඈൽඈඋඇൺංൺ Review editor: Maria I. Sൺඍංඇൺ Articles are selected by the editorial board on the basis of anonymous double-blind independent peer review process. Abstracting / Indexing: Brill Linguistic Bibliography (Online); Cambridge University Press Language Teaching (Online); De Gruyter Saur Dietrich’s Index Philosophicus; EBSCOhost MLA International Bibliography (Modern Language Association); Elsevier BV Scopus; European Reference Index for the Humanities and Social Sciences (ERIH PLUS); Gale MLA International Bibliography (Modern Language Association); ProQuest Linguistics and Language Behavior Abstracts (Online), Core; ProQuest MLA International Bibliography (Modern Language Association); Rossiiskii indeks nauchnogo tsitirovaniya (RINTs); Russian Science Citation Index (RSCI); Web of Science Core Collection’s Emerging Sources Citation Index (ESCI); Wiley-Blackwell Publishing Ltd. Linguistics Abstracts (Online). Address: “Voprosy Jazykoznanija”, editorial office, Vinogradov Russian Language Institute (RAS), Volkhonka street, 18/2, Moscow, 119019, Russia Tеlephone: +7 495 637-25-16 E-mail: voprosy@mail.ru Website: https://vja.ruslang.ru ISSN 0373-658X
2024. № 2 В О П Р О С Ы Я З Ы К О З Н А Н И Я 5 Содержание С. О. Сสฬแิ, Т. А. Аฺ฿สือฯีๆิาำ, А. А. Бุืแ-Оึุีุฬิส้, О. В. Дุืาืส, Ю. Н. Кัืฯเุฬส, О. Н. Л้โฯฬิส้, Б. В. Оฺฯ฿ุฬ, М. В. Пุฮฺ้ฮแาิุฬส. Национальный корпус русского языка 2.0: новые возможности и перспективы развития . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 N. A. Zൾඏൺඁංඇൺ, A. A. Sඁർඁංඉඈඏൺ. Asymmetry in Russian metalinguistic comparatives: Corpus and experimental evidence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 В. И. Пุฮีฯิส้. Скажем так: дискурсивные маркеры, восходящие к глаголам речи в русском языке . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 М. А. Кฺุือสั. Чередование а и о в основе и прагматика распределения вариантов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Ю. А. Лสืฮฯฺ, Ш. Ш. Уืสฺุิุฬส. Принципы выделения местоименных серий (на материале адыгейских демонстративов) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 И. А. Зาหฯฺ. Чукотские сонорные согласные в типологической перспективе . . . . . . . . 122 Обзоры Ю. В. Нาิุีสฯฬส. «Язык и семиотика тела». Исследования Г. Е. Крейдлина по воплощенной семиотике . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 Рецензии Т. А. Мสำสิ [Рец. на:] L. Johanson. Code Copying. The strength of languages in takeover and carry-over roles. Leiden: Brill, 2023 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
V O P R O S Y J A Z Y K O Z N A N I J A 2024. № 2 Contents Svetlana O. Sൺඏർඁඎ, Timofey Aඋඁൺඇൾඅඌංඒ, Anastasiya A. Bඈඇർඁ-Oඌආඈඅඈඏඌൺඒൺ, Ol’ga V. Dඈඇංඇൺ, Yuliya N. Kඎඓඇൾඍඌඈඏൺ, Ol’ga N. Lඒൺඌඁൾඏඌൺඒൺ, Boris V. Oඋൾඁඈඏ, Mariya V. Pඈൽඋඒൺൽർඁංඈඏൺ. Russian National Corpus 2.0: New opportunities and development prospects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Natalia A. Zൾඏൺඁංඇൺ, Alina A. Sඁർඁංඉඈඏൺ. Asymmetry in Russian metalinguistic comparatives: Corpus and experimental evidence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Vera I. Pඈൽඅൾඌඌൺඒൺ. Skažem tak: Discourse markers originating from verbs of speech in Russian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Maxim A. Kඋඈඇൺඎඓ. The alternation of stem-internal a and o and pragmatic mechanisms of alternant distribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Yuri A. Lൺඇൽൾඋ, Shamset Sh. Uඇൺඋඈඈඏൺ. Defi ning pronominal series: Demonstratives in West Circassian . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Inna A. Sංൾൻൾඋ. Chukchi sonorant consonants in a typological perspective . . . . . . . . . . . . . 122 Overviews Yulia V. Nංඈඅൺൾඏൺ. “Language and body semiotics”. Grigory E. Kreidlin’s research on embodied semiotics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 Reviews Timur A. Mൺංඌൺ [Review of:] L. Johanson. Code Copying. The strength of languages in take-over and carry-over roles. Leiden: Brill, 2023 . . . . . . . . . . . . . . . . . . . . . . . . . . 159
2024. № 2 В О П Р О С Ы Я З Ы К О З Н А Н И Я С. / Pp. 7–34 Voprosy Jazykoznanija Национальный корпус русского языка 2.0: новые возможности и перспективы развития © 2024 Светлана Олеговна Савчук Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; savsvetlana@mail.ru Тимофей Александрович Архангельский Университет Гамбурга, Гамбург, Германия; timarkh@gmail.com Анастасия Александровна Бонч-Осмоловская Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия; abonch@gmail.com Ольга Валерьевна Донина Воронежский государственный университет, Воронеж, Россия; olga-donina@mail.ru Юлия Николаевна Кузнецова Московский государственный университет имени М. В. Ломоносова, Москва, Россия; Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия; kuznetsova.yn@gmail.com Ольга Николаевна Ляшевская Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; olesar@yandex.ru Борис Валерьевич Орехов Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; nevmenandr@gmail.com Мария Владимировна Подрядчикова независимый исследователь; mpodr2015@gmail.com Аннотация: В статье подводятся итоги проекта фундаментальной реконструкции и модернизации платформы Национального корпуса русского языка, осуществленного в 2020–2023 гг. В фокусе статьи новые возможности, которые открываются для лингвистов и более широкой аудитории, в частности, улучшение репрезентативности имеющихся корпусов, создание новых корпусов, новая разметка, полученная с помощью применения нейросетевых моделей, новые интерфейсные решения. Более детально рассматриваются три ярких новых компонента: ресурсный — новый корпус «Социальные сети», поисковый — Панхронический корпус, объединяющий поиск по корпусам разных периодов, и аналитический — функциональный комплекс статистики и визуализации данных. Ключевые слова: квантитативная лингвистика, корпусная лингвистика, русский язык Благодарности: Исследование проводилось в рамках работ, поддержанных грантом Министерства науки и высшего образования № 075-15-2020-793. Авторы выражают свою признательность за ценную помощь и плодотворное сотрудничество Д. В. Сичинаве, А. Н. Дышканту, С. Ю. Толдовой, Н. С. Горбунову, Д. А. Фурсиной, А. А. Маховой, С. В. Пискуновой, Н. Н. Буйловой,
Вопросы языкознания 2024. № 2 Д. Г. Бородиной, А. Д. Козеренко, И. И. Виноградовой, С. А. Гладилину, Д. А. Морозову, В. Г. Сизову, П. В. Дяченко, А. О. Казенникову, Н. А. Власовой, А. В. Глазковой, С. С. Столярову, Т. А. Гарипову, И. А. Смалю. Для цитирования: Савчук С. О., Архангельский Т. А., Бонч-Осмоловская А. А., Донина О. В., Кузнецова Ю. Н., Ляшевская О. Н., Орехов Б. В., Подрядчикова М. В. Национальный корпус русского языка 2.0: новые возможности и перспективы развития. Вопросы языкознания, 2024, 2: 7–34. DOI: 10.31857/0373-658X.2024.2.7-34 Russian National Corpus 2.0: New opportunities and development prospects Svetlana O. Savchuk Vinogradov Russian Language Institute, Russian Academy of Sciences, Moscow, Russia; savsvetlana@mail.ru Timofey Arkhangelskiy Hamburg University, Hamburg, Germany; timarkh@gmail.com Anastasiya A. Bonch-Osmolovskaya HSE University, Moscow, Russia; Kharkevich Institute for Information Transmission Problems, Russian Academy of Sciences, Moscow, Russia; abonch@gmail.com Ol’ga V. Donina Voronezh State University, Voronezh, Russia; olga-donina@mail.ru Yuliya N. Kuznetsova Lomonosov Moscow State University, Moscow, Russia; Kharkevich Institute for Information Transmission Problems, Russian Academy of Sciences, Moscow, Russia; kuznetsova.yn@gmail.com Ol’ga N. Lyashevskaya HSE University, Moscow, Russia; Vinogradov Russian Language Institute, Russian Academy of Sciences, Moscow, Russia; olesar@yandex.ru Boris V. Orekhov HSE University, Moscow, Russia; nevmenandr@gmail.com Mariya V. Podryadchikova independent researcher; mpodr2015@gmail.com Abstract: The paper provides an overview of the results of the fundamental reconstruction and modernization project of the National Corpus of the Russian Language platform, carried out from 2020 to 2023. The focus of the paper is on the new opportunities that are opening up for linguists and a wider audience. This includes improving the representativeness of existing corpora, creating new corpora, new annotation obtained through the application of neural network models, and new interface solutions. Three notable new components are examined in more detail: a resource-related one, which is the new Social Networks corpus, a search-related one, which is the Panchronic corpus that combines searches across corpora from different periods, and an analytical one, which is the functional complex of statistics and data visualization. Keywords: corpus linguistics, quantitative linguistics, Russian
С. О. Савчук, Т. А. Архангельский, А. А. Бонч-Осмоловская, О. В. Донина и др. 9 Acknowledgements: The current research was a part of research work supported by the Ministry of Science and Higher Education grant No. 075-15-2020-793. The authors express their gratitude for the valuable assistance and fruitful cooperation to D. V. Sichinava, A. N. Dyshkant, S. Y. Toldova, N. S. Gorbunov, D. A. Fursina, A. A. Makhova, S. V. Piskunova, N. N. Builova, D. G. Borodina, A. D. Kozerenko, I. I. Vinogradova, S. A. Gladilin, D. A. Morozov, V. G. Sizov, P. V. Dyachenko, A. O. Kazennikov, N. A. Vlasova, A. V. Glazkova, S. S. Stolyarov, T. A. Garipov, I. A. Smal’. For citation: Savchuk S. O., Arkhangelskiy T., Bonch-Osmolovskaya A. A., Donina O. V., Kuznetsova Yu. N., Lyashevskaya O. N., Orekhov B. V., Podryadchikova M. V. Russian National Corpus 2.0: New opportunities and development prospects. Voprosy Jazykoznanija, 2024, 2: 7–34. DOI: 10.31857/0373-658X.2024.2.7-34 Введение Национальный корпус русского языка был открыт для публичного использования в 2004 г. [Сичинава 2005]. За прошедшее время корпус увеличился многократно и по своим объемам, и по разнообразию представленных данных и типов аннотации, однако к 2020 г. стало понятно, что дальнейшее развитие Национального корпуса тормозится из-за накопившихся нерешенных технологических проблем: отсутствия универсальной платформы для развертывания лингвистических корпусов, медленной индексации и нерегулярных обновлений, ограниченности поисковых возможностей, негибкого, плохо адаптируемого интерфейса взаимодействия с корпусной базой. Кроме технологических сложностей, была еще и концептуальная сложность, заключавшаяся в изолированном существовании разных корпусов в составе НКРЯ, из-за этого процессы подготовки и загрузки данных требовали дополнительных усилий программистов. Накопилось и «содержательное» отставание, проявлявшееся в недостаточной репрезентативности диахронических данных основного корпуса, и явная недостаточность статистического функционала относительно современных стандартов корпусной лингвистики. Иными словами, в результате более чем 15 лет своего плодотворного развития, Национальный корпус русского языка оказался в той точке, когда критическим образом стали необходимы глубокие системные и концептуальные решения о том, как должна быть в дальнейшем организована экосистема корпуса, которая бы обеспечивала возможности по его поддержке, обновлению и внедрению современных корпусных технологий. В 2020 г. началась работа научного коллектива, созданного на базе консорциума пяти научных институтов и вузов и поддержанная субсидией Министерства науки и образования. Глобальной целью проекта стало создание компьютерно-лингвистической платформы нового поколения, ядром которой является Национальный корпус русского языка (НКРЯ). Работы по проекту были сгруппированы в три взаимосвязанных направления: — инфраструктурное направление, в рамках которого была заложена программно-технологическая основа для создаваемой компьютерно-лингвистической платформы; — ресурсное направление, обеспечивавшее развитие и пополнение всех корпусов платформы; — научно-исследовательское направление, в котором созданная платформа была апробирована в конкретных лингвистических исследованиях. Цель настоящей статьи — очертить наиболее значимые изменения, связанные с новым этапом развития Национального корпуса русского языка. В фокусе статьи будут в первую очередь новые возможности, которые открываются для лингвистов и для более широкой аудитории. В части 1 представлен общий краткий обзор модернизации НКРЯ, части 2, 3 и 4 посвящены наиболее интересным и многообещающим обновлениям: новому корпусу «Социальные сети» (2), Панхроническому корпусу (3) и инструментам статистического анализа и визуализации данных (4).
Вопросы языкознания 2024. № 2 1. Общий обзор изменений Национального корпуса русского языка Работа над так называемым «Корпусом 2.0» — технологически и концептуально обновленным (а в части архитектуры даже пересобранным) Национальным корпусом русского языка — велась в нескольких направлениях: технической модернизации программной архитектуры, ресурсного пополнения и обновления данных и разметки. Эти направления тесно взаимосвязаны: без технологической перестройки корпусной платформы невозможно было выстроить процесс оперативного пополнения корпусов (каждый корпус раньше существовал изолированно и требовал сложной настройки), устаревшая модель интерфейса ограничивала возможности по развитию разметки корпусов, добавлению новых типов метаданных и новых поисковых возможностей. Принципиально важна и обратная связь — данные, подготовленные с помощью нового инструмента автоматической разметки и снятия омонимии, позволили внедрить инструменты статистического анализа. Таким образом, Корпус 2.0 стал мощным аналитическим инструментом и на уровне отдельных лемм (портрет слова), и на уровне их сочетаний (простых частотностей и коллокаций), и на уровне отбираемых пользователем подкорпусов (портрет подкорпуса). Ниже мы кратко перечислим наиболее значимые изменения, произошедшие в Корпусе на этапе 2.0. 1.1. Пополнение корпусов, новые корпуса К концу 2022 г. общий объем коллекций текстов НКРЯ превысил 2 млрд словоупотреблений. Благодаря увеличению базы текстов корпуса на сотни миллионов слов Корпус 2.0 теперь представляет собой наиболее полную и разнообразную коллекцию текстов на русском языке, собранную в одном месте и объединенную удобным интерфейсом. Особое внимание было уделено улучшению показателей репрезентативности в области жанров и периодов, ранее мало представленных в Корпусе. Так, коллекции нехудожественной прозы и публицистики Основного корпуса были пополнены текстами научных трудов XVIII — начала XIX в., были добавлены документы, научные работы, описания путешествий, подборки мемуаров, публицистика (в том числе из журналов «Сын отечества», «Московский наблюдатель», «Вестник Европы»), тексты дневников и воспоминаний XIX–XXI вв. из проекта «Прожито» и др. С другой стороны, увеличена представленность образцов современного языка, в частности была добавлена проза XX — начала XXI в., коллекция современных путеводителей, собрание современных научных текстов разных жанров (тезисы, программы, учебные пособия, задачи, конспекты), коллекция производственно-технических инструкций и пособий. Коллекции Газетного корпуса расширили временной охват: теперь они включают хронологический диапазон с 1983 по 2021 г. Газетный корпус достиг более 800 млн словоупотреблений. Существенно были расширены коллекции корпусов со специальной разметкой, причем принципиально важным является не только увеличение объема, но и качественные характеристики источников, расширение репрезентативности по параметрам, определяемым спецификой корпуса. Так, в Диалектный корпус были добавлены тексты из различных регионов и диалектных зон: северные говоры (Архангельская область), среднерусские (Тверская область), южнорусские (Смоленская, Тамбовская области), говоры позднего формирования (Поволжье, Урал, Сибирь). Расширение Параллельных корпусов коснулось не только существенного увеличения имеющихся коллекций и жанрового разнообразия представленных в них текстов, но и создания новых языковых пар, таких, например, как сербско-русская, румынско-русская, корейско-русская, хинди-русская. В Древнерусский корпус были добавлены знаменитые памятники русской литературы, такие как «Сказание