Линейные и нелинейные средства обеспечения связности в языке и смысловая плотность текста
Покупка
Новинка
Издательство:
Санкт-Петербургский государственный университет
Авторы:
Касевич Вадим Борисович, Аврутина Аполлинария Сергеевна, Берникова Ольга Александровна, Гроховский Павел Леонович, Емельченкова Елена Николаевна, Костина Екатерина Александровна, Лакунина Дарья Игоревна, Лебедева Юлия Владимировна, Мазарчук Анна Владимировна, Мовшович Евгения Игоревна, Новикова М. Ф., Розов Владимир Андреевич, Ягунова Елена Викторовна
Год издания: 2024
Кол-во страниц: 422
Дополнительно
Вид издания:
Монография
Уровень образования:
ВО - Магистратура
ISBN: 978-5-288-06379-4
Артикул: 848609.01.99
В коллективной монографии на материале ряда языков исследуются актуальные проблемы синтаксиса и семантики текста. Существенно раздвигая рамки, очерченные в ранних работах Э. Сэпира, Дж. Гринберга, В. Б. Касевича и С. Е. Яхонтова, авторы показывают сложные системные факторы, влияющие на тип и степень целостности и связности текста, впервые распространяя структурно-квантитативный подход на анализ процессов речевой деятельности. Предлагается принципиально новая трактовка категории дискурсивных слов, иконичности текста и других. Для лингвистов-типологов, филологов-востоковедов, специалистов по общему языкознанию.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЛИНЕЙНЫЕ И НЕЛИНЕЙНЫЕ СРЕДСТВА ОБЕСПЕЧЕНИЯ СВЯЗНОСТИ В ЯЗЫКЕ И СМЫСЛОВАЯ ПЛОТНОСТЬ ТЕКСТА Под редакцией В.Б.Касевича, Е.Н.Емельченковой и Е.А.Костиной ИЗДАТЕЛЬСТВО САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
УДК 81'33 ББК 81.1 Л59 Рец ен з енты: д-р филол. наук, проф. И.В.Недялков (С.-Петерб. гос. ун-т); д-р филол. наук, проф. Е.В.Ерофеева (Перм. гос. нац. исследоват. ун-т) О т в е т с т в е н н ы е р е д а к т о р ы : д-р филол. наук, проф. В.Б.Касевич канд. филол. наук, доц. Е.Н.Емельченкова ст. преп. Е.А.Костина А в т о р с к и й к о л л е к т и в : В.Б.Касевич , А.С.Аврутина, О.А.Берникова, П.Л.Гроховский, Е.Н.Емельченкова Е.А.Костина, Д.И.Лакунина, Ю.В.Лебедева, А.В.Мазарчук, Е.И.Мовшович, М.Ф.Новикова, В.А.Розов, Е.В.Ягунова Рекомендовано к публикации Научной комиссией в области наук о языках и литературе Санкт-Петербургского государственного университета Л59 Линейные и нелинейные средства обеспечения связности в языке и смысловая плотность текста / под ред. В.Б.Касевича, Е.Н.Емельченковой и Е.А.Костиной. — СПб.: Изд-во С.-Петерб. ун-та, 2024. — 420 с. ISBN 978-5-288-06379-4 В коллективной монографии на материале ряда языков исследуются актуальные проблемы синтаксиса и семантики текста. Существенно раздвигая рамки, очерченные в ранних работах Э.Сэпира, Дж.Гринберга, В.Б.Касевича и С.Е.Яхонтова, авторы показывают сложные системные факторы, влияющие на тип и степень целостности и связности текста, впервые распространяя структурно-квантитативный подход на анализ процессов речевой деятельности. Предлагается принципиально новая трактовка категории дискурсивных слов, иконичности текста и других. Для лингвистов-типологов, филологов-востоковедов, специалистов по общему языкознанию. УДК 81'33 ББК 81.1 Проект — победитель по результатам ежегодного открытого конкурса научных изданий СПбГУ «Конкурс монографий — 2020» © Санкт-Петербургский государственный ISBN 978-5-288-06379-4 университет, 2024
Оглавление Предисловие. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Общие замечания . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – Характеристика исследуемых текстов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Глава 1. Системные способы обеспечения связности языковых единиц. Фоновая связность . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.1. Общие положения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 1.2. Теоретические предпосылки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 1.3. Некоторые функционально близкие экспериментальные методики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1.4. Нелинейное предсказание в сравнении с линейным . . . . . . . . . . . 36 1.5. Некоторые варианты использования методики линейного прогнозирования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 1.6. Возможный вариант экспериментальной методики с использованием звуковой составляющей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 1.7. Экспериментальные данные . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 1.8. Развитие предложенной экспериментальной методики. Некоторые теоретические следствия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 Глава 2. Тема-рематические и информационные структуры: системные модели, речевые реализации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 2.1. Общие положения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 2.2. Темы клауз и критерии их выделения. Тема и рема в каждой клаузе . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2.3. Развитие темы в динамике . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.4. Иерархия тем. Привязка персонажей . . . . . . . . . . . . . . . . . . . . . . . . . 79 2.5. Типы тема-рематических прогрессий . . . . . . . . . . . . . . . . . . . . . . . . . 85 2.6. Дискурсивные слова . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Глава 3. Средства повторной номинации. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 3.1. Арабский язык . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 3.2. Бенгальский язык. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.3. Китайский язык. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 3.4. Монгольский язык. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.5. Тибетский язык. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 3.6. Японский язык . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Глава 4. Ключевые слова. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 4.1. Общие положения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 4.2. Распределение ключевых слов по сюжетным блокам текстов . . . 123 4.3. Эксперимент по восстановлению текста на основе ключевых слов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Глава 5. Количественная типология в диахронии . . . . . . . . . . . . . . . . . . . . . . . . . . 139 5.1. Общие положения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 5.2. Формирование диахронически ориентированного множества типологических индексов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 5.3. Языковой материал для апробации методики индексальной типологии в диахронии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 5.4. Общая характеристика рассматриваемого произведения и языковое новаторство его автора . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 5.5. Сравнительный анализ индексов текста на староосманском языке и текста на турецком языке . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Глава 6. Симметричность и асимметричность языковой системы . . . . . . . . . . . 151 6.1. Общие положения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . – 6.2. «Базы» языка: семантическая база . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 6.3. Количественная оценка семантической связности текста . . . . . . . 157 6.4. Симметричность/асимметричность и семантическая неоднородность текста. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 Приложение 1. Тема-рематическое членение текстов . . . . . . . . . . . . . . . . . . . . . . 179 Приложение 2. Переводы текстов, составленных носителями языка в ходе эксперимента с ключевыми словами. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407
ƹǚǏǎǒǛǕǘnjǒǏ Настоящая монография исследует проблемы, принадлежащие к широкому полю квантитативной лингвистики. Сразу же оговорим, что прежде всего нас интересует восходящая к Джозефу Гринбергу квантитативная типология языков (см.: [Greenberg, 1960; Гринберг, 1963] и др.). Именно в этой области в течение ряда лет работал на материале языков Азии и Африки исследовательский коллектив профессоров и преподавателей, аспирантов, студентов восточного факультета СПбГУ . Промежуточные результаты работы отражены в коллективных монографиях, статьях, докладах на конференциях (из последних публикаций см., например, [Касевич и др., 2016])1. В монографии развивается исследовательская парадигма, ориентированная на пионерские изыскания 1960–1980-х гг. в области, как уже сказано, квантитативной типологии языков (см. [Sapir, 1921; Greenberg, 1960; Касевич, Яхонтов (ред.), 1982; Касевич и др., 2016] и др.). Предвосхищая характеристики, более полно приведенные в основных главах книги, предварительно отметим, что по крайней мере в трех аспектах такой подход расширяет поле наших знаний в области типологии языка, речи и речевой деятельности. Первый аспект — это универсализация типологического инструментария. Если Дж.Гринберг, родоначальник квантитативной типологии, с помощью квантитативно-типологических индексов исследует почти исключительно морфологию языка, то в настоящей книге «идеологически» близкие приемы анализа позволяют существенно расширить масштаб типологических штудий, 1В некоторых работах нетрудно усмотреть путаницу между математической лингвистикой, математической статистикой и рядом других подходов в области количественной и неколичественной математики; иногда возникает впечатление, что «математика» усматривается там, где используется соответствующая символика (которая и сама иногда не имеет отношения к математике). Не рискуя углубляться в эту непростую научную сферу, скажем лишь, что математизированные разделы лингвистики есть смысл выделять там, где лингвистическая проблема ставится и разрешается математическими средствами (более «мягкий» вариант: с привлечением таковых). Что касается математической статистики, то это универсальный обслуживающий язык, придающий доказательность решениям, по сути своей вовсе не обязательно требующим привлечения количественных методов анализа.
ƹǚǏǎǒǛǕǘnjǒǏ 6 распространяя их на синтаксис, семантику, а там, где это было уместно, грамматику текста и отчасти на дискурсивно-культурные измерения речи. Второй аспект, принципиально отличающий наш подход, который можно назвать «неоквантитативным», — это отражение в модели процессов, связанных с речевой деятельностью. Иначе говоря, традиционные подходы сосредоточены на отражении статических закономерностей, на внутрисистемных отношениях языка, в то время как «неоквантитативный» добавляет к ним динамический аспект. Наконец, третий аспект инновативности — в приложении квантитативных индексов к материалам диахронии; это дает исследователю достаточно точные методы вычисления времени расхождения языков и т.п. Например, если индекс синтеза по Дж.Гринбергу (среднее число морфем на число слов в тексте, M/W) дает величину 0,5 для языка-предка и величину 1,0 для языка-потомка, то это демонстрирует, что за период наблюдения существенно — в среднем вдвое — удлинились словоформы соответствующего идиома (подробнее см. ниже). По мере выполнения проектного задания обнаружилось, что некоторые — причем важные — аспекты изучаемой проблематики не могут исследоваться сколько-нибудь полно без ответов на смежные вопросы или как минимум без эксплицитного их упоминания. Примером может служить индекс иконичности: по нашим представлениям, иконические конструкции в процессах восприятия речи обрабатываются быстрее, чем неиконические (не требуя дополнительной семантической процедуры по установлению изоморфности семантики и синтаксиса). Обеспечить достаточное проникновение в данную проблему пока не удалось, но можно сказать, что она была включена в область стратегического планирования. Приведем некоторые предварительные соображения, связанные с эмпирической базой исследования. 1. Хотя эмпирическая база характеризуется некоторыми объективно неустранимыми слабостями, она все же поддается усовершенствованию. Так, чтобы преодолеть возможные различия, связанные с разной трактовкой лингвистического понятия слова, авторы монографии избрали единицей измерения длины (длительности) текста слог, а не слово; «основной текст», как согласились авторы именовать текстовый фрагмент, участвовавший во всех (или почти во всех) типологических операциях, составлял 5–6 тыс. слогов для всех языков. 2. Для сравнимости текстов было решено избрать в качестве основного текста событийный нарратив. Под событийным нарративом здесь понимается текст, отображающий некоторые последовательные события. 3. «Ответственным» за каждый из языков-объектов назначался специалист в области этого языка, в необходимых случаях привлекались носители языка.
ƹǚǏǎǒǛǕǘnjǒǏ 7 4. В отдельных случаях в качестве материала анализа использовались параллельные (переводные) тексты, что предположительно повышало степень сравнимости текстов. Перечислим вовлеченные в анализ языки, а также «ответственных» за них исследователей: • арабский: Ольга Александровна Берникова, доцент, кандидат филологических наук, доцент кафедры арабской филологии, Научная лаборатория анализа и моделирования социальных процессов, СПбГУ; Владимир Андреевич Розов, кандидат филологических наук, старший преподаватель кафедры арабской филологии, Научная лаборатория анализа и моделирования социальных процессов, СПбГУ; • бенгальский: Екатерина Александровна Костина, старший преподаватель, кафедра индийской филологии, СПбГУ; • китайский: Евгения Игоревна Мовшович, аспирант кафедры теории и методики преподавания языков и культур Азии и Африки, СПбГУ; Елена Николаевна Емельченкова, кандидат филологических наук, доцент, заведующая кафедрой теории и методики преподавания языков и культур Азии и Африки, СПбГУ; • монгольский: Наталья Сергеевна Яхонтова, кандидат филологических наук, доцент кафедры монголоведения и тибетологии СПбГУ , старший научный сотрудник сектора тюркологии и монголистики Института восточных рукописей РАН; Анна Владимировна Мазарчук, младший научный сотрудник Института лингвистических исследований РАН; • тибетский современный: Павел Леонович Гроховский (1972–2018), кандидат филологических наук, доцент кафедры монголоведения и тибетологии, СПбГУ; Юлия Николаевна Лебедева, во время проекта обучающаяся, СПбГУ; • японский: Дарья Игоревна Лакунина, во время проекта обучающаяся, СПбГУ2. Большинство представленных языков используют собственную графику, однако для удобства восприятия в данной монографии тексты цитируются в латинской или кириллической транслитерации в соответствии с традициями, принятыми в соответствующей отрасли востоковедения. К сожалению, по разным причинам не все языки были проанализированы с равной глубиной; эти различия в большинстве случаев очевидны и специально не оговариваются. 2На финальном этапе подготовки полученных результатов в виде коллективной монографии к работе с языковым материалом также привлекались и другие специалисты по соответствующим языкам: Смирнова Мария Олеговна, кандидат филологических наук, доцент кафедры монголоведения и тибетологии, СПбГУ; Шишкин Валерий Андреевич, во время проекта обучающийся, СПбГУ . Коллектив авторов выражает свою благодарность коллегам за помощь в работе с материалом.
ƹǚǏǎǒǛǕǘnjǒǏ 8 Так как диалог и монолог существенно отличны один от другого грамматикой, из повествовательных текстов были механически удалены диалоги, но преимущественно сохранены отдельные реплики и монологи персонажей. Монография состоит из предисловия, введения, шести глав и заключения. Глава 1 имеет вводный характер, в ней анализируются базовые средства обеспечения связности языковых единиц и вопросы валентности, а также излагаются результаты экспериментов, выполненных Марией Федоровной Новиковой на материале русского и испанского языков. В главе 2 рассматриваются тема-рематическая структура формирующих текст клауз, развитие темы в динамике, а также типы тема-рематических последовательностей. Здесь же содержатся описание и классификация дискурсивных слов, способствующих обеспечению связности текста в шести рассматриваемых языках. Глава 3 посвящена средствам повторной номинации и типам анафоры: именной, прономинальной и нулевой. Глава 4 обращается к понятию «ключевые слова». Здесь рассматривается распределение ключевых слов по различным сюжетным блокам текстов, а также приводятся результаты экспериментов по восстановлению текста на основе списка ключевых слов. В главе 5 на основе сопоставления текстов на староосманском и турецком языках производится анализ типологических индексов в диахронии (идея такого анализа возникла у Аполлинарии Сергеевны Аврутиной, доктора филологических наук, профессора кафедры теории и методики преподавания языков и культур Азии и Африки СПбГУ). Глава 6, написанная при участии Елены Викторовны Ягуновой, доктора филологических наук, профессора кафедры междисциплинарных исследований в области языков и литературы СПбГУ , затрагивает вопросы симметричности и асимметричности языковой системы и иллюстрирует возможность количественной оценки семантической связности текста. Особый интерес представляют приложения, иллюстрирующие полученные в ходе исследования языковые данные. Приложение 1 отражает тема-рематическое членение нарративных текстов на языках, с которыми работали авторы. Приложение 2 содержит переводы текстов, составленных носителями в ходе эксперимента с ключевыми словами, дающие представление о специфике формирования смысловой и композиционной структуры текста. В проекте на разных этапах его реализации принимали участие разные ученые, преподаватели и учащиеся из СПбГУ . Вдохновителем и бессменным руководителем исследования выступил доктор филологических наук, почетный профессор Вадим Борисович Касевич (1941–2023), заведовавший кафедрой теории и методики преподавания языков и культур Азии и Африки СПбГУ . Эта книга адресована востоковедам, но может оказаться интересна как профессиональным лингвистам, так и лицам, изучающим представленные в монографии языки. Полученные в ходе исследования данные могут быть также полезны для специалистов по типологии языков и лингвистике текста.
ƬnjǏǎǏǗǒǏ ƸNjǣǒǏǑNJǖǏǡNJǗǒǩ К Фердинанду де Соссюру восходят ключевые понятия, тем или иным образом фигурирующие в названии настоящей монографии. На линейность речи (текста) ссылался сам Соссюр [Saussure, 1916]. Большая или меньшая плотность текста предполагает возможность количественного подхода, измерения, а один из тезисов Н.С.Трубецкого — «язык лежит вне меры и числа» [Трубецкой, 1960, с.15]. Иначе говоря, название монографии в данном случае входит в прямое противоречие с одним из кардинальных постулатов соссюрианства. Использование количественных методов в лингвистике развивается синусоидально: если для Соссюра, как мы только что отметили, существенно подчеркивать неколичественность системно-языковых отношений, то для более поздних работ характерным было бурное вторжение количественных методов в самые разные сферы языкознания. Этого энтузиазма хватило ненадолго — в почти тотальном увлечении квантитативными сюжетами в лингвистике и в целом в гуманитарных и социальных науках обнаружилось множество изъянов, и был выявлен «квантитативный кризис» (quantitative crisis), который усматривался в следующем: • невоспроизводимость полученных результатов, например когда оригинальные данные и аналитические процедуры оказываются недоступными; • умножение непроверенных данных (false-positive findings) в научных публикациях; • придание слишком большого веса конкретным «авторитетным» результатам, в том числе влиятельным теориям, а иногда и целым исследовательским парадигмам, лежащим в основе используемой теории; • недостаточная прозрачность методологии и аналитического аппарата; • пренебрежение повторными исследованиями, якобы неоригинальными (и непрестижными), несмотря на потенциальную возможность встроить их в дальнейшем в общую перспективу [Fedriani, Sansò, 2017, p.1].
ƬnjǏǎǏǗǒǏ 10 Начнем с материалов и методики исследования. Дж.Гринберг исследовал небольшие (по 100 слов) фрагменты текста (безотносительно к его связности), на выходе же он получал типологические характеристики соответствующего языка. При этом по умолчанию предполагалось, что тексты в некоторых существенных отношениях однородны (что неочевидно) и, по-видимому, все авторы экспериментальных текстов тоже, иначе говоря, все привлекаемые носители языков характеризуются одним и тем же уровнем языковой компетенции (что очевидно еще менее). Ясно, что решение указанных вопросов каким-то образом влияет на величины типологических индексов, но не очень ясно, как на эти вопросы отвечать. Не спасает ситуацию и попытка обращения к методике социологического анализа, которую предпринимает Джоан Байби [Bybee, 1985]. Чтобы минимизировать искажающее влияние контекстов разного рода, Байби формирует универсальную репрезентативную выборку, где ни одна произвольная пара языков не является связанной ни генетически, ни ареально. Но именно такая группировка языков с учетом их равноудаленности друг от друга приводит к тому, что внутри выборки оказываются и достаточно хорошо изученные языки (английский, французский и т.п.), и языки, до сих пор известные по «миссионерским» грамматикам (шона, чинские и т.п.). Эта вполне «внешняя» причина, безусловно, затрудняет их сравнение. В известном смысле даже удивляет тот факт, что, несмотря на очевидно разнородный материал, Байби удалось получить внушающие доверие и в ряде случаев нетривиальные результаты. Продолжая обсуждать проблемы эмпирической базы исследования, стоит еще раз напомнить, что в первых публикациях Дж.Гринберга [Greenberg, 1960] все типологические индексы вычислялись для фрагмента текста объемом в 100 слов. Снова приходится с удивлением констатировать, что, несмотря на более чем скромный объем материала, большинство индексов отнюдь не производят впечатления случайных. Наблюдаемая картина, скорее всего, объясняется тем, что исследователи использовали в качестве объекта анализа текст, который (при определенном огрублении и при определенной трактовке понятия слова) можно представить как упорядоченное множество словоформ (подробнее см. далее). Несколько рискованным выглядит и выбор слóва как знаменателя дробей, которыми являются индексы: слово «славится» своей неопределенностью и разными подходами к нему в рамках тех или иных лингвистических традиций. При рассмотрении ряда средств обеспечения связности авторы учитывали структурные особенности текста и набор персонажей рассказа; в связи с этим представляется необходимым вкратце охарактеризовать исследуемый материал.