Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Контент-анализ документов

Покупка
Новинка
Артикул: 835331.01.99
Доступ онлайн
164 ₽
В корзину
В данном учебном пособии подробно рассмотрены принципы и технология применения контент-анализа в исследовании социальной действительности. Раскрываются особенности практического использования метода для изучения политических, педагогических и психологических ситуаций. Особое внимание уделяется возможностям автоматизации процедур контент-анализа. Пособие предназначено для студентов, занимающихся научно-исследовательской работой и желающих расширить границы своих универсальных компетенций способностью осуществлять контент-анализ документов для решения поставленных профессиональных задач. Данное пособие целесообразно использовать при подготовке студентов, обучающихся по направлениям 39.03.01 Социология, 44.03.05 Педагогическое образование (Обществознание и финансовая грамотность), 41.03.06 Публичная политика, 48.03.01 Теология в рамках дисциплин, связанных с научно-проектной и научно-исследовательской деятельностью: «Методология и методы социологического исследования», «Контент-анализ документов», «Методология теологического научного исследования».
Караваева, Ю. В. Контент-анализ документов : учебное пособие / Ю. В. Караваева, С. В. Литвинова. - Липецк : ЛГПУ имени П. П. Семёнова-Тян-Шанского, 2020. - 82 с. - ISBN 978-5-907335-12-7. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2158029 (дата обращения: 08.07.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
 
 
 
 

 

 

 

 

 

 

 

Ю.В. Караваева, С.В. Литвинова 

 

КОНТЕНТ-АНАЛИЗ ДОКУМЕНТОВ 

 

Учебное пособие 

 

 

 

 

 

 

 

 

 

 

 

 

 

Липецк – 2020 

 

 

 

 

МИНИСТЕРСТВО ПРОСВЕЩЕНИЯ РФ 

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ 

ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ 

«ЛИПЕЦКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ 

УНИВЕРСИТЕТ ИМЕНИ П.П. СЕМЕНОВА-ТЯН-ШАНСКОГО» 

 
 

КАФЕДРА ФИЛОСОФИИ, СОЦИОЛОГИИ И ТЕОЛОГИИ 

 
 
 
 
 
 
 
 

Ю.В. Караваева, С.В. Литвинова  

 

КОНТЕНТ-АНАЛИЗ ДОКУМЕНТОВ 
 

Учебное пособие 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Липецк – 2020 

 

 

 
УДК 316
ББК 74.58
К 21

Рекомендовано к печати кафедрой философии, социологии и теологии ЛГПУ имени 
П.П. Семенова-Тян-Шанского.
Протокол № 7 от 6 июля 2020 года

 
 

Караваева, Ю.В. 
Контент-анализ документов: учебное пособие / Ю.В. Караваева, 

С.В. Литвинова. – Липецк: ЛГПУ имени П.П. Семенова-Тян-Шанского, 2020. – 
82 с. 

 
ISBN 978-5-907335-12-7 
 
В данном учебном пособии подробно рассмотрены принципы и технология 

применения контент-анализа в исследовании социальной действительности. 
Раскрываются особенности практического использования метода для изучения 
политических, педагогических и психологических ситуаций. Особое внимание 
уделяется возможностям автоматизации процедур контент-анализа. 

Пособие 
предназначено 
для 
студентов, 
занимающихся 
научно
исследовательской работой и желающих расширить границы своих универсальных компетенций способностью осуществлять контент-анализ документов 
для решения поставленных профессиональных задач. Данное пособие целесообразно использовать при подготовке студентов, обучающихся по направлениям 39.03.01 Социология, 44.03.05 Педагогическое образование (Обществознание и финансовая грамотность), 41.03.06 Публичная политика, 48.03.01 
Теология в рамках дисциплин, связанных с научно-проектной и научноисследовательской деятельностью: «Методология и методы социологического 
исследования», «Контент-анализ документов», «Методология теологического 
научного исследования». 

УДК 316 
ББК 74.58 
К 21 

 
Рецензенты: Д.В. Катаев, профессор, доктор социологических наук ЛГПУ  

имени П.П. Семенова-Тян-Шанского 
П.И. Литвинов, руководитель службы сопровождения систем документооборота ООО «ИС-Сервис» 

 
 

© ФГБОУ ВО «Липецкий государственный педагогический университет имени 
П.П. Семенова-Тян-Шанского», 2020 
© Ю.В. Караваева, С.В. Литвинова, 2020 

ОГЛАВЛЕНИЕ 

 
ПРЕДИСЛОВИЕ .......................................................................................................... 4 
1. ТЕКСТ КАК ОБЪЕКТ ИССЛЕДОВАНИЯ .......................................................... 5 
2. КОЛИЧЕСТВЕННЫЕ ПАРАМЕТРЫ ТЕКСТА .................................................. 8 
3. ОСНОВЫ ИСПОЛЬЗОВАНИЯ КОНТЕНТ-АНАЛИЗА ................................... 10 
4. ТЕХНОЛОГИЯ КОНТЕНТ-АНАЛИЗА .............................................................. 19 
5. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ КОНТЕНТ-АНАЛИЗА ............................ 36 
6. ПРАКТИКУМ ПО КУРСУ КОНТЕНТ-АНАЛИЗ ............................................. 56 
ЗАКЛЮЧЕНИЕ ......................................................................................................... 77 
СПИСОК ЛИТЕРАТУРЫ: ........................................................................................ 78 

ПРЕДИСЛОВИЕ 

В данном учебном пособии представлены материалы для формирования 

компетенции специалистов в области формирования их системного и критического мышления, предполагающей способности осуществлять поиск, критический анализ и синтез информации, применять системный подход для решения 
профессионально значимых задач. В настоящее время значимость информации 
для осуществления любой профессиональной деятельности растет в силу общей 
интеллектуализации жизни современного человека, в связи с развитием процессов информатизации социальной сферы. От профессионала требуется владение 
методами и средствами отбора, анализа, обработки и интерпретации информации, представленной в различных формах вербального и невербального коммуникативного взаимодействия. Информация наиболее содержательно отражается 
в текстах различной направленности, сохраняясь и накапливаясь в организационной документации, материалах средств массой информации, в личных архивах; особенной формой хранения можно рассматривать Интернет со всеми информационными ресурсами. Многообразие данных несет в себе огромное 
знание, получение которого способствует выработке высокоэффективных 
управленческих решений, разработке и внедрению оптимальных социальных 
технологий. Вот только как эти знания получить из бесконечного множества 
документов? В настоящее время существует много методик обработки документов, среди них важное место занимает метод контент-анализа. Находясь на 
стыке лингвистики, социологии и психологии, он в многообразии своих реализаций позволяет решать большое количество задач по обработке информации 
для последующего ее использования в ходе регулирования социальных и политических процессов.  

Пособие разбито на шесть разделов, последний из которых можно рас
сматривать как комплекс практических упражнений, способствующих последовательному формированию у специалистов навыков осуществления контентанализа документов. Теоретические разделы раскрывают сущность текста и его 
структурных элементов как объектов исследования, возможности количественных и качественных оценок текста, особенности и принципы осуществления 
контент-анализа документов и его автоматизации. 

Учебное пособие будет полезно студентам – будущим исследователям со
циальных процессов, обучающимся по направлениям 39.03.01 Социология, 
44.03.05 Педагогическое образование (Обществознание и финансовая грамотность), 41.03.06 Публичная политика, 48.03.01 Теология в рамках дисциплин, 
связанных с научно-проектной и научно-исследовательской деятельностью: 
«Методология и методы социологического исследования», «Контент-анализ 
документов», «Методология теологического научного исследования».  
 

1. ТЕКСТ КАК ОБЪЕКТ ИССЛЕДОВАНИЯ 

Слово, словосочетание и структурные модели предложения необходимо 

рассматривать как основные объекты социологии языка, выступающей основой 
для осуществления такого метода социологических исследований как контентанализ документов. Слово и словосочетание можно рассматривать как основные структурно-семантические единицы языка, служащие для именования явлений, предметов и их свойств, т.е. выступают средством номинации предметов, явлений, процессов, качеств [1, с. 162]. В лингвистике единицей языка 
рассматривают предложение, а в психолингвистике обращаются к изучению 
высказываний, которые являются единицами речевого общения; они отражают 
коммуникативную ситуацию и позицию говорящего с учетом знаний и возможной реакции собеседника [1, с. 163]. 

Слова в реальном общении включены в предложения, тексты и ситуации, 

поэтому слово и словосочетания несут свое основное значение и осмысление 
только в тексте. Чтобы понять смысл слов, необходимо рассматривать весь 
текст, в котором они используются. В тексте находит отражение языковая личность со своей сформированной системой языка [1, с. 164]. 

Текст следует рассматривать не только как филологическую категорию, но 

и как социальное явление [19, с. 7]. Текст – это результат речетворческого процесса, произведение, обладающее завершенностью, объективированное в виде 
письменного документа, состоящее из заголовка (названия) и набора особых 
единиц (абзацев), объединенных разными типами грамматической, лексической, стилистической, логической связи, имеющее определенную прагматическую установку и направленность [1, с. 165]. Текст отличается от сообщения 
тем, что он ориентирован на хранение и многократное использование, является 
стратегической, а не тактической коммуникацией. Текст из-за широкого круга 
потребителей (со своими особенностями, часто противоположными ориентациями) предполагает наличие его многозначных прочтений [18, с. 184-185]. 

Когда рассматривается процесс общения, то язык является первичным яв
лением, в то время как текст выступает вторичным явлением; однако в случае 
языков искусства (деятельность писателя, художника и т.д.) первичным выступает текст, вторичным – язык [18, с. 187]. Эту особенность следует учитывать 
при осуществлении контент-анализа художественных произведений. 

В зависимости от целей и характеристик структуры коммуникации (рацио
нальной/иррациональной) можно выделить (таблица 1) четыре типа текстов 
[18, с. 157]: 

Таблица 1 

Классификация текстов 

Говорящий
Слушающий
Пример текста

рациональный
рациональный
инструкция

иррациональный
иррациональный
поэтический

рациональный
иррациональный
реклама

иррациональный
рациональный
общение пациента с врачом 
(психоанализ)

 

Свойства текста, значимые для осуществления его анализа [1, с. 187-191]: 
1. Цельность – наличие замысла текста. 
2. Связность – завершенная последовательность предложений текста, свя
занных друг с другом по смыслу в рамках основного замысла автора. 

3. Эмотивность – функция языковых единиц, связанная с выражением эмо
ционального отношения говорящего к объективной действительности. 

4. Креолизованность. Креолизованные тексты состоят из двух негомоген
ных частей: вербальной (языковой/речевой) и невербальной (принадлежащей к 
другим знаковым системам) [2, с. 8]. 

5. Скважность (пропуски смысла) – «разорванная» связь отдельных смы
словых частей текста. Скважность содержания, сокращая внутренне речевую 
коммуникацию, расширяет мир художественной реальности и служит стимулом психофилологической деятельности адресата. 

Исследование действительности посредством изучения текста требует об
ращения к таким понятиям как контекст, затекст, подтекст. Контекст – это 
правое и левое окружение фразы, которое придает ей однозначное толкование 
[1, с. 163]. Контекст может быть узким (в размерах словосочетания), широким 
(в рамках предложения), кроме того имеется еще сверхконтекст, рассматриваемый в рамках произведения или эпохи. Затекст – это фрагмент действительности, описанный в тексте, реальные события. Подтекст – это скрытая информация, получаемая из текста исходя из ассоциативности его единиц и их 
способности к приращению смыслов. Важно отметить, что научная литература 
не обладает подтекстом [1, с. 172].  

Научная литература предполагает выделение следующих видов текста / ре
чи [1, 165-169]: 

1. По видам речевой деятельности (письменные, устные; монологические, 

диологические). 

2. По жанрам (официально-деловой, научный, публицистический, художе
ственный, религиозный, разговорный). 

3. По содержанию (тексты-описания – говорится об одновременных при
знаках, тексты-повествования – о последовательных действиях, текстырассуждения – о причинах свойств или явлений). 

4. По целям (ориентированные на содержание – комментарии прессы, ре
портажи, учебная литература и т.п.; ориентированные на форму – художественная литература; ориентированные на обращение – политические тексты). 

5. Первичные (оригинальные исследования) и вторичные (отражение уста
новки автора на изложение уже известного). 

6. Тексты-примитивы – это небольшие по размерам текстовые структуры с 

отсутствием привычных для нормы специальных средств связности (например, 
детская речь двух лет, реплики на малознакомом языке, рекламные слоганы, 
вывески). 

7. По тематико-адресным рубрикам (политика, внешняя политика, эконо
мика, сельское хозяйство, спорт, наука и техника, культура, право, медицина, 
торговля и бытовые услуги, природа, мораль и этика, молодежь, дети, женщины, военно-патриотическая тематика, досуг, художественные тексты). 

8. Формы текста / функционально-коммуникативные типы текстов (ново
сти, комментарий, интервью, корреспонденция, статья/лекция, беседа, репортаж, передовая статья, очерк, фельетон, обзор писем, официально-деловые тексты, речь/выступления, реклама, документальные фильмы, спектакль, проза, 
стихи, художественные фильмы, композиция, прочее). 

9. По функциям (информирование, регулирование (общественных мнений, 

формирование ценностей, побуждение к действию), развлечение (эмоциональное, интеллектуальное)). 

10. Функционально-смысловые типы речи (определение, объяснение, умо
заключение, рассуждение, характеристика, описание, сообщение, повествование). 

Вышеописанные классификации научного текста используются при осу
ществлении контент-анализа, на этапе анализа и интерпретации результатов. 

Выделяются следующие факторы текстообразования [36, с. 225-226]: тема 

текста (смысловое ядро), предмет речи (содержание, которое необходимо осветить), обстановка общения (условия создания текста – время, место и др.), отношение к получателю текста (представления о его физических, психических и 
культурных особенностях), композиция (план текста: диахронический – предполагает соответствие события (которое стало предметом речи) течению времени; синхронический – описывается как нечто застывшее во времени), стилистико-жанровый тип текста. 

 

ВОПРОСЫ И ЗАДАНИЯ ПО РАЗДЕЛУ 

1. Что выступает основной структурно-семантической единицей языка, ис
пользующейся для именования явлений, предметов и их свойств? 

2. Какой термин обозначает характеристики окружения фразы, придающие 

ей однозначное толкование? 

3. Какой термин наиболее полно отражает следующее определение: «за
вершенное произведение речетворческого процесса, объективированное в виде 
письменного документа»? 

4. Какое слово пропущено: «___________ – произведение, состоящее из за
головка и ряда особых единиц, объединенных разными типами грамматической, лексической, стилистической, логической связи, имеющее определенную 
прагматическую установку и направленность? 

5. Почему научная литература не обладает подтекстом? 
6. Какие свойства текста из нерассмотренных ранее еще важны для осуще
ствления его контент-анализа: напряженность, диалогичность, завершенность, 
антропоцентричность, социологичность, интерпретируемость, динамичность, 
образность, развернутость? Кратко опишите данные свойства текста.  

7. Приведите примеры произведений с различными типами композиции 

(диахроническим и синхроническим). 

8. Приведите примеры художественных произведений, анализ которых це
лесообразно осуществлять в рамках широкого контекста всего произведения, в 
рамках сверхконтекста. 

2. КОЛИЧЕСТВЕННЫЕ ПАРАМЕТРЫ ТЕКСТА 

Текст можно рассматривать как коммуникационный процесс между его ав
тором и адресатом (рисунок 1), он отражает качества личностей, включенных в 
опосредованную коммуникацию, их мотивы, эмоции, знания. 

При знакомстве с текстом у субъекта и адресата возникают различные, но 

схожие в своей основе мыслительные образы. Так как текст протяжен во времени, то воссоздание мыслительных образов адресата требует продумывания 
порядка линейной развертки его образов. 

 
 
 
 
 
 
 
 

 

Рисунок 1. Сферы диагностики контент-анализа текста [5] 

Количественные параметры текста: 
1. Индекс Шлисмаана (количество прилагательных, глаголов и соотноше
ние количества глаголов к количеству прилагательных). Так, например в текстах, написанных мужчинами, преобладают глаголы, а в текстах, написанных 
женщинами, – прилагательные. 

2. Длина предложения как количество знаменательных или знаменатель
ных и служебных слов. Знаменательные слова – существительные, местоимения, прилагательные, наречия, глаголы, причастия, деепричастия, числительные. Служебные слова – союзы, предлоги, артикли. Некоторые слова могут 
относиться к различным знаменательным и служебным словам (например: «На! 
Бери!» и «на» – предлог, «Три!» – императив от глагола тереть и «три» – числительное). Длина предложения считается мерой его восприятия, а через это и 
мерой сложности восприятия текста в целом [19, с. 135-136]. Эксперименты (в 
русском языке) доказывают, что до уровня 11 слов длина фразы не оказывает 
влияния на ее восприятие, при фразах длинной более 11 слов восприятие существенно ухудшается [19, с. 136-137]. 

3. Фог-индекс – количество длинных слов. 
4. Формула читабельности Р. Флеша: 

R.E.=206,835-0,846*wl-1,015*sl, 
где: wl – число слогов на 100 слов, R.E. – сложность стиля, sl – средняя длина 
предложения, измеренная в количестве слов. 

5. Коэффициент лексического разнообразия речи: 

Клекс = Л/С, 
где: С – общее число слов (единицы между пробелами) этого текста, Л – число 
лексем в данном тексте. Значение коэффициента располагается в промежутке 
от 0 до 1. Характеристика лексического разнообразия речи увеличивается с 
увеличением показателя получаемой десятичной дроби. Для английской газеты 

 

ВНЕШНИЕ УСЛОВИЯ

ситуация создания текста, события общественной жизни, историко
культурный контекст

СУБЪЕКТ

мотивы, эмоции,  субъективные 
представле
ния, стереотипы, знания, 
заблуждения

ТЕКСТ

предметное содержание, 
отражаемая 
ситуация, 

искажения, ошибки

АДРЕСАТ

производимый эффект, 
возможные интерпретации, 
уровень 
знаний, 

мотивы

40-х годов XX века он равен 0,136. Считается, что этот показатель положительно коррелирует с уровнем образования автора и с его интеллектуальным коэффициентом.  

6. Коэффициент синтаксического разнообразия рассчитывается как отно
шение числа предложений к числу слов данного текста: 
Ксинкт=1-П/С, 
где: П – число предложений,  Ксинт – коэффициент сложности, С – число слов 
во всем тексте. Чем больше результат, тем многословнее в целом предложения 
текста. 

7. Активный и пассивный словарь. Пример расчета: Из словаря объемом в 

2000 страниц случайным образом отбираются 20 страниц (1% от общего числа). 
Эти слова предъявляются испытуемому, который должен отметить те из них, 
которые он употребляет, и слова, знакомые ему, но не используемые в употреблении. Результаты экстраполируются на весь объем словаря. Для понимания 
полученных характеристик словаря важно их сравнение с выявленными статистическими нормами словарного запаса, используемыми в той или иной профессиональной сфере (таблица 2), соответствующими различным возрастным 
группам и др. 

Таблица 2 

Пример существующего лексикона 

№
Испытуемые
Словарь активный 
Словарь пассивный 
Разница

1
Секретарь
31500
38300
21,5%

2
Бизнесмен 
(женщина)

63000
73350
16,4%

3
Преподаватель
56250
76250
35,5%

При анализе словаря важно рассматривать его структуру. Словоупотребле
ние не является однородным [13, с. 74]. Так, в словаре языка А.С. Пушкина «56 
наиболее частых слов составляет 40% всех словоупотреблений, 204 – 52%», в 
словаре языка М.Ю. Лермонтова 10 наиболее частых слов (0,0067% объема его 
словаря) составляют 19,96% словоупотреблений. Такие закономерности наблюдаются не только при исследовании словаря личности, примерами могут выступать данные об освещении в СМИ стран мира и международных организаций: «на 10% (из 225) наиболее часто упоминаемых стран и организаций 
приходится 66% от общего числа их упоминания». 

 

ВОПРОСЫ И ЗАДАНИЯ ПО РАЗДЕЛУ 

1. Каким образом можно учитывать особенности внешних условий созда
ния текста при анализе документа? 

2. Что важнее учитывать при анализе качеств личности – характеристики 

его активного или пассивного словаря? Почему? 

3. Что может сказать о личности Фог-индекс его речи? 

 

3. ОСНОВЫ ИСПОЛЬЗОВАНИЯ КОНТЕНТ-АНАЛИЗА 

Метод контент-анализа документов первично применялся с целями изуче
ния эффективности массовой пропаганды (определение эффекта от конкретного 
информационного источника, выявление принципов создания текстов, способных произвести на людей наибольшее впечатление). Во время военных действий контент-анализ документов интенсивно использовался для изучения пропаганды 
противника, 
определения 
морального 
духа 
населения 
страны 

противника, выявления событий, происходящих в различных странах.  

Основные 
этапы 
развития 
метода 
контент-анализ 
документов 

(О.В. Попова):  

1. Конец XIX – 30-е годы XX в. Рассмотрение процедуры контент-анализа 

с позиций строгого частотного анализа содержания понятий, разработка основных процедур осуществления количественного контент-анализа.  

2. 1940-1950 гг. Становление классического частотного контент-анализа 

(Б. Берельсон, Г. Лассуэл), использование контент-анализа для анализа речей 
президентов США на инаугурации, пропагандистских выступлений Рузвельта и 
Гитлера, радиопрограмм в США, проводивших пропаганду идеологии  
фашизма.  

3. Конец 1950-х – конец 1960-х гг. Усовершенствование методики контент
анализа (Ч. Осгуд). Создание программы «Универсальный анализатор», разработанной Ф. Стоуном и Ч. Бейлсом.  

4. 1970-е – середина 1990-х гг. Развитие программного обеспечения осуще
ствления контент-анализа документов, позволяющего увеличить эффективность и быстроту обрабатки больших массивов данных и снизить трудоёмкость 
процедур контент-анализа.  

5. Вторая половина 1990-х гг. – наше время. Развитие других направлений 

анализа документов с учетом межпредметных знаний и новых информационных технологий.  

Контент-анализ в СССР использовался с середины 1960-х годов. Примера
ми его применения являются исследования А.В. Баранова, В.З. Когана, Ю.И. 
Скворцова, в которых изучалась степень обращения к субъективным интересам 
читателей в газете «Известия», рассматривались информационные воздействия 
на читателей газеты «Труд».  

Контент-анализ применяется в различных направлениях для достижения 

разнообразных научных целей [6]:  
 изучения темы популярных песенок; 
 анализа религиозной символики, используемой в различных произведениях 

(например, в гимнах); 

 определения идеологического тона редакционных передовых статей; 
 выявления гендерных стереотипов в учебниках и учебных пособиях; 
 определения межнациональной политики СМИ (частота появления людей 

разных рас в телевизионных рекламных роликах и программах); 

 анализа вражеской пропаганды в годы скрытых или явных военных дейст
вий [7, с. 10]; 

Доступ онлайн
164 ₽
В корзину