Анализ данных в социологии
Покупка
Основная коллекция
Тематика:
Методы социологических исследований
Издательство:
Южный федеральный университет
Год издания: 2018
Кол-во страниц: 226
Дополнительно
Вид издания:
Учебник
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-927-52690-1
Артикул: 717694.01.99
Основная цель книги - дать читателю-гуманитарию базовые представления о методах статистического анализа и вывода. Содержание издания является продолжением материала по математической статистике, изложенного в учебнике А.В.Дятлова и П.Н. Лукичева «Методы математической статистики в социальных науках (описательная статистика)». Приложение содержит статистические таблицы. Учебник предназначен для аспирантов, магистрантов, студентов бакалавриата, а также для всех интересующихся указанной проблематикой.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ» А. В. Дятлов Д. А. Гугуева Анализ данных в социологии Учебник Ростов-на-Дону – Таганрог Издательство Южного федерального университета 2018
УДК 519.23:303(075.8) ББК 22.172я73 Д998 Печатается по решению кафедры отраслевой и прикладной социологии Института социологии и регионоведения Южного федерального университета (протокол № 6 от 20 февраля 2017 г.) Рецензенты: профессор кафедры отраслевой и прикладной социологии Института социологии и регионоведения Южного федерального университета, доктор социологических наук, профессор М. С. Астоянц; профессор кафедры экономической социологии и регионального управления Института социологии и регионоведения Южного федерального университета, доктор экономических наук, профессор В. М. Белоусов Дятлов, А. В. Д998 Анализ данных в социологии : учебник / А. В. Дят лов, Д. А. Гугуева ; Южный федеральный университет. – Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2018. – 226 с. ISBN 978-5-9275-2690-1 Основная цель книги – дать читателю-гуманитарию базовые представ ления о методах статистического анализа и вывода. Содержание издания является продолжением материала по математической статистике, изложенного в учебнике А. В. Дятлова и П. Н. Лукичева «Методы математической статистики в социальных науках (описательная статистика)». Приложение содержит статистические таблицы. Учебник предназначен для аспирантов, магистрантов, студентов бака лав ри ата, а также для всех интересующихся указанной проблематикой. УДК 519.23:303(075.8) ББК 22.172я73 ISBN 978-5-9275-2690-1 © Южный федеральный университет, 2018 © Дятлов А. В., Гугуева Д. А., 2018 © Оформление. Макет. Издательство Южного федерального университета, 2018
Предисловие, или Как читать эту книгу Уважаемые друзья! Если вы сейчас читаете эти строки, значит, вы интересуетесь статистическими методами, применяемыми современной социологией и, вероятнее всего, у вас возникли вопросы, на которые вы хотели бы получить ответы, используя этот учебник. Если это ваша первая попытка овладеть применением стати стических методов в социологии, а этот учебник вы выбрали случайно, то сто́ит изучить материал в порядке изложения, чтобы у вас сформировалось системное представление об изучаемом курсе и о той помощи, которую вносят статистические методы в исследовательскую работу социолога. Возможно, вы ранее уже были знакомы с применением стати стических методов, изучали курс, сдавали экзамен. Но необходимость написания курсовой работы, дипломной работы (проекта) или магистерской диссертации снова привела вас к изучению статистических методов. В таком случае вам необходимо начать с введения и далее использовать материал учебника сообразно выбранной вами исследовательской стратегии – обращаться к тем темам, которые помогут вам в представлении, описании и анализе рассматриваемых в вашей работе данных. Вполне возможно, что у вас далеко позади осталась учеба в уни верситете, вы профессиональный исследователь, но при проведении конкретного исследования возникли трудности с выбором параметра статистической гипотезы или с интерпретацией полученного вывода. В данном учебнике есть главы, касающиеся особенностей выдвижения и подтверждения гипотез для различного количества выборок и разных параметров, что может помочь при осуществлении анализа собранных социологических данных. В ряде случаев для удобства восприятия допускаются краткие напоминания определений терминов. Это сделано для сокращения времени при их поиске по тексту. Если вы в данный момент не изучаете системно курс, а вам только необходимо уточнить суть какого-либо статистического метода, то данный материал может послужить вам как справочный. Хотим пожелать, чтобы все, кто решил воспользоваться этой книгой, не разочаровались в своем выборе. Мы постарались сделать упор на сути механизма статистического вывода с конкретными
примерами. Но необходимо предостеречь – применяемые методы не способны доказать справедливость выдвинутых вами гипотез, они только способны подтвердить, что собранный социологический материал обладает статистической значимостью и может быть подвергнут анализу, а именно поэтому ваши гипотезы при соответствующих условиях и ограничениях могут быть сочтены справедливыми и распространены на генеральную совокупность с определенной долей вероятности. Вопрос же содержательной интерпретации всегда остается за исследователем, и, к сожалению, статистические методы в этом отношении бессильны. 4 Предисловие, или Как читать эту книгу
Введение Когда речь заходит о математике в среде гуманитариев, большин ство людей пытаются обойти эту тему, полагая, что они «и без математики проживут» и, вообще, «математика им ни к чему». Может быть, это и так, но при этом, сами того не подозревая, они повсеместно пользуются математикой в своей обыденной жизни, осуществляя учет или оценку каких-либо объектов и ситуаций. Все эти действия связаны с использованием чисел, математических вычислений, пусть и элементарных, но всё же вносящих рациональное удобство в нашу жизнь. Сфер деятельности, где математика может оказать добрую услугу, очень много, но наша цель заключается в том, чтобы разобраться, как математика, а точнее, определенные математические методы могут качественно улучшить исследовательскую работу социолога. Деятельность социолога достаточно сложна и ответственна, ему необходимо выявлять, описывать важные социологические характеристики, проводить их сравнение, исходя из направления проводимого исследования, выдвигать гипотезы о связях и зависимостях между свойствами и явлениями, подтверждать или опровергать их. Попробуем разобраться, какие разделы математики нам могут быть полезны, какие математические методы смогут помочь в проведении обработки результатов социологического исследования, в чём их специфика и как интерпретировать полученные результаты. Прежде чем углубляться в терминологию и содержание инте ресующих нас разделов математики, рассмотрим, как выглядит процесс социологического исследования и что нам необходимо для его осуществления. Любое социологическое исследование – это исследование свойств и характеристик каких-то объектов и связей (зависимостей) между ними. Первоначально необходимо определить программу прикладного социологического исследования и определить, какие из методов анализа предполагаемых данных будут использоваться для выявления свойств и связей изучаемого объекта. Это означает, что его характеристики будут представлены в виде математических символов (как правило, чисел), а связи между ними, если таковые есть, – в виде формул. Соответственно, уже изначально – при построении программы исследования – необходимо продумать, какие данные будут извлечены и каким образом их валидность будет подтверждена.
Введение В результате такой процедуры, которая называется измере нием (а инструмент, определяющий соответствие, – шкалой измерения), мы получим множество, состоящее из чисел, показывающих свойства изучаемого объекта. Далее возникает вопрос об «удобном» виде представления этого множества чисел для проведения дальнейшего анализа. Критерии такого представления следующие: наглядность и удобство последующей обработки данных. На практике, как правило, используется табличное или графическое представление. Далее поступают следующим образом: если множество рассма триваемых в исследовании значений изучаемого свойства небольшое, работают со всем множеством значений одновременно. В этом случае речь идет о том, что вся эта небольшая социальная группа, показатели которой исследуются, является генеральной совокупностью. Если количество данных позволяет одновременно работать со всеми элементами генеральной совокупности, то применяется метод сплошного исследования. Но, к сожалению, очень часто возникает такая ситуация, когда приходится иметь дело с настолько большим количеством данных, собранных на генеральной совокупности, что работать со всеми одновременно по разным причинам не представляется возможным. В этом случае применяется так называемый выборочный метод. Он заключается в том, что в анализе используют не все данные, а только лишь их часть, отобранную особым (случайным) образом. Эти данные образуют подмножество, называемое выборкой, а социальная группа, на базе которой собран анализируемый материал, носит название выборочной совокупности. Исследование, таким образом, происходит на выборке, но при соблюдении условий, обеспечивающих правомерность распространения полученных результатов (и выводов) на первоначальное множество, т. е. на генеральную совокупность. Следует иметь в виду, что далеко не всегда генеральной сово купностью выступает всё общество в целом, состоящее из разных социальных групп. В качестве генеральной совокупности может выступать часть общества, какая-либо социальная группа или даже ее часть. Так, например, если генеральной совокупностью для социологического исследования выступает студенческая молодежь, скажем, Ростовской области, то выборочная совокупность будет охватывать часть именно студенческой молодежи
Введение 7 и именно Ростовской области. Соответственно, и результаты исследования уверенно могут быть распространены только на данную генеральную совокупность. При этом объём выборочной совокупности определяется исходно заданными значениями стандартного отклонения и уровня значимости. Максимальной величиной последней принято считать α = 0,05. Иначе говоря, вероятность, с которой в этом случае можно переносить полученные на выборочной совокупности данные и сделанные выводы на генеральную совокупность, составляет Р = 0,95, т. е. 95 %, эта вероятность носит название уровня доверия (или, иначе, доверительной вероятности, уровня надежности, индекса надежности, вероятностного уровня) и обозначается γ. Если же мы задаем требования к уровню значимости как α = 0,01, то вероятность повторения результатов исследования, или, что то же самое, надежность перенесения его результатов и выводов на генеральную совокупность, будет составлять уже γ = 0,99. Для расчета стандартного отклонения полученных результатов от тех, которые могли бы быть получены при опросе всей генеральной совокупности или при повторном исследовании, используется формула Произведение, стоящее под корнем, означает, что по каждой ответной позиции каждого вопроса анкеты с одинаковой долей вероятности может быть дан утвердительный или отрицательный ответ, т. е. каждая конкретная ответная позиция может быть выделена (вероятность – p) или не выделена респондентом (невероятность ее выделения – q). Поскольку вероятность и невероятность равны, то p = q = 0,5. N – число опытов, т. е., например, при проведении опроса – респондентов, t = 1,96 – табличное значение, приводящее вероятность повторения опыта к уровню Р = 0,95. Данное значение t определяется из равенства 2Ф(t) = Р, где Ф – это функция Лапласа. По таблице функции Лапласа (см. прил. 1) находится аргумент t, которому соответствует значение функции равное , т. е. в данном случае Р : 2 = 0,95 : 2 = 0,475, каковому значению в таблице и соответствует t = 1,96. Однако если мы
Введение стремимся к вероятности распространения полученных результатов на генеральную совокупность с уровнем Р = 0,99, то значение t будет уже 2,58, что потребует увеличения численности выборочной совокупности, но не повлияет на заданный уровень стандартного откло нения, потому что . И если мы определили в качестве стандартного отклонения значение δ = ±0,03, то при численности респондентов в 1067 полученные результаты исследования можно будет переносить на генеральную совокупность с вероятностью Р = 0,95, т. е. с надежностью γ = 0,95. Но чтобы перенести результаты исследования на генеральную совокупность с надежностью γ = 0,99, потребуется привлечение к опросу уже 1849 респондентов. При этом отклонение результатов, полученных на выборочной совокупности, от действительных значений на генеральной совокупности, если бы они были собраны, останется тем же: δ = ±0,03. Это означает: при численности респондентов в 1849 человек можно утверждать с 99%-ной надежностью, что полученный результат не отклонится более чем на ±3 % от действительных значений. Если же оставить число респондентов равным 1067, сохранив требование 99%-ной надежности, то отклонение составит уже т. е. ±3,9 %. На практике оказывается достаточным уровень статистической значимости α = 0,05, т. е. 95%-ной вероятности того, что полученный результат не отклонится от истинных значений на заданную величину (в данном примере ±3 %). Необходимо заметить, что данный уровень стандартного откло нения имеет значимость только для всей выборки в целом, т. е. для всей выборочной совокупности в каждом из аспектов исследования (например, по каждому из вопросов анкеты) в отдельности, иными словами – только для одномерных распределений. При рассмотрении сопряженности аспектов исследования (скажем, вопросов анкеты) – многомерных распределений будут иметь место уже другие величины уровня значимости и стандартного отклонения, обусловленные свойствами изучаемой характеристики социальной общности и качеством собранного материала.
Введение 9 Чтобы по полученным данным выявить свойства и зависимости, используют рассчитываемые на выборке статистики распределения, являющиеся наиболее важными интерпретирующими характеристиками изучаемого явления (их аналоги для генеральной совокупности называются параметрами). Эти статистики дают возможность охарактеризовать среднюю тенденцию, вокруг которой группируются значения распределения, и тенденцию отклонения (рассеивания), определяющую разброс значений относительно средней тенденции на множестве полученных значений. Необходимо заметить, что существуют наиболее часто встреча ющиеся виды распределений (самое распространенное – нормальное распределение) и методы стандартизации, дающие возможность сравнивать различные распределения. Расчет по статистическим формулам позволяет установить зависимости между обнаруженными свойствами, выдвинуть соответствующие гипотезы и опять же посредством статистических методов (критериев) принять или отклонить их. Для подтверждения (или опровержения) какойлибо гипотезы используют процедуру статистического вывода. Она дает возможность путем замены научной гипотезы на статистическую и посредством проведения необходимых расчетов сделать вывод о том, какая из статистических гипотез будет принята, а какая отвергнута. Далее, чтобы сделать выводы относительно исследуемых свойств на языке социологии, необходимо декодировать полученный результат, т. е. заменить верную статистическую гипотезу на научную. Иначе говоря, цифровой материал должен быть интерпретирован, и его интерпретация в словесно-логической форме целиком и полностью остается на совести исследователя.
Глава 1. Типы коэффициентов взаимосвязи КЛЮЧЕВЫЕ ТЕРМИНЫ: бисериальная корреляция; корреляционное отношение; коэффициент η; иерархия шкал; коэффициент контингенции С; коэффициент смешанных моментов Пирсона; криволинейная связь; нелинейная корреляция; рангово-бисериальная корреляция; коэффициент корреляции Спирмена ρ; соответствие рейтингов; таблицы сопряженности (кросс-табуляции); коэффициент корреляции Кендалла τ; тетрахорическая корреляция; точечнобисериальная корреляция; коэффициент φ. В учебнике А. В. Дятлова и П. Н. Лукичева «Методы математиче ской статистики в социальных науках (описательная статистика)», продолжением которого является эта книга, речь шла только о коэффициенте корреляции Пирсона, или так называемом коэффициенте смешанных моментов r. Этот коэффициент был введен как показатель взаимосвязи между двумя случайными переменными. Были обсуждены условия, которые необходимо выполнить, чтобы использовать этот коэффициент, а также факторы, влияющие на размер коэффициента, и способы его вычисления. Одним из основных требований к его применению предпочтительно является измерение переменных в интервальной шкале или шкале отношений, т. е. в метрических шкалах, как, например, измеряются температура, вес, рост. В этом случае его применение наиболее эффективно. К сожалению, очень часто это требование невозможно удовлетворить, что делает его использование затруднительным или малоинформативным. Соответственно, становится необходимым вернуться к проблеме шкал измерения социологической информации. 1.1. Шкалы измерения Одним из наиболее важных вопросов при использовании корреля ционного анализа является вопрос о шкале измерения переменных, по которой должны оценить силу взаимосвязи. Мы уже обсуждали* иерархию используемых в социологии шкал измерения. В настоящей * Дятлов А. В., Лукичев П. Н. Методы математической статистики в соци альных науках (описательная статистика) : учебник. Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2018. 172 с.