Статистика
Покупка
Тематика:
Экономическая статистика
Издательство:
ФЛИНТА
Год издания: 2017
Кол-во страниц: 286
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-89349-998-8
Артикул: 618341.02.99
Пособие написано в соответствии с Государственным образовательным стандартом для гуманитарных специальностей. Оно содержит основные положения статистики и прикладные вопросы статистической обработки данных, необходимые для широкого практического использования в образовательном процессе. Учебное пособие состоит из двух частей: первая часть содержит 15 лекций, вторая часть включает 15 семинаров, 13 из которых посвящены практическому освоению на компьютере статистического пакета STATISTICA. Изложение курса рассчитано на один семестр учебы в высшем учебном заведении гуманитарного профиля. Для студентов, аспирантов и преподавателей высших учебных заведений.
Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
К.Э. Плохотников С.В. Колков СТАТИСТИКА Учебное пособие 5-е издание, стереотипное Рекомендовано Учебно-методическим объединением по образованию в области коммерции, маркетинга и рекламы в качестве учебного пособия для студентов, обучающихся по специальности 350700 — «Реклама» Москва Издательство «ФЛИНТА» 2017
УДК 519.2(075) ББК 22.171я73 П39 Р е ц е н з е н т ы : докт. физ.-мат. наук, с.н.с. Н.В. Песков, канд. физ.-мат. наук, доцент М.Л. Сердобольская Плохотников К.Э. П39 Статистика [Электронный ресурс] : учеб. пособие / К.Э. Плохотников, С.В. Колков. — 5-е изд., стер. — М. : ФЛИНТА, 2017. — 286 c. (Экономика и управление). ISBN 978-5-89349-998-8 Пособие написано в соответствии с Государственным образо вательным стандартом для гуманитарных специальностей. Оно содержит основные положения статистики и прикладные вопросы статистической обработки данных, необходимые для широкого практического использования в образовательном процессе. Учебное пособие состоит из двух частей: первая часть содержит 15 лекций, вторая часть включает 15 семинаров, 13 из которых посвящены практическому освоению на компьютере статистического пакета STATISTICA. Изложение курса рассчитано на один семестр учебы в высшем учебном заведении гуманитарного профиля. Для студентов, аспирантов и преподавателей высших учебных заведений. УДК 519.2(075) ББК 22.171я73 ISBN 978-5-89349-998-8 © Издательство «ФЛИНТА», 2017
Оглавление Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 ЧАСТЬ I Лекция 1. Реклама в контексте общей информационной индустрии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Изучение потребителей . . . . . . . . . . . . . . . . . . . . . . . . . 14 Анализ товара . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Анализ рынка . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Эффективность рекламы . . . . . . . . . . . . . . . . . . . . . . . . 19 Лекция 1’. Зачем нужна математика вообще и статистика в частности в социологии? Социология в контексте общей информационной индустрии . . . . . . . . . . . . . . . . . . . . . . 21 Из истории социологии . . . . . . . . . . . . . . . . . . . . . . . . . 24 Статистика в социологических исследованиях . . . . . . . . . . . . 25 Лекция 2. Введение в статистику . . . . . . . . . . . . . . . . . . . . . 29 Немного из истории науки «статистика» . . . . . . . . . . . . . . . 29 Лекция 3. Основные статистические показатели . . . . . . . . . . . . 36 Средняя величина . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 Средняя арифметическая . . . . . . . . . . . . . . . . . . . . . . . . 39 Показатели вариации . . . . . . . . . . . . . . . . . . . . . . . . . . 43 Лекция 4. Введение в теорию вероятностей . . . . . . . . . . . . . . 47 Частотное определение вероятности . . . . . . . . . . . . . . . . . . 48 Аксиоматическое определение вероятности . . . . . . . . . . . . . . 49 Нормальное распределение . . . . . . . . . . . . . . . . . . . . . . . 51 Лекция 5. Анализ взаимосвязи. Корреляция и регрессия . . . . . . 57 Причинность и корреляция . . . . . . . . . . . . . . . . . . . . . . . 57 Регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 Метод наименьших квадратов . . . . . . . . . . . . . . . . . . . . . 64 Линейный коэффициент корреляции . . . . . . . . . . . . . . . . . 66 Лекция 6. Введение в выборочный метод . . . . . . . . . . . . . . . . 69 Простая случайная выборка . . . . . . . . . . . . . . . . . . . . . . 70 Некоторые примеры выборочного метода . . . . . . . . . . . . . . . 71 Проверка статистических гипотез. Постановка вопроса . . . . . . . 72 3
Лекция 7. Выборочный метод. Проверка статистических гипотез . 75 Генеральная средняя неизвестна (дисперсия известна) . . . . . . . 75 Доверительные границы (пределы, интервалы) . . . . . . . . . . . . 79 Проверка значимости статистической гипотезы . . . . . . . . . . . 80 Лекция 8. Выборочный метод. Проверка статистических гипотез II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 Оценка среднего при неизвестной дисперсии . . . . . . . . . . . . . 83 Ошибки I и II рода . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Оценка дисперсии . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Лекция 9. Сравнение двух нормальных выборок . . . . . . . . . . . 91 Сравнение двух зависимых нормальных выборок . . . . . . . . . . 91 Сравнение двух независимых нормальных выборок . . . . . . . . . 95 Лекция 10. Ряды динамики . . . . . . . . . . . . . . . . . . . . . . . . 99 Показатели изменения ряда динамики . . . . . . . . . . . . . . . . 100 Средний уровень ряда динамики . . . . . . . . . . . . . . . . . . . . 101 Компоненты ряда динамики . . . . . . . . . . . . . . . . . . . . . . 103 Трендовая компонента . . . . . . . . . . . . . . . . . . . . . . . . . . 104 Лекция 11. Методы анализа рядов динамики . . . . . . . . . . . . . 109 Методы анализа основной тенденции . . . . . . . . . . . . . . . . . 112 Метод простой скользящей средней . . . . . . . . . . . . . . . . . . 112 Методы анализа колебательной компоненты . . . . . . . . . . . . . 114 Корреляционный анализ динамических рядов . . . . . . . . . . . . 116 Лекция 12. Элементы прогнозирования и интерполяции. Моделирование временных рядов . . . . . . . . . . . . . . . . . . 119 Моделирование временных рядов . . . . . . . . . . . . . . . . . . . 121 Прогнозирование . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Лекция 13. Многомерный статистический анализ . . . . . . . . . . 126 Факторный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Дискриминантный анализ . . . . . . . . . . . . . . . . . . . . . . . . 129 Кластерный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Многомерное шкалирование . . . . . . . . . . . . . . . . . . . . . . 134 Методы контроля качества . . . . . . . . . . . . . . . . . . . . . . . 137 Лекция 14. Факторный анализ . . . . . . . . . . . . . . . . . . . . . 138 Краткая история факторного анализа . . . . . . . . . . . . . . . . . 139 Элементы теории факторного анализа . . . . . . . . . . . . . . . . . 140 Линейные модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 Компоненты дисперсии . . . . . . . . . . . . . . . . . . . . . . . . . 143 4
Факторное отображение и факторная структура . . . . . . . . . . . 143 Статистический смысл факторной модели . . . . . . . . . . . . . . . 144 Компонентный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Принцип простой структуры . . . . . . . . . . . . . . . . . . . . . . 149 Лекция 15. Россия в цифрах. Опыт статистического анализа социально-экономической реальности России . . . . . . . . . . 152 Корреляционный анализ . . . . . . . . . . . . . . . . . . . . . . . . 153 Факторный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 Кластерный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Другой взгляд на исходные данные . . . . . . . . . . . . . . . . . . 161 ЧАСТЬ II Семинар 1. События и их вероятности . . . . . . . . . . . . . . . . . 164 Понятие «вероятность» . . . . . . . . . . . . . . . . . . . . . . . . . 164 Свойства вероятности . . . . . . . . . . . . . . . . . . . . . . . . . . 166 Другое толкование понятия «вероятность» . . . . . . . . . . . . . . 168 Семинар 2. Элементы комбинаторики. Перестановки и сочетания. Биномиальное распределение . . . . . . . . . . . . . . . . . . . . 172 Комбинаторика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Перестановки и сочетания . . . . . . . . . . . . . . . . . . . . . . . 172 Биномиальное распределение . . . . . . . . . . . . . . . . . . . . . . 174 Идея метода проверки статистических гипотез . . . . . . . . . . . . 176 Семинар 3. Пакет STATISTICA в сравнении с рядом других статистических пакетов . . . . . . . . . . . . . . . . . . . . . . . . 178 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 Обзор компьютерных средств обработки данных . . . . . . . . . . . 178 Пакет STATISTICA. Краткая характеристика . . . . . . . . . . . . . 179 Пакет STATISTICA в целом . . . . . . . . . . . . . . . . . . . . . . 180 Пакет STATISTICA. Начало работы . . . . . . . . . . . . . . . . . . 181 Семинар 4. Биномиальное распределение. Испытания Бернулли . 189 Повторные испытания. Формула Бернулли . . . . . . . . . . . . . . 189 Биномиальное распределение (распределение Бернулли) . . . . . . 189 Семинар 5. Основные статистические показатели . . . . . . . . . . 196 Средняя арифметическая . . . . . . . . . . . . . . . . . . . . . . . . 196 Дисперсия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 5
Семинар 6. Анализ взаимосвязи. Корреляция и регрессия . . . . 202 Корреляция . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 Регрессионный анализ в пакете STATISTICA . . . . . . . . . . . . . 206 Семинар 7. Вероятностный калькулятор. Различные функции распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Вероятностный калькулятор . . . . . . . . . . . . . . . . . . . . . . 215 Нормальное распределение . . . . . . . . . . . . . . . . . . . . . . . 216 Правила 2-х и 3-х сигм . . . . . . . . . . . . . . . . . . . . . . . . . 219 Распределение «хи-квадрат» . . . . . . . . . . . . . . . . . . . . . . 220 Распределение Стьюдента . . . . . . . . . . . . . . . . . . . . . . . . 221 F-распределение, распределение Фишера . . . . . . . . . . . . . . . 222 Семинар 8. Анализ двух нормальных выборок. Исследование эффективности рекламной кампании . . . . . . . . . . . . . . . 226 Сравнение двух нормальных выборок . . . . . . . . . . . . . . . . . 226 Сравнение средних значений двух независимых нормальных выборок . . . . . . . . . . . . . 234 Семинар 9. Анализ и синтез временных рядов. Моделирование временных рядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 Семинар 10. Элементы прогнозирования временных рядов . . . . 246 Семинар 11. Введение в факторный анализ . . . . . . . . . . . . . . 253 Семинар 12. Факторный анализ II . . . . . . . . . . . . . . . . . . . 261 Семинар 13. Кластерный анализ . . . . . . . . . . . . . . . . . . . . 269 Семинар 14. Россия в цифрах . . . . . . . . . . . . . . . . . . . . . . 274 Корреляционный анализ . . . . . . . . . . . . . . . . . . . . . . . . 275 Факторный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 Семинар 15. Россия в цифрах II . . . . . . . . . . . . . . . . . . . . . 282 Кластерный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . 282 Другой взгляд на исходные данные . . . . . . . . . . . . . . . . . . 284
Введение Вхождение России в единое мировое информационное пространство предполагает подготовку соответствующих кадров, к которым относятся в том числе и будущие специалисты в области рекламного бизнеса и социальные работники. Реклама, рекламный бизнес находятся на острие информационной индустрии сбора, обработки, анализа и истолкования данных, а также производства новых данных, их внедрения и продвижения на рынке. Будущие социальные работники вообще ничего не могут утверждать или опровергать без проведения того или иного статистического исследования. Большинство статистических исследований в рамках социальной работы направлены в конечном счете на выработку рекомендаций для формирования правильного социального управления, воздействия. Адекватное социальное управление делает особенно ответственной любую социальную работу, прежде всего в части методологии, которая пронизана статистикой. Дисциплина «статистика» знакомит студентов с базовым инструментарием сбора, обработки и анализа данных, а также вводит в круг вопросов, характерных для специалистов в области рекламно-информационного бизнеса и социальной работы. В части подготовки социальных работников курс может быть представлен как социальная статистика. Методическая особенность и трудность курса «статистика» состоит в том, что, наряду с изложением тематических узкопрофильных стандартов статистики, необходимо также определить общие статистические понятия, которые носят универсальный, общестатистический характер. Задачей курса является: • развитие у студентов абстрактно-математического образа мышления; • формирование у студентов навыков статистико-вероятностного способа оценки (не)правоты статистических утверждений; • увлечение студентов богатой фактурой статистики вообще, включая примеры из рекламного бизнеса и социальной работы; • убеждение студентов в безальтернативности статистики в вопросах сбора, обработки и истолкования социально-экономической информации для целей рекламного бизнеса и социальной работы; • развитие у студентов навыка работы с современными статистическими пакетами обработки данных на примере такого программного средства, как пакет STATISTICA. В результате изучения разделов статистики студент должен: • иметь представление о роли и месте статистики в современном информационном обществе; 7
об универсальных статистических характеристиках, методах и приемах, поставщиках новой социально-экономической информации; о значении и роли статистического инструментария в текущей работе специалиста в области рекламного бизнеса и социальной работы; о специализированных статистических пакетах (STATISTICA и ряд других); • знать основные статистические категории, понятия и термины; общие принципы сбора, обработки и анализа данных; устройство статистических специализированных пакетов; • уметь оперировать абстрактными статистическими понятиями; представлять данные для статистической обработки; обрабатывать данные на предмет поиска основных статистических характеристик; истолковывать (анализировать) данные. Изучение дисциплины «статистика» базируется на естественно-научной дисциплине «Математика и информатика» и предполагает использование студентами компьютера на персональном уровне с максимальным учетом как степени подготовки студента, так и его индивидуальных способностей при общении с компьютером и овладении информационными технологиями. Курс состоит из двух частей. Первая часть включает 15 лекций, которые рассчитаны на 30 академических часов. Вторая часть содержит 15 семинаров — 15 практических занятий в компьютерном классе с преподавателем. Практическая часть курса также рассчитана на 30 академических часов. Особенности лекционного курса. Первая лекция представлена в двух вариантах: для специализирующихся в рекламном бизнесе и для тех, кто ориентирован на обучение по теме социальной работы. В лекции 1 дается введение в рекламный бизнес в целом с особым выделением тех пунктов, где происходит непосредственное соприкосновение рекламной специфики со статистикой. Аналогично в лекции 1′ дается введение в социологию вообще и социальную работу в частности с указанием на те места, изучение которых без овладения статистической методологией невозможно. Последняя лекция (лекция 15 «Россия в цифрах») является итоговой, в ней приводится пример применения статистических методов к изучению социальноэкономической реальности РФ за период с 1991 по 2000 г. Особенности семинарских занятий. Из представленных во второй части учебного пособия 15 семинаров первые два могут быть проведены без 8
привлечения компьютера. Это сделано намеренно, чтобы дать время в начале учебного процесса для снятия различного рода возможных накладок в организации учебного процесса в компьютерном классе. Реальное использование компьютеров начинается с семинара 3, в котором дается общее введение в статистический пакет STATISTICA. Последние два семинара 14, 15 показывают, как с помощью пакета STATISTICA можно провести статистическое исследование социально-экономической реальности Российской Федерации за период с 1991 по 2000 г. В большинстве случаев темы семинарских занятий дублируют тематику лекций. Это делается с целью как закрепления лекционного материала, так и получения практического навыка работы с данными в статистическом пакете STATISTICA. Примечание. Рекомендации учебно-методического объединения по образованию в области коммерции, маркетинга и рекламы в качестве учебного пособия для студентов, обучающихся по специальности 350700 — «Реклама», распространяются на первую часть курса.
Часть I