Статистика для всех
Покупка
Тематика:
Общая теория статистики
Издательство:
ДМК Пресс
Автор:
Бослаф Сара
Год издания: 2023
Кол-во страниц: 587
Дополнительно
Вид издания:
Практическое пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-89818-302-8
Артикул: 487738.05.95
Нужно овладеть статистикой по долгу службы? Хотите получить помощь при сдаче курса статистики? «Статистика для всех» — ясное и краткое введение и руководство для всех новичков. Тщательно переработанное и расширенное, это издание поможет вам глубоко понять статистику, избегая ошеломляющей сложности многих университетских учебников. Эта книга — руководство, которое можно приспосабливать к имеющимся знаниям и нуждам отдельных читателей. Некоторые главы посвящены темам, которые часто отсутствуют в вводных книгах по статистике. Каждая глава представляет собой простые для понимания объяснения, дополненные диаграммами, формулами, задачами с решениями и взятыми из практики заданиями. Если вы хотите не ломая голову применять распространенные методы анализа данных и узнать о разнообразных подходах — эта книга для вас.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Сара Бослаф СТАТИСТИКА ДЛЯ ВСЕХ
STATISTICS IN A NUTSHELL Second Edition Beijing • Cambridge • Farnham • Köln • Sebastopol • Tokyo Sarah Boslaugh
СТАТИСТИКА ДЛЯ ВСЕХ Москва, 2023 Сара Бослаф 2-е издание, электронное
УДК 311:004.9 ББК 60.6с515 Б85 Б85 Бослаф, Сара. Статистика для всех / С. Бослаф ; пер. с англ. П. А. Волкова, И. М. Флямер, М. В. Либерман, А. А. Галицына. — 2-е изд., эл. — 1 файл pdf : 588 с. — Москва : ДМК Пресс, 2023. — Систем. требования: Adobe Reader XI либо Adobe Digital Editions 4.5 ; экран 10". — Текст : электронный. ISBN 978-5-89818-302-8 Нужно овладеть статистикой по долгу службы? Хотите получить помощь при сдаче курса статистики? «Статистика для всех» — ясное и краткое введение и руководство для всех новичков. Тщательно переработанное и расширенное, это издание поможет вам глубоко понять статистику, избегая ошеломляющей сложности многих университетских учебников. Эта книга — руководство, которое можно приспосабливать к имеющимся знаниям и нуждам отдельных читателей. Некоторые главы посвящены темам, которые часто отсутствуют в вводных книгах по статистике. Каждая глава представляет собой простые для понимания объяснения, дополненные диаграммами, формулами, задачами с решениями и взятыми из практики заданиями. Если вы хотите не ломая голову применять распространенные методы анализа данных и узнать о разнообразных подходах — эта книга для вас. УДК 311:004.9 ББК 60.6с515 Электронное издание на основе печатного издания: Статистика для всех / С. Бослаф ; пер. с англ. П. А. Волкова, И. М. Флямер, М. В. Либерман, А. А. Галицына. — Москва : ДМК Пресс, 2015. — 586 с. — ISBN 978-594074-969-1. — Текст : непосредственный. Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность технических ошибок все равно существует, издательство не может гарантировать абсолютную точность и правильность приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги. В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами защиты авторских прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации. ISBN 978-5-89818-302-8 © 2013 Sarah Boslaugh. All rights reserved © Оформление, перевод на русский язык, издание, ДМК Пресс, 2015
ОГЛАВЛЕНИЕ Предисловие ...........................................................................9 Ну хорошо, и что же такое статистика? ................................................................ 9 Основная цель этой книги ................................................................................. 12 Статистика в информационную эпоху ................................................................ 13 Структура книги ................................................................................................ 14 Условные обозначения, используемые в этой книге .......................................... 18 Благодарности .................................................................................................. 19 Об авторе .......................................................................................................... 19 Об иллюстрации на обложке ............................................................................. 20 Глава 1. Основные понятия, связанные с измерениями ................. 21 Измерение ........................................................................................................ 22 Типы измерений ................................................................................................ 22 Истинные значения и ошибки ............................................................................ 29 Надежность и валидность .................................................................................. 31 Смещение измерений ....................................................................................... 36 Упражнения ....................................................................................................... 40 Глава 2. Теория вероятности ..................................................... 43 О формулах ....................................................................................................... 44 Основные определения ..................................................................................... 45 Определение вероятности ................................................................................ 52 Вычисление вероятности сложных событий ...................................................... 54 Теорема Байеса ................................................................................................ 56 Достаточно разговоров, давайте займемся статистикой! .................................. 59 Упражнения ....................................................................................................... 61 Заключительное замечание: связь между статистикой и азартными играми ..... 65 Глава 3. Статистический вывод ................................................. 67 Распределения вероятностей ........................................................................... 68 Независимые и зависимые переменные ........................................................... 76 Генеральные совокупности и выборки ............................................................... 77 Теорема центрального предела ......................................................................... 82 Проверка гипотез .............................................................................................. 87 Доверительные интервалы ................................................................................ 91 Значения p ................................................................................... 92 Z-статистика ..................................................................................................... 93 Преобразования данных ................................................................................... 96 Упражнения ....................................................................................................... 99
Оглавление Глава 4. Описательная статистика и графическое представление данных .......................................................... 107 Генеральные совокупности и выборки ............................................................. 107 Меры центральной тенденции ......................................................................... 108 Меры разброса ............................................................................................... 115 Выбросы ......................................................................................................... 121 Графические методы ....................................................................................... 122 Столбчатые диаграммы ................................................................................... 125 Двумерные диаграммы ................................................................................... 136 Упражнения ..................................................................................................... 142 Глава 5. Категориальные данные ............................................. 146 R×C-таблицы ................................................................................................... 147 Распределение хи-квадрат ............................................................................. 150 Тест хи-квадрат ............................................................................................... 152 Точный тест Фишера ....................................................................................... 158 Парный тест МакНемара ................................................................................. 160 Пропорции: большие выборки ......................................................................... 162 Корреляции для категориальных данных ......................................................... 164 Порядковые переменные ................................................................................ 167 Шкала Лайкерта и шкалы семантического дифференциала ............................ 171 Упражнения ..................................................................................................... 173 Глава 6. t-критерий ............................................................... 179 t-распределение ............................................................................................. 179 Одновыборочный t-критерий .......................................................................... 182 t-критерий для независимых выборок ............................................................. 184 t-критерий для парных измерений .................................................................. 188 t-критерий для выборок с неравной дисперсией ............................................. 191 Упражнения ..................................................................................................... 192 Глава 7. Коэффициент корреляции Пирсона .............................. 196 Связь .............................................................................................................. 196 Диаграмма рассеяния ..................................................................................... 198 Коэффициент корреляции Пирсона ................................................................ 205 Коэффициент детерминации .......................................................................... 210 Упражнения ..................................................................................................... 211 Глава 8. Введение в регрессию и дисперсионный анализ .............215 Общая линейная модель ................................................................................. 215 Линейная регрессия ........................................................................................ 217 Дисперсионный анализ (ANOVA) ..................................................................... 228 Расчет простой регрессии вручную ................................................................. 235 Упражнения ..................................................................................................... 237 Глава 9. Многофакторный дисперсионный анализ и ковариационный анализ .......................................................245 Многофакторный дисперсионный анализ ....................................................... 245 ANCOVA ........................................................................................................... 254 Упражнения ..................................................................................................... 260
Оглавление Глава 10. Множественная линейная регрессия ...........................265 Модели множественной регрессии ................................................................. 265 Упражнения ..................................................................................................... 291 Глава 11. Логистическая, мультиномиальная и полиномиальная регрессия ............................................................................296 Логистическая регрессия ................................................................................ 296 Мультиномиальная логистическая регрессия .................................................. 303 Полиномиальная регрессия ............................................................................ 306 Переподгонка ................................................................................................. 310 Упражнения ..................................................................................................... 312 Глава 12. Факторный, кластерный и дискриминантный анализы ... 315 Факторный анализ .......................................................................................... 315 Кластерный анализ ......................................................................................... 323 Дискриминантный анализ ............................................................................... 327 Упражнения ..................................................................................................... 330 Глава 13. Непараметрическая статистика ..................................332 Независимые выборки .................................................................................... 333 Зависимые выборки ........................................................................................ 341 Упражнения ..................................................................................................... 346 Глава 14. Статистика для бизнеса и контроля качества ................349 Индексы .......................................................................................................... 349 Временные ряды ............................................................................................. 354 Анализ решений .............................................................................................. 358 Улучшение качества ........................................................................................ 363 Упражнения ..................................................................................................... 371 Глава 15. Статистика в медицине и эпидемиологии .....................376 Показатели заболеваемости ........................................................................... 376 Отношение рисков .......................................................................................... 388 Отношение шансов ......................................................................................... 393 Искажение, послойный анализ и коэффициент Мантеля–Гензеля ................... 396 Анализ мощности ............................................................................................ 401 Вычисление размера выборки ........................................................................ 404 Упражнения ..................................................................................................... 407 Глава 16. Статистика в образовании и психологии ...................... 411 Перцентили ..................................................................................................... 412 Стандартизированные баллы .......................................................................... 414 Разработка тестов ........................................................................................... 417 Классическая теория тестов: модель истинных баллов ................................... 420 Надежность теста ............................................................................................ 421 Показатели внутренней непротиворечивости .................................................. 422 Анализ заданий ............................................................................................... 426 Современная теория тестирования ................................................................. 430 Упражнения ..................................................................................................... 435 Глава 17. Управление данными ................................................437 Общий подход, а не набор методов ................................................................. 438
Оглавление Иерархия ........................................................................................................ 439 Кодификатор ................................................................................................... 439 Прямоугольный файл данных .......................................................................... 442 Электронные таблицы и реляционные базы данных ........................................ 444 Проверка нового файла данных ....................................................................... 445 Текстовые и числовые данные ......................................................................... 449 Пропущенные данные ..................................................................................... 450 Глава 18. Планирование исследования .....................................453 Словарь основных терминов ........................................................................... 454 Наблюдения .................................................................................................... 457 Квазиэкспериментальные исследования ........................................................ 459 Эксперименты ................................................................................................ 465 Сбор экспериментальных данных .................................................................... 467 Пример экспериментального дизайна ............................................................. 477 Глава 19. Представление статистических материалов .................479 Общие замечания ........................................................................................... 480 Глава 20. Оценка работ по статистике других авторов ..................488 Оценка статьи в целом .................................................................................... 488 Ошибки в применении статистики ................................................................... 490 Общие проблемы ............................................................................................ 490 Быстрая проверка ........................................................................................... 492 Спорные вопросы планирования исследования .............................................. 495 Описательная статистика ................................................................................ 498 Логическая статистика .................................................................................... 503 Приложение А. Обзор основных математических понятий ............506 Приложение B. Краткий обзор статистических пакетов ................530 Приложение C. Ссылки .......................................................... 545 Приложение D. Таблицы вероятностей для распространенных типов распределений ............................................................ 559 Приложение E. Интернет-ресурсы ........................................... 571 Приложение F. Словарь статистических терминов ..................... 576
ПРЕДИСЛОВИЕ Первое издание «Статистики для всех» пользовалось оглушительным успехом, однако любую книгу можно улучшить, и я благодарна за предоставленную возможность переработать ее. Мой принцип изложения не изменился: эта книга гораздо больше предназначена тем, кто хочет размышлять и понимать результаты статистической обработки данных, чем тем, кто хочет узнать, как пользоваться конкретным статистическим пакетом программ или углубиться в математические основы при помощи статистических формул. Эта книга также несколько отличается от других изданий в этой серии «Руководств для всех» издательства О’Рейлли – она действительно находится где-то между руководством для тех, кто уже знаком со статистикой, и учебником для людей, которые только начали осваивать этот предмет. Несмотря на продолжающееся проникновение статистики во многие области нашей жизни, одна вещь осталась неизменной: сказать, что ты работаешь статистиком, – по-прежнему верный способ испортить приятную беседу на вечеринке. Почему-то оказывается, что это побуждает людей рассказать мне, как они ненавидели обязательные занятия по статистике в колледже, или заставляет их процитировать старую шутку, ставшую популярной благодаря Марку Твену, о том, что существует три вида лжецов: простые лжецы, отъявленные лжецы и статистики. Лично я нахожу статистику захватывающей и обожаю работать в этой области. Я также люблю преподавать статистику, и мне нравится думать, что я заражаю своим энтузиазмом окружающих. Хотя часто это превращается в напряженную битву; многие считают, что статистика – это не более чем набор хитростей и подтасовок для искажения реальности, которые нужны, чтобы одурачить других людей. Другие занимают противоположную позицию, полагая, что статистика – это набор волшебных приемов, которые избавят вас от необходимости размышлять над данными. Ну хорошо, и что же такое статистика? Прежде чем погрузиться в технические детали изучения и использования статистики, вернемся на минуту назад и обсудим, что можно подразумевать под словом «статистика». Не беспокойтесь, если вы сразу не поймете всю терминологию, она прояснится в ходе чтения этой книги.
Предисловие Когда люди говорят о статистике, они обычно имеют в виду один или несколько пунктов из приведенного ниже перечня: 1. Числовые данные, такие как уровень безработицы, число людей, умирающих ежегодно от пчелиных укусов, или численность жителей г. Нью-Йорк в 2006 году по сравнению с 1906 годом. 2. Числа, использованные для описания выборок, в противоположность параметрам (числам, характеризующим генеральную совокупность). Например, рекламная компания может интересоваться средним возрастом подписчиков журнала «Спортс Иллюстрейтед» (Sports Illustrated)1. Для ответа на этот вопрос компания может создать случайную выборку подписчиков, вычислить среднее значение для этой выборки (статистику) и использовать его как оценку среднего значения для всей генеральной совокупности подписчиков (параметра). 3. Определенные методы анализа данных и результаты такого анализа, такие как t-статистика или статистика хи-квадрат. 4. Область науки, которая разрабатывает и использует математические методы для описания данных и формирования суждений о них. Тот тип статистики, о котором говорится в первом определении, не имеет прямого отношения к этой книге. Если вы просто хотите найти последние данные о безработице, здоровье или о любой из множества других тем, по которым правительство или другие организации регулярно публикуют статистические данные, вам лучше всего проконсультироваться у библиотекаря или у специалиста в данной области. Если же вы хотите узнать, как интерпретировать эти данные (понять, например, почему среднее арифметическое часто бывает плохим показателем средней тенденции, или сравнить исходные и стандартизованные показатели смертности), то «Статистика для всех» точно вам поможет. Понятия, использованные во втором определении, будут обсуждаться в главе 3, посвященной предсказательным статистикам. Однако эти термины пронизывают всю книгу. Это отчасти терминологические тонкости (статистики – это числа, которые описывают выборки, а параметры характеризуют генеральные совокупности), которые тем не менее подчеркивают ключевой момент применения статистики. Идея использования информации, полученной при изучении выборки, для формирования суждений обо всей генеральной совокупности лежит в основе всей предсказательной статистики, а предсказательная статистика – это основная тема этой книги (как и большинства других книг, посвященных статистике). Третье определение также является ключевым для большинства глав этой книги. Процесс изучения статистики до некоторой степени сводится к освоению определенных статистических методов, включая такие вопросы, как способы вычислений и их интерпретации, выбор подходящей статистики в конкретной ситуации и так далее. На самом деле многие люди, начинающие изучать статистику, держат в голове в основном это определение. Освоить статистику для них означает узнать, 1 Еженедельный иллюстрированный спортивный журнал, крупнейшее и самое популярное спортивное издание в США. – Прим. пер.