Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Статистика для всех

Покупка
Артикул: 487738.05.95
Доступ онлайн
759 ₽
В корзину
Нужно овладеть статистикой по долгу службы? Хотите получить помощь при сдаче курса статистики? «Статистика для всех» — ясное и краткое введение и руководство для всех новичков. Тщательно переработанное и расширенное, это издание поможет вам глубоко понять статистику, избегая ошеломляющей сложности многих университетских учебников. Эта книга — руководство, которое можно приспосабливать к имеющимся знаниям и нуждам отдельных читателей. Некоторые главы посвящены темам, которые часто отсутствуют в вводных книгах по статистике. Каждая глава представляет собой простые для понимания объяснения, дополненные диаграммами, формулами, задачами с решениями и взятыми из практики заданиями. Если вы хотите не ломая голову применять распространенные методы анализа данных и узнать о разнообразных подходах — эта книга для вас.
Бослаф, С. Статистика для всех : практическое руководство / С. Бослаф ; пер. с англ. П. А. Волкова, И. М. Флямер, М. В. Либерман, А. А. Галицына. - 2-е изд. - Москва : ДМК Пресс, 2023. - 587 с. - ISBN 978-5-89818-302-8. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2102590 (дата обращения: 28.09.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
Сара Бослаф

СТАТИСТИКА 
ДЛЯ ВСЕХ

STATISTICS
IN A NUTSHELL

Second Edition

Beijing • Cambridge • Farnham • Köln • Sebastopol • Tokyo

Sarah Boslaugh

СТАТИСТИКА
ДЛЯ ВСЕХ

Москва, 2023

Сара Бослаф

2-е издание, электронное

УДК 311:004.9
ББК 60.6с515
Б85

Б85
Бослаф, Сара.
Статистика для всех / С. Бослаф ; пер. с англ. П. А. Волкова, И. М. Флямер, М. В. Либерман, А. А. Галицына. — 2-е изд., эл. — 1 файл pdf : 588 с. — Москва : ДМК Пресс, 
2023. — Систем. требования: Adobe Reader XI либо Adobe Digital Editions 4.5 ; экран 10". — 
Текст : электронный.
ISBN 978-5-89818-302-8
Нужно овладеть статистикой по долгу службы? Хотите получить помощь при сдаче курса 
статистики? «Статистика для всех» — ясное и краткое введение и руководство для всех новичков. 
Тщательно переработанное и расширенное, это издание поможет вам глубоко понять статистику, 
избегая ошеломляющей сложности многих университетских учебников.
Эта книга — руководство, которое можно приспосабливать к имеющимся знаниям и нуждам 
отдельных читателей. Некоторые главы посвящены темам, которые часто отсутствуют в вводных 
книгах по статистике. Каждая глава представляет собой простые для понимания объяснения, дополненные диаграммами, формулами, задачами с решениями и взятыми из практики заданиями. 
Если вы хотите не ломая голову применять распространенные методы анализа данных и узнать о 
разнообразных подходах — эта книга для вас.

УДК 311:004.9 
ББК 60.6с515

Электронное издание на основе печатного издания: Статистика для всех / С. Бослаф ; пер. с англ. П. А. Волкова, И. М. Флямер, М. В. Либерман, А. А. Галицына. — Москва : ДМК Пресс, 2015. — 586 с. — ISBN 978-594074-969-1. — Текст : непосредственный.

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы 
то ни было средствами без  письменного разрешения владельцев авторских прав.
Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность технических ошибок все равно существует, издательство не может гарантировать абсолютную точность и правильность приводимых сведений. В связи с 
этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги.

В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами защиты авторских 
прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации.

ISBN 978-5-89818-302-8
© 2013 Sarah Boslaugh. All rights reserved
©  Оформление, перевод на русский язык, 
издание, ДМК Пресс, 2015

ОГЛАВЛЕНИЕ

Предисловие ...........................................................................9
Ну хорошо, и что же такое статистика? ................................................................ 9
Основная цель этой книги ................................................................................. 12
Статистика в информационную эпоху ................................................................ 13
Структура книги ................................................................................................ 14
Условные обозначения, используемые в этой книге .......................................... 18
Благодарности .................................................................................................. 19
Об авторе .......................................................................................................... 19
Об иллюстрации на обложке ............................................................................. 20

Глава 1. Основные понятия, связанные с измерениями ................. 21
Измерение ........................................................................................................ 22
Типы измерений ................................................................................................ 22
Истинные значения и ошибки ............................................................................ 29
Надежность и валидность .................................................................................. 31
Смещение измерений ....................................................................................... 36
Упражнения ....................................................................................................... 40

Глава 2. Теория вероятности ..................................................... 43
О формулах ....................................................................................................... 44
Основные определения ..................................................................................... 45
Определение вероятности ................................................................................ 52
Вычисление вероятности сложных событий ...................................................... 54
Теорема Байеса ................................................................................................ 56
Достаточно разговоров, давайте займемся статистикой! .................................. 59
Упражнения ....................................................................................................... 61
Заключительное замечание: связь между статистикой и азартными играми ..... 65

Глава 3. Статистический вывод ................................................. 67
Распределения вероятностей ........................................................................... 68
Независимые и зависимые переменные ........................................................... 76
Генеральные совокупности и выборки ............................................................... 77
Теорема центрального предела ......................................................................... 82
Проверка гипотез .............................................................................................. 87
Доверительные интервалы ................................................................................ 91
Значения p ................................................................................... 92
Z-статистика ..................................................................................................... 93
Преобразования данных ................................................................................... 96
Упражнения ....................................................................................................... 99

Оглавление

Глава 4. Описательная статистика и графическое 
представление данных .......................................................... 107
Генеральные совокупности и выборки ............................................................. 107
Меры центральной тенденции ......................................................................... 108
Меры разброса ............................................................................................... 115
Выбросы ......................................................................................................... 121
Графические методы ....................................................................................... 122
Столбчатые диаграммы ................................................................................... 125
Двумерные диаграммы ................................................................................... 136
Упражнения ..................................................................................................... 142

Глава 5. Категориальные данные ............................................. 146
R×C-таблицы ................................................................................................... 147
Распределение хи-квадрат ............................................................................. 150
Тест хи-квадрат ............................................................................................... 152
Точный тест Фишера ....................................................................................... 158
Парный тест МакНемара ................................................................................. 160
Пропорции: большие выборки ......................................................................... 162
Корреляции для категориальных данных ......................................................... 164
Порядковые переменные ................................................................................ 167
Шкала Лайкерта и шкалы семантического дифференциала ............................ 171
Упражнения ..................................................................................................... 173

Глава 6. t-критерий ............................................................... 179
t-распределение ............................................................................................. 179
Одновыборочный t-критерий .......................................................................... 182
t-критерий для независимых выборок ............................................................. 184
t-критерий для парных измерений .................................................................. 188
t-критерий для выборок с неравной дисперсией ............................................. 191
Упражнения ..................................................................................................... 192

Глава 7. Коэффициент корреляции Пирсона .............................. 196
Связь .............................................................................................................. 196
Диаграмма рассеяния ..................................................................................... 198
Коэффициент корреляции Пирсона ................................................................ 205
Коэффициент детерминации .......................................................................... 210
Упражнения ..................................................................................................... 211

Глава 8. Введение в регрессию и дисперсионный анализ .............215
Общая линейная модель ................................................................................. 215
Линейная регрессия ........................................................................................ 217
Дисперсионный анализ (ANOVA) ..................................................................... 228
Расчет простой регрессии вручную ................................................................. 235
Упражнения ..................................................................................................... 237

Глава 9. Многофакторный дисперсионный анализ 
и ковариационный анализ .......................................................245
Многофакторный дисперсионный анализ ....................................................... 245
ANCOVA ........................................................................................................... 254
Упражнения ..................................................................................................... 260

Оглавление

Глава 10. Множественная линейная регрессия ...........................265
Модели множественной регрессии ................................................................. 265
Упражнения ..................................................................................................... 291

Глава 11. Логистическая, мультиномиальная и полиномиальная 
регрессия ............................................................................296
Логистическая регрессия ................................................................................ 296
Мультиномиальная логистическая регрессия .................................................. 303
Полиномиальная регрессия ............................................................................ 306
Переподгонка ................................................................................................. 310
Упражнения ..................................................................................................... 312

Глава 12. Факторный, кластерный и дискриминантный анализы ... 315
Факторный анализ .......................................................................................... 315
Кластерный анализ ......................................................................................... 323
Дискриминантный анализ ............................................................................... 327
Упражнения ..................................................................................................... 330

Глава 13. Непараметрическая статистика ..................................332
Независимые выборки .................................................................................... 333
Зависимые выборки ........................................................................................ 341
Упражнения ..................................................................................................... 346

Глава 14. Статистика для бизнеса и контроля качества ................349
Индексы .......................................................................................................... 349
Временные ряды ............................................................................................. 354
Анализ решений .............................................................................................. 358
Улучшение качества ........................................................................................ 363
Упражнения ..................................................................................................... 371

Глава 15. Статистика в медицине и эпидемиологии .....................376
Показатели заболеваемости ........................................................................... 376
Отношение рисков .......................................................................................... 388
Отношение шансов ......................................................................................... 393
Искажение, послойный анализ и коэффициент Мантеля–Гензеля ................... 396
Анализ мощности ............................................................................................ 401
Вычисление размера выборки ........................................................................ 404
Упражнения ..................................................................................................... 407

Глава 16. Статистика в образовании и психологии ...................... 411
Перцентили ..................................................................................................... 412
Стандартизированные баллы .......................................................................... 414
Разработка тестов ........................................................................................... 417
Классическая теория тестов: модель истинных баллов ................................... 420
Надежность теста ............................................................................................ 421
Показатели внутренней непротиворечивости .................................................. 422
Анализ заданий ............................................................................................... 426
Современная теория тестирования ................................................................. 430
Упражнения ..................................................................................................... 435

Глава 17. Управление данными ................................................437
Общий подход, а не набор методов ................................................................. 438

Оглавление

Иерархия ........................................................................................................ 439
Кодификатор ................................................................................................... 439
Прямоугольный файл данных .......................................................................... 442
Электронные таблицы и реляционные базы данных ........................................ 444
Проверка нового файла данных ....................................................................... 445
Текстовые и числовые данные ......................................................................... 449
Пропущенные данные ..................................................................................... 450

Глава 18. Планирование исследования .....................................453
Словарь основных терминов ........................................................................... 454
Наблюдения .................................................................................................... 457
Квазиэкспериментальные исследования ........................................................ 459
Эксперименты ................................................................................................ 465
Сбор экспериментальных данных .................................................................... 467
Пример экспериментального дизайна ............................................................. 477

Глава 19. Представление статистических материалов .................479
Общие замечания ........................................................................................... 480

Глава 20. Оценка работ по статистике других авторов ..................488
Оценка статьи в целом .................................................................................... 488
Ошибки в применении статистики ................................................................... 490
Общие проблемы ............................................................................................ 490
Быстрая проверка ........................................................................................... 492
Спорные вопросы планирования исследования .............................................. 495
Описательная статистика ................................................................................ 498
Логическая статистика .................................................................................... 503

Приложение А. Обзор основных математических понятий ............506

Приложение B. Краткий обзор статистических пакетов ................530

Приложение C. Ссылки .......................................................... 545

Приложение D. Таблицы вероятностей для распространенных 
типов распределений ............................................................ 559

Приложение E. Интернет-ресурсы ........................................... 571

Приложение F. Словарь статистических терминов ..................... 576

ПРЕДИСЛОВИЕ

Первое издание «Статистики для всех» пользовалось оглушительным успехом, однако любую книгу можно улучшить, и я благодарна за предоставленную возможность переработать ее. Мой принцип изложения не изменился: эта книга гораздо 
больше предназначена тем, кто хочет размышлять и понимать результаты статистической обработки данных, чем тем, кто хочет узнать, как пользоваться конкретным статистическим пакетом программ или углубиться в математические основы 
при помощи статистических формул. Эта книга также несколько отличается от 
других изданий в этой серии «Руководств для всех» издательства О’Рейлли – она 
действительно находится где-то между руководством для тех, кто уже знаком со 
статистикой, и учебником для людей, которые только начали осваивать этот предмет.
Несмотря на продолжающееся проникновение статистики во многие области 
нашей жизни, одна вещь осталась неизменной: сказать, что ты работаешь статистиком, – по-прежнему верный способ испортить приятную беседу на вечеринке. 
Почему-то оказывается, что это побуждает людей рассказать мне, как они ненавидели обязательные занятия по статистике в колледже, или заставляет их процитировать старую шутку, ставшую популярной благодаря Марку Твену, о том, что 
существует три вида лжецов: простые лжецы, отъявленные лжецы и статистики. 
Лично я нахожу статистику захватывающей и обожаю работать в этой области. 
Я также люблю преподавать статистику, и мне нравится думать, что я заражаю 
своим энтузиазмом окружающих. Хотя часто это превращается в напряженную 
битву; многие считают, что статистика – это не более чем набор хитростей и подтасовок для искажения реальности, которые нужны, чтобы одурачить других людей. Другие занимают противоположную позицию, полагая, что статистика – это 
набор волшебных приемов, которые избавят вас от необходимости размышлять 
над данными.

Ну хорошо, и что же такое статистика?

Прежде чем погрузиться в технические детали изучения и использования статистики, вернемся на минуту назад и обсудим, что можно подразумевать под словом 
«статистика». Не беспокойтесь, если вы сразу не поймете всю терминологию, она 
прояснится в ходе чтения этой книги.

Предисловие

Когда люди говорят о статистике, они обычно имеют в виду один или несколько 
пунктов из приведенного ниже перечня:
1. Числовые данные, такие как уровень безработицы, число людей, умирающих ежегодно от пчелиных укусов, или численность жителей г. Нью-Йорк 
в 2006 году по сравнению с 1906 годом.
2. Числа, использованные для описания выборок, в противоположность 
параметрам (числам, характеризующим генеральную совокупность). Например, рекламная компания может интересоваться средним возрастом 
подписчиков журнала «Спортс Иллюстрейтед» (Sports Illustrated)1. Для 
ответа на этот вопрос компания может создать случайную выборку подписчиков, вычислить среднее значение для этой выборки (статистику) и 
использовать его как оценку среднего значения для всей генеральной совокупности подписчиков (параметра).
3. Определенные методы анализа данных и результаты такого анализа, такие 
как t-статистика или статистика хи-квадрат.
4. Область науки, которая разрабатывает и использует математические методы для описания данных и формирования суждений о них. 
Тот тип статистики, о котором говорится в первом определении, не имеет прямого 
отношения к этой книге. Если вы просто хотите найти последние данные о безработице, здоровье или о любой из множества других тем, по которым правительство или 
другие организации регулярно публикуют статистические данные, вам лучше всего 
проконсультироваться у библиотекаря или у специалиста в данной области. Если 
же вы хотите узнать, как интерпретировать эти данные (понять, например, почему 
среднее арифметическое часто бывает плохим показателем средней тенденции, или 
сравнить исходные и стандартизованные показатели смертности), то «Статистика 
для всех» точно вам поможет.
Понятия, использованные во втором определении, будут обсуждаться в главе 3, 
посвященной предсказательным статистикам. Однако эти термины пронизывают 
всю книгу. Это отчасти терминологические тонкости (статистики – это числа, которые описывают выборки, а параметры характеризуют генеральные совокупности), которые тем не менее подчеркивают ключевой момент применения статистики. Идея использования информации, полученной при изучении выборки, для 
формирования суждений обо всей генеральной совокупности лежит в основе всей 
предсказательной статистики, а предсказательная статистика – это основная тема 
этой книги (как и большинства других книг, посвященных статистике).
Третье определение также является ключевым для большинства глав этой книги. Процесс изучения статистики до некоторой степени сводится к освоению определенных статистических методов, включая такие вопросы, как способы вычислений и их интерпретации, выбор подходящей статистики в конкретной ситуации и 
так далее. На самом деле многие люди, начинающие изучать статистику, держат в 
голове в основном это определение. Освоить статистику для них означает узнать, 

1 
Еженедельный иллюстрированный спортивный журнал, крупнейшее и самое популярное спортивное издание в США. – Прим. пер.

Доступ онлайн
759 ₽
В корзину