Статистика без подвоха: Методы критического анализа данных и причинного вывода
Покупка
Новинка
Тематика:
Статистика
Издательство:
ДМК Пресс
Автор:
Мескита Итан Буэно
Перевод:
Яценков Валерий Станиславович
Год издания: 2023
Кол-во страниц: 455
Дополнительно
Вид издания:
Научно-популярная литература
Уровень образования:
Дополнительное образование
ISBN: 978-5-93700-240-2
Артикул: 848866.02.99
Увлекательное введение в науку о данных, в котором упор делается на критическое мышление, а не на статистические методы. Введение в науку о данных или статистику не должно начинаться с доказательства сложных теорем или запоминания терминов и формул, но именно так устроены многие учебники по статистике. В книге показано, как инструменты критического анализа применяются к проблемам в самых разных областях, включая выборы, гражданские конфликты, преступность, терроризм, финансовые кризисы, здравоохранение, спорт, музыка и космические путешествия.
Издание предназначено широкому кругу читателей, которые хотят быть вдумчивыми потребителями и аналитиками тех видов информации и аргументов, с которыми они будут сталкиваться на протяжении всей своей жизни.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Итан Буэно де Мескита Энтони Фаулер Статистика без подвоха Методы критического анализа данных и причинного вывода
Thinking Clearly with Data A Guide to Quantitative Reasoning and Analysis Ethan Bueno De Mesquita Anthony Fowler PRINCETON UNIVERSITY PRESS Princeton and Oxford
Статистика без подвоха Методы критического анализа данных и причинного вывода Итан Буэно де Мескита Энтони Фаулер Москва, 2023
УДК 311.1 ББК 60.6 М53 Итан Буэно де Мескита, Энтони Фаулер М53 Статистика без подвоха: Методы критического анализа данных и причинного вывода / пер. с англ. В. С. Яценкова. – М.: ДМК Пресс, 2023. – 454 с.: ил. ISBN 978-5-93700-240-2 Увлекательное введение в науку о данных, в котором упор делается на критическое мышление, а не на статистические методы. Введение в науку о данных или статистику не должно начинаться с доказательства сложных теорем или запоминания терминов и формул, но именно так устроены многие учебники по статистике. В книге показано, как инструменты критического анализа применяются к проблемам в самых разных областях, включая выборы, гражданские конфликты, преступность, терроризм, финансовые кризисы, здравоохранение, спорт, музыка и космические путешествия. Издание предназначено широкому кругу читателей, которые хотят быть вдумчивыми потребителями и аналитиками тех видов информации и аргументов, с которыми они будут сталкиваться на протяжении всей своей жизни. УДК 311.1 ББК 60.6 All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage and retrieval system, without permission in writing from the Publisher. Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Copyright © 2021 by Princeton University Press © Оформление, издание, перевод, ДМК Пресс, 2023 ISBN (анг.) 978-0-69121-436-8 ISBN (рус.) 978-5-93700-240-2
Оглавление Предисловие от издательства......................................................... 14 Предисловие....................................................................................... 15 Как построена эта книга...................................................................................17 Кому адресована эта книга?..............................................................................18 Благодарности...................................................................................................19 Глава 1. Критическое мышление в эпоху данных........................ 21 О чем эта глава...................................................................................................21 Введение.............................................................................................................21 Поучительные истории.....................................................................................22 Поспешный диагноз Эйба.............................................................................22 Гражданское сопротивление........................................................................24 Теория разбитых окон...................................................................................26 Дополнение или замена?..................................................................................29 Дополнительное чтение и ссылки....................................................................31 ЧАСТЬ I. В ПОИСКЕ ОБЩЕГО ЯЗЫКА....................................... 33 Глава 2. Корреляция: что это такое и для чего она нужна?........ 35 О чем эта глава...................................................................................................35 Введение.............................................................................................................35 Что такое корреляция?......................................................................................36 Факт или корреляция?...................................................................................40 Для чего нужна корреляция?............................................................................42 Описание........................................................................................................43 Прогнозирование..........................................................................................44 Причинный вывод.........................................................................................47 Измерение корреляций.....................................................................................48 Среднее значение, дисперсия и стандартное отклонение.........................48 Ковариация....................................................................................................53 Коэффициент корреляции............................................................................53
Наклон линии регрессии...............................................................................54 Совокупности и выборки..............................................................................55 Откровенно о линейности................................................................................55 Подведение итогов............................................................................................59 Ключевые термины...........................................................................................59 Упражнения.......................................................................................................60 Дополнительное чтение и ссылки....................................................................62 Глава 3. Причинно-следственная связь: что это такое и для чего она нужна?.............................................. 63 О чем эта глава...................................................................................................63 Введение.............................................................................................................63 Что такое причинно-следственная связь?.......................................................64 Потенциальные исходы и контрфактические сравнения..............................65 Зачем нужно знать причинно-следственную связь?......................................67 Фундаментальная проблема причинного вывода..........................................67 Принципиальные вопросы...............................................................................69 В чем причина?..............................................................................................69 Причинность и контрпримеры....................................................................72 Причинность и закон....................................................................................75 Может ли причинно-следственная связь распространяться вспять во времени?.......................................................................................76 Требует ли причинно-следственная связь физической связи?..................77 Причинно-следственная связь не обязательно подразумевает корреляцию....................................................................................................77 Подведение итогов............................................................................................78 Ключевые термины...........................................................................................78 Упражнения.......................................................................................................79 Дополнительное чтение и ссылки....................................................................81 ЧАСТЬ II. СУЩЕСТВУЕТ ЛИ ВЗАИМОСВЯЗЬ?........................ 83 Глава 4. Не бывает корреляции без вариаций.............................. 85 О чем эта глава...................................................................................................85 Введение.............................................................................................................85 Выбор зависимой переменной.........................................................................87 Правило 10 000 часов....................................................................................88 Деградация молодежи...................................................................................90 Уход из средней школы.................................................................................93 Атаки смертников.........................................................................................94 Мир заставляет нас выбирать зависимую переменную.................................97 Врачи чаще наблюдают за больными людьми............................................97 Анализ постфактум.......................................................................................97 Катастрофа «Челленджера»........................................................................100 Финансовый кризис 2008 года....................................................................101 Жизненные советы......................................................................................103 Подведение итогов..........................................................................................103 6 Оглавление
Ключевые термины.........................................................................................103 Упражнения.....................................................................................................104 Дополнительное чтение и ссылки..................................................................105 Глава 5. Применение регрессии в описании и прогнозировании..........................................................................107 О чем эта глава.................................................................................................107 Введение...........................................................................................................107 Основы регрессии............................................................................................107 Линейная регрессия при нелинейных данных..............................................113 Проблема переобучения.................................................................................121 Прогнозирование президентских выборов...............................................122 Как представляют выводы регрессии............................................................124 Краткая история регрессии.............................................................................125 Подведение итогов..........................................................................................127 Ключевые термины.........................................................................................127 Упражнения.....................................................................................................128 Дополнительное чтение и ссылки..................................................................129 Глава 6. Выборки, неопределенность и статистические выводы...............................................................130 О чем эта глава.................................................................................................130 Введение...........................................................................................................130 Оценка..............................................................................................................130 Почему оценка отличается от оцениваемой величины?..............................132 Смещение.....................................................................................................133 Шум...............................................................................................................134 Как получается хороший оцениватель?.........................................................134 Количественная оценка точности..................................................................136 Стандартные ошибки..................................................................................137 Маленькие выборки и экстремальные наблюдения.................................139 Доверительные интервалы.........................................................................140 Статистический вывод и проверка гипотез..................................................141 Проверка гипотез........................................................................................141 Статистическая значимость.......................................................................143 Статистический вывод о взаимосвязях.........................................................143 Что, если у нас есть данные для всей совокупности?....................................145 Содержательная и статистическая значимость.............................................146 Социальные сети и голосование................................................................147 Второй закон о реформе.............................................................................147 Подведение итогов..........................................................................................148 Ключевые термины.........................................................................................149 Упражнения.....................................................................................................150 Дополнительное чтение и ссылки..................................................................151 Глава 7. Завышение значимости и занижение отчетности.......153 О чем эта глава.................................................................................................153 Оглавление 7
Введение...........................................................................................................153 Может ли осьминог быть футбольным экспертом?..................................153 Предвзятость публикации..............................................................................159 р-хакинг........................................................................................................161 p-скрининг...................................................................................................162 Являются ли большинство научных «фактов» ложными?............................163 Экстрасенсорное восприятие.....................................................................164 Явка избирателей на голосование..............................................................165 Выявление p-хакинга..................................................................................166 Возможные решения проблемы.....................................................................169 Уменьшение порога статистической значимости....................................169 Корректировка p-значения при многократном тестировании................170 Не зацикливайтесь на статистической значимости.................................170 Предварительная регистрация...................................................................171 Проверка важных и правдоподобных гипотез..........................................174 За пределами науки.........................................................................................175 Суперзвезды.................................................................................................176 Подведение итогов..........................................................................................179 Ключевые термины.........................................................................................179 Упражнения.....................................................................................................180 Дополнительное чтение и ссылки..................................................................181 Глава 8. Возврат к среднему значению........................................183 О чем эта глава.................................................................................................183 Введение...........................................................................................................183 Исчезает ли истина?....................................................................................183 Фрэнсис Гальтон и возврат к среднему..........................................................185 Возврат к среднему значению не является силой притяжения...................188 Поиск помощи.................................................................................................191 Работает ли операция на колене?...............................................................193 Возвращение к среднему, эффект плацебо и космическое привыкание....194 Эффект плацебо...........................................................................................194 Объяснение космического привыкания....................................................195 Космическое привыкание и генетика........................................................197 Убеждения не возвращаются к среднему значению....................................198 Подведение итогов..........................................................................................200 Ключевые термины.........................................................................................200 Упражнения.....................................................................................................200 Дополнительное чтение и ссылки..................................................................203 ЧАСТЬ III. ЯВЛЯЕТСЯ ЛИ СВЯЗЬ ПРИЧИННО-СЛЕДСТВЕННОЙ?................................................205 Глава 9. Почему корреляция и причинно-следственная связь не одно и то же......................................................................207 О чем эта глава.................................................................................................207 8 Оглавление
Введение...........................................................................................................207 Чартерные школы........................................................................................208 Критический анализ потенциальных исходов..............................................212 Источники смещения......................................................................................217 Искажающие факторы................................................................................217 Обратная причинно-следственная связь...................................................219 Новый взгляд на правило 10 000 часов......................................................220 Диетическая газировка...............................................................................224 Насколько похожи искажающие факторы и обратная причинность?.........225 Расходы на предвыборную кампанию.......................................................226 Признаки смещения........................................................................................228 Контрацепция и ВИЧ...................................................................................232 Механизмы или факторы?..............................................................................233 Критические размышления о смещении и шуме.........................................236 Подведение итогов..........................................................................................240 Ключевые термины.........................................................................................241 Упражнения.....................................................................................................242 Дополнительное чтение и ссылки..................................................................245 Глава 10. Выявление и ограничение искажающих факторов..... 247 О чем эта глава.................................................................................................247 Введение...........................................................................................................247 Влияние партии на голосование в конгрессе............................................247 Примечание о гетерогенных эффектах воздействия...............................252 Анатомия регрессии........................................................................................253 Как регрессия ограничивает влияние искажающего фактора?...................257 Контроль и причинно-следственная связь....................................................265 Вредят ли нам социальные сети?...............................................................267 Чтение таблицы регрессии.............................................................................268 Чем искажающий фактор отличается от механизма?..................................271 Статистика без волшебства.............................................................................271 Подведение итогов..........................................................................................273 Ключевые термины.........................................................................................273 Упражнения.....................................................................................................274 Дополнительное чтение и ссылки..................................................................275 Глава 11. Рандомизированные эксперименты...........................276 О чем эта глава.................................................................................................276 Введение...........................................................................................................276 Грудное вскармливание..............................................................................277 Рандомизация и причинно-следственный вывод........................................280 Оценка и вывод в экспериментах..................................................................283 Стандартные ошибки..................................................................................283 Проверка гипотезы......................................................................................285 Проблемы, возникающие при экспериментах..............................................285 Несоблюдение условий и инструментальные переменные.....................285 Случайный дисбаланс.................................................................................294 Оглавление 9
Нехватка статистической мощности.........................................................296 Убыль в ходе эксперимента........................................................................297 Взаимное влияние.......................................................................................298 Естественные эксперименты..........................................................................300 Военная служба и будущие доходы............................................................301 Подведение итогов..........................................................................................302 Ключевые термины.........................................................................................302 Упражнения.....................................................................................................304 Дополнительное чтение и ссылки..................................................................305 Глава 12. Модели разрывной регрессии......................................307 О чем эта глава.................................................................................................307 Введение...........................................................................................................307 Реализация метода разрывной регрессии.................................................312 Какие кандидаты более успешны – радикальные или умеренные?........314 Непрерывность в пороговой точке............................................................317 Сохраняется ли непрерывность в разрывных регрессиях для анализа выборов?.................................................................................322 Несоблюдение условий и нечеткая разрывная регрессия............................323 Бомбардировки во Вьетнаме......................................................................324 Мотивация и успех......................................................................................328 Подведение итогов..........................................................................................329 Ключевые термины.........................................................................................330 Упражнения.....................................................................................................330 Дополнительное чтение и ссылки..................................................................332 Глава 13. Метод разности различий.............................................334 О чем эта глава.................................................................................................334 Введение...........................................................................................................334 Параллельность трендов.................................................................................335 Два объекта и два периода..............................................................................337 Безработица и минимальная заработная плата........................................337 N объектов и два периода...............................................................................341 Вредит ли просмотр телевизора детям?....................................................342 N объектов и N периодов................................................................................345 Контрацепция и гендерный разрыв в оплате труда.................................346 Полезные проверки.........................................................................................348 Влияет ли поддержка газет на решение по голосованию?.......................349 Заразно ли ожирение?.................................................................................350 Разность различий как проверка достоверности выводов...........................353 Подведение итогов..........................................................................................353 Ключевые термины.........................................................................................353 Упражнения.....................................................................................................354 Дополнительное чтение и ссылки..................................................................356 Глава 14. Механизмы причинно-следственных связей............358 О чем эта глава.................................................................................................358 10 Оглавление