Прикладная медицинская статистика
Покупка
Издательство:
Фолиант
Год издания: 2006
Кол-во страниц: 432
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Специалитет
ISBN: 5-93929-135-X
Артикул: 729108.01.99
Настоящее издание является пособием по применению статистического анализа в медицине. В пособии рассматриваются источники получения информации о здоровье населения, некоторые понятия теории вероятности, необходимые для уяснения логики статистического анализа, а также конкретные методики математической статистики в приложении к практике медико-биологических, клинических, гигиенических и социально-гигиенических исследований. На наглядных примерах рассмотрены приемы статистической обработки данных с помощью популярного программного пакета Microsoft Excel. Издание предназначено для студентов вузов медико-биологического профиля, научных работников и врачей всех специальностей. При подготовке издания использованы материалы А. А. Самуся.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 34.03.01: Сестринское дело
- ВО - Специалитет
- 30.05.01: Медицинская биохимия
- 30.05.02: Медицинская биофизика
- 30.05.03: Медицинская кибернетика
- 31.05.01: Лечебное дело
- 31.05.02: Педиатрия
- 31.05.03: Стоматология
- 32.05.01: Медико-профилактическое дело
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
В. М. Зайцев, В. Г. Лифляндский, В. И. Маринкин ПРИКЛАДНАЯ МЕДИЦИНСКАЯ СТАТИСТИКА Учебное пособие Издание второе Рекомендовано Учебно-методическим объединением по медицинскому и фармацевтическому образованию Министерства образования и Министерства здравоохранения РФ в качестве учебного пособия для студентов медицинских вузов Санкт-Петербург ФОЛИАНТ 2006
УДК 61: 311-2 ББК 51.1 (2) Рецензенты: Заведующий кафедрой общественного здоровья и здравоохранения СПбГМУ им. И. П. Павлова д. м. н., профессор Н. И. Вишняков Заведующий кафедрой общественного здоровья и здравоохранения СПбПМА, д. м. н., профессор В. К. Юрьев Зайцев В. М., Лифляндский В. Г., Маринкин В. И. Прикладная медицинская статистика : Учебное пособие. — 2-е изд. — СПб : ООО «Издательство ФОЛИАНТ», 2006. — 432 с. ISBN 5-93929-135-Х Настоящее издание является пособием по применению статистического анализа в медицине. В пособии рассматриваются источники получения информации о здоровье населения, некоторые понятия теории вероятности, необходимые для уяснения логики статистического анализа, а также конкретные методики математической статистики в приложении к практике медико-биологических, клинических, гигиенических и социально-гигиенических исследований. На наглядных примерах рассмотрены приемы статистической обработки данных с помощью популярного программного пакета Microsoft Excel. Издание предназначено для студентов вузов медико-биологического профиля, научных работников и врачей всех специальностей. При подготовке издания использованы материалы А. А. Самуся. © В. М. Зайцев, В. Г. Лифляндский, В. И. Маринкин, 2006 ISBN 5-93929-135-Х © ООО «Издательство ФОЛИАНТ», 2006
оглавление 1. Введение в медицинскую статистику . . . . . . . . . . . . . . . . . . . . . . . 7 2. Цели, задачи, план и программа статистического исследования . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.1. Статистическая совокупность, единица наблюдения, учетные признаки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2. Программа сбора. Генеральная и выборочная совокупности. Репрезентативность данных. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3. Программа статистической разработки. Основы группировки данных. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.4. Статистические таблицы. Правила оформления статистических таблиц . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.5. Основы работы с электронной таблицей MS Excel . . . . . . . . . . . . 48 2.5.1. Ввод и редактирование данных . . . . . . . . . . . . . . . . . . . . . . . . 50 2.5.2. Выделение блока ячеек . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.5.3. Ввод математических формул . . . . . . . . . . . . . . . . . . . . . . . . . 52 2.5.4. Копирование данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.5.5. Дублирование формул . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.5.6. Формирование границ таблицы . . . . . . . . . . . . . . . . . . . . . . . . 55 2.5.7. Формирование баз данных и сводных таблиц в MS Excel 56 2.6. Графические изображения. Правила построения графических изображений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.6.1. Основные типы диаграмм . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 2.6.2. Специальные диаграммы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 2.6.3. Построение диаграммы в MS Excel. . . . . . . . . . . . . . . . . . . . . 88 3. Источники статистической информации о здоровье. . . . . . . . . . 92 3.1. Заболеваемость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 3.2. Физическое развитие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 3
ПРИКЛАДНАЯ МЕДИЦИНСКАЯ СТАТИСТИКА 3.3. Медицинская демография . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 3.3.1. Статика населения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 3.3.2. Динамика населения. Естественное и механическое движение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 3.4. Планирование медико-биологического эксперимента с малым числом наблюдений . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 4. Основы математико-статистической обработки данных . . . . . . 169 4.1. Относительные величины. Статистические коэффициенты. . . . 170 4.2. Показатели описательной статистики . . . . . . . . . . . . . . . . . . . . . . . . 178 4.3. Ряды распределений. Вариационные ряды. . . . . . . . . . . . . . . . . . . 179 4.3.1. Построение вариационных рядов в MS Excel. . . . . . . . . . . . 188 4.4. Показатели центра распределения. Средние величины . . . . . . . 191 4.4.1. Среднее арифметическое. Статистическое взвешивание 192 4.4.2. Упрощенный способ «ручного» вычисления среднего арифметического . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 4.4.3. Другие степенные средние . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 4.4.4. Мода и медиана . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 4.4.5. Вычисление средних в MS Excel . . . . . . . . . . . . . . . . . . . . . . . 209 4.5. Показатели рассеяния вариант. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 4.5.1. Дисперсия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 4.5.2. Среднеквадратическое отклонение . . . . . . . . . . . . . . . . . . . . 218 4.5.3. Коэффициент вариации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 4.5.4. Квантили. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 4.5.5. Использование MS Excel для нахождения квантилей . . . . 224 4.5.6. Статистические моменты. Асимметрия и эксцесс . . . . . . . 227 4.6. Статистическая проверка статистических гипотез. . . . . . . . . . . . . 229 4.7. Оценка статистических параметров по выборочным данным . . 236 4.7.1. Доверительная значимость, доверительная вероятность, доверительный интервал, доверительный предел . . . . . . 239 4.8. Вычисление показателей описательной статистики в MS Excel 245 5. Теоретические распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 5.1. Нормальное распределение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 5.2. Критерии совпадения эмпирических и теоретических распределений. Статистические оценки нормальности распределения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 4
Оглавление 5.2.1. Нахождение нормального распределения с помощью MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254 5.2.2. Критерий согласия Пирсона c2 . . . . . . . . . . . . . . . . . . . . . . . . . 255 5.2.3. Критерий согласия Колмогорова К(l) . . . . . . . . . . . . . . . . . . . 259 6. Статистическая (корреляционная) связь между признаками. Основные виды связи. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 6.1.1. Регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 6.1.2. Коэффициент ковариации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 6.1.3. Коэффициент линейной корреляции (Пирсона) . . . . . . . . . 276 6.1.4. Корреляционное отношение. Криволинейная корреляция 281 6.1.5. Частная (парциальная) корреляция . . . . . . . . . . . . . . . . . . . . 284 6.1.6. Понятие о множественной корреляции . . . . . . . . . . . . . . . . . 287 6.1.7. Вычисление коэффициентов корреляции и уравнений регрессии в MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 6.1.8. Оценки взаимосвязи качественных признаков с помощью коэффициента ранговой корреляции Спирмена . . . . . . . . 297 6.2. Оценки взаимосвязи качественных признаков на принципе взаимной сопряженности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 6.2.1. Коэффициенты Q и Ф . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 6.2.2. Коэффициенты сопряженности Пирсона (С) и Чупрова (К) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 6.2.3. Вычисление критерия сопряженности в MS Excel. . . . . . . . 306 7. Статистические критерии различия. . . . . . . . . . . . . . . . . . . . . . . . . . . 308 7.1. Принадлежность варианты к совокупности . . . . . . . . . . . . . . . . . . . 309 7.1.1. Определение «выскакивающей» варианты с помощью MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311 7.2. Критерии различий эмпирических распределений . . . . . . . . . . . . 313 7.2.1. Оценка различий эмпирических распределений с помощью MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 7.3. Оценка различий между двумя долями, интенсивными величинами и средними арифметическими с помощью t-критерия. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 7.3.1. Использование MS Excel при статистической проверке различий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 7.4. Критерии различия между двумя средними тенденциями. . . . . . 329 7.4.1. Критерий знаков . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 5
ПРИКЛАДНАЯ МЕДИЦИНСКАЯ СТАТИСТИКА 7.4.2. Критерий Вилкоксона . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330 7.5. Оценка различия между несколькими средними. Дисперсионный анализ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 7.6. Дисперсионный анализ в MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . 338 7.6.1. Однофакторный дисперсионный анализ . . . . . . . . . . . . . . . . 338 7.6.2. Двухфакторный анализ с неповторяющимися данными . . 341 7.6.3. Двухфакторный анализ с повторяющимися данными . . . . 344 7.7. Оценка различий коэффициентов корреляции. . . . . . . . . . . . . . . . 347 7.8. Оценка достоверности различий коэффициентов вариации . . . 348 8. Динамические (временны;е) ряды. . . . . . . . . . . . . . . . . . . . . . . . . . 350 8.1. Показатели динамического ряда. Вычисление основных показателей динамического ряда . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 8.2. Углубленный анализ динамических рядов. . . . . . . . . . . . . . . . . . . . 354 8.2.1. Показатели сезонности. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 8.2.2. Вычисление показателей сезонности в MS Excel . . . . . . . . 357 8.2.3. Повышение наглядности тенденций динамических рядов. Прогноз динамики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 8.3. Обработка динамических рядов и прогноз динамики в MS Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365 9. Оценка различий показателей заболеваемости . . . . . . . . . . . . . . 371 9.1. Типичные ошибки, допускаемые при анализе показателей заболеваемости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371 9.2. Определение различий альтернативных показателей заболеваемости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374 9.3. Определение различий интенсивных показателей заболеваемости при неальтернативном распределении . . . . . . 377 9.3.1. Расчет доверительных интервалов для показателей заболеваемости в программе Excel. . . . . . . . . . . . . . . . . . . . 381 9.4. Непараметрические критерии оценки различий показателей заболеваемости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 382 Приложения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 Словарь терминов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
1. Введение в медицинскую статистику В здравоохранении, как в системе организации медицинской помощи населению, а также в профилактической и клинической медицине повсеместно используются различные численные методы. Они применяются в клинической практике, когда врач имеет дело с отдельным больным, в организации медико-социальной помощи населению при прогнозировании и оценке результатов тех или иных медико-социальных программ. Знание этих методов необходимо при планировании и проведении научных исследований, для правильного понимания их результатов, критической оценки публикуемых данных. Понимает врач это или нет, но в основе решения любого вопроса о применении способа, тактики лечения или профилактики патологии лежат численные методы. Исторически сложилось так, что большой набор численных методов, применяемых в медицине, получил общее название — статистика. По своей природе термин статистика имеет несколько толкований. Наиболее примитивное из них подразумевает под статистикой всякий упорядоченный набор числовых характеристик какого-либо явления. Если рассматривать статистику как отрасль знаний или отрасль практической деятельности, то все выглядит значительно сложнее. Считается, что корни термина статистика происходят от латинского слова «статус» (status) — состояние. Несомненна связь и с итальянским «stato» — государство. Собирание данных о материальном состоянии населения, случаях рождений и смерти, по свидетельству древнегреческого историка Геродота, существовало в Персии уже за 400 лет до Рождества Христова. В Ветхом Завете Библии есть целая глава (Книга чисел), посвященная таким статистическим выкладкам. 7
ПРИКЛАДНАЯ МЕДИЦИНСКАЯ СТАТИСТИКА В эпоху Возрождения в Италии появились люди, которых называли «Statisto» — знаток государства. Как синоним терминов политическая арифметика и государствоведние термин статистика стал впервые употребляться с середины XVII века. Государственная или политическая статистика остается и поныне большим самостоятельным разделом статистики. В настоящее время эта статистика представляет собой сложную, разветвленную систему взаимосвязанных разделов и дисциплин. Все они имеют в большей или меньшей степени самостоятельное научное и практическое значение в деле управления государством. Например: статистика государственного бюджета, статистика сельского хозяйства, статистика промышленности, транспорта и т. д. В зависимости от отраслевой принадлежности выделяют статистику капитального строительства, материально-технического обеспечения, статистику материальной базы и т. п. Государственная медицинская статистика, тесно взаимоувязанная с этими разделами статистического учета, также является одной из многих отраслевых статистик, как раньше говорили, «статистикой отрасли народного хозяйства». Но отраслевая медицинская статистика, иногда называемая санитарной статистикой, имеет и свои специфические разделы. В первую очередь это — статистика системы здравоохранения (обеспеченность населения врачами и другим медицинским персоналом, амбулаторно-поликлиническими и стационарными учреждениями, показатели эффективности деятельности этих учреждений и т. п.), а также статистика здоровья населения (медико-демографические характеристики населения, показатели его физического развития и т. п.). В медицинской статистике, как отрасли знаний, нередко выделяют: статистику клиническую, онкологическую, статистику инфекционной заболеваемости, заболеваемости особо опасными инфекциями и т. д. Многообразие этих разделов медицинской статистики определяется многообразием разделов медицины как науки и разнообразием видов конкретной практической деятельности медиков. Все разделы медицинской статистики тесно между собой взаимосвязаны, имеют единую методическую основу, и их деление во многих случаях является весьма условным. 8
1. Введение в медицинскую статистику Математическая статистика, как отрасль знаний, представляет собой специальную научную дисциплину и соответствующую ей учебную дисциплину. Предмет этой дисциплины — явления, оценка которых может производиться только в массе наблюдений. Эта ключевая особенность обусловлена тем, что изучаемые статистикой явления не имеют постоянных, всегда одних и тех же исходов. Например: масса тела даже у одного и того же человека постоянно меняется, состав клеточных элементов крови при каждом заборе анализа у одного и того же пациента будет несколько различаться, последствия применения одного и того же препарата у разных людей могут иметь свои индивидуальные особенности, и т. п. Однако многие хаотичные на первый взгляд явления имеют на самом деле вполне упорядоченную структуру и, соответственно, могут иметь вполне конкретные численные оценки. Главное условие для этого — статистическая регулярность, статистическая устойчивость этих явлений, то есть существование строго определенных закономерностей, пусть даже скрытых на первый взгляд, которые можно описать математическими методами статистики. Френк Йейтс (1937) писал: «Большинству биологических объектов свойственна вариабельность, и прелесть простоты и воспроизводимости физических или химических экспериментов утрачивается. А значит, на передний план начинают выдвигаться статистические проблемы». Фактором, оказавшим значительное влияние на развитие математических методов статистики, стало открытие закона больших чисел Яковом Бернулли (1654–1705) и появление теории вероятности, основы которой разработал французский математик и астроном Пьер Симон Лаплас (1749–1827). Заметным этапом в ряду этих событий для медицинской статистики стала публикация работ бельгийского ученого А. Кетле (1796–1874), впервые применившего на практике математико-статистические методы исследования. В своей работе «О человеке и развитии его способностей» А. Кетле вывел тип среднего человека, наделенного, наряду со средними показателями физического развития (рост, вес), средними умственными способностями и средними моральными качествами. В этот же период времени в России выходит работа 9
ПРИКЛАДНАЯ МЕДИЦИНСКАЯ СТАТИСТИКА врача Д. Бернулли «О прививках против оспы. О смерти и теории вероятности». На основе теории вероятности, которая позволяет выявлять определенные тенденции в кажущемся на первый взгляд хаосе случайных явлений, в последующие годы появилась математическая статистика. Предметом математической статистики стала формально-математическая сторона статистического анализа и количественная оценка на ее основе вероятностей различных явлений. В зависимости от точки приложения существуют различные направления использования методов математической статистики. Медицинская статистика как точка приложения методов математической статистики занимает особое место. Это особое место обусловлено большой ролью медицины в возникновении статистики как самостоятельной науки и существенным влиянием научно-исследовательских разработок медико-биологических проблем на появление многих методов статистического анализа. В настоящее время, с целью подчеркнуть особый статус медико-биологической математической статистики, для ее обозначения все чаще используют термин биометрия. Необходимо помнить, что выбор тех или иных методов статистического исследования не может быть раз и навсегда очерчен рамками какого-либо раздела или отрасли медицины. Окончательный выбор конкретных методик зависит от многих обстоятельств, не последним из которых является уровень подготовки специалиста-исследователя в области применения статистических методов. Большинство методов статистического анализа являются универсальными и могут применяться не только в разных отраслях медицинской статистики, но и в самых разнообразных отраслях человеческой деятельности. Например, с точки зрения формальной логики статистический прогноз инфекционной заболеваемости и прогноз курса доллара — одна и та же задача. По этой же причине большинство компьютерных статистических программ не являются чисто медицинскими прикладными программами. Кроме того, нередко выполнение отдельных стати10