Критерии проверки гипотез об однородности. Руководство по применению
Покупка
Основная коллекция
Тематика:
Статистика
Издательство:
НИЦ ИНФРА-М
Автор:
Лемешко Борис Юрьевич
Год издания: 2021
Кол-во страниц: 248
Дополнительно
Вид издания:
Монография
Уровень образования:
Дополнительное профессиональное образование
ISBN: 978-5-16-016336-9
ISBN-онлайн: 978-5-16-108633-9
DOI:
10.12737/986695
Артикул: 645799.04.01
В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотез об однородности законов, которым принадлежат анализируемые выборки, об однородности средних (о равенстве математических ожиданий), об однородности дисперсий (о равенстве дисперсий сравниваемых выборок). Указываются недостатки и преимущества различных критериев, рассматривается применение критериев в условиях нарушения стандартных предположений.
Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев.
Настоящее издание содержит описание более широкого множества критериев. Предлагаются построенные модели предельных распределений статистик для некоторых выборочных критериев однородности законов.
Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных.
Рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, с обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), преподавателям вузов, аспирантам и студентам.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Б.Ю. ЛЕМЕШКО КРИТЕРИИ ПРОВЕРКИ ГИПОТЕЗ ОБ ОДНОРОДНОСТИ РУКОВОДСТВО ПО ПРИМЕНЕНИЮ МОНОГРАФИЯ 2-е издание, переработанное и дополненное Москва ИНФРА-М 2021
УДК 519.2(075.4) ББК 22.172 Л44 Р е ц е н з е н т ы: Попов А.А., доктор технических наук, профессор; Селезнев В.А., доктор физико-математических наук, профессор Лемешко Б.Ю. Л44 Критерии проверки гипотез об однородности. Руководство по применению : монография / Б.Ю. Лемешко. — 2-е изд., перераб. и доп. — Москва : ИНФРА-М, 2021. — 248 с. — (Научная мысль). — DOI 10.12737/986695. ISBN 978-5-16-016336-9 (print) ISBN 978-5-16-108633-9 (online) В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотез об однородности законов, которым принадлежат анализируемые выборки, об однородности средних (о равенстве математических ожиданий), об однородности дисперсий (о равенстве дисперсий сравниваемых выборок). Указываются недостатки и преимущества различных критериев, рассматривается применение критериев в условиях нарушения стандартных предположений. Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев. Настоящее издание содержит описание более широкого множества критериев. Предлагаются построенные модели предельных распределений статистик для некоторых выборочных критериев однородности законов. Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных. Рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, с обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), преподавателям вузов, аспирантам и студентам. УДК 519.2(075.4) ББК 22.172 ISBN 978-5-16-016336-9 (print) ISBN 978-5-16-108633-9 (online) © Лемешко Б.Ю., 2017 © Лемешко Б.Ю., 2021, с изменениями
ОГЛАВЛЕНИЕ kkk ПРЕДИСЛОВИЕ ..............................................................................5 ВВЕДЕНИЕ .......................................................................................8 1. ОБЩИЕ СВЕДЕНИЯ О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ ...............................................11 2. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ .......................................................................18 2.1. Критерий Смирнова................................................................... 20 2.2. Критерий Лемана-Розенблатта ................................................ 29 2.3. Критерий Андерсона-Дарлинга ............................................... 35 2.4. Многовыборочный критерий Андерсона-Дарлинга .............. 40 2.5. Критерии однородности Жанга ................................................ 48 2.6. Двухвыборочные критерии при анализе k выборок ............... 60 2.6.1. выборочный критерий Смирнова (max) ....................... 61 2.6.2. выборочный критерий Лемана-Розенблатта (max)..... 66 2.6.3. выборочный критерий Андерсона-Дарлинга (max) ... 70 2.7. Критерий однородности F2 ....................................................... 73 2.8. Примеры применения ................................................................ 76 2.9. Выводы по разделу .................................................................... 80 3. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ СРЕДНИХ ...84 3.1. Параметрические критерии однородности средних ............... 85 3.1.1. Критерий сравнения двух выборочных средних при известных дисперсиях .................................................................... 85 3.1.2. Критерий Стьюдента......................................................... 86 3.1.3. Критерий сравнения двух выборочных средних при неизвестных и неравных дисперсиях ............................................ 86 3.1.4. F-критерий однородности средних .................................. 89 3.1.5. k-выборочный вариант критерия Стьюдента ................. 90 3.1.6. Об устойчивости параметрических критериев ............... 91 3.2. Непараметрические критерии однородности средних ........... 95 3.2.1. Критерии Уилкоксона и Манна-Уитни .......................... 95 3.2.2. Критерий Краскела-Уаллиса ........................................... 97 3.2.3. Критерий Ван дер Вардена ............................................... 98 3.2.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга ............... 100 3.2.5. Многовыборочный критерий Ван дер Вардена ............ 101 3.3. Сравнительный анализ мощности критериев ....................... 102 3.4. Выводы по разделу .................................................................. 112
4 «нестандартных» 4. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ ДИСПЕРСИЙ ................................................................................115 4.1. Параметрические критерии однородности дисперсий ......... 118 4.1.1. Критерий Бартлетта ........................................................ 118 4.1.2. Критерий Кокрена ........................................................... 122 4.1.3. Критерий Хартли ............................................................. 124 4.1.4. Критерий Левене ............................................................. 126 4.1.5. Критерий Фишера ........................................................... 132 4.1.6. Критерий Неймана-Пирсона .......................................... 133 4.1.7. Критерий ОCБрайена. ...................................................... 136 4.1.8. Критерий Линка .............................................................. 139 4.1.9. Критерий Ньюмана ......................................................... 140 4.1.10. Критерий Блиса-Кокрена-Тьюки .............................. 142 4.1.11. Критерий Кадуэлла-Лесли-Брауна ........................... 144 4.1.12. Z-критерий Оверолла-Вудворда ............................... 146 4.1.13. Модифицированный Z-критерий .............................. 147 4.1.14. Критерий Миллера ...................................................... 150 4.1.15. Критерий Лайарда ....................................................... 152 4.2. Непараметрические критерии однородности дисперсий ..... 153 4.2.1. Критерий Ансари-Бредли .............................................. 153 4.2.2. Критерий Муда ................................................................ 155 4.2.3. Критерий Сижела-Тьюки ............................................... 157 4.2.4. Критерий Клотца ............................................................. 159 4.2.5. Критерий Кейпена ........................................................... 161 4.2.6. k-выборочный критерий Флайне-Киллина .................. 162 4.3. Сравнительный анализ мощности критериев ....................... 166 4.4. Мощность критериев при нарушении предположения о нормальности .................................................................................. 177 4.5. Критерий Кокрена при законах, отличных от нормального... 183 4.6. Что надо учитывать при выборе критерия однородности дисперсий" .......................................................................................... 184 4.7. О вычислении достигнутого уровня значимости ................. 186 4.8. Применение критериев в ³нестандартных´ условиях .......... 188 4.9. Выводы по разделу .................................................................. 193 ЗАКЛЮЧЕНИЕ ............................................................................197 Библиографический список .......................................................198 Приложение ...................................................................................207
ПРЕДИСЛОВИЕ Необходимость проверки гипотез об однородности законов распределения вероятностей, об однородности средних или однородности дисперсий очень часто возникает в различных приложениях, когда хотят убедиться в неизменности (или наоборот в изменении) статистических свойств некоторого объекта, процесса и т.п. после целенаправленного изменения фактора или факторов (методики, технологии и т.д.), неявным образом влияющих на исследуемый объект. В прикладной математической статистике накопился достаточно обширный арсенал критериев (параметрических и непараметрических), предназначенных для проверки гипотез того или иного вида. В качестве критериев проверки однородности законов для анализа 2-х выборок привычно используют критерии Смирнова, ЛеманаРозенблатта, Андерсона-Дарлинга-Петитта, 2 F . При большем числе сравниваемых выборок могут применяться k -выборочные варианты критериев: k -выборочный критерий Андерсона-Дарлинга, 3 варианта критериев Жанга, критерий однородности 2 F , варианты k - выборочных критериев, предусматривающие многократное использование двухвыборочных критериев. Для проверки гипотез об однородности средних могут использоваться классические критерии (варианты критерия Стьюдента и F -критерий), в основе которых лежит предположение о принадлежности выборок нормальным законам, или применяться непараметрические критерии, свободные от этого предположения (Уилкоксона, Манна-Уитни, Краскела-Уаллиса и др.). Арсенал критериев, ориентированных на проверку гипотез об однородности дисперсий наиболее внушительный. Это длинный и возможно неполный ряд параметрических критериев (Бартлетта, Кокрена, Фишера, Хартли, Неймана-Пирсона, О¶Брайена, Левене, Лайарда, Миллера, Линка, Ньюмана, Блисса-Кокрена-Тьюки, Кадуэлла-Лесли-Брауна, Z-критерий Оверолла-Вудворда, модифи
6 цированный Z-критерий), в обосновании которых решающая роль принадлежит стандартному предположению о принадлежности анализируемых выборок нормальным законам. Это достаточно представительный перечень непараметрических критериев, предназначенных для проверки однородности характеристик рассеяния (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена, Клотца, Флайне-Киллина). Применяемое множество критериев создавалось на протяжении практически столетия интенсивного развития математической статистики. Однако до сих пор не сформировалось устойчивого мнения о том, какие из этого множества критериев наиболее предпочтительны при проверке соответствующих гипотез" Какие критерии обладают большей мощностью" Какие достоинства или недостатки связаны с отдельными критериями" Давно известно, что параметрические критерии проверки однородности средних достаточно устойчивы к нарушению стандартного предположения о нормальности. Выводы могут оставаться корректными при значительных отклонениях наблюдаемого закона от нормального. Однако у устойчивости параметрических критериев есть вторая сторона медали: их преимущество в мощности по сравнению с непараметрическими критериями весьма незначительно. В свою очередь параметрические критерии проверки однородности дисперсий, за редким исключением, чрезвычайно чувствительны к малейшим отклонениям от нормальности, что негативно отражается на корректности статистических выводов. В то же время в основной массе параметрические критерии имеют заметное преимущество в мощности перед непараметрическими. Причём преимущество в мощности сохраняется за параметрическими критериями и в условиях нарушения предположения о нормальности (если только выборки не принадлежат законам с ³тяжёлыми хвостами´). По этой причине очень желательно иметь возможность корректного применения параметрических критериев в условиях нарушения стандартного предположения о нормальности. Для реализации такой возможности необходимо лишь знание
7 распределений статистик критериев в таких нестандартных условиях, что в настоящее время, благодаря использованию компьютерных технологий и имитационного моделирования, отнюдь не является неразрешимой задачей. Данное руководство подготовлено с учетом наших исследований, проведенных в предшествующих работах и непосредственно при формировании его содержания. Исследования позволили провести сравнительный анализ мощности групп критериев относительно различных альтернатив, позволили указать на нюансы применения или существенные недостатки некоторых критериев, проявляющиеся при проверке гипотез. Нельзя утверждать, что в каждом из разделов настоящего руководства проанализированы абсолютно все существующие критерии, предназначенные для проверки гипотез определённого вида, по-видимому, наиболее упоминаемые и чаще используемые. И всё-таки хочется надеяться, что настоящая книга, как и предшествующие [86, 87, 88, 112] окажет реальную помощь специалистам, заинтересованным в корректности проводимого статистического анализа. Я очень признателен своим коллегам и ученикам (Лемешко С.Б., Горбуновой А.А., Сатаевой Т.С., Веретельниковой И.В., Новиковой А.Ю.), внёсшим заметный вклад в уточнение знаний о свойствах критериев, что позволило подготовить и расширить данное руководство. Значительная часть исследований, способствующих подготовке руководства, проведена при поддержке Министерства образования и науки РФ в рамках выполнения государственной работы «Обеспечение проведения научных исследований» (№ 1.4574.2017/6.7) и проектной части государственного задания (проект (№ 1.1009.2017/4.6). Б.Ю. Лемешко апрель 2020
8 ВВЕДЕНИЕ Необходимость в проверке гипотез об однородности выборок случайных величин очень часто возникает в различных приложениях при решении задач статистического анализа результатов экспериментальных исследований. При этом речь может идти или о проверке гипотез об однородности законов распределения вероятностей, соответствующих анализируемым выборкам, или об однородности математических ожиданий, или об однородности дисперсий. Естественно, что наиболее полные выводы могут быть получены на основании решения первой задачи. Однако исследователя в большей степени может интересовать ответ на вопрос об отсутствии (наличии) возможных отклонений в средних значениях анализируемых выборок или в характеристиках рассеяния результатов измерений. Задача проверки гипотезы об однородности законов, соответствующих k выборкам, формулируется следующим образом. Имеется k выборок 1 11 12 1 , , ..., n x x x , 2 21 22 2 , , ..., n x x x , , 1 2 , , ..., k k k kn x x x , где i n - объём i -й выборки, 1, i k . Проверяется гипотеза о том, что все выборки извлечены из одной и той же генеральной совокупности, т. е. 0 H : 1 2 ( ) ( ) ( ) ( ) k F x F x F x F x ( ) k( ) ( ) ( ) ( ) ( при любом x . Конкурирующая гипотеза может иметь вид 1 H : ( ) ( ) i j F x F x z для некоторых , , i j i j k z d . Как правило, критерии проверки гипотезы об однородности законов непараметрические. При проверке гипотезы об однородности средних (о равенстве математических ожиданий) предполагается, что анализируемые выборки принадлежат какому-то одному закону: неизвестному в случае непараметрических критериев и известному в случае параметрических. Проверяемая гипотеза имеет вид
9 0 1 2 : k H P P Pk P при конкурирующей гипотезе 1 2 1: i i H P z P , где неравенство выполняется хотя бы для некоторой пары индексов 1 i , 2 i . Для проверки гипотез о равенстве математических ожиданий может использоваться ряд параметрических критериев, применение которых, как правило, опирается на стандартное предположение о принадлежности анализируемых выборок нормальным законам, а также непараметрические критерии, свободные от этого предположения. В то же время следует иметь в виду, что применение непараметрических критериев базируется на предположении, что законы, которым принадлежат сравниваемые выборки, могут отличаться только параметрами сдвига. В критериях проверки однородности дисперсий проверяемая гипотеза о постоянстве дисперсий k выборок имеет вид 2 2 2 0 1 2 : ... k H V V V , а конкурирующая с ней гипотеза 1 2 2 2 1: i i H V z V , где неравенство выполняется, по крайней мере, для одной пары индексов 1 2 , i i . Для проверки такого рода гипотез может использоваться значительный перечень классических параметрических критериев. Обоснованное применение этих критериев требует выполнения стандартного предположения о принадлежности анализируемых выборок нормальному закону. В случае непараметрических аналогов речи о принадлежности выборок нормальным законам не идёт. Однако предполагается, что анализируемые выборки принадлежат пусть неизвестному, но одному и тому же виду закона с одинаковыми математическими ожиданиями. Именно тогда обеспечивается корректность применения критериев. У исследователя, стоящего перед проблемой выбора критерия, несмотря на обилие публикаций, возникает множество вопросов, так
10 как остается не ясным, в каких случаях применение какого критерия предпочтительней. В случае критериев проверки гипотез об однородности законов распределений, перечень которых достаточно узок, специалиста может интересовать, насколько хорошо при ограниченных объёмах выборок распределения статистик хорошо описываются предельными распределениями" Или какой из критериев является более мощным (лучше распознаёт альтернативы)" Такие же вопросы возникают относительно критериев проверки гипотез о средних, где мы имеем множество критериев (параметрических и непараметрических), но нет четких указаний и сведений о преимуществе тех или иных, например, о степени устойчивости параметрических критериев к отклонениям от стандартного предположения о нормальности, о результатах сравнения мощности параметрических и непараметрических критериев. Отсутствие указаний не позволяет в конкретной ситуации выбрать наиболее мощный критерий. По некоторым параметрическим критериям проверки гипотез о средних имеется информация об относительной устойчивости распределений статистик к отклонениям наблюдаемого закона от нормального [103, 100]. По другим критериям это требует дополнительных исследований. Параметрические критерии проверки гипотез о дисперсиях, наоборот, весьма чувствительны к любым отклонениям от предположений, в условиях которых они были получены. И также отсутствует или противоречива информация о мощности соответствующих критериев [77, 101, 35]. Множества критериев, построенных для проверки гипотез о равенстве математических ожиданий или о равенстве дисперсий, заметно шире множества критериев проверки однородности законов. Поэтому проблема выбора наиболее предпочтительного критерия стоит более остро. Особенно важна объективная информация относительно свойств критериев проверки гипотез об однородности дисперсий (об однородности характеристик рассеяния).