Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Критерии проверки отклонения распределения от нормального закона. Руководство по применению

Покупка
Основная коллекция
Артикул: 479650.06.01
Доступ онлайн
от 424 ₽
В корзину
В монографии рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотезы о принадлежности анализируемых данных нормальному закону распределения вероятностей. Рассматриваются и сравниваются специальные критерии, непараметрические критерии согласия и критерии типа χ2. Указываются недостатки и преимущества различных критериев. Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев. По сравнению с первым изданием существенно расширено множество рассмотренных специальных критериев нормальности. Все множество критериев проранжировано по мощности относительно ряда близких конкурирующих гипотез, что облегчает выбор наиболее предпочтительных критериев. Показано, что в приложениях свойства критериев могут существенно изменяться вследствие наличия ошибок округления и это необходимо учитывать при формировании статистических выводов. Следование рекомендациям при анализе данных обеспечит корректность статистических выводов и повысит их обоснованность. Рассчитана на специалистов, в той или иной мере сталкивающихся в своей деятельности с вопросами статистического анализа данных, обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), преподавателям вузов, аспирантам и студентам.
24
Лемешко, Б. Ю. Критерии проверки отклонения распределения от нормального закона. Руководство по применению : монография / Б.Ю. Лемешко. — 2-е изд., перераб. и доп. — Москва : ИНФРА-М, 2023. — 353 с. — (Научная мысль). — DOI 10.12737/1896110. - ISBN 978-5-16-017901-8. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1896110 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
КРИТЕРИИ ПРОВЕРКИ 
ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ 
ОТ НОРМАЛЬНОГО ЗАКОНА

РУКОВОДСТВО ПО ПРИМЕНЕНИЮ

Б.Ю. ЛЕМЕШКО

2-е издание, переработанное и дополненное

МОНОГРАФИЯ

Москва
ИНФРА-М
2023

УДК 519.23(075.4)
ББК 60.6
 
Л44

Лемешко Б.Ю.
Л44  
Критерии проверки отклонения распределения от нормального закона. Руководство по применению : монография / Б.Ю. Лемешко. — 
2-е изд., перераб. и доп. — Москва : ИНФРА-М, 2023. — 353 с. — (Научная мысль). — DOI 10.12737/1896110.

ISBN 978-5-16-017901-8 (print)
ISBN 978-5-16-110911-3 (online)
В монографии рассматриваются вопросы применения статистических 
критериев, ориентированных на проверку гипотезы о принадлежности 
анализируемых данных нормальному закону распределения вероятностей. 
Рассматриваются и сравниваются специальные критерии, непараметрические критерии согласия и критерии типа 2. Указываются недостатки 
и преимущества различных критериев. Приводятся таблицы, содержащие 
процентные точки и модели распределений статистик, необходимые для 
корректного применения критериев.
По сравнению с первым изданием существенно расширено множество 
рассмотренных специальных критериев нормальности. Все множество критериев проранжировано по мощности относительно ряда близких конкурирующих гипотез, что облегчает выбор наиболее предпочтительных критериев. Показано, что в приложениях свойства критериев могут существенно 
изменяться вследствие наличия ошибок округления и это необходимо учитывать при формировании статистических выводов.
Следование рекомендациям при анализе данных обеспечит корректность статистических выводов и повысит их обоснованность. 
Рассчитана на специалистов, в той или иной мере сталкивающихся в своей 
деятельности с вопросами статистического анализа данных, обработкой результатов экспериментов, применением статистических методов для анализа 
различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля 
(медикам, биологам, социологам, экономистам и др.), преподавателям вузов, 
аспирантам и студентам.

УДК 519.23(075.4)
ББК 60.6

Р е ц е н з е н т ы:
Попов А.А., доктор технических наук, профессор, профессор кафедры теоретической и прикладной информатики Новосибирского 
государственного технического университета;
Селезнев В.А., доктор физико-математических наук, профессор, 
заведующий кафедрой инженерной математики Новосибирского государственного технического университета

ISBN 978-5-16-017901-8 (print)
ISBN 978-5-16-110911-3 (online)

© Лемешко Б.Ю., 2015
© Лемешко Б.Ю., 2022, 
с изменениями

Оглавление 
 
Предисловие ......................................................................................6 
Введение .............................................................................................9 
1. Общие положения ......................................................................13 

1.1. Общие сведения о проверке статистических гипотез .......... 13 
1.2. Конкурирующие гипотезы ...................................................... 20 

2. Критерии проверки отклонения распределения  
от нормального закона ..................................................................24 

2.1. Критерий проверки на симметричность ................................ 24 
2.2. Критерий проверки на эксцесс ............................................... 26 
2.3. Критерий Шапиро–Уилка (Shapiro–Wilk Test) ..................... 29 
2.4. Критерий Эппса–Пулли (Epps–Pulley Test) ........................... 34 
2.5. Модифицированный критерий Шапиро–Уилка .................... 40 
2.6. Критерий Харке–Бера проверки на симметричность  
       и нулевой коэффициент эксцесса (Jarque–Bera Test) ........... 43 
2.7. Модификация Гелы–Гаствирта критерия проверки  
        на симметричность и нулевой коэффициент эксцесса  
       (Gel–Gastwirth Test) ................................................................. 47 
2.8. Модификация Д’Агостино критерия проверки  
       на симметричность .................................................................. 50 
2.9. Модификация Д’Агостино критерия проверки  
       на симметричность и значение эксцесса ............................... 52 
2.10. Совместный критерий проверки на симметричность  
       и нулевой коэффициент эксцесса Д’Агостино ...................... 56 
2.11. Критерий Фросини (Frosini Test) .......................................... 60 
2.12. Критерии Хегази–Грина (Hegazy–Green Test) .................... 64 
2.13. Критерий Гири (Geary Test) .................................................. 69 
2.14. Критерий Дэвида–Хартли–Пирсона  
        (David–Hartley–Pearson Test) .................................................. 74 
2.15. Критерий Шпигельхальтера (Spiegelhalter Test) ................. 78 
2.16. Критерий Ройстона (Royston Test) ....................................... 83 
2.17. Критерий Васичека (Vasicek Test) ........................................ 89 
2.18. Критерий Корреа (Correa Test) ........................................... 100 

2.19. Критерий Ван Эса (Van Es Test) ......................................... 109 
2.20. Критерий Эбрахими (Ebrahimi Test) .................................. 118 
2.21. Критерии Заманзаде–Аргами  
         (Zamanzade–Arghami Test) .................................................. 127 
2.22. Критерий Гаствирта (Gel–Miao–Gastwirth Test) ............... 145 

          2.23. Критерии Локка–Сперриера (Locke–Spurrier Tests)…….. 149 

2.24. Критерий Мартинеса–Иглевича  
         (Martinez–Iglewitcz Test) ...................................................... 157 
2.25. Критерий Филлибена (Filliben Test) ................................... 162 
2.26. Критерий Шапиро–Франциа (Shapiro–Francia Test) ......... 166 
2.27. Критерий Вайсберга–Бингема  
         (Weisberg–Bingham Test) ..................................................... 167 
2.28. Критерий Жанга (Zhang Test) ............................................. 170 
2.29. Критерий Лина–Мудхолкара (Lin–Mudholkar Test) ......... 174 
2.30. Критерий Чена–Шапиро (Chen–Shapiro Test) ................... 177 
2.31. Критерий Бонетта–Сейер (Bonett–Seier Test) .................... 181 
2.32. Критерий Али–Чорго–Ревеса (Aly–Csorgo–Revesz  
Test) ................................................................................................ 184 
2.33. Критерии Бонтемпса–Меддахи  
         (Bontemps–Meddahi Test) ..................................................... 187 
2.34. Критерии Десгань–Мишо (Desgagne–Micheaux Tests) ..... 193 
2.35. Критерии Оя (Oja Tests) ...................................................... 201 
2.36. Модификация критерии Оя ................................................. 210 
2.37. Критерий Чена (Chen Test) .................................................. 211 
2.38. Критерий Брис–Хьюберт–Стройфа  
         (Brys–Hubert–Struyf Test) .................................................... 214 

3. Непараметрические критерии согласия при проверке 
нормальности ................................................................................219 

3.1. Критерий Колмогорова.......................................................... 219 
3.2. Критерий Купера .................................................................... 223 
3.3. Критерий Крамера–Мизеса–Смирнова ................................ 226 
3.4. Критерий Ватсона .................................................................. 229 
3.5. Критерий Андерсона–Дарлинга ........................................... 232 
3.6. Критерии Жанга ..................................................................... 235 
3.7. О применении непараметрических критериев согласия .... 244 

 
 
 

4. Критерии согласия типа хи-квадрат при проверке 
нормальности ................................................................................247 

4.1. Критерий согласия χ2 Пирсона ............................................. 247 
4.2. Критерий согласия Никулина–Рао–Робсона ....................... 259 
4.3. О применении критериев согласия типа 2 ......................... 265 

5. Ранжирование критериев нормальности по мощности ...267 
6. Анализ погрешностей измерений в классических 
экспериментах ...............................................................................278 

6.1. О роли проверки нормальности ............................................ 278 
6.2. Анализируемые эксперименты ............................................. 280 
6.3. Применяемые критерии нормальности ................................ 283 
6.4. Проверка гипотезы о принадлежности анализируемых 
       выборок нормальному закону ............................................... 285 
6.5. О вычислении достигнутых уровней значимости .............. 289 
6.6. Конкурирующие законы, пригодные для описания 
       результатов анализируемых экспериментов ....................... 291 
6.7. Выводы по результатам анализа ........................................... 296 

7. Развитие технологий проверки статистических  
гипотез ............................................................................................298 

7.1. Изменение роли компьютерных технологий  
       при статистическом анализе данных ................................... 298 
7.2. Интерактивный подход к вычислению p-value ................... 299 

8. Применение критериев нормальности в условиях  
влияния ошибок округления .....................................................303 

8.1. Влияние ошибок округления на распределения статистик 
критериев нормальности .............................................................. 303 
8.2. Применение критериев нормальности в условиях  
       округления измерений ........................................................... 312 
8.3. Реализация применения критериев в условиях влияния 
       ошибок округления ................................................................ 320 

Заключение ....................................................................................327 
Библиографический список .......................................................328 
Приложение. Таблицы для критериев проверки  
нормальности ......................................................................................... 338 

Предисловие 

Нормальный закон распределения вероятностей занимает особое 

место в прикладной математической статистике.  

С одной стороны, применение нормального распределения в 

приложениях обосновывает ряд центральных предельных теорем, 
суть которых заключается в том, что сумма большого количества 
независимых (слабо зависимых) случайных величин с конечными 
математическими ожиданиями и (примерно одинаковыми) дисперсиями имеет распределение близкое к нормальному. Так как многие 
случайные величины, встречающиеся в приложениях, формируются 
под влиянием множества слабо зависимых случайных факторов, их 
распределения могут считаться (оказаться) приближенно нормальными. Как правило, ошибки измерений, характеризующие “отлаженную” измерительную систему, могут хорошо описываться нормальным 
законом. Отклонения контролируемого показателя от номинального 
значения для некоторого отлаженного технологического процесса 
также 
могут 
приближенно 
описываться 
нормальным 
законом 

распределения. 

С другой стороны, предпосылкой, обуславливающей возможность 

применения многих классических методов и критериев проверки 
статистических гипотез, является предположение о принадлежности 
анализируемых случайных величин нормальному закону. Корректность формирования статистического вывода с использованием 
соответствующего критерия обеспечивается только при выполнении 
этого предположения. То есть, соответствующий классический критерий можно применять и полученному выводу можно доверять, если 
не отклоняется гипотеза о принадлежности анализируемой выборки 
нормальному закону. 

В 2002 г. был введен в действие ГОСТ Р ИСО 5479–2002 [103], 

посвященный проверке отклонения распределения вероятностей от 
нормального закона. Сразу было видно, что он не помогает практикам 
в решении соответствующих задач и не отвечает на имеющиеся 
вопросы. Почему выбран такой краткий перечень критериев? Почему 
отобраны именно эти критерии? В чём их преимущество? Есть ли 

недостатки? Почему ничего не говорится об использовании для 
проверки нормальности непараметрических критериев согласия? О 

критериях типа 
2
? 

Критериев, которые могут быть использованы для проверки 

гипотезы о принадлежности выборки нормальному закону, достаточно много. Однако не смотря на множество публикаций не хватает 
объективной информации о действительных свойствах критериев, их 
достоинствах и недостатках. Можно натолкнуться на авторитетные 
мнения о целесообразности применения тех или иных критериев, 
которые не подкрепляются результатами сравнительного анализа и не 
всегда подтверждаются при проверке. 

Специалистов, сталкивающихся в своей практической деятель
ности с необходимостью статистического анализа результатов 
экспериментов и, естественно, с проблемой проверки гипотез о 
принадлежности наблюдений или ошибок измерений нормальному 
закону, интересует, какие критерии предпочтительнее использовать и 
почему. Какие критерии обладают большей мощностью? Какие 
существуют “подводные камни”, отражающиеся на результатах 
анализа? 

После выхода стандарта [103] мы выполнили ряд кропотливых 

исследований, в которых проанализировали мощность достаточно 
представительного круга критериев, используемых при проверке 
нормальности. Анализ мощности относительно различных близких 
альтернатив позволил отметить недостатки некоторых популярных 
критериев 
и 
указать 
наиболее 
предпочтительные 
критерии 

нормальности. На базе этих исследований было подготовлено 
руководство [132], которое, надеюсь, как и руководство по 
непараметрическим критериям согласия [131], оказало реальную 
помощь 
отечественным 
специалистам, 
заинтересованным 
в 

корректности проводимого статистического анализа. Позже вышли и 
другие аналогичные работы [133, 134, 135, 136], нацеленные на 
совершенствование методов статистического анализа, применяемых 
на практике.  

Жизнь не стоит на месте. Оказалось, что не все критерии 

нормальности были охвачены в [132], появились новые критерии. В 
современных условиях стало очевидным наличие весомых факторов, 
приводящих к изменению свойств статистических критериев и 
исключающих возможность применения классических результатов. 
Например, сам факт округления результатов измерений ограничивает 
возможность 
применения 
критериев 
проверки 
статистических 

гипотез по большим выборкам и может отражаться на результатах 
статистических выводов при анализе высокоточных измерений при 
любых объёмах выборок. В настоящем руководстве эта проблема 
обсуждается. Кроме этого, сделана попытка проранжировать всё 
множество критериев нормальности по мощности относительно 
рассмотренных конкурирующих законов. 

Я очень признателен своим ученикам и коллегам Лемешко С.Б. и 

Рогожникову А.П., последовательно много сделавшим для исследования распределений статистик и оценки мощности критериев, 
ориентированных на проверку гипотез о принадлежности наблюдений нормальному закону, а также Юркову В.А., внесшему 
существенный вклад в увеличение числа специальных критериев 
нормальности, реализованных в рамках программной системы [146], 
позволяющей исследовать и корректно применять эти критерии. 

 

Б.Ю. Лемешко 

Июнь 2022 

 

Введение 

Принадлежность наблюдаемых данных нормальному закону 

является необходимой предпосылкой для корректного применения 
большинства классических методов математической статистики, 
используемых в задачах обработки измерений, стандартизации и 
контроля качества. Поэтому проверка на отклонение от нормального 
закона является частой процедурой в ходе проведения измерений, 
контроля и испытаний, имеющей особое значение, так как далеко не 
всегда ошибки измерений, связанные с приборами, построенными на 
различных физических принципах, или ошибки наблюдений некоторого контролируемого показателя подчиняются нормальному закону 
[145]. В таких случаях применение классического аппарата, опирающегося на предположение о нормальности наблюдаемого закона, 
оказывается некорректным и может приводить к неверным выводам. 

В 2002 г. введен в действие в отечественный стандарт ГОСТ Р ИСО 

5479–2002 «Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения» [103], 
который представляет собой аутентичный текст международного 
стандарта ISO 5479–97. В стандарте рассматриваются графический 
метод проверки на нормальность с использованием вероятностной 
бумаги, критерии проверки на симметричность и на значение эксцесса, 
статистики которых представляют собой функции от оценок моментов 
закона распределения, критерии Шапиро–Уилка, основанные на 
регрессионном анализе порядковых статистик, критерий Эппса–Пулли, 
статистика которого измеряет некоторое расстояние между выборочной 
характеристической 
функцией 
и 
характеристической 
функцией 

нормального закона.  

По существу, стандарт охватывает лишь малую часть из 

существующего множества критериев, которые были предложены 
специально или могут быть использованы для проверки отклонения 
наблюдаемых данных (ошибок измерений) от нормального закона. В 
стандарте отказываются от использования критериев типа 
2
и не 

упоминается применение для проверки нормальности непараметрических критериев согласия. 

Содержание 
стандарта 
[103] 
и 
ограниченность 
перечня 

включенных в него критериев не позволяет его пользователям 
ориентироваться в том, какой из критериев наиболее предпочтителен 
для применения. Какой из критериев оказывается более мощным и 
против каких конкурирующих гипотез? При каких объемах выборок 
конкретный критерий обладает преимуществом или наоборот? Какие 
недостатки у конкретных критериев? 

В отечественной литературе можно найти много примеров, свя
занных с проверкой отклонений от нормального закона, но исследованию специальных критериев, предназначенных для этих целей, 
уделено достаточно мало внимания [107, 100]. Напротив, в 
зарубежных 
источниках 
исследованию 
критериев 
проверки 

отклонений от нормальности посвящено значительное число работ. 
Уделено внимание и анализу мощности критериев при проверке 
отклонений от нормального закона по отношению к различным 
альтернативам [77, 72]. Подчеркивается, что критерии согласия при 
малых объемах выборок проигрывают по мощности специальным 
критериям проверки на отклонение от нормальности [77] и 
предпочтение, как правило, отдается критерию Шапиро–Уилка. В то 
же время не складывается полной картины того, когда и каким 
критерием целесообразней пользоваться при проверке отклонений 
распределения от нормального.   

Все сказанное не позволяет заинтересованным специалистам точно 

знать, насколько обоснован выбор критериев в стандарте, каковы их 
достоинства и недостатки, какова их мощность, как меняются 
распределения статистик критериев с ростом объемов выборок. Всегда 
ли, например, критерии Шапиро–Уилка и Эппса–Пулли по мощности 
оказываются предпочтительнее?  

После выхода стандарта [103] в работе [120] был проведен срав
нительный анализ ряда статистических критериев, предназначенных 
для проверки отклонения эмпирических распределений от нормального закона, в ходе которого была проанализирована мощность и 
выявлены недостатки отдельных критериев, ранее не упоминаемые в 
литературе. Исследования, проведенные в [120], показали, что 
популярные критерии Шапиро–Уилка и Эппса–Пулли, рекомендуемые 
стандартом [103], при малых объемах выборок и малых уровнях значимости (вероятностях ошибки первого рода) являются смещён
Доступ онлайн
от 424 ₽
В корзину