Статистическая проверка гипотез
Покупка
Новинка
Основная коллекция
Тематика:
Статистика
Издательство:
РГЭУ (РИНХ)
Год издания: 2008
Кол-во страниц: 88
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7972-1217-1
Артикул: 859131.01.99
Пособие подготовлено в соответствии с требованиями Государственного образовательного стандарта высшего профессионального образования. Включает теоретические и методологические материалы по статистической проверке гипотез, практические задания для аудиторных занятий и самостоятельной работы студентов, а также контрольные вопросы, тесты и задания для проверки усвоения студентами изучаемого раздела статистики. В приложениях даны математико-статистические таблицы, необходимые для решения задач. Учебное пособие содержит изложение теоретического материала по статистической проверке гипотез, контрольные вопросы, тесты и задания. Читатели, интересующиеся более подробным изложением вопросов и доказательствами приведенных утверждений, могут воспользоваться литературой, указанной в конце книги.
Предназначено для студентов экономических специальностей всех форм обучения.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 38.03.01: Экономика
- ВО - Магистратура
- 38.04.01: Экономика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ РОСТОВСКИЙ ГОСУДАРСТВЕННЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРИТЕТ «РИНХ» УЧЕТНО-ЭКОНОМИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ, ЭКОНОМЕТРИКИ И АКТУАРНЫХ РАСЧЕТОВ НИВОРОЖКИНА Л.И., МОРОЗОВА З.А. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ Учебное пособие Ростов-на-Дону 2008
УДК 31 (075) Р 60 Ниворожкина, Л.И., Морозова, З.А. Р 60 Статистическая проверка гипотез: Учебное пособие / Л.И. Ниворожкина, З.А. Морозова ; Ростовский государственный экономический университет «РИНХ». – Ростов н/Д, 2008. – 87 с. ISBN 978-5-7972-1217-1 Пособие подготовлено в соответствии с требованиями Государственного образовательного стандарта высшего профессионального образования. Включает теоретические и методологические материалы по статистической проверке гипотез, практические задания для аудиторных занятий и самостоятельной работы студентов, а также контрольные вопросы, тесты и задания для проверки усвоения студентами изучаемого раздела статистики. В приложениях даны математико-статистические таблицы, необходимые для решения задач. Учебное пособие содержит изложение теоретического материала по статистической проверке гипотез, контрольные вопросы, тесты и задания. Читатели, интересующиеся более подробным изложением вопросов и доказательствами приведенных утверждений, могут воспользоваться литературой, указанной в конце книги. Предназначено для студентов экономических специальностей всех форм обучения. УДК 31 (075) Рецензенты: к.э.н., доцент Максимова Т.Л., к.э.н., доцент Кокина Е.П. ISBN 978-5-7972-1217-1 © Ростовский государственный экономический университет «РИНХ», 2008 © Ниворожкина Л.И., Морозова З.А., 2008
СОДЕРЖАНИЕ ВВЕДЕНИЕ .................................................................................................... 5 1. Понятие статической гипотезы. Общая постановка задачи проверки гипотез. Нулевая и альтернативная, простая и сложная гипотезы ....................... 6 2. Ошибки первого и второго рода ..............................................................10 3. Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия.............................................................13 4. Критическая область. Мощность критерия. Область принятия гипотезы. Критические точки...................................14 5. Принцип выбора критерия. Лемма Неймана-Пирсона...........................14 6. Отыскание правосторонней, левосторонней и двусторонней критических областей ...............................................................................16 7. Геометрическая интерпретация ошибок первого и второго рода.........17 8. Проверка гипотезы о значении генеральной средней (математического ожидания) нормально распределенной генеральной совокупности при известной генеральной дисперсии. Связь доверительного интервала с критической областью...................20 9. Стандартная форма проверки гипотезы о значении генеральной средней нормально распределенной генеральной совокупности при известной генеральной дисперсии....................................................25 10. Проверка гипотезы о значении генеральной средней (математического ожидания) нормально распределенной генеральной совокупности при неизвестной генеральной дисперсии ..............................................28 11. Проверка гипотезы о числовом значении генеральной доли (о параметре биномиального закона распределения)...........................31 12. Проверка гипотезы о числовом значении дисперсии генеральной совокупности......................................................................33 13. Проверка гипотез о дисперсиях двух нормальных генеральных совокупностей ...................................................................38
14. Проверка гипотезы о равенстве двух средних нормальных генеральных совокупностей с известными дисперсиями ....................41 15. Проверка гипотезы о равенстве генеральных средних двух нормальных совокупностей при неизвестных равных генеральных дисперсиях (малые неизвестные выборки).....................42 16. Проверка гипотезы о равенстве долей двух нормально распределенных генеральных совокупностей.......................................45 17. Проверка гипотез о виде распределения. Критерий согласия χ2...................................................................................48 18. Проверка гипотезы о распределении случайной величины по закону Пуассона..................................................................................54 19. Критерий согласия В.И. Романовского..................................................56 20. Критерий согласия Б.С. Ястремского ....................................................57 21. Критерий согласия Колмогорова............................................................58 22. Критерий согласия Колмогорова-Смирнова .........................................61 Контрольные вопросы ................................................................................65 Тесты для самопроверки ............................................................................66 Контрольные задания .................................................................................70 СПИСОК ЛИТЕРАТУРЫ ..........................................................................74 ПРИЛОЖЕНИЯ ...........................................................................................76
ВВЕДЕНИЕ Известно, что оценку неизвестного параметра генеральной совокупности можно получить по результатам выборки вычислением точечной оценки или построением доверительного интервала. Альтернативно, выборочная информация может быть использована для оценки правомерности некоторых предположений (гипотез) о генеральной совокупности, которые формулируются до начала сбора выборочных данных. Поэтому студент должен знать: особенности законов распределения Стьюдента, хи-квадрат, Фишера, сферу их применения в математической статистике; понятие статистических гипотез, их виды, ошибки I и II рода, понятие об уровне значимости; виды критических областей; виды параметрических и непараметрических гипотез; алгоритм проверки статистических гипотез; статистические критерии проверки гипотез о форме распределения, о равенстве двух дисперсий нормальных генеральных совокупностей, сравнения исправленной выборочной дисперсии с предлагаемой генеральной дисперсией нормальной совокупности, о равенстве двух средних генеральных совокупностей, дисперсии которых известны (независимые выборки), о равенстве двух средних произвольно распределенных генеральных совокупностей, о равенстве двух средних генеральных совокупностей, дисперсии которых известны и одинаковы (малые независимые выборки), о равенстве выборочной средней с предполагаемой генеральной средней нормальной совокупности при известной и неизвестной генеральной дисперсии, о равенстве двух долей. Студент должен уметь пользоваться таблицами распределений Стьюдента, хи-квадрат, Фишера; формулировать нулевую и конкурирующую гипотезы, устанавливать уровень значимости; определять тип критической области; выбрать критерий проверки статистических гипотез; осуществить проверку гипотез о форме распределения, о равенстве двух дисперсий нормальных генеральных совокупностей, сравнение исправленной выборочной дисперсии с предполагаемой генеральной дисперсией нормальной совокупности, проверить гипотезы о равенстве двух средних генеральных совокупностей, дисперсии которых известны (независимые выборки), о равенстве двух средних произвольно распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки), о равенстве выборочной средней с предполагаемой генеральной средней нормальной совокупности при известной и неизвестной генеральной дисперсии, о равенстве двух долей.
1. Понятие статической гипотезы. Общая постановка задачи проверки гипотез. Нулевая и альтернативная, простая и сложная гипотезы В самом широком смысле слова гипотеза (hypothesis – основание, предположение) – предположительное суждение о закономерной (причинной) связи явлений. Проверка гипотез осуществляется всюду, где теория может быть подтверждена или опровергнута опытом.1 Так, например, медик может выдвинуть гипотезу о том, что новое лекарство эффективнее излечивает некоторое хроническое заболевание. Для проверки своей гипотезы он отбирает людей, страдающих этим заболеванием, и случайным образом делит их на две равные группы. Новое лекарство применяется им при лечении первой группы пациентов, а прежнее – при лечении второй группы. Затем, выяснив долю выздоровевших пациентов в каждой группе, исследователь решает вопрос о том, какое лекарство, новое или старое, более эффективно. Другой пример. Автоматическая линия фасует пакеты с мукой весом в один килограмм (1000 грамм). Производитель утверждает, что точность наладки линии достаточно высока и средний вес наполненных пакетов в точности равен одному килограмму. Покупатель же партии фасованной муки сомневается в точности веса и выдвигает предположение, что вес пакета меньше одного килограмма. Для проверки этих гипотез проведена случайная выборка 25 пакетов с мукой. Повторное их взвешивание показывает, что средний выборочный вес пакета 7, 999 ~ = X грамма. Интуитивно мы понимаем, что поскольку выборочная средняя близка к генеральной средней 1000 = X грамм, то вероятность того, что истинный средний вес пакета с мукой отличается от одного килограмма, очень мала, и гипотеза производителя о высокой точности наладки автоматической линии, фасующей муку, скорее всего верна. С другой стороны, если бы средний вес в выборке получился равным 950 граммам, то напрашивался бы вывод, что вероятнее всего средний вес пакетов с мукой в генеральной совокупности не равен одному килограмму, и резоннее думать, что средний вес пакета меньше одного килограмма. Еще пример. Предположим, что политик “А” предполагает, что получит на ближайших выборах не менее 50% голосов избирателей. Если мы не доверяем предположению политика “А”, то выдвигаем гипотезу о том, что его поддерживает менее 50% электората. Пусть 15 = n – число избирателей, случайно выбранных в определенном городе, среди них m избирателей предпочитает политика “А”. Как по этой выборке оценить истинность утверждения политика “А”? Если в результате выборки никто не предпочитает политика “А” ( ) 0 = m , то какой мы можем сделать вывод относительно политика “А”? Если его действи 1 При этом гипотеза относительно параметра формулируется до опыта (до получения выборочных данных). В этом и состоит принципиальное различие между построением доверительного интервала для неизвестного параметра и процедурой проверки гипотезы.
тельно поддерживает более 50% электората, то вероятность получить 0 = m в выборке очень мала, а если он не имеет достаточного числа сторонников, то вероятность того, что 0 = m , будет несколько больше. И при 1 = m (или при другом малом значении m ), наши выводы останутся такими же. Из приведенных примеров видно, что сам процесс принятия решения не всегда является полностью определенным. Какова мера того, насколько «близок» или «далек» полученный по выборке средний вес пакетов с мукой от истинной средней в генеральной совокупности или доля избирателей, поддерживающих политика “А”, более 50%? Статистическая процедура проверки гипотез ставит в соответствие всем высказанным предположениям в приведенных выше примерах некоторое числовое значение. Под статистической гипотезой понимается всякое высказывание о виде неизвестного распределения, или параметрах генеральной совокупности известных распределений, или о равенстве параметров двух или нескольких распределений, или о независимости выборок, которое можно проверить статистически, то есть, опираясь на результаты наблюдений в случайной выборке. Наиболее часто формулируются и проверяются гипотезы о числовых значениях одного или нескольких параметров генеральной совокупности, подчиняющейся одному из известных законов распределения, такому как нормальный, Стьюдента, Фишера и др. В то же время, например, предположение о реальности посещения Земли инопланетянами не является статистической гипотезой, так как она не относится ни к одному из типов задач статистической проверки гипотез. Какова же роль статистической проверки гипотез? Как выяснить, согласуется ли выборочное наблюдение с выдвинутой гипотезой? Когда мы можем отклонить гипотезу, а когда ее принять? Каков риск принятия неверного решения и, в частности, какая выборочная статистика или функция должна быть использована для проверки гипотезы? Ответы на все эти вопросы даст нам изучение методов статистической проверки гипотез.2 Статистическая гипотеза – это формальное предположение о том, что сходство (или различие) некоторых, например, параметрических характеристик случайно (или, наоборот, неслучайно), то есть имеющее место различие «незначимо» (или «значимо»). Статистические гипотезы проверяются путем сопоставления (по определенным правилам) выдвинутых предположений с выборочными данными, и по результатам этого сравнения делается вывод о справедливости выдвинутой гипотезы. 2 Гипотеза – это форма развития любой отрасли науки: биологии, медицины, техники и др. В экономике сфера применения статистических гипотез несколько ограничена. Это объясняется тем, что в естественных науках можно организовать эксперимент в виде случайной бесповторной выборки, в которой отдельные наблюдения стохастически независимы. В экономике строгое выполнение этого условия порой невозможно.
Первый этап проверки гипотезы – ее формулировка. Для примера с фасовкой муки утверждение о том, что «средний вес пакета муки равен одному килограмму» на статистическом языке называется нульгипотезой (обозначается обычно – 0 Н ) и записывается так: 1000 : 0 = X H г. Если мы сомневаемся в истинности этого факта, то выдвигаем противоположную ему гипотезу, называемую альтернативной (и обозначаемую 1 Н или а Н ). Альтернативные гипотезы для этого примера можно сформулировать так. Первая – «средний вес пакета с мукой не равен одному килограмму», или 1000 : 1 ≠ X H г; вторая – «средний вес пакета с мукой меньше одного килограммы», или 1000 : 1 < X H г. Утверждение политика “А” о том, что за него проголосует не менее 50% избирателей – так же является нуль-гипотезой, которую можно сформулировать так: 5,0 : 0 ≥ p H ; Хотя условие «не менее» означает 5,0 ≥ p , для подтверждения истинности убеждения политика “А” достаточно выполнения условия 5,0 = p . Альтернативная ей гипотеза – «Политика “А” поддерживает менее 50% электората» получается путем утверждения того, что нуль-гипотеза, противоположная ей, – ложна. Таким образом, поддержка одного из предположений получается доказательством «от противного». Поскольку мы заявляем в альтернативной гипотезе, что утверждение политика “А” ложно, то ее можно сформулировать и так: вероятность выбора избирателей, предпочитающих “А”, меньше, чем ( )5,0 5,0 < p . Если мы сможем показать, что данные, поддерживающие отклонение нуль-гипотезы, 5,0 = p (минимальное значение, необходимое для избрания), согласуются с альтернативной гипотезой 5,0 < p , то мы достигаем поставленной цели. Гипотеза о «случайности различий» обычно называется нулевой, а гипотеза о «неслучайности» тогда определяется как альтернативная. Хотя общепринято говорить о проверке нуль-гипотезы, надо помнить, что логика проверки исходит из поддержки альтернативной гипотезы, если, конечно, она оправдана. Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно неизвестных значений параметров распределения определенного вида.3 3 Существуют так же и непараметрические гипотезы, однако в специальной литературе нет однозначного определения этого типа гипотез. Согласно одному из определений статистическая гипотеза называется непараметрической, если в ней сформулированы предположения относительно вида закона распределения, а предположения о параметрах не рассматриваются.
Пусть х1, х2, …,хn – выборка объема n, извлеченная из генеральной совокупности объема N, с плотностью распределения ( ) i x f Θ ; , где i Θ – неизвестный параметр распределения определенного вида (им может быть средняя, дисперсия или доля генеральной совокупности). Статистическая гипотеза называется простой, если предположение в ней однозначно определяет распределение случайной величины; в противном случае, если она не полностью определяет параметры распределения, ее называют сложной. Например, если согласно некоторой гипотезе 0 H случайная величина X распределена по нормальному закону со средней X и неизвестной дисперсией, то в этом случае мы имеем дело со сложной гипотезой. Если в гипотезе (нулевой или альтернативной) параметр генеральной совокупности определяется одним числовым значением, скажем, 0 Θ для Θ , то такая гипотеза – простая. Её запись: 0 0 : Θ Θ = H и читается так: “Нулевая гипотеза 0 H состоит в том, что значение неизвестного генерального параметра Θ есть 0 Θ ”. Например, нас интересует проверка гипотезы о числовом значении математического ожидания нормально распределенной случайной величины 5 : 0 = a H при альтернативной – 8 : 1 = a H . Обе гипотезы – простые. Если гипотеза относится к ряду значений параметра генеральной совокупности, то она будет сложной и будет верна для более чем одного значения параметра генеральной совокупности. Например, простой нуль-гипотезе 5 : 0 = a H может соответствовать сложная альтернативная гипотеза 5 : 1 > a H . Гипотеза о том, что истинный средний вес пакета с мукой менее одного килограмма тоже сложная гипотеза. Она может быть верна для любого значения генеральной средней, меньшего одного килограмма. В большинстве случаев простая гипотеза, например, 0 0 : Θ = Θ H проверяется сложной альтернативной. Можно проверить эту нуль-гипотезу альтернативной 1 H , состоящей в том, что истинное значение генерального параметра Θ больше, чем 0 Θ : 0 1 : Θ Θ > H , или 0 1 : Θ Θ < H . Более общей формой записи последних двух альтернатив является: 0 1 Θ Θ : ≠ H .