Теория вероятностей и математическая статистика : математическая статистика
Покупка
Издательство:
Издательский Дом НИТУ «МИСиС»
Год издания: 2016
Кол-во страниц: 120
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-906846-01-3
Артикул: 752791.01.99
Практикум предназначен для подготовки к занятиям, контрольным работам и к выполнению лабораторных работ (типовых расчетов) по курсу «Теория вероятностей и математическая статистика» разделу «Математическая статистика». Изложение теоретического материала сопровождается большим количеством примеров решения типовых задач, дается подробное описание выполнения лабораторных работ (типовых расчетов), разбирается решение типовых вариантов контрольных работ. В заключение приводятся варианты контрольных работ с ответами. Предназначен для студентов всех направлений.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 01.03.01: Математика
- 01.03.04: Прикладная математика
- 03.03.01: Прикладные математика и физика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» № 2770 Кафедра математики В.А. Карасев Г.Д. Лёвшина Теория вероятностей и математическая статистика Математическая статистика Практикум Рекомендовано редакционно-издательским советом университета Москва 2016
УДК 519.2 К21 Р е ц е н з е н т канд. экон. наук, проф. В.Ф. Михин Карасев В.А. К21 Теория вероятностей и математическая статистика : математическая статистика : практикум / В.А. Карасев, Г.Д. Лёвшина. – М. : Изд. Дом МИСиС, 2016. – 120 с. ISBN 978-5-906846-01-3 Практикум предназначен для подготовки к занятиям, контрольным работам и к выполнению лабораторных работ (типовых расчетов) по курсу «Теория вероятностей и математическая статистика» разделу «Математическая статистика». Изложение теоретического материала сопровождается большим количеством примеров решения типовых задач, дается подробное описание выполнения лабораторных работ (типовых расчетов), разбирается решение типовых вариантов контрольных работ. В заключение приводятся варианты контрольных работ с ответами. Предназначен для студентов всех направлений. УДК 519.2 В.А. Карасев, Г.Д. Лёвшина, 2016 ISBN 978-5-906846-01-3 НИТУ «МИСиС», 2016
СОДЕРЖАНИЕ Предисловие .................................................................................... 5 1. Практические занятия по математической статистике ........... 6 1.1. Первичная обработка результатов эксперимента и оценка основных параметров генеральной совокупности ..... 6 1.2. Оценка математического ожидания по неравноточным измерениям .............................................. 12 1.3. Оценка дисперсии по нескольким сериям экспериментов .......................................................................... 14 1.4. Построение гистограммы распределения ....................... 16 1.5. Некоторые используемые в статистике распределения .......................................................................... 17 1.6. Построение доверительных интервалов ......................... 20 1.6.1. Доверительный интервал для математического ожидания .............................................................................. 21 1.6.2. Доверительный интервал для среднего квадратического отклонения .............................................. 21 1.6.3. Доверительный интервал для дисперсии ................ 22 1.7. Проверка статистических гипотез ................................... 25 1.7.1. Основные понятия ..................................................... 25 1.7.2. Проверка гипотез о дисперсии нормального распределения ...................................................................... 29 1.7.3. Проверка гипотез о математических ожиданиях нормального распределения ............................................... 35 1.7.4. Проверка гипотезы о виде распределения генеральной совокупности ................................................. 43 1.8. Регрессионный анализ. Построение линейной и квадратичной регрессионных моделей ............................... 46 1.8.1. Оценка коэффициентов регрессии .......................... 46 1.8.2. Проверка гипотезы об адекватности регрессионной модели ........................................................ 49 1.8.3. Построение доверительных интервалов для коэффициентов регрессии ........................................... 50 1.8.4. Задача регрессии для линейной функции ............... 51 1.8.5. Задача регрессии для квадратичной функции ........ 53
1.9. Линейный корреляционный анализ ................................ 62 1.9.1. Двумерный случайный вектор, его выборочные характеристики .................................................................... 62 1.9.2. Построение доверительного интервала для коэффициента корреляции. Проверка гипотезы о существовании линейной зависимости ............................. 68 2. Указания по выполнению типовых расчетов (лабораторных работ) «Обработка основных типов экспериментальных данных» ....................................................... 71 2.1. Типовой расчет 1. Сравнение двух случайных выборок (первичная обработка данных, проверка статистических гипотез) ..................................................................................... 71 2.1.1. Первичная обработка результатов измерений ........ 72 2.1.2. Построение доверительных интервалов ................. 73 2.1.3. Проверка гипотез о равенстве дисперсий, о равенстве математических ожиданий ............................ 73 2.1.4. Проверка гипотезы о нормальном распределении объединения двух случайных выборок ............................. 77 2.1.5. Построение гистограмм распределения объединения двух случайных выборок ............................. 81 2.2. Типовой расчет 2. Обработка данных методами регрессионного анализа ........................................................... 84 2.2.1. Задача 1 ....................................................................... 85 2.2.2. Задача 2 ....................................................................... 89 2.3. Типовой расчет 3. Обработка данных методами линейного корреляционного анализа ..................................... 96 2.3.1. Нахождение оценок числовых характеристик двумерного случайного вектора. Расчет оценки коэффициента корреляции ................................................. 96 2.3.2. Нахождение уравнений линейной регрессии ......... 97 2.3.3. Построение доверительного интервала для коэффициента корреляции . Проверка гипотезы о существовании линейной зависимости между величинами X и Y ................................................................. 97 2.4. Примерные варианты контрольной работы ................... 97 Библиографический список ....................................................... 106 Приложение ................................................................................. 107
ПРЕДИСЛОВИЕ Пособие является продолжением практикума «Теория вероятностей и математическая статистика» раздел «Теория вероятностей» (библ. № 2454), вышедшего в 2015 г. В нем приведены необходимые сведения об основных современных методах математической статистики и обработки экспериментальных данных на примерах, заимствованных из области металлургии, металловедения и экономики. Математическая статистика – это наука, которая методами теории вероятностей на основании результатов наблюдений изучает закономерности в массовых случайных явлениях. Математическая статистика (не путать со статистикой – разделом экономической теории) указывает способы сбора и группировки статических данных (результатов наблюдений или экспериментов), разрабатывает методы их обработки для оценки характеристик распределения, для установления зависимости случайной величины от других, для проверки статистических гипотез о виде распределения или значениях его параметров. Математическая статистика возникла и развивалась параллельно с теорией вероятностей. Данный практикум адресуется студентам всех специальностей НИТУ «МИСиС». Практикум подготовлен в соответствии с требованиями государственных образовательных стандартов. Рассматриваются следующие разделы курса: основные выборочные характеристики, точечные и интервальные оценки, проверка статистических гипотез, регрессионный и корреляционный анализ. Согласно учебному плану предусмотрено выполнение трех типо вых расчетов (лабораторных работ). Исходя из этого сформирована структура практикума, состоящая из двух разделов. Первый содержит теоретический материал и методические указания по решению задач для подготовки к практическим занятиям. Приведены необходимые для решения задач понятия и формулы, рассмотрено большое количество примеров решения типовых задач, охватывающих основные темы курса математической статистики. Во второй части практикума разбираются все три типовые расче ты (лабораторные работы), приводятся подробные примеры их выполнения. Затем даны типовые варианты контрольной работы с ответами. В приложении представлены статистические таблицы, необходимые для решения данных задач. Студентам, желающим ознакомиться с более полным и строгим изложением основ математической статистики, рекомендуем литературу, приведенную в библиографическом списке.
1. ПРАКТИЧЕСКИЕ ЗАНЯТИЯ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ 1.1. Первичная обработка результатов эксперимента и оценка основных параметров генеральной совокупности Математическая статистика позволяет с помощью математических методов обрабатывать, систематизировать и использовать численные результаты эксперимента для получения практических выводов. Под генеральной совокупностью в математической статистике понимается множество (гипотетическое) всех возможных результатов измерения некоторой величины, которые могут быть получены в данных условиях. Тем же самым понятием в теории вероятностей является случайная величина Х. Реальная серия повторных измерений этой величины х1, х2,..., хn трактуется как случайная выборка из генеральной совокупности, или просто случайная выборка. Число n называется объемом случайной выборки. Приведем примеры. 1. Проведена серия повторных измерений одной и той же физической величины в одних и тех же условиях. Разброс результатов обусловлен погрешностью измерительной аппаратуры. 2. Измеряется некоторая характеристика одинаковых изделий, изготовленных при поточном производстве. Разброс результатов обусловлен особенностями технологии производства. 3. Измеряется некоторая характеристика людей определенного пола и интервала возрастов, например рост. Разброс результатов обусловлен природными факторами. В статистике принята следующая математическая модель подобных экспериментов. Каждый элемент случайной выборки рассматривается как отдельная случайная величина. Относительно этих случайных величин, которые в дальнейшем будем обозначать прописными буквами, известна некоторая априорная информация. Случайная выборка называется повторной, если все входящие в нее случайные величины 1 2 , ,..., n X X X взаимно независимы и имеют одинаковую функцию распределения ( ) F x , причем ту же, что и наблюдаемая случайная величина Х. На практике это, в частности, означает, что измерения производятся независимо друг от друга (по
лученные результаты одних измерений не влияют на возможные результаты других). Величины имеют одинаковые математические ожидания ( ) i M X a = , т.е., результаты измерений свободны от систематических ошибок (результаты в среднем не смещены относительно истинного значения ( ) M X a = ), и одинаковые дисперсии 2 ( ) ( ) i D X D X = = , что называется равноточностью измерений (например, измерения физической величины проведены на одном и том же приборе при одинаковых условиях). Если случайные величины 1 2 , ,..., n X X X , образующие повторную случайную выборку, имеют нормальное распределение с одинаковыми параметрами а, , т.е., Хi N(a; ), то такая выборка называется нормальной, а соответствующая генеральная совокупность – нормальной генеральной совокупностью. В математической статистике рассматривают и неповторные выборки, в которых нарушается хотя бы одно из указанных условий: взаимная независимость, одинаковость функции распределения. Слово «повторная» обычно опускается, и пишут просто «выборка». Для неповторной выборки обязательно пишут «неповторная выборка». Распределение случайной величины X характеризуется рядом параметров (математическое ожидание, дисперсия и т.д.). Эти параметры называют параметрами генеральной совокупности. Важной задачей математической статистики является нахождение по случайной выборке приближенных значений каждого из параметров, называемых точечными оценками параметров, или просто оценками. Таким образом, оценкой параметра называется функция 1 2 ( , ,..., ) n f X X X от случайной выборки, значение которой принимается в качестве приближенного для данного параметра и обозначается : 1 2 ( , ,..., ) n f X X X » = . (1.1) Так как оценка зависит от случайной выборки, то она, в свою очередь, является случайной величиной. Для одного и того же параметра по одной и той же выборке можно построить много различных оценок. Для сравнения оценок между собой введены специальные характеристики. Оценка называется несмещенной, если ее математическое ожидание равно истинному значению параметра, т.е. ( ) M = . Несмещенная
оценка обеспечивает близость в среднем значений оценки к значению оцениваемого параметра, т.е. не дает систематической ошибки. Оценка называется состоятельной, если при n ¥ она сходится по вероятности к истинному значению оцениваемого параметра, т.е. 0 " > lim ( ) 0 n n P ¥ > = , (1.2) где n – оценка параметра , найденная по выборке объема n. Смысл понятия состоятельности заключается в том, что с увеличением объема выборки оценка стремится к истинному значению параметра. Точностью оценки называется средний квадрат отклонения оценки от : 2 2 ( ) [( ) ] q M = . Для несмещенных оценок точ ность определяется величиной дисперсии оценки: 2( ) ( ) q D = . Чем меньше 2( ) q q = , тем оценка лучше (точнее). Наилучшей линейной оценкой параметра называется такая его линейная несмещенная оценка, которая имеет наименьшую дисперсию в классе всех линейных несмещенных оценок. Пусть задана повторная случайная выборка 1 2 , , , n X X X . За оценку математического ожидания a принимается среднее арифметическое элементов выборки: 1 1 n i i X X n = = å . (1.3) Оценкой дисперсии 2 при известном математическом ожидании a является величина 2 0 S : 2 2 0 1 1 ( ) n i i S X a n = = å . (1.4) Оценкой дисперсии 2 при неизвестном математическом ожидании является величина 2 S , которую называют эмпирической дисперсией: 2 2 1 1 ( ) 1 n i i S X X n = = - å . (1.5)
Оценкой среднего квадратического отклонения при этом являются, соответственно, величины 2 0 0 S S = ; 2 S S = . (1.6) Оценки математического ожидания и дисперсии, найденные по формулам (1.3) – (1.5), являются несмещенными и состоятельными. Среднее арифметическое (1.3) является наилучшей линейной оценкой математического ожидания для повторной случайной выборки. Оценка параметра 2 = с помощью значений (1.6) является состоятельной, но смещенной (ее смещение убывает с увеличением n). Число k = n – 1 в формуле (1.5) называется числом степеней свободы оценки 2 S . Для практических расчетов формулу (1.5) удобно преобразовать к виду 2 2 2 1 1 1 n i i S X nX n = æ ö÷ ç ÷ = ç ÷ ç ÷ ç è ø å . (1.7) Вычисление среднего значения X и оценки дисперсии 2 S упрощается, если отсчет значений i X вести от подходящим образом выбранных начала отсчета С и масштабного коэффициента h, т.е. если сделать линейную замену: 1, 2, ..., ( ) i i X C hU i n = + = . (1.8) При такой замене формулы (1.3) и (1.5) – (1.6) принимают вид 1 1 , n i i X C hU U U n = = + = å ; (1.9) ( ) 2 2 2 2 2 2 1 1 1 1 n n i i i i h h S U U U nU n n = = æ ö÷ ç ÷ = = ç ÷ ç ÷ ç è ø å å . (1.10) Для контроля вычислений весь расчет повторяют с другим началом отсчета С, результаты должны совпадать с точностью до возможных ошибок округления. Задача 1.1. В табл. 1.1 в первом столбце записаны результаты n = 18 независимых равноточных измерений заряда электрона 10 10 q x = ⋅ , полученных Милликеном. Вычислить оценки математического ожидания, дисперсии и среднего квадратического отклонения величины Х, провести контроль расчетов.
Решение Выбираем С = 4,780 и, полагая h = 10–3, подсчитываем значения 3 ( ) / ( 4,780) /10 i i i u x C h x = = и 2 iu . Суммы чисел второго и третьего столбцов дают возможность рассчитать X и S2: 13 /18 0,72, U = = 3 4,780 0,72 10 4,7807; X = + ⋅ = ( ) 2 6 2 4 10 6239 13 /18 /17 3,66 10 S = = ⋅ , откуда 2 4 2 3,66 10 1,91 10 . S S = = ⋅ = ⋅ В последних двух столбцах приведены расчеты при другом начале отсчета С1 = 4,790, т.е. при замене 3 ( 4,790) /10 i i V X = . Эти расче ты дают те же значения X и S: 167 /18 9,2, V = = 3 4,790 9,28 10 4,7809; X = ⋅ = ( ) 2 6 2 4 10 7779 167 /18 /17 3,66 10 S = = ⋅ . Таблица 1.1 Исходные данные и результаты расчета к задаче 1.1 Исходные Расчет Контроль данные X U U2 V V2 4,761 –19 361 –29 841 4,792 12 144 2 4 4,758 –22 484 –32 1024 4,764 –16 256 –26 676 4,810 30 900 20 400 4,799 19 361 9 81 4,797 17 289 7 49 4,790 10 100 0 0 4,747 –33 1089 –43 1849 4,769 –11 121 –21 441 4,806 26 676 16 256 4,779 –1 1 –11 121 4,785 5 25 –5 25 4,790 10 100 0 0 4,777 –3 9 –13 169 4,749 –31 961 –41 1686 4,781 1 1 –9 81 4,799 19 361 9 81 Σ 13 6239 –167 7779