Методы математической обработки экспериментальных данных
Покупка
Тематика:
Математика
Издательство:
ФЛИНТА
Год издания: 2017
Кол-во страниц: 124
Дополнительно
Вид издания:
Учебно-методическая литература
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-9765-3081-2
Артикул: 678502.01.99
Представлены основные разделы курса «Методы математической обработки
экспериментальных данных» технического вуза. Каждый раздел содержит
теоретическую часть, методику проведения лабораторных работ, варианты заданий
для выполнения самостоятельных работ.
Предназначено для студентов всех специальностей и форм обучения.
Тематика:
ББК:
УДК:
ОКСО:
- 01.00.00: МАТЕМАТИКА И МЕХАНИКА
- ВО - Бакалавриат
- 01.03.01: Математика
- ВО - Магистратура
- 01.04.01: Математика
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Министерство образования и науки Российской Федерации Уральский федеральный университет имени первого Президента России Б. Н. Ельцина И. В. Гребенникова МЕТОДЫ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ Учебно-методическое пособие Рекомендовано методическим советом УрФУ для студентов, обучающихся по направлениям подготовки 09.03.02 «Информационные системы и технологии» и 39.04.04 «Организация работы с молодежью» 2-е издание, стереотипное Москва Издательство «ФЛИНТА» Издательство Уральского университета 2017
УДК 519.6:001.891(075.8) ББК 22.171я73+72в6я73 Г79 Рецензенты: кафедра «Информационных технологий» ГАОУ ДПО Института развития образования (завкафедрой д-р пед. наук, проф. Л. И. Долинер); завлабораторией рентгеновской спектроскопии д-р физ.-мат. наук М. А. Коротин (Институт физики металлов УрО РАН). Гребенникова, И. В. Г79 Методы математической обработки экспериментальных данных [Электронный ресурс] : учебно-методическое пособие / И. В. Гребенникова. — 2-е изд., стер. — М. : ФЛИНТА : Изд-во Урал. ун-та, 2017. — 124 с. ISBN 978-5-9765-3081-2 (ФЛИНТА) ISBN 978-5-7996-1456-0 (Изд-во Урал. ун-та) Представлены основные разделы курса «Методы математической обработки экспериментальных данных» технического вуза. Каждый раздел содержит теоретическую часть, методику проведения лабораторных работ, варианты заданий для выполнения самостоятельных работ. Предназначено для студентов всех специальностей и форм обучения. Библиогр.: 9 назв. Рис. 41. Прил. 4. УДК 519.6:001.891(075.8) ББК 22.171я73+72в6я73 ISBN 978-5-9765-3081-2 (ФЛИНТА) ISBN 978-5-7996-1456-0 (Изд-во Урал. ун-та) © Уральский федеральный университет, 2015
Оглавление Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1. Вариационные ряды и их характеристики . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.1. Первичная обработка экспериментальных данных . . . . . . . . . . . . . . . 8 1.2. Выборочные характеристики статистического распределения . . . . 11 1.3. Статистическое распределение. Расчет основных числовых характеристик . . . . . . . . . . . . . . . . . . . . . 13 2. Выборочное наблюдение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1. Точечные оценки и их свойства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.2. Точечные оценки математического ожидания и дисперсии . . . . . . 34 2.3. Методы получения точечных оценок параметров распределения . . . 36 2.4. Интервальные оценки. Доверительные интервалы . . . . . . . . . . . . . 41 2.5. Доверительные интервалы для параметров нормально распределенной генеральной совокупности . . . . . . . . . . . . . . . . . . . 44 2.5.1. Доверительный интервал для математического ожидания случайной величины при известной дисперсии . . . . . . . . . . . 44 2.5.2. Доверительный интервал для математического ожидания случайной величины при неизвестной дисперсии и малой выборки . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.5.3. Доверительный интервал для дисперсии случайной величины с неизвестным математическим ожиданием . . . . . 47 2.6. Доверительный интервал для вероятности успеха в схеме Бернулли и параметра l распределения Пуассона . . . . . . . 48 2.7. Статистические оценки параметров распределения . . . . . . . . . . . . . 50 3. Корреляционная зависимость . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3.1. Регрессия. Уравнение регрессии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.2. Линейная регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.3. Свойства коэффициента корреляции . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.4. Смысл коэффициента корреляции . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.5. Доверительный интервал для линейной регрессии . . . . . . . . . . . . . 72 3.6. Нелинейная регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.7. Свойства корреляционного отношения . . . . . . . . . . . . . . . . . . . . . . . 75
ОгЛАвЛЕНИЕ 3.8. Параболическая регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 3.9. Гиперболическая регрессия . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3.10. Построение линейной регрессии по несгруппированным данным . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4. Cтатистическая проверка гипотез . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.1. Оценка статистической значимости коэффициента корреляции . . . . 98 4.2. Статистическая проверка гипотезы о теоретическом распределении . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.3. Построение кривой распределения по эмпирическим данным Проверка гипотезы о нормальном распределении выборки . . . . . 103 Рекомендуемый библиографический список . . . . . . . . . . . . . . . . . . . . . . . 117 Приложение 1. Таблица значений функции Лапласа . . . . . . . . . . . . . . . . . 118 Приложение 2. Таблица квантилей распределения Стьюдента t k g( ) с k степенями свободы . . . . . . . . . . . . . . 121 Приложение 3. Таблица квантилей распределения Хи-квадрат c g 2 ( ) k с k степенями свободы . . . . . . . . . . . . 122 Приложение 4. Таблица значений Z распределения Фишера . . . . . . . . . . 123
Предисловие К аждая глава пособия состоит из трех частей: теоретической, методической и практической. В первой части содержится теоретический материал справочного характера: понятия, определения, утверждения, формулы по курсу «Математические методы обработки экспериментальных данных», а также примеры решения задач, графические иллюстрации. Во второй части приведена методика проведения лабораторных работ. Третья часть включает варианты заданий для выполнения самостоятельных работ. По содержанию данное пособие соответствует требованиям ФГОС ВПО для специальностей технических вузов и включает в себя в соответствии с учебной программой основные разделы: ► построение вариационных рядов статистических распределений и расчет числовых характеристик; ► статистическое оценивание параметров распределения; ► построение математических моделей парных линейной и нелинейной корреляций; ► построение эмпирических и теоретических кривых распределения с нормальным теоретическим в соответствии с критерием согласия. Предназначено для студентов вузов всех форм обучения, может быть использовано преподавателями при организации и проведении лабораторных занятий по методам обработки экспериментальных данных.
введение М етоды обработки экспериментальных данных начали разрабатываться более двух веков тому назад в связи с необходимостью решения практических задач по агробиологии, медицине, экономике, социологии. Полученные при этом результаты составили фундамент такой научной дисциплины, как математическая статистика. В научный оборот слово «статистика» ввел немецкий ученый, профессор философии и права Готфрид Ахенваль (1719–1772), определяя этим термином круг вопросов, относящихся к государствоведению: описание государства, его устройства, быта населения, естественных условиях климата и др. Близким к современному пониманию сущности статистки было направление политической арифметики, основоположниками которой являлись английские исследователи: Джон Граунт (1620–1674), торговец, член Лондонского королевского общества; Уильям Петти (1623–1687), экономист, врач, доктор физики, профессор анатомии, изобретатель копировальной машины. Граунт Д. на основе обработки данных о естественном движении населения сделал вывод о существовании тесной связи между интенсивностью демографических процессов и особенностями социальной жизни людей, открыл некоторые закономерности массовых общественных явлений, используя собственный метод обработки и анализа первичных данных. Он попытался также построить таблицы смертности (или таблицы «дожития», показывающие процент доживших до определенного возраста), используемые для целей страхования. Исследования Петти относятся к политической экономии. Наибольшую известность получили его работы «Эссе о политической арифметике» (1683 г.) и «Политический обзор, или Анатомия Ирландии» (1672 г.), в которых социально-экономические вопросы изучались на основе числовых данных. Петти У. показал, что можно реконструировать информацию при отсутствии достаточного объема исходных данных (то есть с помощью различных расчетов найти нужные характеристики). Возникновению математической статистики как науки способствовало появление теории вероятностей, развитие ее методов, использование в практических приложениях. Становление статистики связано с именами выдающихся ученых, в числе которых Пьер Симон Лаплас (1749–1827), Симеон Дени Пуассон (1781–1840), Жан Батист Фурье (1768–1830), Ламбер Адольф
введение Кетле (1796–1874). Они заложили основы современной статистической методологии, активно применяли полученные методы для установления закономерностей в общественных явлениях. Современный уровень естественнонаучного эксперимента характеризуется большими потоками информации. При этом визуальный просмотр данных, не говоря уже об анализе, невозможен без применения ЭВМ. Обработка результатов экспериментов предполагает знание основных понятий и методов теории вероятностей и математической статистики. Выявление характерных классов задач в обработке экспериментальных данных и стандартных методов их решения позволяет выделить обработку результатов экспериментов из многообразия задач прикладной статистики. Как правило, основным подходом в решении многих задач является метод наименьших квадратов (МНК) в его различных модификациях. Однако МНК эффективно работает только для линейных моделей, а на практике встречаются ситуации, когда связь искомого параметра с измеряемой величиной сугубо нелинейная. В этом случае применяют нелинейный МНК или другие методы обработки. Знакомство со всеми этими методами расширяет арсенал средств, находящихся в распоряжении обработчика, что особенно важно в сложных случаях, например, когда измерения производятся при воздействии большого числа факторов, мешающих их проведению. Появление электронных таблиц (табличных процессоров) привело к тому, что статистические методы, ранее доступные лишь узкому кругу математиков, стали использоваться широким кругом специалистов разных областей. Дальнейшее развитие программного обеспечения привело к созданию большого количества прикладных пакетов по статистике. Удобной универсальной вычислительной средой для решения задач обработки экспериментальных данных является табличный процессор Microsoft Excel.
1. вариационные ряды и их характеристики С татистика изучает методы сбора и анализа результатов наблюдений массовых случайных явлений в целях выявления существующих закономерностей. Типичная задача математической статистики — на основании результатов наблюдений оценить вероятность случайного события или характеристики случайной величины. При решении любой задачи математической статистики имеется два источника информации. Первый источник — результаты наблюдений (экспериментов), причем процесс наблюдений может корректироваться на основании предварительных результатов (так называемый последовательный анализ). Второй источник — априорная (доопытная) информация о свойствах изучаемого объекта, накопленная к текущему моменту. Эта информация отражается в статистической модели, выбираемой при решении задачи. Следует заметить, что степень обоснованности применения априорной информации зависит от компетентности и добросовестности конкретного исследователя и неверные исходные допущения могут существенно исказить результат статистического анализа. 1.1. Первичная обработка экспериментальных данных Пусть все возможные значения случайной величины Х, получаемые при экспериментальных измерениях, образуют множество x x 1 2 , ,... { }, которое называется генеральной совокупностью значений Х. Выборочная совокупность, или выборка, случайной величины Х — случайно выбранное подмножество генеральной совокупности x x xn 1 2 , ,..., { } , полученное при проведении в одинаковых условиях n независимых измерений случайной величины Х, где n — объем выборки. Значения xi располагают в порядке возрастания: x x x n ( ) ( ) ( ) , ,..., 1 2 { }, x x x n ( ) ( ) ( ) ... 1 2 Ј Ј Ј . Может оказаться, что некоторые варианты xi в выборке встречаются несколько раз. Число ni, показывающее сколько раз встречается варианта xi в выборочной совокупности, называется частотой (эмпирической частотой) результата xi. Частоты вариант называют их весами. Отноше
1.1. Первичная обработка экспериментальных данных ние w n n i i = частоты к объему выборки называют относительной частотой значения xi. Очевидно, что n n i iе =1. Вариационный ряд (или статистическое распределение) — это упорядоченный ряд вариант с соответствующими им весами: x n i i , ( ) . Различают дискретные и непрерывные вариационные ряды. Дискретный ряд записывают так: Варианты, xi x1 x2 … xk Частоты, ni n1 n2 … nk Здесь ni — частота появления результата xi. Если объем выборки большой (n > 30 ), то результаты наблюдений сводят в интервальный вариационный ряд, который формируется следующим образом. Вычисляют размах R варьирования признака X как разность между наибольшим xmax и наименьшим xmin значениями признака: R x x = max min . Размах R варьирования признака X делят на k равных частей и таким образом определяют число интервалов. Число k частичных интервалов выбирают, пользуясь одним из следующих правил: 1) 6 20 Ј Ј k ; 2) k n » ; 3) k n n » + » + 1 1 3 221 2 log , lg . При небольшом объеме n выборки число k принимают равным от 6 до 10. Длина каждого частичного интервала определяется по формуле h R k x x k = = max min . Величину h обычно округляют до некоторого значения d. Например, если результаты xi признака X — целые числа, то h округляют до целого значения; ели xi содержат десятичные знаки, то h округляют до значения d, содержащего такое же число десятичных знаков. Затем подсчитывается частота ni, с которой попадают значения xi признака X в i-й интервал. За начало a0 первого интервала рекомендуется брать величину a x h 0 2 = min .
1. вАРИАцИОННЫЕ РяДЫ И ИХ ХАРАКТЕРИСТИКИ Конец ak последнего интервала находят по формуле a x h k = + max 2 . Сформированный интервальный вариационный ряд записывают так: Интервалы, (ai–1; ai) (a0; a1) (a1; a2) … (ak–1; ak) Частоты, ni n1 n2 … nk Интервальный вариационный ряд изображают в виде гистограммы ча стот ni или гистограммы относительных частот w n n i i = . Гистограммой называется ступенчатая фигура, для построения которой по оси абсцисс откладывают отрезки длиной h, изображающие частичные интервалы (ai–1; ai) варьирования признака X, и на этих отрезках как на основаниях строят прямоугольники с высотами, равными отношению частоты к длине отрезка n h i или отношению относительной частоты к длине отрезка n nh i соот ветствующих интервалов (рис. 1.1). Гистограмма относительных частот является аналогом закона распределения случайной величины X, играет роль эмпирического закона распределения. Для расчета характеристик (выборочной средней, выборочной дисперсии, начального и центрального выборочного момента порядка l) переходят от интервального вариационного ряда к дискретному. В качестве вариант xi этого ряда берут середины интервалов (ai–1; ai). Графически дискретный вариационный ряд изображают в виде полигона частот (соответственно полигона относительных частот) следующим образом. Сначала на числовой плоскости ставят точки (xi; ni) (точки (xi; wi)), где xi — i-я варианта, ni — частота (wi — относительная частота). Затем строят ломаную, соединяющую построенные точки, которую и называют полигоном (рис. 1.2). Для характеристики свойств статистического распределения в математической статистике вводится понятие эмпирическая функция распределения. Эмпирической функцией распределения или функцией распределения называется функция F x *( ) , определяемая равенством Рис. 1.1. Гистограмма Рис. 1.2. Полигон in nh x 1 a 4 a 2 a 3 a 2,0 0 0 a i w x 2 x 3 x 4 x 2,0 0 1x