Анализ данных в материаловедении. Часть 1
Покупка
Тематика:
Материаловедение
Издательство:
Издательский Дом НИТУ «МИСиС»
Год издания: 2013
Кол-во страниц: 72
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-87623-666-1
Артикул: 751158.01.99
В учебном пособии рассмотрены вопросы статистического анализа данных, включая статистические оценки, проверку гипотез, дисперсионный и корреляционный анализ. По всем темам приводятся примеры решения реальных задач из металлургии и материаловедения в программе Excel. В пособие включены задания для самостоятельной работы. Предназначено для студентов, обучающихся по направлениям «Материаловедение» и «Металлургия». Может быть использовано аспирантами в области металлургии и материаловедения
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 22.03.01: Материаловедение и технологии материалов
- 22.03.02: Металлургия
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
№ 2201 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» Кафедра металловедения и физики прочности А.С. Мельниченко Анализ данных в материаловедении Часть 1 Учебное пособие Допущено учебно-методическим объединением по образованию в области металлургии в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлениям 150700 – Физическое материаловедение и Металлургия Москва 2013
УДК 620.22 М48 Р е ц е н з е н т канд. техн. наук, доц. С.Н. Богданов Мельниченко, А.С. М48 Анализ данных в материаловедении : учеб. пособие / А.С. Мельниченко. – М. : Изд. Дом МИСиС, 2013. – ч. 1. – 72 с. ISBN 978-5-87623-666-1 В учебном пособии рассмотрены вопросы статистического анализа данных, включая статистические оценки, проверку гипотез, дисперсионный и корреляционный анализ. По всем темам приводятся примеры решения реальных задач из металлургии и материаловедения в программе Excel. В пособие включены задания для самостоятельной работы. Предназначено для студентов, обучающихся по направлениям «Материаловедение» и «Металлургия». Может быть использовано аспирантами в области металлургии и материаловедения. УДК 620.22 ISBN 978-5-87623-666-1 © АА.С. Мельниченко, 2013 2
ОГЛАВЛЕНИЕ Предисловие..............................................................................................4 1. Функции распределений и описательная статистика.......................5 1.1. Функции распределений ...............................................................5 1.2. Описательная статистика..............................................................9 2. Сравнение средних и дисперсий.......................................................15 2.1. Проверка статистических гипотез..............................................15 2.2. Сравнение дисперсий..................................................................16 2.3. Сравнение средних......................................................................17 2.4. Проверка гипотезы однородности дисперсий ..........................25 3. Проверка вида распределения и анализ выбросов ..........................29 3.1. Проверка вида распределения....................................................29 3.2. Проверка гипотезы о выбросах ..................................................38 4. Дисперсионный анализ ......................................................................41 4.1. Однофакторный дисперсионный анализ...................................41 4.2. Двухфакторный дисперсионный анализ ...................................45 4.3. Одно измерение в группе............................................................52 5. Корреляционный анализ ....................................................................56 5.1. Парный коэффициент корреляции и эллипс рассеяния...........56 5.2. Анализ корреляционных матриц................................................64 Библиографический список...................................................................71 3
ПРЕДИСЛОВИЕ Электронные таблицы Excel – общепринятое программное средство для хранения и обработки результатов эксперимента. Сама обработка чаще всего ограничивается элементарными оценками средних и дисперсий и построением графиков. Между тем, вычислительных возможностей программы Excel достаточно для решения большинства стандартных задач статистической обработки. Цель данного пособия – научить студентов, выполняющих курсовые и дипломные исследовательские работы, проводить статистический анализ, не прибегая к другим программам и статистическим таблицам. В пособии рассмотрены задачи, которые по опыту кафедры металловедения и физики прочности чаще всего встречаются в научно-исследовательских работах студентов и аспирантов. Это точечные и интервальные оценки, сравнение средних и дисперсий, проверка гипотез о виде распределения и выбросах, дисперсионный и корреляционный анализ. Задачи регрессионного анализа в силу их большого разнообразия будут рассмотрены во второй части пособия. Каждой теме предпослано краткое теоретическое введение. Подробнее ознакомиться с вопросами теории можно в изданиях [1–4]. По каждой теме разобраны примеры типичных задач статистической обработки материаловедческих данных. Эти примеры являются готовыми шаблонами для решения аналогичных или близких задач. В пособии рассмотрены не все статистические функции программы Excel, а только те, которые необходимы для решения поставленных задач. Точно также в пособии подробно не разбираются вопросы, относящиеся к самой программе Excel, такие как упорядочение данных, построение и форматирование графиков и т.п. Дополнительные сведения о программе Excel можно почерпнуть, например, в [5]. В пособии приняты следующие правила ссылок в формулах: если формула или функция относится к диапазону ячеек, то она приводится только для верхней левой ячейки диапазона, а на остальные ячейки распространяется копированием; если формула относится к единственной ячейке, то ссылки в ней относительные. 4
1. ФУНКЦИИ РАСПРЕДЕЛЕНИЙ И ОПИСАТЕЛЬНАЯ СТАТИСТИКА 1.1. Функции распределений Основными характеристиками распределения непрерывной случайной величины Х, имеющей плотность распределения ( ) w x , являются: математическое ожидание ∞ ( )d x xw x x −∞ µ = ∫ , дисперсия ∞ 2 2 ( ) ( )d x x x w x x −∞ σ = −μ ∫ , стандартное отклонение 2 x x σ = σ , коэффициент асимметрии ∞ x w x x 3 3 1 ( ) ( )d x x x −∞ γ = −μ σ ∫ . Математическое ожидание x μ – характеристика центра распределения случайной величины Х, дисперсия 2 x σ и стандартное отклонение x σ − характеристики разброса случайной величины вокруг центра распределения, коэффициент асимметрии x γ – характеристика симметрии распределения. Если функция ( ) w x симметрична относительно математического ожидания x µ , то 0 x γ = . Положительное значение x γ указывает на более длинный «хвост» распределения справа от x μ , отрицательное – слева. Величины x μ , 2 x σ , x σ , x γ в математической статистике называются параметрами генеральной совокупности. 5
Для описания экспериментальных данных часто используются следующие распределения. Нормальное распределение 2 2 1 ( ) ( ) exp 2 2 x w x ⎡ ⎤ −μ = − ⎢ ⎥ σ σ π ⎣ ⎦ . (1.1) Область определения x −∞< < ∞, параметры распределения μ , 0 σ > . Случайная величина распределена нормально, если ее разброс вызван множеством причин, среди которых нет единственной преобладающей причины. Нормальное распределение играет центральную роль в теоретической статистике. Большинство приводимых далее оценок и статистических критериев предполагают, что анализируемые случайные величины распределены нормально. Гамма-распределение b x x w x b − λ λ −λ = Γ , (1.2) 1 ( ) exp( ) ( ) ( ) где Γ – гамма-функция. Область определения 0 x ≥ , параметры распределения: 0 λ > – масштабный параметр, 0 b > – параметр формы. Гамма-распределение – универсальное распределение для описания ограниченных снизу несимметрично распределенных случайных величин. По мере увеличения параметра b гамма-распределение становится более симметричным. Частный случай гамма-распределения с 1 b = и единственным параметром λ называется экспоненциальным распределением. Логарифмически нормальное распределение 2 2 1 (ln ) ( ) exp 2 2 x w x x ⎡ ⎤ −μ = − ⎢ ⎥ σ πσ ⎣ ⎦ . (1.3) Область определения 0, x ≥ параметры распределения μ , 0 σ > . Случайная величина, логарифм которой распределен нормально с параметрами μ и σ , имеет логарифмически нормальное распределение. Используется наряду с гамма-распределением для описания ограниченных снизу несимметрично распределенных случайных величин. 6
В табл. 1.1 приводятся выражения математического ожидания x μ , стандартного отклонения x σ и коэффициента асимметрии x γ распределений через их параметры. Таблица 1.1 Распределение Математическое ожидание x μ Стандартное отклонение x σ Коэффициент асимметрии x γ Нормальное (1.1) µ σ 0 2 b Гамма (1.2) b λ b λ 2 2 exp 2 exp 2 μ + σ × ⎡ ⎤ σ + × ⎣ ⎦ 2 Логарифмически нормальное (1.3) 2 exp 1 × σ − exp 1 2 exp 2 ⎛ ⎞ σ μ − ⎜ ⎟ ⎝ ⎠ ( ) × σ − ( ) ( ) ( ) В статистическом анализе используются следующие распределения. Распределение Пирсона ( 2 χ -распределение) – распределение суммы квадратов нормально распределенных случайных величин 1 2 , ,..., k U U U с математическими ожиданиями 0 i u µ = и стандартными отклонениями 1 i u σ = ( 1, 2,..., i k = ). 2 2 2 2 1 2 ... k U U U χ = + + + . (1.4) Параметр распределения k ν ≤ – число степеней свободы (ч.с.с.). 2 χ -распределение – частный случай гамма-распределения с параметрами 1 2 λ = и 2 b = ν . Распределение Стьюдента (t-распределение) – распределение случайной величины 0 , (1.5) 2 2 2 1 2 ( ... ) k U t U U U = + + + ν где 0 1 , ,..., k U U U – нормально распределенные случайные величины. Параметр распределения – ч.с.с. k ν ≤ . Распределение Фишера (F-распределение) – распределение случайной величины k U U U F V V V + + + ν = + + + ν , (1.6) ( ... )/ ( ... )/ m 2 2 2 1 2 1 2 2 2 1 2 2 7
где 1 1 ,..., , ,..., k m U U V V – нормально распределенные случайные величины. Параметры распределения – 1 k ν ≤ – ч.с.с. среднего квадрата в числителе, 2 m ν ≤ – ч.с.с. среднего квадрата в знаменателе. Функция распределения случайной величины Х, имеющей плотность распределения ( ) w x по значению аргумента х, вычисляет вероятность р того, что : X x ≤ ( )d x p w u u −∞ = ∫ , (1.7) а обратная функция распределения по величине вероятности р рассчитывает значение аргумента функции распределения х. В табл. 1.2 приведены встроенные функции программы Excel, рассчитывающие рассмотренные функции распределений. Таблица 1.2 Плотность распределения Функция распределения Обратная функция распределения Нормальное, μ – математическое ожидание, σ – стандартное отклонение НОРМРАСП(x; μ; σ;0) НОРМРАСП(x; μ; σ; 1) НОРМОБР(p; μ; σ) Гамма, λ – масштабный параметр, b – параметр формы ГАММАРАСП(x;b;1/λ;0) ГАММАРАСП(x; b; 1/λ; 1) ГАММАОБР(p; b; 1/λ) Экспоненциальное, λ – параметр распределения ЭКСПРАСП(х; λ;0) ЭКСПРАСП(х; λ;1) ГАММАОБР(p; 1; 1/λ) Логарифмически нормальное, μ, σ – параметры ЛОГНОРМРАСП(x; μ; σ) ЛОГНОРМОБР(p; μ; σ) χ2-распределение (Пирсона), ν – число степеней свободы 1−ХИ2РАСП(x; ν) ХИ2ОБР(1−p; ν) t-распределение (Стьюдента), ν – число степеней свободы СТЬЮДРАСП(−x; ν; 1), если х < 0; 1-СТЬЮДРАСП(x; ν; 1), если х ≥ 0 −СТЬЮДРАСПОБР(2p; ν), если р ≤ 0,5; СТЬЮДРАСПОБР(2(1–p); ν), если р > 0,5 F-распределение (Фишера), ν1, ν2 – числа степеней свободы 1−FРАСП(x; ν1; ν2) FРАСПОБР(1−p; ν1; ν2) Функции распределения используются в расчетах уровней значимости статистических критериев. Приводимые в статистических таблицах значения обратных функций распределения называются квантилями (иначе – процентными точками) распределений и обозначаются хр. 8