Статистические методы обработки и планирования эксперимента
Покупка
Издательство:
Директ-Медиа
Год издания: 2020
Кол-во страниц: 61
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-4499-1629-7
Артикул: 781048.01.99
В учебном пособии рассматриваются вопросы статистической обработки экспериментальных данных, являющейся важным этапом при проведении полной математической обработки результатов экспериментов. Выделены основные проблемы, связанные с применением дисперсионного анализа, начиная от создания математической модели вплоть до интерпретации результатов.
Данное пособие предназначено для студентов вузов, преподавателей и всех занимающихся научными исследованиями.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 01.03.04: Прикладная математика
- 01.03.05: Статистика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
С. А. Осипенко Статистические методы обработки и планирования эксперимента Учебное пособие Москва Берлин 2020
УДК 519.226(075) ББК 22.172.1я73+87.256.631я73 О74 Осипенко, С. А. О74 Статистические методы обработки и планирования эксперимента : учебное пособие / С. А. Осипенко. – Москва ; Берлин : Директ-Медиа, 2020. – 61 с. ISBN 978-5-4499-1629-7 В учебном пособии рассматриваются вопросы статистической обработки экспериментальных данных, являющейся важным этапом при проведении полной математической обработки результатов экспериментов. Выделены основные проблемы, связанные с применением дисперсионного анализа, начиная от создания математической модели вплоть до интерпретации результатов. Данное пособие предназначено для студентов вузов, преподавателей и всех занимающихся научными исследованиями. Текст печатается в авторской редакции. УДК 519.226(075) ББК 22.172.1я73+87.256.631я73 ISBN 978-5-4499-1629-7 © Осипенко С. А., текст, 2020 © Издательство «Директ-Медиа», оформление, 2020
Оглавление 1. Основные принципы планирования эксперимента .................................................... 4 2. Дисперсионный анализ ................................................................................................. 5 3. Однофакторный дисперсионный анализ (при одинаковом числе испытаний на всех уровнях) .................................................... 7 4. Однофакторный дисперсионный анализ (при неодинаковом числе испытаний на всех уровнях) .............................................. 14 5. Двухфакторный дисперсионный анализ ................................................................... 27 6. Трехфакторный дисперсионный анализ ................................................................... 43 7. Гнездовые или иерархические планы (схемы) ......................................................... 51 Библиографический список ............................................................................................ 54 Приложение 1 ................................................................................................................... 55 Приложение 2 ................................................................................................................... 59
1. Основные принципы планирования эксперимента Под статистическим планированием эксперимента понимается организация экспериментального исследования, которая позволит собрать необходимые данные, применить для их анализа статистические методы и сделать правильные и объективные выводы. Без статистического подхода к планированию эксперимента не обойтись. Если данные эксперимента содержат ошибки, то статистические методы являются единственным объективным подходом к их анализу. Таким образом, в любой экспериментальной задаче два аспекта: планирование эксперимента и статистический анализ данных, причем эти два аспекта тесно взаимосвязаны, так как метод анализа непосредственно зависит от использованного плана. В основе планирования эксперимента лежат два принципа – репликация и рандомизация. Под репликацией понимают повторение основного эксперимента. Рандомизация – краеугольный камень, на котором основано применение статистических методов в планировании эксперимента. Рандомизация означает, что распределение экспериментального материала и порядок, в котором должны проводиться отдельные опыты или прогоны, устанавливаются случайным образом. При использовании статистического подхода к планированию экспериментов и анализу данных необходимо, чтобы все участники эксперимента еще до его начала ясно понимали, что именно предстоит исследовать и каким образом нужно собирать данные. Можно рекомендовать следующую схему: 1. Признание факта существования задачи и ее формулировка. 2. Выбор факторов и уровней. 3. Выбор переменной отклика (зависимой переменной). 4. Выбор плана эксперимента. 5. Проведение эксперимента 6. Анализ данных. 7. Выводы и рекомендации.
2. Дисперсионный анализ Инициатором применения статистических методов в планировании экспериментов является Рональд А. Фишер. В течение нескольких лет он был ответственным за статистическую обработку данных в Лондоне. Фишер разработал и впервые применил дисперсионный анализ в качестве важнейшего метода статистического анализа в планировании экспериментов. Методы планирования эксперимента впервые начали использовать в сельскохозяйственных и биологических науках. Современные методы планирования экспериментов сегодня широко применяются во всех областях исследований: агрономии, медицине, биологии, прикладных, естественных и общественных науках и др. Дисперсионный анализ – статистический метод, позволяющий анализировать влияние различных факторов (категориальных, группирующих, независимых переменных), обозначаемых латинскими буквами A,B,C и т. д., на результаты эксперимента (зависимые переменные). Для проведения дисперсионного анализа необходимо, чтобы независимая переменная была категориальной, а зависимая – метрической. Например, факторами, влияющими на содержание микроэлементов в пробе, могут быть: A – метод геохимического анализа, B – территория, C – среда съёмки (почва, снег, зола, накипь). В этом случае говорят о применении 3-х факторного дисперсионного анализа для исследования влияния 3-х факторов (A – метод геохимического анализа с 2-мя уровнями; B – территория с 3-мя уровнями и C – среда съемки с 4-мя уровнями) на содержание микроэлементов в пробе. Суть дисперсионного анализа (analysis of variance – сокращенно ANOVA) заключается в разложении дисперсии измеряемого признака на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации. Анализ основан на расчете F-статистики (статистика Фише-ра), которая представляет собой отношение двух дисперсий: межгрупповой и внутригрупповой. F-тест в однофакторном дисперсионном анализе определяет, значимо ли различаются средние нескольких независимых выборок. Задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака вычленить вариативность иного рода: а) вариативность обусловленную действием каждой из исследуемых независимых переменных; б) вариативность, обусловленную взаимодействием исследуемых независимых переменных; в) случайную вариативность, обусловленную всеми другими неизвестными переменными.
Чем в большей степени вариативность признака обусловлена исследуемыми переменными (факторами) или их взаимодействием, тем выше эмпирические значения критерия. Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины исследуемого результативного признака во всех градациях одинаковы. Альтернативная гипотеза будет утверждать, что средние величины результативного признака в разных градациях исследуемого фактора различны. Ограничения метода однофакторного дисперсионного анализа для несвязанных выборок: 1. Однофакторный дисперсионный анализ требует не менее трех градаций фактора и не менее двух испытуемых в каждой градации. 2. Результативный признак должен быть нормально распределен в исследуемой выборке. Правда, обычно не указывается, идет ли речь о распределении признака во всей обследованной выборке или в той ее части, которая составляет дисперсионный комплекс.
3. Однофакторный дисперсионный анализ (при одинаковом числе испытаний на всех уровнях) Пусть на количественный нормально распределенный признак Х воздействует фактор F, который имеет p постоянных уровней F1, F2,…,Fp. На каждом уровне произведено по q испытаний. Результаты наблюдений – числа xij, где i-номер испытания (i=1,2,…,q), j – номер уровня фактора (j=1,2,…,p) записываются в виде таблицы (таблица 1) Таблица 1 Номер испытания Уровни фактора i F1 F2 … Fp 1 𝑥11 𝑥12 … 𝑥1𝑝 2 𝑥21 𝑥22 … 𝑥2𝑝 … … … … … q 𝑥𝑞1 𝑥𝑞2 … 𝑥𝑞𝑝 Групповая средняя 𝑥гр 𝑥гр1 𝑥гр2 … 𝑥гр 𝑝 Ставится задача: на уровне значимости α проверить нулевую гипотезу о равенстве групповых средних при допущении, что групповые генеральные дисперсии хотя и независимы, но одинаковы. Для решения этой задачи вводятся: - общая сумма квадратов отклонений наблюдаемых значений признака от общей средней 𝑆общ = 𝑥𝑖𝑗 − 𝑥̅2 𝑞 𝑖=1 𝑝 𝑗=1 (1) - факторная сумма квадратов отклонений групповых средних от общей средней (характеризует рассеяние «между группами») 𝑆факт = 𝑞 (𝑥гр 𝚥 − 𝑥̅)2 𝑝 𝑗=1 (2) - остаточная сумма квадратов отклонений наблюдаемых значений группы от всей групповой средней (характеризует рассеяние «внутри групп») 𝑆ост = (𝑥𝑖1 − 𝑥гр1 )2 + ⋯ + (𝑥𝑖𝑝 − 𝑥гр 𝑝 )2 𝑞 𝑖=1 𝑞 𝑖=1 (3) Практически остаточную сумму находят по формуле: Sост=Sобщ - Sфакт (4) Для вычисления общей и факторной сумм более удобны следующие формулы: