Статистический анализ и теория планирования эксперимента
Покупка
Автор:
Сидняев Николай Иванович
Год издания: 2017
Кол-во страниц: 198
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-7038-4707-7
Артикул: 804693.01.99
Изложены краткие теоретические сведения по курсу "Теория планирования эксперимента". Представлено введение в статистический анализ и теорию планирования эксперимента. Основные понятия иллюстрируются примерами практического содержания, рассмотренными с позиций регрессионного анализа. Издание носит справочный характер и поможет студентам старших курсов овладеть методами теории планирования эксперимента, которые широко используются при решении прикладных задач.
Для студентов 4-6-го курсов инженерных специальностей технических университетов.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 01.03.01: Математика
- 01.03.02: Прикладная математика и информатика
- 01.03.04: Прикладная математика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Н.И. Сидняев Статистический анализ и теория планирования эксперимента Учебное пособие
ISBN 978-5-7038-4707-7 © МГТУ им. Н.Э. Баумана, 2017 © Оформление. Издательство МГТУ им. Н.Э. Баумана, 2017 УДК 519.2 ББК 32.81я73 С34 Издание доступно в электронном виде на портале ebooks.bmstu.ru по адресу: http://ebooks.bmstu.ru/catalog/109/book1687.html Факультет «Фундаментальные науки» Кафедра «Высшая математика» Рекомендовано Редакционно-издательским советом МГТУ им. Н.Э. Баумана в качестве учебного пособия Рецензент д-р физ.-мат. наук А.А. Гурченков ISBN 978-5-7038-4707-7 Изложены краткие теоретические сведения по курсу «Теория планирования эксперимента». Представлено введение в статистический анализ и теорию планирования эксперимента. Основные понятия иллюстрируются примерами практического содержания, рассмотренными с позиций регрессионного анализа. Издание носит справочный характер и поможет студентам старших курсов овладеть методами теории планирования эксперимента, которые широко используются при решении прикладных задач. Для студентов 4–6-го курсов инженерных специальностей технических университетов. УДК 519.2 ББК 32.81я73 Сидняев, Н. И. С34 Статистический анализ и теория планирования эксперимента : учебное пособие / Н. И. Сидняев. — Москва : Издательство МГТУ им. Н. Э. Баумана, 2017. — 195, [5] с. : ил.
Предисловие В учебном пособии, состоящем из четырех глав, изложены основы теории планирования эксперимента в соответствии с программой этого курса для технических и экономических специальностей технических вузов. Материал учебного пособия представлен в строгой, но доступной пониманию форме, примеры имеют практическую направленность. Содержание учебного пособия соответствует курсу лекций по дисциплине «Теория планирования эксперимента», который автор читает в МГТУ им. Н.Э. Баумана для студентов специальности «Прикладная математика». Учебное пособие предназначено для студентов старших курсов и может быть полезно преподавателям, аспирантам, а также специалистам в области статистического моделирования. В первой главе рассмотрены статистические методы обработки экспериментальных данных, предназначенные для построения эмпирических зависимостей. Это дает возможность перейти к рассмотрению принципиально нового подхода к экспериментированию, который состоит в том, что в каждом опыте по специальному плану одновременно варьируют все независимые переменные (факторы). Последовательно объяснены основные понятия математической статистики, а именно: эмпирические функции распределения, плотность распределения, гистограмма, выборка, порядковая статистика. Приведены асимптотические свойства оценок, описаны способы доверительного оценивания, представлены основные распределения математической статистики (χ2-распределение, распределение Стьюдента, распределение Фишера). Рассмотрено доверительное оценивание параметров биномиального, нормального и экспоненциального распределений. Введены понятия статистической гипотезы, критерия проверки гипотезы, статистики критерия. Дана общая логическая схема построения критерия проверки гипотезы. Подробно изложены элементы регрессивного анализа (простая регрессия, парная линейная регрессия, ортогональная регрессия). Рассмотрены множественная линейная регрессия, статистические выводы о параметрах регрессии, оценка множественного коэффициента корреляции. Во второй главе введены основные понятия теории планирования эксперимента, обсуждаются критерии планирования. Проанализированы этап предпланирования эксперимента, особенности выбора факторов, определения области проведения эксперимента, выбора базовой точки и интервалов варьирования. Приведены примеры полного факторного эксперимента типа 2m, линейных моделей второго порядка. Рассмотрена возможность сокращения числа опытов путем проведения дробного факторного эксперимента. В этом случае из всех опытов, необхо
димых при полном факторном эксперименте, некоторые сочетания исключаются и опыты при этих сочетаниях не проводятся. Отмечено, что опыты, в которых все факторы находятся на основном уровне (+1, 0, –1), исключать не следует. Приведено описание методов выделения существенных факторов, которые необходимо учитывать при построении математических моделей. Рассмотрены проблемы планирования эксперимента и расчета оценок параметров, входящих в модели нелинейно. Применение теории планирования эксперимента в таких задачах основано на линеаризации модели по неизвестным параметрам при некоторых начальных значениях этих параметров. В связи с тем что в дробных репликах часть взаимодействий заменена новыми факторами, найденные коэффициенты уравнения регрессии рассматриваются как совместные оценки линейных эффектов и эффектов взаимодействия. В композиционных планах за основу принимают двухуровневый полный факторный эксперимент и к нему добавляют эксперименты, проводимые на других уровнях: как в центре, так и при различных значениях ±α (расстояние от ребер гиперкуба, или длина «звездного плеча»). При большом числе факторов (k > 3) проведение полного факторного эксперимента связано с большим числом опытов, значительно превосходящим число коэффициентов линейной модели. Если при получении модели можно ограничиться линейным приближением, т. е. получить адекватную модель в виде полинома, то число опытов можно резко сократить в результате использования дробного факторного эксперимента. В третьей главе представлены композиционные планы Бокса, ротатабельные, центральные композиционные планы, планы типа Вm, D-оптимальные планы, планы Кифера и Коно на отрезке Ω = (–1, 1). Центральные композиционные планы второго порядка рассматриваются в совокупности с ортогональными и ротатабельными планами второго порядка. Изложены основные методы получения математического описания на относительно линейных участках поверхности отклика и в области главного экстремума. Введено понятие информационного профиля плана. Объяснено понятие разрешающей способности как числа несмешанных линейных эффектов в дробной реплике. Прямая оценка разрешающей способности дробной реплики затруднена, поэтому дробные реплики задают с помощью генерирующих соотношений. Генерирующее соотношение показывает, какое из взаимодействий принято незначимым и заменено новым фактором. Приведен пример, когда план типа 23–1 может быть представлен двумя полурепликами, которые задаются генерирующими соотношениями. Описаны полные и дробные факторные планы, а также композиционные ортогональные и ротатабельные планы эксперимента для квадратичных моделей. На примерах показано, что весьма сложной задачей является выбор некоторого универсального критерия оптимальности планирования, позволяющего оценивать планы со всех возможных точек зрения. Показано, что ротатабельные планы являются оптимальными и в более широком смысле: к ним приходится обращаться и тогда, когда надо минимизировать систематические ошибки, связанные с неадекватностью представления результа
тов исследования полиномами второго порядка. Построение ротатабельных планов второго порядка — сложная математическая задача. Приведены данные, необходимые для построения матриц центрального композиционного ротатабельного планирования. Показано, как планы разбиваются на ортогональные блоки. Разобраны примеры применения ротатабельного планирования. Предложено несколько способов построения ротатабельных планов второго порядка. Отмечено, что ортогональные планы первого порядка являются одновременно ротатабельными планами. Дана геометрическая интерпретация ортогональных планов первого порядка. Рассмотрены примеры различных матриц D, задающих координаты экспериментальных точек в факторном пространстве для ортогонального плана первого порядка с минимальным числом экспериментов N. Четвертая глава посвящена анализу почти стационарной области. Рассмо трено ортогональное и ротатабельное планирование второго порядка, а также ротатабельное планирование с учетом эффекта неадекватности модели. В приложении приведены варианты домашнего задания. В соответствии с целями конкретной общеобразовательной программы высшего профессонального образования и задачами профессиональной деятельности студент в дополнение к компетенциям, соответствующим квалификации магистра, должен обладать следующими компетенциями. Общекультурные компетенции: умение находить, анализировать и обрабатывать информацию, в том числе относящуюся к новым областям знания, непосредственно не связанным с профессиональной деятельностью. Профессиональные, в том числе общенаучные, компетенции: способность самостоятельно приобретать, осмысливать, структурировать и использовать в профессиональной деятельности новые знания, применять современные образовательные и информационные технологии, развивать свои инновационные способности, расширять и углублять свое научное мировоззрение; способность самостоятельно формулировать цели исследований, устанавливать последовательность решения задач с использованием теории планирования эксперимента, внедрять результаты научно-исследовательской работы в практику. Инструментальные компетенции: владение современными средствами вычислительной техники, системным и прикладным программным обеспечением, позволяющее выбирать и творчески использовать их для решения научных и практических задач в профессиональной деятельности. Профессионально-специализированные компетенции: владение методологией математического моделирования технических систем и технологических процессов, процессов управления ими, а также методами статистического анализа и теории массового обслуживания, математической теории надежности технических систем и технологических процессов на основе глубоких знаний фундаментальных математических и естественно-научных дисциплин, информационных технологий; способность самостоятельно разрабатывать математические модели и методы их качественного и количественного анализа с использованием теории планирования эксперимента применительно к техническим объектам, характерным для современного машино- и приборостроения.
После освоения дисциплины студент должен знать: методы теории планирования эксперимента, основы математического моделирования и его применения при исследовании физических, технических, биологических, экологических процессов; теоретический материал (исходные факты, определения, аксиомы, основные утверждения, теоремы, свойства математических объектов); методики решения задач теоретического и прикладного характера. Студент должен уметь: анализировать и решать научные, научно-исследовательские и инженерно-экономические задачи в области теории планирования эксперимента и ее приложений; применять полученные знания при математическом моделировании явлений живой и неживой природы, экономических и социальных процессов общественной жизни, решении разнообразных задач; использовать информационные технологии в проектно-конструкторской, управленческой и финансовой деятельности. Студент должен иметь навыки: постановки задач (описание физической задачи, выделение существенных факторов, использование физической модели и ограничение области ее применимости, математическое моделирование задачи); вывода расчетных формул (переход от уравнений математической модели к расчетным формулам; грамотное использование основных расчетных формул теории планирования эксперимента, если вывод расчетных формул является громоздким).
Введение Практическая полезность научных исследований в значительной степени зависит от методов их проведения и формы представления результатов. Применение эффективной технологии исследований позволяет существенно сократить фазу внедрения, что приводит к экономии времени и средств [1–3]. Обеспечить с помощью традиционных методов исследования требуемые темпы развития ни в фундаментальных или прикладных исследованиях, ни при модернизации или проектировании производственных установок не удается [4–6]. В связи с этим в науке, технике, производстве при решении разнообразных задач во все больших масштабах применяют новые эффективные методы исследования. При этом особое внимание уделяют моделям процессов и способам их построения [7]. Для эффективного анализа механизмов явлений и управления производственными процессами необходимо выявить взаимосвязи между факторами, определяющими ход процесса, и представить их в количественной форме — в виде математической модели [7–9]. Математическая модель является математическим отображением наиболее существенных сторон процесса. В зависимости от источника информации, используемого при построе нии математической модели, различают физико-химические модели (называемые также иногда аналитическими или теоретическими) и статистические (или эмпирические) модели [1, 7]. В первом случае за основу берут физико-химические закономерности моделируемых процессов, например, в виде уравнений баланса или кинетических уравнений для превращений вещества. Построение теоретических моделей сопряжено с проведением обширных и длительных исследований, поскольку при этом необходимо выяснить природу микропроцессов, протекающих в объекте, и описать их математически [10–12]. Как правило, модели процессов представляют в виде сложных систем уравнений (системы алгебраических, обыкновенных дифференциальных уравнений или уравнений в частных производных). Эти системы уравнений позволяют очень точно описать процессы, протекающие в объекте, и допускают экстраполяцию в точки факторного пространства, где непосредственное наблюдение процессов невозможно. Статистические модели получают в результате статистической обработки экспериментальных данных, собранных на исследуемом объекте. Структура статистической модели может быть выбрана относительно произвольно [13]. Соответствие модели объекту ограничивается лишь количественно. Статистические модели имеют относительно простую структуру и очень часто представлены в виде полиномов. Область их применения отвечает
лишь ближайшей окрестности рабочих точек, в которой проводятся эксперименты. Во многих случаях такие модели можно построить при сравнительно небольших затратах времени и средств [14–16]. В результате множества экспериментов должна быть построена подходящая модель, выявлены возможные ошибки. Экспериментатор, применяя свои технические знания, может обнаружить дефекты модели, скорректировать их и построить новую модель, которая также будет подвергнута испытаниям [7]. Функциональная форма, полученная на основе теоретического представления, обычно нелинейна в неизвестных параметрах. Эмпирический подход иногда применяют просто для того, чтобы избежать осложнений, связанных с нелинейными уравнениями. Решение нелинейных уравнений — область применения численных методов. Эксперимент занимает главенствующее место среди способов получения информации о внутренних взаимосвязях явлений в природе и технике. Он является отправной точкой и критерием большинства знаний. Эксперименты и наблюдения стали основой для открытия многих известных законов природы и проверки теоретических гипотез [4]. По мере усложнения исследуемых процессов и явлений возрастают затраты на аппаратуру и проведение эксперимента. В последние годы была создана последовательная и достаточно строгая теория регрессионного анализа, базирующаяся на современных теоретико-вероятностных представлениях [12]. Эта теория позволила значительно глубже понять и оценить результаты, получаемые методом наименьших квадратов. Опыт показал, что классический регрессионный анализ, несмотря на хорошо разработанную теорию, не нашел широкого применения для решения экстремальных задач в физике, химии и металлургии [9]. При решении подобного рода задач приходится иметь дело с очень большим числом независимых переменных. В этом случае метод становится крайне громоздким и возникают практически непреодолимые трудности, связанные, с одной стороны, с необходимостью ставить очень большое число экспериментов, с другой стороны — с интерпретацией уравнения регрессии (все коэффициенты регрессии оказываются корреляционно связанными между собой). Отметим следующие новые возможности, которые открывает перед исследователями теория планирования эксперимента: 1. Статистическое представление об эксперименте образует основу для исследования сложных объектов и систем [3]. Эти объекты характеризуются большим числом факторов, воздействующих на результаты эксперимента. При классическом подходе к экспериментам влияние совокупности факторов на результаты эксперимента исследовалось при условии, что изменяется только один из факторов и фиксируются «значения» всех остальных. В сложных системах, где большое число воздействий невозможно контролировать (или управлять ими), это условие не выполняется. Статистическая концепция позволяет учесть влияние неконтролируемых факторов иным образом [16]. Воздействие этих факторов рассматривается как дополнительный стохастический шум, наложенный на истинные ре
зультаты экспериментов. Для того чтобы воздействие сделать случайным, применяют специальные методы. Благодаря этому удается надежно отделить факторы, интересующие экспериментатора, от шумового фона, обусловленного неконтролируемыми воздействиями. 2. Математическая статистика предоставляет в распоряжение экспериментатора методы анализа данных и принятия решений относительно исследуемого объекта на основании обработанных результатов эксперимента. Эти методы дают возможность учесть стохастический характер результатов и основаны на статистической проверке гипотез. Планирование эксперимента — это новый подход к исследованию, при котором активная роль отводится математическим методам [7–9]. Основываясь на априорных сведениях об изучаемом процессе, исследователь выбирает некоторую оптимальную стратегию для управления экспериментом. Процесс исследования обычно разбивается на этапы. После каждого этапа исследователь получает новую информацию, позволяющую ему изменять стратегию исследования. На математическом языке задача планирования эксперимента формулируется следующим образом: нужно выбрать в некотором смысле оптимальное расположение точек в факторном пространстве, для того чтобы получить какое-то представление о поверхности отклика. А выбор критерия оптимальности в значительной степени произволен. Задачи, для решения которых может использоваться планирование эксперимента, чрезвычайно разнообразны. Поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей (например, кинетических), выбор из некоторого множества гипотез о механизме явлений наиболее приемлемых, исследование диаграмм состав–свойство — вот примеры задач, при решении которых применяется планирование эксперимента [10]. Можно сказать, что там, где есть эксперимент, присутствует и наука о его проведении — теория планирования эксперимента. Поиск оптимальных условий — один из наиболее распространенных типов научно-технических задач. Эти задачи возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (в некотором смысле оптимальные) условия его реализации. Например, у химика возникла гипотеза о том, что при взаимодействии двух веществ должен получаться некоторый интересующий его продукт. Требуется подобрать концентрации реагирующих веществ, температуру, давление, время реакции и другие факторы таким образом, чтобы сделать выход продукта возможно более близким к 100 %. В этом примере находят условия проведения процесса, оптимальные в смысле максимизации выхода требуемого продукта. Но это далеко не единственно возможная постановка задачи. Найденные условия могли оказаться другими, если бы ставилась, например, задача минимизировать себестоимость продукта или количество вредных примесей. Следует подчеркнуть, что всегда необходимо четко формулировать, в каком смысле условия должны быть оптимальными. Этим определяется выбор цели исследования. Точная формулировка цели в значительной мере определяет успех исследования.
Задачи, сформулированные аналогичным образом, называются задачами оптимизации. Процесс их решения называется процессом оптимизации (или просто оптимизацией). Выбор оптимального состава многокомпонентных смесей или сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение — вот примеры задач оптимизации. Эксперимент, который ставится для решения задач оптимизации, называется экстремальным.