Инфокоммуникационные технологии обработки экспериментальных данных в агроинженерии
Покупка
Основная коллекция
Тематика:
Прикладные информационные технологии
Издательство:
Волгоградский государственный аграрный университет
Автор:
Мелихова Елена Валентиновна
Год издания: 2018
Кол-во страниц: 112
Дополнительно
Содержатся теоретические положения, примеры решения задач по обработке экспериментальных данных с использованием специали-зированных программ MS Excel, Matlab, Statistica, Mathcad и др. Учебное пособие содержит методические указания по выполнению контрольных заданий, вопросы и тесты для изучения дисциплины.
Для аспирантов и соискателей, а также магистрантов очного и заочного обучения, по направлениям подготовки 35.06.01, 35.06.02, 35.06.04, 36.06.01, 05.06.01, 08.06.01, 38.06.01.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- ВО - Магистратура
- 09.04.01: Информатика и вычислительная техника
- Аспирантура
- 09.06.01: Информатика и вычислительная техника
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Министерство сельского хозяйства Российской Федерации Департамент научно-технологической политики и образования Федеральное государственное бюджетное образовательное учреждение высшего образования «Волгоградский государственный аграрный университет» Кафедра «Математическое моделирование и информатика» Е.В. Мелихова А.Ф. Рогачев ИНФОКОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В АГРОИНЖЕНЕРИИ Учебное пособие Волгоград Волгоградский ГАУ 2018
УДК 004.42:631.5 ББК 32.81 М-47 Рецензенты: кандидат экономических наук, доцент кафедры «Информационные системы в экономике» ФГБОУ ВО «Волгоградский ГТУ» А.Г. Гагарин; Почетный работник высшего профессионального образования РФ, доктор сельскохозяйственных наук, профессор кафедры «Эксплуатация машинно-тракторного парка» ФГБОУ ВО Волгоградский ГАУ, Заслуженный работник высшей школы РФ, академик РАЕ А.И. Ряднов Мелихова, Елена Валентиновна М-47 Инфокоммуникационные технологии обработки эксперимен тальных данных в агроинженерии: учебное пособие / Е.В. Мелихова, А.Ф. Рогачев. – Волгоград: ФГБОУ ВО Волгоградский ГАУ, 2018. – 112 с. Содержатся теоретические положения, примеры решения задач по обработке экспериментальных данных с использованием специализированных программ MS Excel, Matlab, Statistica, Mathcad и др. Учебное пособие содержит методические указания по выполнению контрольных заданий, вопросы и тесты для изучения дисциплины. Для аспирантов и соискателей, а также магистрантов очного и заочного обучения, по направлениям подготовки 35.06.01, 35.06.02, 35.06.04, 36.06.01, 05.06.01, 08.06.01, 38.06.01. УДК 42:631.5 ББК 32.81 © ФГБОУ ВО Волгоградский ГАУ, 2018 © Мелихова Е.В., Рогачев А.Ф., 2018
ОГЛАВЛЕНИЕ ВВЕДЕНИЕ .......................................................................................... 5 1. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ .............................. 7 1.1. Представление эмпирических данных .................................... 7 1.2. Построение уравнения регрессии ............................................ 8 1.3. Оценка параметров модели ...................................................... 9 1.4. Оценка тесноты связи ............................................................... 10 1.5. Оценка значимости уравнения регрессии ............................... 12 1.6. Определение доверительных интервалов ............................... 15 1.7. Вопросы для самопроверки ...................................................... 16 1.8. Решение типовых задач ............................................................ 16 1.9. Контрольные задания ................................................................ 22 2. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ ........................................ 27 2.1. Основные понятия ........................................................................ 27 2.2. Параметры уравнения множественной регрессии и их оценка ................................................................................................... 28 2.3. Мультиколлинеарность ............................................................ 31 2.4. Оценка качества модели множественной регрессии ............. 32 2.5. Проверка остатков регрессии на гомоскедастичность .......... 34 2.6. Устранение проблемы гетероскедастичности метод взве шенных наименьших квадратов ......................................................... 34 2.7. Автокорреляция ......................................................................... 35 2.7.1. Метод рядов ............................................................................... 36 2.7.2. Критерий Дарбина-Уотсона ..................................................... 36 2.7.3. Фиктивные переменные ............................................................ 37 2.8. Вопросы для самопроверки ...................................................... 38 2.9. Решение типовых задач ............................................................ 39 2.10 Визуализация экспериментальных данных и их аппроксимация кубическим сплайном в программе Mathcad ......................... 47 2.11. Контрольные задания ................................................................ 52 3. ВРЕМЕННЫЕ РЯДЫ ................................................................ 56 3.1. Основные понятия ..................................................................... 56 3.2. Моделирование временных рядов ........................................... 58 3.3. Решение типовых задач ............................................................ 60 3.4. Контрольные задания ................................................................ 70 4. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ЭКСПЕРИМЕН ТАЛЬНЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ НАДСТРОЙКИ «АНАЛИЗ ДАННЫХ» MS EXCEL ................................................... 72 4.1. Оценка изменчивости количественных признаков для независимых выборок ................................................................................ 72
4.2. Оценка средней разности при количественной изменчиво сти признаков для зависимых выборок. Парный двухвыборочный t-тест для средних ................................................................................ 74 4.3. Дисперсионный анализ данных однофакторного вегетаци онного и полевого опытов с полной рандомизацией вариантов .... 75 4.4. Дисперсионный анализ данных двухфакторного вегетаци онного и полевого опытов с полной рандомизацией вариантов .... 77 4.5. Задания для самостоятельной работы ..................................... 79 5. ПОСТРОЕНИЕ ГИСТОГРАММ НА ОСНОВЕ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ............................................. 81 КОНТРОЛЬНЫЕ ВОПРОСЫ И ТЕСТЫ ПО КУРСУ ..................... 87 6. ПЛАНИРОВАНИЕ И ОБРАБОТКА МНОГОФАКТОР НЫХ ЭКСПЕРИМЕНТОВ ................................................................ 88 6.1. Планирование однофакторных экспериментов ...................... 88 6.2. Двухуровневые планы многофакторных экспериментов ...... 89 Вопросы для самопроверки ................................................................ 94 КОНТРОЛЬНЫЕ ТЕСТЫ ................................................................... 95 ПРИЛОЖЕНИЕ А ............................................................................... 103 ПРИЛОЖЕНИЕ Б ............................................................................... 104 ПРИЛОЖЕНИЕ В ............................................................................... 105 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ........................................................... 106 СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ........................... 107 СВЕДЕНИЯ ОБ АВТОРАХ ................................................................ 109
ВВЕДЕНИЕ Обработка экспериментальных и статистических данных явля ется основой научных исследования в ряде наук. Анализ экспериментальных и статистической информации тре бует специальных методов, которые составляют один из аспектов математического моделирования. Центральной проблемой являются построение математической модели и определение ее адекватности для использования, анализа и прогнозирования различных природных и социальных процессов. На совершенствование данного направления существенное вли яние оказало развитие вычислительной техники и сопутствующих компьютерных программ. Цель учебной дисциплины «Компьютерная обработка экспери ментальных данных» построение, визуализация и анализ математических моделей. Задача дисциплины состоит в том, чтобы с помощью информа ционных технологий и комплексов программ найти выражения тех закономерностей, которые были выявлены экспериментально или статистически. Для аспирантов, соискателей и магистрантов, обучающихся по очной и заочной формах обучения. Студенты, прослушавшие учебный курс «Компьютерная обработка экспериментальных данных» должны: знать: методы построения регрессионных моделей, объектов и процессов; основы построения расчетов и анализ современной системы показателей, характеризующих деятельность хозяйствующих субъектов на микро- и микроуровне; уметь: осуществлять выбор инструментальных средств для об работки экспериментальных данных в соответствии с поставленной задачей, анализировать результаты расчетов и обосновывать полученные выводы; строить на основе описания ситуаций стандартные теоретические и математические модели, анализировать и содержательно интерпретировать полученные результаты; прогнозировать на основе стандартных регрессионных моделей развитие моделируемы процессов и явлений; владеть: методологией научного исследования; современной методикой построения математических моделей; методами и приѐмами анализа экономических явлений и процессов с помощью стандартных теоретических и экономических моделей.
Данное пособие предназначено для освоения практических навыков построения линейных моделей множественной регрессии с применением метода наименьших квадратов, оценки качества эконометрических моделей и их анализ, линеаризации нелинейных моделей, построение аддитивных и мультипликативных моделей временных рядов, решение систем линейных одновременных уравнений и их идентификация. Структура учебного пособия позволяет аспирантам, соискате лям и магистрантам познакомиться с теоретическим и практическим материалом. Проверить себя по освоению основных понятий изученной темы с помощью вопросов. Закрепить навыки и умения, решив самостоятельно задачи, представленные в конце каждой главы. И, наконец, пройти тест по дисциплине «Инфокоммуникационные технологии обработки экспериментальных данных».
1 ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ 1.1 Представление эмпирических данных Обработка и представление многомерных данных и наглядное представление в виде поля распределения или таблицы распределения (частот, относительных частот) возможно лишь в двумерном случае. Пусть имеется выборка х1,..., хn наблюдений по двум признакам xi = (xi, yi). Наглядное представление о двумерном распределении можно получить в виде поля наблюдений, которое представляет собой в системе координат xOy множество точек с координатами (xi, yi) ̅̅̅̅̅. Рассмотрим пример построения двумерного поля. Пример 1. В таблице представлены данные эксперимента зави симости сопротивления (yi) от диаметра сечения провода (xi) Таблица № 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 y 0.55 1 7.7 7.8 5.6 1.7 0.9 3.2 0.74 1.2 4.5 3.8 0.4 3.1 4.2 3.5 x 0.13 0.46 10.9 6.6 9.3 1.3 3.4 3.7 1.5 2.7 3.7 1.5 0.6 7.7 4.2 4.8 На рис. 1.1 приведен пример поля наблюдений, где первой ком понентой является проницаемость, измеренная промысловым методом, а второй по шлифам. Другим способом наглядного представления двумерных данных является составление таблиц двумерных статистик, в ячейках которых указывается количество наблюдений, попавших в соответствующие интервалы значений признаков (табл. 1.1). Рисунок 1 – Поле наблюдений
Таблица 1.1 – Сгруппированные двумерные данные z/y [0.4, 2.25) [2.25, 4.1) [4.1, 5.95) [5.95, 7.8] [0.13, 2.8) 6 1 0 0 [2.8, 5.5) 1 2 1 0 [5.5, 8.2) 0 2 0 1 [8.2, 10.9] 0 0 1 1 После группировки данных можно показать количество попада ний значений в заданные интервалы в виде графика (рис. 2). Рисунок 1 – График частот 1.2 Построение уравнения регрессии Линейная регрессия представляет собой модель, где среднее значение зависимой переменной у рассматривается как функция одной независимой переменной х, т.е. это модель вида: ) ,..., , ( ) ( 1 n x f x y , где y – зависимая переменная (результативный признак); x – независимая (объясняющая) переменная; βj – параметры регрессии; ε – случайная составляющая. Случайная величина включает влияние неучтенных в модели факторов, случайных ошибок и особенностей измерения. В зависимости от вида функции f(x) различают линейные и не линейные регрессии.
Линейная регрессия имеет вид: ̂ где bj – оценки параметров βj. Нелинейные регрессии делят на два класса: 1) регрессии, нелинейные по объясняющим переменным: полиномы разных степеней ̂ ; равносторонняя гипербола ̂ ; 2) регрессии, нелинейные по оцениваемым параметрам: степенная ̂ ; показательная ̂ экспоненциальная ̂ . Постановка задачи. По имеющейся выборке объема n двух па раметров (xi; yi),i=1…n необходимо определить аналитическую зависимость x b b y 1 0 , которая наиболее точно описывает данные наблюдений. Построение уравнения осуществляется в два этапа: спецификация модели, т.е. определение вида аналитиче ской зависимости ̂ ; оценка параметров полученной модели. В парной линейной регрессии выбор вида математической функции может быть осуществлен графическим, аналитическим или экспериментальным методом [19]. 1.3 Оценка параметров модели Построение уравнения регрессии сводится к оценке ее парамет ров. Для оценки параметров регрессий обычно используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от теоретических x y ми нимальна, т.е. min ) ( 2 2 xy y . Для линейных и нелинейных уравнений, приводимых к линей ным, решается следующая система относительно b0 и b1:
xy x b x b y x b nb 2 1 0 1 0 . (2.1) Можно воспользоваться готовыми формулами, которые выте кают из этой системы: 2 2 1 1 0 , x x y x xy b x b y b . (2.2) Для нелинейных уравнений регрессии, приводимых к линейным с помощью преобразования (x, y) → (x′, y′), система нормальных уравнений имеет вид (2.1) в преобразованных переменных x′, y′. Коэффициент b при факторной переменной x имеет следующую интерпретацию: он показывает, на сколько изменится в среднем величина y при изменении фактора x на 1 единицу измерения. Гиперболическая регрессия: . Линеаризующие преобразования: , . Уравнения (2.1) и (2.2) принимают вид: x y x b x b y x b nb 1 1 1 1 2 1 0 1 0 , , ) ( , 2 2 1 1 0 x x y x y x b x b y b где , 1 1 x n x , 1 y n y . Экспоненциальная регрессия: . Линеаризующие преобразования: , . , ) ( , 2 2 1 1 0 x x y x y x b x b y b где x n x 1 , y n y ln 1 1.4 Оценка тесноты связи Тесноту связи изучаемых явлений оценивает: линейный коэффициент парной корреляции rxy для ли нейной регрессии ( 1 1 xy r ):