Многомерный статистический анализ эколого-геохимических измерений. Ч.2. Компьютерный практикум
Покупка
Основная коллекция
Тематика:
Отраслевая и прикладная экология
Издательство:
Томский политехнический университет
Год издания: 2015
Кол-во страниц: 152
Дополнительно
Пособие содержит: краткие теоретические сведения; примеры и рекомендации по решению типовых задач с использованием современного компьютерного инструментария (систем STATISTICA и Excel) на уровне модульного анализа данных с помощью мастер-макросов; учет особенностей ССА в случае малых выборок; наглядные графические иллюстрации, выполненные
в системе STATISTICA 6.1. Оно может быть полезно при усвоении теоретического материала и овладении необходимыми практическими навыками при проведении сравни-
тельного статистического анализа (ССА) эколого-геохимической информации.
Предназначено для бакалавров и магистров направления «Экология и природопользование», а также для аспирантов специальности 25.00.36 «Геоэкология».
Тематика:
ББК:
- 201: Человек и окружающая среда. Экология человека. Экология в целом. Охрана природы
- 263: Геологические науки
УДК:
- 550: Вспомогательные геологические науки
- 574: Общая экология. Биоценология. Гидробиология. Биогеография
ОКСО:
- ВО - Бакалавриат
- 05.03.01: Геология
- 05.03.06: Экология и природопользование
- ВО - Магистратура
- 05.04.06: Экология и природопользование
- ВО - Специалитет
- 04.05.01: Фундаментальная и прикладная химия
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего образования «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ» А.А. Михальчук, Е.Г. Язиков МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКОЛОГО-ГЕОХИМИЧЕСКИХ ИЗМЕРЕНИЙ ЧАСТЬ II. КОМПЬЮТЕРНЫЙ ПРАКТИКУМ Рекомендовано в качестве учебного пособия Редакционно-издательским советом Томского политехнического университета Издательство Томского политехнического университета 2015
УДК 550.4:504:51(076.5) ББК 26.30:20.1я73 М69 Михальчук А.А. М69 Многомерный статистический анализ эколого-геохимических измерений : учебное пособие. Часть II. Компьютерный практикум / А.А. Михальчук, Е.Г. Язиков ; Томский политехнический университет. – Томск : Изд-во Томского политехнического университета, 2015. – 152 с. Пособие содержит: краткие теоретические сведения; примеры и рекомендации по решению типовых задач с использованием современного компьютерного инструментария (систем STATISTICA и Excel) на уровне модульного анализа данных с помощью мастер-макросов; учет особенностей ССА в случае малых выборок; наглядные графические иллюстрации, выполненные в системе STATISTICA 6.1. Оно может быть полезно при усвоении теоретического материала и овладении необходимыми практическими навыками при проведении сравнительного статистического анализа (ССА) эколого-геохимической информации. Предназначено для бакалавров и магистров направления «Экология и природопользование», а также для аспирантов специальности 25.00.36 «Геоэкология». УДК 550.4:504:51(076.5) ББК 26.30:20.1я73 Рецензенты Доктор физико-математических наук, профессор заведующий кафедрой ТФ ТГУ А.В. Шаповалов Кандидат геолого-минералогических наук начальник экспедиции ООО «ВостокГАЗПРОМгеофизика» О.А. Миков © ФГАОУ ВО НИ ТПУ, 2015 © Михальчук А.А., Язиков Е.Г., 2015 © Оформление. Издательство Томского политехнического университета, 2015
Оглавление Введение .................................................................................................................... 4 ЧАСТЬ II. КОМПЬЮТЕРНЫЙ ПРАКТИКУМ .................................................... 5 2.1. Описательная статистика .............................................................................. 6 2.1.1. Вычисление оценок числовых характеристик содержаний химических элементов ............................................................................ 6 2.1.2. Построение диаграммы размаха ............................................................ 8 2.1.3. Построение гистограммы содержаний микроэлементов .................. 10 2.2. Проверка статистических гипотез ............................................................. 16 2.2.1. Проверка гипотезы о законе распределения содержаний химических элементов .......................................................................... 16 2.2.2. Оценка различия содержаний двух выборок ..................................... 20 2.3. Компьютерный дисперсионный анализ .................................................... 28 2.3.1. Однофакторный дисперсионный анализ ............................................ 29 2.3.2. Двухфакторный дисперсионный анализ ............................................ 40 2.4. Корреляционно-регрессионный анализ ..................................................... 48 2.4.1. Вычисление корреляционной матрицы ассоциации содержаний микроэлементов ............................................................... 48 2.4.2. Вычисление коэффициента корреляции Спирмена .......................... 52 2.4.3. Построение диаграммы рассеяния и линии регрессии ..................... 54 2.5. Канонический анализ двух ассоциаций микроэлементов ....................... 66 2.6. Кластерный анализ ассоциации микроэлементов .................................... 82 2.7. Факторный анализ ассоциации микроэлементов ..................................... 90 2.8. Кластерный анализ наблюдений в факторной модели ассоциации микроэлементов ..................................................................... 101 2.9. Средства статистического анализа данных в системе Excel ................. 117 2.10. Модульный анализ данных в системе STATISTICA ........................... 136 ПРИЛОЖЕНИЕ. П1. Содержание микроэлементов (мг/кг) в почве территории Томского региона, полученное методами ИНАА (И) и ISP (I) ................................................................... 145 Заключение ........................................................................................................... 149 Список литературы ........................................................................................... 150
ВВЕДЕНИЕ Анализ проведенных эколого-геохимических исследований мониторинговых наблюдений урбанизированных территорий России и других стран показывает, что они характеризуются комплексом химических компонентов (тяжелые металлы, радиоактивные, редкоземельные и редкие элементы, макроэлементы). Таким образом, база данных экологогеохимических измерений является многомерной, что предполагает при проведении анализа эколого-геохимической информации использование многомерных статистических методов [4, 7, 9–11, 14–17, 19–21, 24, 26]. Резкое увеличение количественной информации, получаемой в процессе эколого-геохимических исследований, вызвало необходимость использования современных способов ее обработки и статистического анализа с помощью ЭВМ [1–3, 22–23]. Современная геохимия уже не может ограничиться изучением лишь качественных сторон явлений и процессов, а должна активно и всесторонне выявлять их количественные характеристики, обеспечивая тем самым более высокий научный уровень исследования экологии окружающей среды. Важным моментом в настоящее время является использование эколого-геохимической информации в виде выборки в небольшом объеме. Основным фактором в данном случае являются дорогостоящие методы анализа. В данном пособии рассматривается возможность применения методов статистической обработки при небольшом объеме выборок [12–13] при изучении загрязнения окружающей среды, в том числе почв и снегового покрова, на кафедре геоэкологии и геохимии Томского политехнического университета [18, 27]. Учебное пособие состоит из трех частей. В первой части рассматривается теоретический материал математических основ курса «Многомерный статистический анализ эколого-геохимических измерений», содержащий краткие теоретические сведения по теории вероятностей и многомерным статистическим методам. Вторая часть включает компьютерный практикум по многомерным статистическим методам. Авторы преследовали цель не только создать учебно-методическое пособие, но и на конкретных примерах показать возможность применения современного компьютерного инструментария (системы STATISTICA 6.1) для овладения необходимыми практическими навыками при проведении сравнительного статистического анализа эколого-геохимической информации.
ЧАСТЬ II. КОМПЬЮТЕРНЫЙ ПРАКТИКУМ Компьютерный многомерный статистический анализ [1–3, 22–23] содержаний микроэлементов, полученных при проведении экологогеохимических исследований разными методами, предполагает: I. Вычисление оценок числовых характеристик содержаний. II. Проведение оценки различия содержаний по двум методам: 1) проверка нормальности распределений содержаний, 2) применение параметрических или непараметрических (ранговых) критериев различия (неоднородности) выборок. III. Проведение оценки степени зависимости между микроэлементами на основе корреляционно-регрессионного анализа: 1) вычисление корреляционной матрицы двух выборок и оценку значимости коэффициента корреляции, 2) построение диаграммы рассеяния и уравнения регрессии для наиболее значимых корреляционных связей в ассоциациях. IV. Проведение канонического анализа двух ассоциаций микроэлементов. V. Проведение оценки степени сходства результатов, полученных разными методами, на основе метода иерархический группировки (кластерного анализа). VI. Проведение кластеризации эколого-геохимических наблюдений на основе факторного анализа содержаний химических элементов. С использованием пакета STATISTICA 6.1 данная работа может быть выполнена в следующей последовательности. На предварительном этапе создается (импортируется из Excel или набирается в Statistica) файл (с названием, например, ИНАА-ISP почва.sta) с категориальной и раздельной по методам базой данных (см. приложение П1 и рис. 2.1). При этом названия микроэлементов выносятся в названия переменных (столбцов). Рис. 2.1. Фрагмент числового файла в рабочем окне STATISTICA
2.1. Описательная статистика 2.1.1. Вычисление оценок числовых характеристик содержаний химических элементов На этапе I для вычисления оценок числовых характеристик содержаний химических элементов в ассоциациях по двум методам в активизированном пакете Statistica 6.1 необходимо выполнить последовательность следующих действий: Шаг 1. Запустите в головном меню модуль . Рис. 2.2. Запуск модуля в системе STATISTICA Шаг 2. В стартовой панели модуля нажмите клавишу . Шаг 3. В появившемся окне выберите : Рис. 2.3. Окно в STATISTICA Шаг 4. В открывшемся окне нажмите кнопку , выберите переменные раздельной по методам базы данных и нажмите ОК. Шаг 5. Нажмите кнопку и закажите (пометьте все нужные числовые характеристики (рис. 2.4)): объем выборки N, стандартное отклонение S, минимум (Min) и максимум (Max), среднее (m), медиану (Me), моду (Mo), асимметрию (А), эксцесс (Е) и их стандартные ошибки , A E , а также m .
Рис. 2.4. Режим в окне . Шаг 6. Нажмите в окне кнопку . Следующая таблица появится на экране (табл. 2.1): Таблица 2.1 Числовые характеристики содержаний микроэлементов в почве населенных пунктов Томского региона, полученных методами ИНАА и ISP N m Me Mo Min Max S σm A σА E σЕ NaИ 91 1,33 1,30 1,30 0,50 2,30 0,42 0,04 0,31 0,25 –0,87 0,50 FeИ 91 3,20 3,30 3,20 1,50 4,80 0,68 0,07 –0,77 0,25 0,42 0,50 BaИ 91 501,1 480,0 400,0 260,0 970,0 137,4 14,40 0,88 0,25 0,81 0,50 ScИ 91 12,08 12,80 12,80 5,40 16,80 2,88 0,30 –0,76 0,25 –0,28 0,50 CrИ 91 127,0 117,4 Много 46,50 354,2 51,15 5,36 2,13 0,25 6,26 0,50 CoИ 91 15,79 15,30 14,30 3,70 64,40 6,99 0,73 4,23 0,25 27,21 0,50 LaИ 91 27,03 27,50 Много 14,00 41,10 5,04 0,53 –0,21 0,25 0,08 0,50 NaI 91 1,79 1,697 1,99 0,88 2,96 0,49 0,05 0,65 0,25 –0,19 0,50 FeI 91 3,04 3,048 Много 0,99 4,57 0,67 0,07 –0,57 0,25 1,73 0,50 BaI 91 406,6 387,0 380,0 245,0 883,0 92,36 9,68 2,48 0,25 9,55 0,50 ScI 91 9,18 9,00 Много 3,00 14,30 2,43 0,26 0,10 0,25 0,08 0,50 CrI 91 117,5 104,0 80,0 62,90 360,0 49,50 5,19 2,76 0,25 10,50 0,50 CoI 91 18,65 19,00 Много 3,00 65,00 8,84 0,93 2,67 0,25 13,04 0,50 LaI 91 22,21 24,00 20,0 2,00 33,10 6,92 0,73 –0,71 0,25 0,27 0,50
2.1.2. Построение диаграммы размаха Для построения диаграммы размаха (графика ящики-усы), геометрически интерпретирующей наборы числовых характеристик (центр и диапазон значений выбранной переменной), необходимо выполнить последовательность первых трех шагов п. 2.1.1. Шаг 4. В открывшемся окне нажмите кнопку и выберите переменную, например NaИ , и нажмите ОК. Шаг 5. Нажмите кнопку и закажите тип графика выбором . Например, (Медиана/квартильный размах(25 %,75 % процентили) / размах (минимум, максимум)). Рис. 2.5. Режим в окне . Шаг 6. Закажите в режиме Рис. 2.6. Режим в окне
Следующая картинка появится на экране (рис. 2.7). Рис. 2.7. Диаграмма размаха микроэлемента NaИ типа Медиана/ … Если на пятом шаге заказать тип графика выбором , например, (Среднее/ стандартная ошибка/ стандартное отклонение ), то на экране появится следующая картинка. Рис. 2.8. Диаграмма размаха микроэлемента NaИ типа Среднее/ …
На графике может быть представлено более одной переменной, если на четвертом шаге в окне выбрать несколько переменных, например CoИ и LaИ . Рис. 2.9. Составная диаграмма размаха CoИ и LaИ типа Среднее/ … 2.1.3. Построение гистограммы содержаний микроэлементов Гистограмма (столбчатый график), геометрически отображающая распределение частот значений переменной по интервалам (см. п. 1.2.1; рис. 1.16), дает наглядное представление о форме распределения и числовых характеристиках содержаний одной (простая гистограмма) или нескольких микроэлементов (составная гистограмма). Гистограмма наглядно показывает, какие значения или диапазон значений исследуемой переменной являются наиболее частыми, насколько сильно они различаются между собой, как сконцентрировано большинство наблюдений вокруг среднего, является распределение симметричным или нет, имеет ли оно одну моду или несколько мод, т. е. является мультимодальным.