Многомерные статистические методы
Покупка
Издательство:
ФЛИНТА
Год издания: 2021
Кол-во страниц: 65
Дополнительно
Вид издания:
Учебно-методическая литература
Уровень образования:
ВО - Магистратура
ISBN: 978-5-9765-4763-6
Артикул: 771186.01.99
Содержат основные темы курса «Многомерные статистические методы». Включают лабораторный практикум, состоящий из 7 лабораторных работ и описание инструментальных средств Microsoft Office Excel (встроенные функции, пакет анализа. Для студентов-магистров очной и заочной форм обучения по направлению «Прикладная информатика».
Тематика:
ББК:
УДК:
- 004: Информационные технологии. Вычислительная техника...
- 519: Комбинатор. анализ. Теория графов. Теория вер. и мат. стат. Вычисл. мат., числ. анализ. Мат. кибер..
ОКСО:
- ВО - Бакалавриат
- 09.03.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
МНОГОМЕРНЫЕ СТАТИСТИЧЕСКИЕ МЕТОДЫ Методические указания по выполнению лабораторных работ для студентов-магистров очной и заочной форм обучения по направлению подготовки «Прикладная информатика», профиль «Прикладная информатика в экономике» Москва Издательство «ФЛИНТА» 2021
Рецензент к. т. н., доцент Е.И. Улитина Составители: И.Л. Макарова А.М. Игнатенко Многомерные статистические методы: методические указания по выполнению лабораторных работ / сост.: И.Л. Макарова, А.М. Игнатенко. — Москва : ФЛИНТА, 2021. — 65 с. — ISBN 978-5-9765-4763-6. — Текст : электронный. Содержат основные темы курса «Многомерные статистические методы». Включают лабораторный практикум, состоящий из 7 лабораторных работ и описание инструментальных средств Microsoft Office Excel (встроенные функции, пакет анализа. Для студентов-магистров очной и заочной форм обучения по направлению «Прикладная информатика». УДК 519.237 ББК 22.172.6 © ФГБОУ ВО «СГУ», 2018 © Макарова И.Л., Игнатенко А.М., составление, 2018 УДК 519.237 ББК 22.172.6 М73 М73 ISBN 978-5-9765-4763-6
Содержание Введение 4 I. Лабораторный практикум Лабораторная работа № 1. Статистические оценки 6 Лабораторная работа № 2. Корреляционный анализ 12 Лабораторная работа № 3. Частная корреляция 13 Лабораторная работа № 4. Множественная регрессия 16 Лабораторная работа № 5. Компонентный анализ 21 Лабораторная работа № 6. Факторный анализ 25 Лабораторная работа № 7. Кластерный и дискриминантный анализ 31 II. Инструментальные средства Microsoft Оffice Excel 1. Встроенные функции Excel 35 2. Пакет анализа Excel 54 Библиографический список 62 Приложения: 1. Форма титульного листа отчёта по лабораторной работе 63 2. Содержание отчета по лабораторной работе 64
Введение Методы многомерного статистического анализа (МСА) часто называют интеллектуальным инструментарием современного исследователя. Они составляют обязательную часть фундаментальных курсов университетского образования. Многомерные статистические методы (МСМ) позволяют построить вероятностно-статистическую модель, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала. Использование методов МСА в задачах принятия решений на основе анализа стохастической, неполной информации является не только оправданным, но существенно необходимым. Методами МСА могут решаться задачи уменьшения, концентрации исходных данных, выявления структуры и взаимосвязей между ними на основе построения обобщенных характеристик множества признаков и множества объектов. В настоящее время методы и модели МСА используются в составе новых информационных технологий. Можно выделить три основные задачи, решаемые в рамках МСА: 1) исследование характера явных и неявных зависимостей между объектами или признаками; 2) классификация объектов или признаков как при задании профиля групп, так и при его отсутствии; 3) снижение размерности пространства признаков за счет выявления внутренней структуры в заданной совокупности. Развитие вычислительной техники и программного обеспечения способствует широкому внедрению методов МСА в практику. Однако, если исследователь применяет программы без понимания математической сущности используемых алгоритмов, это может привести к неверным или необоснованным результатам. Значимые практические результаты могут быть получены только на основе профессиональных знаний в предметной области, подкрепленных владением математическими методами и пакетами прикладных программ, в которых эти методы реализованы. Методические указания по выполнению лабораторных работ по дисциплине «Многомерные статистические методы» содержат примеры выполнения лабораторных работ по основным разделам дисциплины: Статистические оценки, Корреляционный анализ, Частная корреляция, Множественная регрессия, Компонентный анализ, Факторный анализ, Кластерный и дискриминантный анализ. В методических указаниях подробно описано использование возможностей стандартного пакета MS Excel для выполнения необходимых расчетов.
Рекомендуется перед работой с исходными статистическими данными ознакомиться с теоретическими сведениями по соответствующей теме, используя лекционные записи, литературу и ресурсы Интернет.
I. Лабораторный практикум Лабораторная работа № 1. Статистические оценки Задача 1. По данным таблицы найти оценки математических ожиданий, дисперсии и коэффициентов корреляции, доверительную область для вектора математических ожиданий с надежностью 𝛾 = 0,95. № п/п х1 х2 x3 1 89 69 29 2 86 58 26 3 91 62 22 4 76,4 49 20 5 58 40,5 16 6 53,7 37,6 9,5 7 57 38 16,3 8 102 52 28 9 64 47 17 10 78 45 19 11 55 54 8 12 62 37 19,2 13 66,7 42 19,8 14 59 50,3 19,1 15 96,4 58 22,6 16 70 64 25 17 82 66 21,8 18 107 76,5 32,5 19 94,8 74 25,6 20 100,3 74,7 22 Решение 1. Найдем средние арифметические 𝑥1 = 77,415, 𝑥2 = 54,73 и 𝑥3 = 20,92 и перейдем к центрированным величинам 𝑢𝑖𝑗 = 𝑥𝑖𝑗 − 𝑥𝑗. 𝑈𝑇𝑈 = ( 11,585 … 22,885 … … … 8,08 … 1,08 ) ( 11,585 … 8,08 … … … 22,885 … 1,08 ) = ( 5865,986 3341,671 1654,994 3341,671 3201,982 996,948 1654,994 996,948 690,112 ) 𝑆̂ = 1 𝑛 − 1 𝑈𝑇𝑈 = 1 19 ( 5865,986 3341,671 1654,994 3341,671 3201,982 996,948 1654,994 996,948 690,112 ) = ( 308,736 175,877 87,105 175,877 168,525 52,471 87,105 52,471 36,322 ) Таким образом, оценки дисперсий и среднеквадратических отклонений следующие: 𝑠̂1 2 = 308,736; 𝑠̂1 = 17,571; 𝑠̂2 2 = 168,525; 𝑠̂2 = 12,982; 𝑠̂3 2 = 36,322; 𝑠̂3 = 6,027. Эти расчеты можно выполнить, вызвав «Данные»- «Анализ данных» - «Описательная статистика» 2. Найдем выборочные коэффициенты корреляции: «Данные» - «Анализ данных» - «Корреляция» 𝑟12 = 0,771; 𝑟13 = 0,823; 𝑟23 = 0,671
Обратная матрица к 𝑆̂ будет иметь вид (функция «МОБР») 𝑆̂−1 = ( 0,014 −0,007 −0,022 −0,007 0,015 −0,004 −0,022 −0,004 0,086 ) 3. Тогда согласно уравнению (𝑥 − 𝜇)𝑇ŝ−1(𝑥 − 𝜇) = 𝑘(𝑛 − 1) 𝑛(𝑛 − 𝑘) 𝐹𝛼,𝑘,𝑛−𝑘 (77,415 − 𝜇1 54,73 − 𝜇2 20,92 − 𝜇3) ( 0,014 −0,007 −0,022 −0,007 0,015 −0,004 −0,022 −0,004 0,086 ) ( 77,415 − 𝜇1 54,73 − 𝜇2 20,92 − 𝜇3 ) = = 3 ∙ 19 20 ∙ 17 3,197 = 0,536 гдe 𝐹(0,05; 3; 17) = 3,197 находим по таблице (FРАСПОБР(0,05;3;17)) для 𝛼 = 1 − 𝛾 = 0,05 и чисел степеней свободы 𝜈1 = 3 и 𝜈2 = 17. После преобразований получаем уравнение эллипсоида 0,0137(77,415 − 𝜇1)2 + 0,0148(54,73 − 𝜇2)2 + 0,086(20,92 − 𝜇3)2 − −0,0148(77,415 − 𝜇1)(54,73 − 𝜇2) − 0,0444(77,415 − 𝜇1)(20,92 − 𝜇3) − −0,0072(54,73 − 𝜇2)(20,92 − 𝜇3) = 0,536, которое определяет границы доверительной области для вектора (𝜇1, 𝜇2, 𝜇3)𝑇. Задача 2. По данным Задачи 1 с помощью линейных комбинаций найти с надежностью 𝛾 = 0,95 интервальные оценки генеральных средних 𝜇1, 𝜇2 и 𝜇3. Решение 1. Для нашего примера 𝛼 = 1 − 𝛾 = 0,05, 𝜈1 = 1, 𝜈2 = 𝑛 − 1 = 19. Согласно таблице F-распределения F(0,05; 1; 19) = 4,381. Для построения интервальной оценки средней 𝜇1 примем 𝐶1 = (1,0,0)𝑇, так что 𝐶1𝑥 = 77,415; 𝐶1 𝑇𝑆𝐶1 = 𝑆̂1 2 =308,736. Тогда границы доверительного интервала для 𝜇1 имеют вид 𝐶𝑇𝑥 ± √ 1 𝑛 𝐶𝑗 𝑇𝑆𝐶𝑗𝐹𝛼,1,𝑛−1 : 𝜇1 ∈ [77,415 ± √ 1 20 308,736 ∙ 4,381] = [77,415 ± 8,223] Следовательно, 69,192 ≤ 𝜇1 ≤ 85,638. 2. Для построения интервальной оценки генерального среднего 𝜇2 принимаем 𝐶2 = (0,1,0)𝑇, откуда 𝐶2 𝑇𝑥 = 54,73; 𝐶2 𝑇𝑆𝐶2=168,525. Тогда с надежностью 𝛾 = 0,95 границы доверительного интервала таковы: 54,73 ± √ 1 20 168,525 ∙ 4,381 = 54,73 ± 6,076 48,654 ≤ 𝜇2 ≤ 60,806 3. Для построения интервальной оценки генерального среднего 𝜇3 принимаем 𝐶3 = (0,0,1)𝑇, откуда 𝐶3 𝑇𝑥 = 20,92; 𝐶3 𝑇𝑆𝐶3=36,322. Тогда с надежностью 𝛾 = 0,95 границы доверительного интервала таковы: