Многомерный статистический анализ в экономических задачах: компьютерное моделирование в SPSS
Покупка
Основная коллекция
Издательство:
Вузовский учебник
Авторы:
Концевая Наталья Валерьевна, Орлова Ирина Владленовна, Турундаевский Виктор Борисович, Уродовских Виктор Николаевич, Филонова Елена Сергеевна
Год издания: 2024
Кол-во страниц: 310
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-9558-0108-7
ISBN-онлайн: 978-5-16-110205-3
Артикул: 108350.12.01
Учебное пособие посвящено многомерному статистическому анализу (МСА) и организации вычислений по МСА. Для реализации методов многомерной статистики используется программа обработки статистической информации — SPSS версии 14. Дано исчерпывающее описание среды организации вычислительных работ в системе SPSS. Помимо теоретической части, приведены практические рекомендации по решению задач МСА, а также задачи для самостоятельной работы.
Для студентов и аспирантов всех экономических специальностей университетов и вузов, а также для работников, занимающихся анализом финансово-экономического состояния фирм и предприятий.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 38.03.01: Экономика
- 38.03.02: Менеджмент
- 38.03.04: Государственное и муниципальное управление
- 38.03.05: Бизнес-информатика
- 38.03.06: Торговое дело
- 38.03.07: Товароведение
ГРНТИ:
Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №150 Вашего печатного экземпляра.
Ввести кодовое слово
ошибка
-
CD_content.zip
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
ВЫСШЕЕ ОБРАЗОВАНИЕ серия основана в 1 996 г. МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ В ЭКОНОМИЧЕСКИХ ЗАДАЧАХ КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ В SPSS УЧЕБНОЕ ПОСОБИЕ Под редакцией И.В. Орловой Рекомендовано Научно-методическим советом по заочному экономическому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по экономическим специальностям znanium.com электронно-библиотечная система Москва ВУЗОВСКИЙ УЧЕБНИК ИНФРА-М 2024
УДК 311(075.8) ББК 60.6я73 М73 Авторы: Концевая Н.А. (гл. 4); Орлова И.В. (гл. 1 совместно с Уродовских В.Н. и Филоновой Е.С.; § 2.1 и 2.2; § 2.3 совместно с Турундаевским В.Б.); Турун даевский В.Б. (§ 2.3 совместно с Орловой И.В.); Уро довских В.Н. (гл. 1 совместно с Орловой И.В. и Филоновой Е.С.; гл. 5 и 6); Филонова Е.С. (гл. 1 совместно с Орловой И.В. и Уродовских В.Н.; гл. 3) Рецензенты: кафедра математической статистики и эконометрики Московского государственного университета экономики, статистики и информатики (заведующий кафедрой — доктор экономических наук, профессор Мхитарян В.С.); Колемаев В.А., доктор экономических наук, профессор, заведующий кафедрой прикладной математики Государственного университета управления Многомерный статистический анализ в экономических задачах: М73 компьютерное моделирование в SPSS : учебное пособие / под ред. И.В. Орловой. — Москва : Вузовский учебник : ИНФРА-М, 2024. — 310 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование). ISBN 978-5-9558-0108-7 (Вузовский учебник) ISBN 978-5-16-017632-1 (ИНФРА-М, print) ISBN 978-5-16-110205-3 (ИНФРА-М, online) Учебное пособие посвящено многомерному статистическому анализу (МСА) и организации вычислений по МСА. Для реализации методов многомерной статистики используется программа обработки статистической информации — SPSS версии 14. Дано исчерпывающее описание среды организации вычислительных работ в системе SPSS. Помимо теоретической части, приведены практические рекомендации по решению задач МСА, а также задачи для самостоятельной работы. Для студентов и аспирантов всех экономических специальностей университетов и вузов, а также для работников, занимающихся анализом финансовоэкономического состояния фирм и предприятий. УДК 311(075.8) ББК 60.6я73 Материалы, отмеченные знаком доступны в электронно-библиотечной системе Znanium ISBN 978-5-9558-0108-7 (Вузовский учебник) ISBN 978-5-16-017632-1 (ИНФРА-М, print) ISBN 978-5-16-110205-3 (ИНФРА-М, online) © Вузовский учебник, 2009 © Коллектив авторов, 2009
ПРЕДИСЛОВИЕ Учебное пособие посвящено методам многомерного статистического анализа (MCA) и организации вычислений по MCA. Оно продолжает серию учебных изданий, предназначенныхдля развития у студентов практических навыков применения методов MCA при решении конкретных экономических и финансовых задач с использованием компьютерных технологий. В книге представлена практическая технология компьютерного моделирования экономических систем, необходимая для понимания причинно-следственных связей в экономике, для прогнозирования, планирования и принятия решений менеджерами. Работа подготовлена в соответствии с программой по дисциплине «Эконометрика», учитывающей требования Государственных стандартов подготовки специалистов по специальностям «Бухгалтерский учет, анализ и аудит», «Финансы и кредит» и «Экономика труда». Необходимость создания данного учебного пособия следует из того, что изучение ряда тем курсов «Эконометрика» и «Статистика» требует применения современного программного обеспечения для решения реальных экономических задач, вытекающих из типовых хозяйственных ситуаций. В качестве инструментального средствадля реализации методов многомерной статистики используется распространенная программа обработки статистической информации — SPSS (аббревиатура от Statistical Packagefor the Social Science) версии 14. Существуют и другие пакеты, однако этот продукт наиболее доступен, поэтому его применяют при решении многих прикладных задач и в качестве вспомогательного средства в дисциплинах, читаемых на кафедре экономико-математических методов и моделей. SPSS содержит хорошее аналитическое программное обеспечение, предоставляет решения в области «добычи знаний» (Data Mining), позволяет выявить скрытые связи данных, находящихся в базах и хранилищах данных. Программные продукты SPSS помогают решать прикладные задачи в различных областях, от классификации и профилирования клиентов до анализа кредитного риска, управления контролем качества и повышения производительности персонала, занимающегося продажами. 3
Изучение и практическое применение методов МСА на базе современных программных продуктов, к которым относится SPSS, поможет сделать первые шаги в этом направлении. Пособие состоит из шести глав, в которых рассмотрены методы прикладной статистики: регрессионный, кластерный, факторный, дискриминантный и дисперсионный анализ, а также изложены основные требования к сбору и представлению исходных данных. В работе раскрывается методология решения задач с применением всех перечисленных методов, с последующим анализом, выводами и предложениями по результатам моделирования. Каждая глава состоит из трех частей: теоретическая часть, практикум, задачи для самостоятельного решения. Теоретическая информация приведена в виде краткого обзора. Основная часть материала представляет собой иллюстрацию использования модулей программы SPSS для проведения разного рода эконометрических исследований. Книга содержит большое количество примеров, характеризующих реальное состояние современной российской экономики. Отличительной особенностью пособия является наличие задач для самостоятельного решения по каждой теме. ¹ В целях сокращения объема книги числовые данные для задач размещены в интернете на www.znanium.com. Учебное пособие является практическим руководством по использованию методов МСА, которое поможет студентам, аспирантам, менеджерам овладеть этими методами и применять их в выпускных квалификационных работах и при решении практических задач.
Глава 1 ВВЕДЕНИЕ В МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ 1.1. ПРЕДМЕТ И ЗАДАЧИ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА Исходная информация в социально-экономических исследованиях чаще всего представляется в виде набора объектов, каждый из которыххарактеризуется рядом признаков (показателей). В качестве объектов могут выступать страны, регионы, предприятия, респонденты и т.д., а в качестве признаков — различные показатели социально-экономической структуры изучаемых объектов. В настоящее время вычислительные системы и компьютерные сети позволяют накапливать большие массивы данных для решения задач обработки и анализа данных. Как показывает опыт анализа массовых явлений, число объектов может достигать многих десятков и сотен; число признаков также может исчисляться десятками. Очевидно, что непосредственный (визуальный) анализ исходных данных при большом количестве объектов и признаков практически малоэффективен — можно лишь выявить отдельные особенности изучаемой структуры, извлечь иллюстративные частные примеры. В реальных исследованиях возникают задачи уменьшения, концентрации исходныхданных, выявления структуры и взаимосвязей между ними на основе построения обобщенных характеристик множества признаков и множества объектов. Такие задачи могут решаться методами многомерного статистического анализа (MCA). Многомерный статистический анализ — раздел математической статистики, развивающий математические методы выявления характера и структуры взаимосвязей явлений, характеризующихся большим количеством различных свойств. Обычно для проведения анализа используются результаты измерения компонент многомерного признака для каждого объекта из исследуемой совокупности. Механизм анализа данных и прогнозирования, который еще принято называть Data Mining, т.е. «извлечение информации», «добычаданных», «добыча знаний», позволяет использовать в при 5
кладных решениях инструменты для выявления закономерностей, которые обычно скрываются за большими объемами информации. Математической основой инструментария анализа данных является многомерный статистический анализ, бурное развитие которого началось в конце XX века в период массового распространения компьютеров. В настоящее время методы и модели МСА используются в составе новых информационных технологий, называемых интеллектуальным анализом данных. Можно выделить три основные задачи, решаемые в рамках МСА: 1) исследование характера явных и неявных зависимостей между объектами или признаками; 2) классификация объектов или признаков как при задании профиля групп, так и при его отсутствии; 3) снижение размерности пространства признаков за счет выявления внутренней структуры в заданной совокупности. Развитие вычислительной техники и программного обеспечения способствует широкому внедрению методов МСА в практику. Однако если исследователь применяет программы без понимания математической сущности используемых алгоритмов, это может привести к неверным или необоснованным результатам. Значимые практические результаты могут быть получены только на основе профессиональных знаний в предметной области, подкрепленных владением математическими методами и пакетами прикладных программ, в которых эти методы реализованы. Сущность МСА состоит в том, что многомерные исходные данные обрабатываются математико-статистическими методами с привлечением вычислительной техники, в результате чего об изучаемом объекте появляется новая информация (в том числе скрытая, ненаблюдаемая непосредственно — латентная) в табличной или графической форме, которая впоследствии анализируется и интерпретируется в интересах принятия решений. Выделим основные этапы проведения многомерного анализа методами МСА [35]: ♦ постановка задачи на исследование, определение объемов исходной и выходной информации, выбор формы представления данных; ♦ определение последовательности обработки исходной информации и выбор методов ее обработки из арсенала методов МСА; 6
♦ сбор и систематизация исходных данных для их обработки; • предварительный анализ данных: по критериям однородности, соответствию данных статистической гипотезе, подчинению закону распределения и отсутствию в них грубых ошибок; • уточнение математической постановки задачи и оценка возможности применения методов MCA (при необходимости уточняется набор методов анализа); • проведение вычислительного эксперимента с помощью вычислительной техники; • оценка результатов по статистическим критериям качества, непротиворечивости полученных результатов экономическим выводам и по степени их интерпретируемости; • обобщение результатов исследования в табличной или графической форме, интерпретация, выводы, предложения и практические рекомендации по результатам проведенного анализа. Организуя поэтапное проведение исследований с применением методов MCA, можно повысить их эффективность. 1.2. МЕТОДЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА К методам многомерного статистического анализа относятся пошаговая линейная и нелинейная регрессия, логистическая регрессия, кластерный анализ, компонентный, факторный, дисперсионный, дискриминантный анализ и др. В учебном пособии будут рассмотрены наиболее часто применяемые методы. Множественный регрессионный анализ предназначен для построения модели, позволяющей по значениям независимых переменных получать оценки значений зависимой переменной. Многие потребности анализа данных можно так или иначе свести к задачам регрессии. В частности, регрессия применяется для таких задач, какпрогнозирование, оценкарисков, анализ эластичности спроса. Логистическая регрессия — инструмент для решения задачи классификации. Логистическая регрессия — это разновидность множественной регрессии, назначение которой состоит в анализе связи между несколькими независимыми переменными и зависимой переменной, которая является бинарной (т.е. может принимать только два значения). 7
Методы снижения размерности многомерного пространства объединяют в себе компонентный и факторный анализ. Метод главных компонент состоит в том, чтобы среди всех линейных комбинаций множества признаков наблюдаемых объектов выделить гораздо меньшее число таких, изменчивость которых в значительной степени описывает изменчивость первоначального набора признаков в целом. В дальнейшем можно использовать эти найденные комбинации (которые и называются главными компонентами) для классификации и других задач, связанных с изучаемыми объектами. Можно привести также пример, когда измеряемые по разным методикам коэффициенты экономической активности сводят путем их комбинирования к одному (интегральному) показателю. За этим стоит мысль о том, что, хотя каждый из предлагаемых коэффициентов по-разному учитывает экономические факторы, все они призваны объяснять одно и то же явление, и, значит, это явление наилучшим образом должно описываться какой-то их линейной комбинацией, являющейся как бы результатом «компромисса» между различными методиками. Факторный анализ занимается определением относительно небольшого числа скрытых (латентных) факторов, изменчивостью которых объясняется изменчивость всех наблюдаемых показателей, связанных с каждым из подвергающихся изучению объектов. В этом смысле оцениваемые латентные факторы можно считать причинами, а наблюдаемые признаки — следствиями. Результаты факторного анализа будут успешными, если большое число признаков удается достаточно точно объяснить малым количеством причин. Итак, факторный анализ направлен на снижение размерности рассматриваемой задачи. Метод главных компонент и факторный анализ часто дают близкие результаты. Именно поэтому метод главных компонент иногда считают частью факторного анализа. Однако это не так. Математические модели факторного и компонентного анализа различны. Методы многомерной классификации, к которым относятся кластерный и дискриминантный анализ, предназначены для разделения совокупностей объектов на классы, в каждый из которых должны входить объекты в определенном смысле однородные или близкие. При кластерном анализе заранее неизвестно, сколько получится 8
групп объектов и какого они будут объема. Дискриминантный анализ разделяет объекты по уже существующим классам. Пусть при изучении объектов у каждого из них измеряется большое количество показателей. Если число измеряемых показателей достаточно велико, то с ростом количества объектов возникает ряд проблем: объем информации очень велик, а нужно ли хранить ее всю? И как наглядно представить себе всю информацию, чтобы извлечь из нее некую суть, необходимую для принятия решения? Задачу классификации, т.е. объединения данных в некоторые группы, можно рассматривать как частный случай задачи снижения размерности. Дело в том, что индивидуальное (большое) разнообразие данных после успешного решения задачи классификации переходит в групповое разнообразие с некоторыми усредненными показателями данных в пределах одного класса. Многомерный дисперсионный анализ предназначен для оценки и исследования дисперсий комплексов признаков. Рассмотрим для примера зависимость урожая Y от внесения в почву определенного вещества (удобрения). Это и будет фактор X, который в данном случае является нечисловой величиной. В простейшем случае имеется два уровня фактора X: 1) удобрение было внесено (факторуприсваивается значение 1); 2) удобрение не было внесено (фактору присваивается значение 0). Пусть нам заранее известна дисперсия величины Y в случае, когда фактор Xне действовал. Далее оценивается дисперсия Yпод воздействием фактора X. Если фактор X не оказывал влияния на изменчивость Y, то новая дисперсия несильно отличается от прежней. Если же дисперсия стала значительно больше, то вклад фактора в изменчивость наблюдаемой случайной величины следует признать значительным. Идея дисперсионного анализа заключается в оценке степени влияния факторов на исследуемую величину. В основе этого раздела MCA лежит изучение доли той дисперсии, которая объясняется через изучаемый фактор, в полной дисперсии. 1.3. ПРИМЕНЕНИЕ MCA В ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ В этом параграфе представлены наиболее часто встречающиеся на практике задачи анализа данных. 9
Фактически любой экономический процесс описывается набором многомерных статистических данных. Качество и полнота информации о его структуре и развитии зависят от совершенства методов исследования этих эмпирических данных. В связи с этим MCA обладает наиболее широким спектром методов анализа, направленных на выявление структуры и взаимосвязей экономических переменных, причин и последствий протекания экономических процессов. Все это, при высоком уровне стохастичности финансово-экономических процессов, дает возможность планирования и предсказания их протекания с определенной вероятностью. В экономическом анализе применимо большинство методов MCA. Например, важнейшей составной частью экономических исследований оказывается задача выявления и анализа силы, характера и формы взаимосвязей показателей, выбранных для описания того или иного процесса. При наличии количественной информации, записанной в виде матрицы исходных данных, для решения указанных задач может быть привлечен корреляционный анализ, затем он подкрепляется множественнымрегрессионным анализом. В определении структуры взаимосвязей, а также в выявлении причин наличия связей вообще наиболее подходящим оказывается факторный анализ. Известно, что взаимосвязь двух или более экономических показателей объясняется либо тем, что они обусловливают друг друга, либо тем, что на каждый из них воздействует некий скрытый, не входящий в данную группу признак. Факторный анализ как раз и позволяет определить эти неявные, скрытые факторы. Сложную структуру взаимосвязей экономических показателей в каком-либо явлении факторный анализ объясняет наличием у этого явления небольшого числа скрытых, обобщенных характеристик («общих факторов»), каждая из которых в той или иной мере воздействует на все исходные показатели. Те из показателей, чьи изменения в наибольшей степени определяются каким-то фактором, оказываются тесно связанными между собой. В экономических исследованиях актуальными являются также различные процедуры классификации объектов. При этом наблюдается тенденция к комплексному использованию методов факторного анализа и автоматической классификации. Сначала с помощью методов классификации получают группировку объектов в исходном многомерном пространстве признаков. Затем с помощью 10