Кластерный анализ и MANOVA в маркетинговых и экономических исследованиях
Покупка
Новинка
Основная коллекция
Тематика:
Маркетинговые исследования. Бенчмаркинг
Издательство:
НИЦ ИНФРА-М
Год издания: 2025
Кол-во страниц: 202
Дополнительно
Вид издания:
Монография
Уровень образования:
Дополнительное профессиональное образование
ISBN: 978-5-16-020629-5
ISBN-онлайн: 978-5-16-113298-2
DOI:
10.12737/2186588
Артикул: 839520.01.01
Монография знакомит читателя с основами применения многомерных статистических методов — кластерного анализа и анализа MANOVA — в маркетинговых и экономических исследованиях. Данные представляют собой незаменимый продукт любой деятельности и основу принятия объективных управленческих решений. Большие данные оказали значительное влияние на маркетинг и развитие его инструментов. Сбор, накопление и обработка информации о клиентах и рынке — основа информационного обеспечения маркетинговой деятельности. Методы многомерной статистики, кластерный анализ и анализ MANOVA в частности, открывают новые возможности для маркетологов в связи с большим прикладным потенциалом их использования. Подробно описаны области маркетингового применения кластерного анализа и метода MANOVA, дается пошаговый план реализации статистических процедур и рекомендации для исследователя по подготовке данных и оценке результатов статистического анализа. Методы многомерной статистики позволяют маркетологам выявлять сложные поведенческие паттерны, прогнозировать поведение потребителей, находить новые подходы к сегментации клиентов и, таким образом, разрабатывать новые маркетинговые стратегии и тактики на рынке.
Предназначена для практикующих маркетологов и научных сотрудников, экономистов и специалистов в области статистики, студентов высших учебных заведений и преподавателей, а также всех тех, кого интересует расширение своих возможностей в обработке больших данных для открытия новых стратегических горизонтов.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Магистратура
- 38.04.01: Экономика
- 38.04.02: Менеджмент
- Аспирантура
- 38.06.01: Экономика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Министерство науки и высшего образования Российской Федерации Российский государственный гуманитарный университет Ю.А. ЗУЕНКОВА М.Д. СТАМЕНКОВИЧ КЛАСТЕРНЫЙ АНАЛИЗ И MANOVA В МАРКЕТИНГОВЫХ И ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ МОНОГРАФИЯ Москва ИНФРА-М 2025
УДК 339.138(075.4) ББК 65.291.3 З-93 Р е ц е н з е н т ы: Бурлаков В.В., доктор экономических наук, доцент, профессор кафедры информационных технологий МИРЭА — Российского технологического университета; Лясников Н.В., доктор экономических наук, профессор, главный научный сотрудник Института проблем рынка Российской академии наук Зуенкова Ю.А. З-93 Кластерный анализ и MANOVA в маркетинговых и экономических исследованиях : монография / Ю.А. Зуенкова, М.Д. Стаменкович. — Москва : ИНФРА-М, 2025. — 202 с. — (Научная мысль). — DOI 10.12737/2186588. ISBN 978-5-16-020629-5 (print) ISBN 978-5-16-113298-2 (online) Монография знакомит читателя с основами применения многомерных статистических методов — кластерного анализа и анализа MANOVA — в маркетинговых и экономических исследованиях. Данные представляют собой незаменимый продукт любой деятельности и основу принятия объективных управленческих решений. Большие данные оказали значительное влияние на маркетинг и развитие его инструментов. Сбор, накопление и обработка информации о клиентах и рынке — основа информационного обеспечения маркетинговой деятельности. Методы многомерной статистики, кластерный анализ и анализ MANOVA в частности, открывают новые возможности для маркетологов в связи с большим прикладным потенциалом их использования. Подробно описаны области маркетингового применения кластерного анализа и метода MANOVA, дается пошаговый план реализации статистических процедур и рекомендации для исследователя по подготовке данных и оценке результатов статистического анализа. Методы многомерной статистики позволяют маркетологам выявлять сложные поведенческие паттерны, прогнозировать поведение потребителей, находить новые подходы к сегментации клиентов и, таким образом, разрабатывать новые маркетинговые стратегии и тактики на рынке. Предназначена для практикующих маркетологов и научных сотрудников, экономистов и специалистов в области статистики, студентов высших учебных заведений и преподавателей, а также всех тех, кого интересует расширение своих возможностей в обработке больших данных для открытия новых стратегических горизонтов. УДК 339.138(075.4) ББК 65.291.3 Данная книга доступна в цветном исполнении в электронно-библиотечной системе Znanium ISBN 978-5-16-020629-5 (print) ISBN 978-5-16-113298-2 (online) © Зуенкова Ю.А., Стаменкович М.Д., 2024
_____________________________________________________________ ОГЛАВЛЕНИЕ ___________________________________________________________________ 1. МНОГОМЕРНЫЙ АНАЛИЗ ДАННЫХ: ВВЕДЕНИЕ ........................................... 5 1.1. Ключевые термины и определения ..................................................................... 5 1.2. Классификация методов многомерного анализа данных ............................... 7 1.3. Процессный подход при создании многомерной модели данных ................ 10 1.4. Методологические аспекты предварительной обработки данных.............. 12 1.5. Графическое отображение многомерных данных .......................................... 15 1.6. Статистические программные пакеты для многомерного анализа............ 16 2. МЕТОДОЛОГИЯ КЛАСТЕРНОГО АНАЛИЗА .................................................... 18 2.1. Основы терминологии и историческое развитие ........................................... 18 2.2. Современные взгляды на кластерный анализ: статистическая перспектива .................................................................................................................. 20 2.3. Предварительная обработка данных в кластерном анализе ........................ 24 2.4. Концепция близости многомерных наблюдений ............................................ 30 2.5. Меры близости для непрерывных числовых переменных ........................... 37 2.6. Методы группировки (кластеризации) многомерных наблюдений ........... 48 2.7. Методы иерархической группировки (кластеризации) и меры расстояния между группами ........................................................................................................... 50 2.8. Методы неиерархической группировки объектов ......................................... 66 2.9. Статистическая оценка качества результатов кластерного анализа ......... 68 2.10. Визуализация и интерпретация результатов кластерного анализа .......... 84 3. МНОГОМЕРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ ............................................. 92 3.1. Цели и процедура проведения многомерного дисперсионного анализа..... 94 3.2. Статистические предположения для реализации MANOVA .....................106 3.3. Тестирование статистической значимости различий между векторами средних двух многомерных совокупностей: распределение Хотеллинга по Т-квадрату (T2) ......................................................................................................113 3
3.4. Тестирование статистической значимости различий между векторами средних трех или более многомерных совокупностей (групп): тесты MANOVA .........................................................................................................117 3.5. Сравнение производительности тестов MANOVA и их связи с тестом T2 ...................................................................................................................126 3.6. Интерпретация результатов и специфика применения MANOVA ............130 4. КЛАСТЕРНЫЙ АНАЛИЗ И MANOVA В ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ ......................................................................................................134 4.1. Методологические аспекты прикладного потенциала кластерного анализа и MANOVA ..................................................................................................................134 4.2. Проведение кластерного анализа и MANOVA в программной среде .......138 4.3. Кластерный анализ и MANOVA: обзор избранных исследований ...........150 5. КЛАСТЕРНЫЙ АНАЛИЗ И MANOVA В МАРКЕТИНГЕ И МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЯХ ..........................................................162 5.1. Роль и особенности применения статистических методов в маркетинге ...............................................................................................................162 5.2. Управление маркетинговыми исследованиями рынка посредством многомерного кластерного анализа .......................................................................165 5.3. Кластерный анализ в маркетинговом сегметировании ..............................166 5.4. Использование кластерного анализа для разработки стратегий и оценки их качества ..................................................................................................................171 5.5. Оценка конкурентоспособности организации на основе кластерного анализа .........................................................................................................................172 5.6. Разработка позиционирования на основе кластерного анализа ................176 5.7. Оценка потребительской корзины с помощью методов кластеризации ...177 5.8. Разработка маркетинговых коммуникаций с использованием метода кластерного анализа ..................................................................................................178 5.9. Кластерный анализ в мерчендайзинге ...........................................................180 5.10. Управление знаниями с помощью кластеризации .....................................182 5.11. Анализ MANOVA в маркетинговых исследованиях .................................184 СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ..................................................193 4
________________________________________________________ 1. МНОГОМЕРНЫЙ АНАЛИЗ ДАННЫХ: ВВЕДЕНИЕ ___________________________________________________________________ 1.1. Ключевые термины и определения Данные представляют собой незаменимый продукт любой деятельности и каждого процесса во всех сферах жизни и работы, поэтому функционирование современного мира практически невозможно представить без данных. Таким образом, понимание свойств данных и процессов, которые их создают, а также выявление потенциально полезной информации, содержащейся в данных, посредством научно обоснованного (статистического) анализа формируют отправную точку в объяснении интересующих явлений и решении конкретных проблем. Фактически, анализ данных позволяет преобразовывать данные в информацию и знания о структуре, отношениях и тенденциях, которые характеризуют наблюдаемые явления, путем охвата, измерения и обработки их различных характеристик (переменных) с применением различных методологических процедур. Другими словами, статистический анализ данных относится к изучению данных для целей исследования характеристик единиц наблюдения, в которых проявляются наблюдаемые явления, и обобщения результатов испытаний в форме соответствующих закономерностей, интерпретируемых в анализируемом контексте. В зависимости от количества анализируемых переменных различают три подхода в статистическом анализе: одномерный, двумерный и многомерный. Эти подходы, основанные на анализе вариаций одной, двух и более двух переменных соответственно. Для реализации целей концептуальных фундаментальных и прикладных исследований сам ход анализа очень часто требует перехода от одномерного и двумерного к многомерному подходу, что обеспечивает полное и всеобъемлющее изучение, взгляд с разных точек зрения, понимание сложной природы явлений (природных и социальных), которые являются объектом изучения. Разработка и применение статистических методов и процедур для одновременного анализа различных характеристик многомерных явлений в литературе охвачены совокупностью методов многомерного статистического анализа, где термин «многомерный» указывает не только на наличие множества переменных в анализе, но и на наличие взаимосвязей и 5
зависимостей между ними (Jordjevic et al, 2011: 89). Хотя многомерный анализ определяется по-разному, почти всегда под этим термином понимается набор методов (Kovacic, 1994: 1) или направление статистики (Kgameg, 1978: 848). Далее основные определения концепции многомерного анализа могут быть заменены следующей формулировкой: многомерный статистический анализ представляет собой набор методов, которые позволяют осуществлять одновременный анализ многомерных измерений, полученных для каждой единицы наблюдения одного или нескольких образцов. Другими словами, многомерный анализ - это статистический анализ взаимосвязей (более одного за раз) между переменными (более двух) в наборе путем анализа включенных переменных. Отправной точкой в многомерном анализе являются многомерные данные, которые получены путем измерения переменных р для n единиц наблюдения. Таблица 1 представляет многомерный профиль единиц наблюдения в виде (n×p) матрицы, X = [xij]. Строки матрицы обозначают каждое значение из n единиц наблюдения (i = 1, 2,..., l,..., n), а столбцы – переменные Хj (j=1, 2,..., m,..., p). Элемент матрицы xij представляет значение j-й переменной, измеренной на i-й единице наблюдения. Таблица 1 Матрица многомерных данных Переменные Единицы наблюдения Х1 Х2 … Xm … Хp 1 х11 х12 … х1m … х1p 2 х21 х22 … х2m … х2p ೇ ೇ ೇ ೇ ೇ ೇ ೇ L хl1 хl2 … хlm … хlp ೇ ೇ ೇ ೇ ೇ ೇ ೇ N хn1 хn2 … хnm … хnp Источник: таблица авторов При этом измеренные значения, то есть наборы многомерных наблюдений, могут вписываться в одну из следующих основных категорий многомерных данных или, в качестве альтернативы, представлять их комбинацию (Rencher, 2002: 4): Ź данные одной выборки с несколькими переменными, измеренными на каждой единице наблюдения; Ź данные одной выборки с двумя наборами переменных, измеренными на каждой единице наблюдения; Ź данные двух выборок с несколькими переменными, измеренными на каждой единице наблюдения; и Ź данные трех или более образцов с несколькими переменными, измеренными на каждой единице наблюдения. Для обработки этих данных используются различные методологические процедуры многомерного статистического анализа, 6
которые соответствуют конкретным свойствам каждой указанной категории, а также сформулированным целям исследования. Хотя идеи для многих методов многомерного анализа возникли в первые десятилетия прошлого века, их утверждение, интенсивное использование и распространение практически во всех областях исследований связано с появлением и развитием компьютерных технологий. Действительно, технологические достижения и решения, прежде всего, в области хранения данных и разработки программных пакетов для их анализа, позволили легко производить вычисления сложными методами многомерного анализа. Помимо вышесказанного, причина повышенной значимости и интереса к применению и развитию этих методов также заключается в том, что многомерность является неотъемлемым свойством большинства явлений в современном мире, так что их понимание требует анализа множества переменных, между которыми, как правило, существуют очень сложные отношения. В этом контексте, поскольку почти все процессы, явления и проблемы в экономике, бизнесе и управлении по своей природе многомерны, исследования в объяснения связей между экономическими явлениями представляют собой подходящую почву для применения методов многомерного анализа. 1.2. Классификация методов многомерного анализа данных Многомерный анализ охватывает широкий спектр методов, классификация которых может быть выполнена на основе различных критериев. В литературе наиболее распространенным является ответ на вопрос: позволяет ли применение методов исследовать зависимости между двумя подмножествами переменных, где одно подмножество представляет зависимые, а другое - независимые переменные" Существует ли различие между методами зависимости (dependence methods) и методами взаимозависимости (interdependence methods)" Интуитивно суть методов зависимости отражается в исследовании связей между подмножествами переменных, при этом аналитическая цель направлена на объяснение или прогнозирование значений зависимых переменных на основе подмножества независимых переменных. Следовательно, эта группа методов относится к категории прогнозных аналитических процедур (Kovacic, 1994: 3). С другой стороны, методы взаимозависимости обеспечивают установление отношений между переменными, при этом априори, концептуально и теоретически, не имеют 7
оснований для формирования подмножеств зависимых и независимых переменных. Фактически, в начале анализа все переменные имеют одинаковое значение и принадлежат к одной группе. Применение методов взаимозависимости позволяет установить, как и почему анализируемые переменные взаимосвязаны (Sharma, 1996: 4), то есть посредством одновременного анализа всех переменных в наблюдаемом наборе и сокращения данных объяснить сложную внутреннюю структуру и отношения между данными (Kovacic, 1994: 3; Jordjevic и другие, 2011: 90). По сути, эта группа методов относится к категории описательных методов, хотя некоторые из них также успешно используются для реализации прогнозных задач. Для дальнейшей классификации методов и для более глубокого понимания их природы часто выделяются два дополнительных критерия, касающихся количества (зависимых) переменных и деления переменных на количественные и категориальные (в зависимости от типа шкалы измерения), при этом при классификации методов взаимозависимости используется только второй критерий. На рисунке 1 представлены указанные критерии разделения, и для каждой классификационной группы выделены наиболее часто используемые методы. В целом, понимание и знание свойств различных типов данных и шкал измерения является очень важным фактором, влияющим на выбор адекватного метода многомерного анализа в конкретной исследовательской ситуации. 8
Методы многомерного анализа Нет Да Методы зависимости Методы взаимозависимости Вовлечены ли зависимые переменные" Больше одной х Да Нет а е а Не Являются ли переменные числовыми" Сколько зависимых переменных Одна Да Д Являются ли зависимые переменные числовыми" 9 Log-линейные модели 9 Качественный многомерный пропорциональный анализ 9 Факторный анализ 9 Кластерный анализ 9 Количественный многомерный пропорциональный анализ Являются ли зависимые переменные числовыми" 9MANOVA Нет Да 9 Классический корреляционный анализ Нет 9 Множественный регрессионный анализ 9 Дискриминационный анализ Рисунок 1 Классификация методов многомерного анализа Источник: рисунок авторов, на основе материалов Kovaþiü (1994: 6) Тот факт, что это богатый методологический аппарат для исследования многомерных явлений, подтверждается многочисленными вариантами (алгоритмами) существующих фундаментальных методов. Например, кластерный анализ может быть успешно применен для формирования групп единиц наблюдения, свойства которых выражаются не только количественными, но и качественными переменными, включая их комбинацию. В дополнение к вышеупомянутым многомерным методам анализа в научных исследованиях также используется ряд других методов, которые могут быть обозначены как методы, принадлежащие к этой группе, учитывая их общие свойства для одновременного анализа множества переменных, между которыми существуют взаимосвязи. Учитывая изложенную методологическую обоснованность многомерного анализа, можно констатировать, что выбор подходящего метода или их комбинации в конкретной проблемной ситуации представляет собой сложную задачу. По сути, окончательный выбор определяется (в дополнение к уже выделенным типам данных) характеристиками определенной проблемы, 9
целями исследования, характеристиками методов, а также объемом знаний исследователя о свойствах методов и наличием аналитических навыков в их реализации. 1.3. Процессный подход при создании многомерной модели данных Успешное проведение многомерного анализа данных в контексте решения конкретной проблемной ситуации представляет собой чрезвычайно сложную задачу, которая выходит за рамки проблемы выбора метода и простого применения программных платформ из серии «user-friendly pointand-click». В соответствии с вышеизложенным, многомерное моделирование и, следовательно, создание статистически достоверных моделей, как результат многомерного анализа данных, обязательно подразумевает определение четкой процедурной основы в форме модели процесса. По сути, каждая модель процесса содержит серию шагов (этапов), охватывающих серию действий процесса, с включенными петлями обратной связи и итерациями. Фактически, применение процессного подхода позволяет интегрировать все действия, относящиеся к пониманию конкретной проблемы исследования, и разработать качественную модель как упрощенное представление реальности, которое может иметь ценность для пользователя. Одна из универсальных многофазных процедур для многомерного моделирования, согласно идее, изложенной Hair et al. (2014: 23-24), включает шесть этапов, которые представлены на блок-схеме на рисунке 2. Эта модель процесса разработки многомерной модели определяет общую основу для разработки, интерпретации и проверки результатов применения любого многомерного метода. Первый этап включает определение задачи исследования и целей в конкретной области исследования, а затем их перевод в статистические (методологические) цели и задачи. В зависимости от того, направлены ли конкретные цели на изучение зависимостей между переменными или на определение структурных отношений и закономерностей в отношении взаимно схожего поведения переменных, исследователь подходит к выбору потенциальных методов многомерного анализа для применения. Второй этап включает определение переменных на основе опыта исследователя и/или теоретических предположений, а также вопросов, связанных с определением выборки (от определения целевой выборки, методов выборки, определения размера выборки, уточнения пространственного и временного охвата данных до сбора данных по элементам 10