Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Методы и средства комплексного статистического анализа данных

Покупка
Основная коллекция
Артикул: 068000.10.01
К покупке доступен более свежий выпуск Перейти
Книга представляет собой обобщающее учебное пособие по математической статистике. В конспективной и доступной форме, с использованием наглядных предметных примеров из различных областей приложения рассмотрены все основные статистические разделы, понятия, методы и средства анализа данных на компьютере. Обучающим инструментом для практического освоения излагаемых методов является универсальный российский статистический пакет STADIA, ставший в данной области своеобразным стандартом де-факто. Для студентов, аспирантов и преподавателей вузов, а также для специалистов разного профиля, связанных с анализом информации в различных областях науки, техники, производства, медицины, управления, планирования, экономики, бизнеса и др.
Кулаичев, А. П. Методы и средства комплексного статистического анализа данных : учебное пособие / А.П. Кулаичев. — 5-е изд., перераб. и доп. — Москва : ИНФРА-М, 2022. — 484 с. — (Высшее образование: Бакалавриат). — DOI 10.12737/25093. - ISBN 978-5-16-012834-4. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1815604 (дата обращения: 27.07.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
ВЫСШЕЕ ОБРАЗОВАНИЕ - БАКАЛАВРИАТ

серия основана в 1 996 г.




А.П. КУЛАИЧЕВ



МЕТОДЫ И СРЕДСТВА КОМПЛЕКСНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ



УЧЕБНОЕ ПОСОБИЕ
5-е издание, переработанное и дополненное

Допущено
             Учебно-методическим объединением по классическому университетскому образованию в качестве учебного пособия для вузов по дисциплинам «Математическая статистика» и «Информатика»



znanium.com

Москва ИНФРА-М 2022


УДК 519.2(075.8)
 ББК 22.172я73
       К90


   ФЗ    Издание не подлежит маркировке   
№ 436-ФЗ в соответствии с п. 1 ч. 4 ст. 11

 К90


        Кулаичев А.П.
           Методы и средства комплексного статистического анализа данных : учебное пособие / А.П. Кулаичев. — 5-е изд., перераб. и доп. — Москва : ИНФРА-М, 2022. — 484 с. — (Высшее образование: Бакалавриат). — DOI 10.12737/25093.
           ISBN 978-5-16-012834-4 (print)
           ISBN 978-5-16-103357-9 (online)
           Книга представляет собой обобщающее учебное пособие по математической статистике. В конспективной и доступной форме, с использованием наглядных предметных примеров из различных областей приложения рассмотрены все основные статистические разделы, понятия, методы и средства анализа данных на компьютере.
           Обучающим инструментом для практического освоения излагаемых методов является универсальный российский статистический пакет STADIA, ставший в данной области своеобразным стандартом де-факто.
           Для студентов, аспирантов и преподавателей вузов, а также для специалистов разного профиля, связанных с анализом информации в различных областях науки, техники, производства, медицины, управления, планирования, экономики, бизнеса и др.

УДК 519.2(075.8)
ББК 22.172я73



  ISBN 978-5-16-012834-4 (print)
  ISBN 978-5-16-103357-9 (online)



© Кулаичев А.П., 2017

               Оригинал-макет подготовлен в НИЦ ИНФРА-М
ООО «Научно-издательский центр ИНФРА-М» 127214, Москва, ул. Полярная, д. 31В, стр. 1 Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29
E-mail: books@infra-m.ru http://www.infra-m.ru

Подписано в печать 03.07.2021.
Формат 60x90/16. Бумага офсетная. Гарнитура Newton. Печать цифровая. Усл. печ. л. 30,25.
ППТ20. Заказ № 00000
ТК 68000-1815604-200317


Отпечатано в типографии ООО «Научно-издательский центр ИНФРА-М»
127214, Москва, ул. Полярная, д. 31В, стр. 1
Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29


           ОГЛАВЛЕНИЕ


Первому читателю......................................7
Последующим читателям.................................8
Глава 1. Изучение прикладной статистики
1.1. Статистические разделы и методы..................11
1.2. Этапы анализа данных...........................16
1.3. Статистические пакеты..........................19
1.4. Организация учебного процесса..................24
1.5. Примеры календарных планов.....................29
1.6. Темы занятий.....................................33
Глава 2. Работа в среде Windows
2.1. Статистическая диалоговая система STADIA.......38
2.2. Порядок диалога................................46
2.3. Использование формул...........................53
2.4. Экранная помощь и совет........................55
2.5. Буфер обмена...................................56
2.6. Диагностика ошибок.............................57
Глава 3. Работа с данными
3.1. Электронная таблица............................60
3.2. Чтение, запись и удаление файлов...............62
3.3. Калькулятор....................................67
3.4. Преобразования.................................68
3.5. Пропуски и выбросы.............................75
    Примеры и задачи................................77
Глава 4. Графические средства
4.1. Графический диалог.............................80
4.2. Научная графика и сплайны......................86
4.3. Деловая графика................................90
4.4. Трехмерная графика.............................94
Глава 5. Статистические средства
5.1. Статистический диалог.........................103
5.2. Статистические данные.........................106
5.3. Статистические гипотезы.......................110
5.4. Текстовый редактор результатов................118
5.5. Обозначения, учебная версия и примеры.........119



Оглавление

Глава 6. Параметрические критерии
6.1. Описательная статистика..............................123
    Примеры и задачи......................................126
6.2. Гистограмма и проверка распределения на нормальность.128
    Примеры и задачи......................................132
6.3. Линейная корреляция..................................134
    Примеры и задачи......................................137
6.4. Критерии Стьюдента и Фишера..........................139
    Примеры и задачи......................................140

Глава 7. Непараметрические критерии
7.1. Критерий хи-квадрат..................................144
    Примеры и задачи......................................145
7.2. Критерии различия сдвига (положения).................146
    Примеры и задачи......................................149
7.3. Критерии различия масштаба (рассеяния)..............150
    Примеры и задачи......................................152
7.4. Критерии интегральных различий.......................153
    Примеры и задачи......................................153
7.5. Ранговая корреляция..................................154
    Примеры и задачи......................................156
7.6. Анализ таблиц сопряженности..........................156
    Примеры и задачи......................................160

Глава 8. Дисперсионный анализ факторных эффектов
8.1. Модели факторного эксперимента.......................164
    Примеры и задачи......................................169
8.2. Однофакторный дисперсионный анализ...................170
 8.2.1. Параметрические методы............................170
      Примеры и задачи....................................173
8.2.2. Непараметрические методы Крускала-Уоллиса и Джонкхриера.............................................174
      Примеры и задачи....................................176
 8.2.3. Непараметрические методы Фридмана и Пейджа .......176
      Примеры и задачи....................................178
8.3. Двухфакторный дисперсионный анализ...................179
    Примеры и задачи......................................182
8.4. Дисперсионный анализ групповых измерений.............185
    Примеры и задачи......................................195
8.5. Многофакторный дисперсионный анализ..................206
    Примеры и задачи......................................207
8.6. Ковариационный анализ................................209
    Примеры и задачи......................................210


�главление

5

Глава 9. Анализ временных рядов
9.1. Анализ и прогнозирование тренда...................214
9.2. Корреляционный анализ.............................214
    Примеры и задачи...................................217
9.3. Спектральный анализ...............................222
    Примеры и задачи...................................230
9.4. Сглаживание и фильтрация..........................236
    Примеры и задачи...................................238
9.5. Авторегрессионные модели..........................241
    Примеры и задачи...................................246
9.6. Фурье-модели......................................249
    Примеры и задачи...................................253
Глава 10. Регрессионный анализ
10.1. Общие регрессионные результаты...................264
10.2. Сравнение двух линий регрессии...................268
     Примеры и задачи..................................269
10.3. Простая регрессия................................269
     Примеры и задачи..................................277
10.4. Множественная линейная регрессия.................287
     Примеры и задачи..................................288
10.5. Пошаговая регрессия..............................291
     Примеры и задачи..................................295
10.6. Общая регрессия..................................296
     Примеры и задачи..................................299
Глава 11. Многомерные методы
11.1. Факторный анализ.................................302
     Примеры и задачи..................................329
11.2. Кластерный анализ................................341
     Примеры и задачи..................................348
11.3. Дискриминантный анализ...........................355
     Примеры и задачи..................................358
11.4. Шкалирование.....................................361
     Примеры и задачи..................................364
Глава 12. Вероятности и частоты
12.1. Случайные величины и распределения...............368
12.2. Вычисления вероятностей..........................370
     Примеры и задачи..................................373
12.3. Согласие распределений...........................374
     Примеры и задачи..................................377
12.4. Согласие частот событий (долей)..................377
     Примеры и задачи..................................379



Оглавление

12.5. Последовательный анализ.........................379
     Примеры и задачи.................................380
12.6. Анализ выживаемости.............................381
     Примеры и задачи.................................384
Глава 13. Методы контроля качества
13.1. Гистограмма качества............................386
     Примеры и задачи.................................387
13.2. Диаграмма Парето................................387
     Примеры и задачи.................................388
13.3. Контрольные карты...............................389
     Примеры и задачи.................................391
Глава 14. Комплексная статистическая аналитика
14.1. Оценка индивидуальной квалификации..............395
14.2. Оценка квалификации в коллективных действиях....409
14.3. Многомерные ряды и зависимости..................423
14.4. Макроэкономические исследования.................444
   14.4.1. Временные и функциональные зависимости.....444
   14.4.2. Деятельность предприятий...................451
   14.4.3. Экономика государства......................462
Литература............................................473

Предметный указатель..................................476


           ПЕРВОМУ ЧИТАТЕЛЮ


                            «Непродуманная жизнь не стоит того, чтобы ее прожить» [Хаммураби]
   На рубеже 80-х нам посчастливилось с десяток лет вести в МГУ комплексный практикум по статистике, программированию и автоматизации эксперимента для старшекурсников и слушателей ФПК (объемом около 40 часов). В течение отведенных на статистику 10—15 лекционных и практических часов слушатели, к своему немалому удивлению, начинали понимать в статистике то, что они не поняли на предыдущих объемных общих семестровых курсах. Тогда-то и зародилась идея создания такого методического и инструментального обеспечения, которое сделала бы эту область доступной не только для избранных.
   Действительно, обычно профессиональные статистики и написанные ими учебники грешат изложением предмета в плане принципов построения и конструктивных особенностей телеги, в то время как потенциального пользователя волнует, где запрягать лошадь, и сколько, чего, куда и зачем можно увезти. По наблюдениям того времени, лишь отдельные монографии по статистике представлялись сбалансированными и понятными, а большинство статистических пакетов страдали обилием редко употребляемых методов, чрезмерно сложным и запутанным диалогом и тотальным отсутствием пояснений.
   Поэтому в первой версии воплощались следующие тезисы:
•   достигнуть максимальной понятности, компактности и лаконичности в изложении материала и операционных средствах (статистика — для Человека);
•   собрать представительный набор элементарных и развитых методов анализа и преобразования данных, покрывающих большую часть типичных практических задач (все необходимое — под рукой);
•   предоставить лаконичные оперативные подсказки и неформальные взаимосвязанные справки по используемым методам (библиотека — на экране);
•   во всех возможных случаях буквально навязать наглядное графи -ческое представление данных и результатов.
   Особую признательность автор приносит А.Н. Гусеву, А.А. Макарову, В.Э. Фигурнову, Д.С. Шмерлингу, а также многим профессионалам, коллегам и пользователям за многочисленные обсуждения, настойчивые критические замечания и предложения. Большое спасибо профессору В.В. Налимову за изумительный пример личной стойкости, во многом инициировавший данную работу.


Москва, 1989

канд. физ.-мат. наук. А.П.Кулаичев


           ПОСЛЕДУЮЩИМ ЧИТАТЕЛЯМ



Посвящается друзьям и близким, оставшимся во II тысячелетии

               «Гуны движутся среди гун» [Бхагавад-Гита: 3, 28]

   Достаточно часто приходится наблюдать чисто утилитарный подход к прикладной статистике: есть данные, есть конкретная узкая задача, есть метод для этой задачи, применяем этот метод. Обычно прагматической целью такой деятельности является сделать убедительными для аудитории выводы, очевидные исследователю из содержательных соображений, профессиональной интуиции и опыта. Широко распространены и более прозаические, житейские мотивировки, например: «у нас все так делают» или «при обсуждении работы посоветовали оценить различия данных по Вилкоксону — ну мы и оценили» (с глаз долой, из сердца вон). Такому узконаправленному взгляду способствует и большинство учебников, в которых статистические методы излагаются как изолированные, почти не связанные друг с другом разноцелевые разделы.
   В противовес этому нашей главной задачей в последующих изданиях является научение творческому подходу к работе с исходными данными, методологии комплексного статистического мышления с целью выжать из данных максимум возможного, потрясти их с разных сторон и разными методами, внимательно вглядываясь в результаты каждого шага, выявляя новые тонкие закономерности и последовательно выдвигая задачи и шаги для их дальнейшего изучения. Очень важно, что при этом высвечивается внутренняя взаимосвязанность и дополнительность различных разделов и методов анализа данных.
   Этим подходом проникнуто большинство рассматриваемых в книге примеров, проходящих «красной нитью» через серии разделов статистического анализа. Но наиболее полно и всесторонне эта комплексная методология продемонстрирована в специальной заключительной главе 14.
   При этом везде особо подчеркивается и предметно доказывается, что одним из важнейших и эффективнейших инструментов исследования является визуальный анализ данных и результатов, когда преимущества наглядно-образного мышления становятся очевидными.


Москва, 2005

доктор биол. наук А.П.Кулаичев


�лава 1



            ИЗУЧЕНИЕ ПРИКЛАДНОЙ СТАТИСТИКИ


                                     «Знающий — не говорит, говорящий — не знает» [Лао Дзы]
   Введение. Хорошо известно, что в развитых странах практически любое решение (политическое, финансовое, техническое и даже бытовое) принимается только после всестороннего анализа данных. Поэтому изучение прикладной статистики и методов анализа данных является неотъемлемым компонентом образования на всех уровнях, а компьютерные пакеты для аналитических исследований и прогнозирования ежегодно расходятся в десятках тысяч экземпляров и являются настольным рабочим инструментом любого специалиста, так или иначе связанного с информационной сферой. И в нашей стране в последнее время заметен рост понимания значимости таких инструментов, хотя, в силу исторических причин, мы сильно отстали в соответствующем массовом образовании.
   Для чего же нужна математическая статистика в нашем мире? Известно, что окружающий нас мир характеризуется постоянной изменчивостью и в нем, наряду с закономерностью, существует и случайность, порождающая много прекрасных вещей, включая разнообразие возможностей и свободу выбора. Однако в практической деятельности люди обычно хотят, чтобы их действия приносили стабильный, полезный и предсказуемый результат.
   Действительно, современному человеку ежедневно приходится решать многие проблемы выбора, связанные с организацией производства, сбытом готовой продукции, оптимизацией поставок сырья, областями вложения капитала, эффективностью деятельности персонала, перспективными исследованиями и многое другое. Некоторое время, особенно на этапе становления, все эти вопросы можно решать за счет личной энергии, интуиции и предыдущего опыта. Однако тот, кто серьезно думает о перспективах своей деятельности, обязательно будет накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей, чтобы опереться на них в своих действиях, и он будет постоянно искать стабильные и обоснованные критерии выбора, позволяющие стандартизировать процесс принятия решений.
   Именно таким, изумительным по мощности и гибкости инструментом для выделения закономерностей и отсеивания случайностей, является аппарат математической статистики, созданный многими поколениями выдающихся математиков.


Глава 1. Изучение прикладной статистики

   Ситуация с учебным обеспечением. К сожалению, имеющиеся в портфелях отечественных издательств учебники по математической статистике являют достаточно удручающую картину. Они затрагивают преимущественно начальные разделы статистики, часто включая малоизвестные методы по субъективному выбору авторов, с излишним теоретизированием и отсутствием интегрированного, комплексного и критического подхода к материалу. Если и затрагиваются некоторые более продвинутые разделы, то их изложение обычно сокращенное и отрывочное. Особенно это усугубляется с ориентацией на новую 2-ступенчатую систему высшего образования, когда для каждой ступени субъективно отбирается некоторый материал. К тому же обычно нет доступного обучающего инструмента. Авторы чего-то понаизлагали, а на чем и как это все можно руками пощупать, опробовать и освоить - неизвестно! И наконец, изучение статистических методов часто выступает некой вспомогательной добавкой к теории вероятностей, из которой для понимания и применения статистических методов достаточно лишь ограниченных сведений о статистических гипотезах, ошибках, основных законах распределения вероятностей и частотах событий.
   Перечень компетенций ГОС ВПО приведен в разделе 1.4.


ПРИКЛАДНАЯ СТАТИСТИКА


Рис. 1.1. Группировка статистических методов, используемых в различных областях исследования.


.1. Статистические разделы и методы

11



            1.1. Статистические разделы и методы


   Методы прикладной статистики активно используются в большинстве научных областей, однако в каждой из них превалируют те или иные разделы. Так в биологии и агрономии сравнительно не часто нужны методы многомерной статистики, психологам не актуален анализ временных рядов и регрессии, экономисты редко прибегают к критериям выборочных различий и дисперсионному анализу, методы контроля качества крайне важны для производственников и т.д. Поэтому и большинство издаваемых учебников имеет специальную ориентацию.
   Однако, безусловно, существует некое подвижное «ядро» (рис.1.1.), включающее общие для всех приложений разделы и области их частичного пересечения. И нашей главной задачей всегда была именно ориентация на такое «ядро» и сбалансированная проработка его дидактики — интегрированность. Образцом такого подхода является классическая монография [1] и за прошедшие десятилетия нам не встретилось сопоставимого аналога из книг, ориентированных на широкую аудиторию, а не на узко профессиональную.
СТАТИСТИЧЕСКИЕ РАЗДЕЛЫ
             1. ОПИСАТЕЛЬНАЯ СТАТИСТИКА
2. КРИТЕРИИ ВЫБОРОЧНЫХ РАЗЛИЧИЙ
          Параметрические     Пепараметрические
(средних, дисперсий (медиан, масштабов, интегральные, корреляция)       корреляция, кросстабуляция)
             3. ДИСПЕРСИОННЫЙ АНАЛИЗ
               ФАКТОРНЫХ ЭФФЕКТОВ
             Параметрический, непараметрический,
1,2,3, N-факторный, модели
              4. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
Корреляционный, спектральный, сглаживание и фильтрация, моделирование и прогнозирование 5. РЕГРЕССИОННЫЙ АНАЛИЗ
Простая регрессия, сравнение регрессий, многомерная линейная, пошаговая, общая
               6. МНОГОМЕРНЫЕ МЕТОДЫ
Факторный, кластерный, дискриминантный, шкалирование, ...
              7. ВЕРОЯТНОСТИ И ЧАСТОТЫ
Случайные величины и распределения, вычисление вероятностей, согласие распределений, согласие частот (долей), последовательный анализ, анализ выживаемости 8. КОНТРОЛЬ КАЧЕСТВА
Описательная статистика, гистограммы, диаграмма Парето, контрольные карты
Рис.1.2. Традиционные статистические разделы и методы


Глава 1. Изучение прикладной статистики

   В математической статистике традиционно выделяют ряд крупных методических разделов (рис. 1.2)1.
   Описательная статистика дает нам основные параметры, характеризующие собранную информацию (см. разд. 6.1): среднее значение, раз -брос значений или стандартное отклонение, характеристики формы распределения данных (мода, медиана, асимметрия, эксцесс, квантили) и т. п.
   Критерии попарных различий оценивают различия между двумя совокупностями данных (см. разд. 6.2, 6.3, 7.1—7.5). Вот типичная ситуация: вы ввели важное нововведение: перешли к новой финансовой стратегии, изменили систему оплаты труда, перешли на выпуск новой продукции, использовали новую технологию, агрохимический прием, метод лечения и т. п. Вам кажется, что это дало положительный эффект, но действительно ли это так? А может быть, этот кажущийся эффект определен вовсе не вашим нововведением, а естественной случайностью типа последовательного выпадения орла при бросании монеты, и уже завтра вы получите прямо противоположный, но столь же случайный эффект? Вы можете теперь заменить приведенные данные на геологические образцы из двух регионов, а проблему — на неслучайность различий в содержании редкоземельных элементов, или же — на данные из совершенно другой области, но методы исследования от этого не изменятся.
   Для разрешения подобных дилемм вы формируете два набора чисел, каждый из которых содержит, например, значения важного показателя эффективности вашей деятельности до и после произведенного нововведения: прибыль фирмы за ряд месяцев, объем реализации продукции, производительность труда работников, курс акций, плодовитость, выздоравливаем ость и т. п. Результат применения критериев парных различий

  ¹ Распространенную у популяризаторов западных статпакетов классификацию статистических методов следует признать крайне неудачной, неадекватной смыслу и назначению методов, сбивающей пользователя с толку. Так методы начальной статистики разбиваются на две большие категории: применимые к так называемым независимым или же к зависимым выборкам. Уже само слово «зависимые» выборки по-русски означает, что между ними существует некая априорная причинная зависимость (и неясно какого типа), хотя ее наличие еще только предстоит доказать. На самом же деле речь идет о парных или групповых измерениях, например веса и цвета глаз у группы людей, между каковыми признаками не может быть никакой зависимости. Благодаря такой классификации в одни и те же кучи попадают параметрические и непараметрические критерии, критерии оценки различий средних, масштабов и форм распределения, попарные и множественные сравнения, а также различные методы дисперсионного анализа. То же касается и многомерных методов, некоторые из которых вдруг выделяются в самостоятельный раздел «снижение размерности», хотя все они в той или иной степени решают такую задачу. Найти самостоятельно в подобном хаосе нужный метод часто оказывается невозможным без компетентной консультационной поддержки. В конкретных пакетах встречается и более радикальная отсебятина. Все это является следствием прихода в компьютерную статистику новых аналитиков, утративших связь с классической статистикой и уверенных, что они лучше знают, что нужно пользователю.


.1. Статистические разделы и методы

13

покажет, случайны или неслучайны различия подобных двух числовых выборок. При этом различия можно проанализировать по средним значениям (сдвигу), по разбросу значений (масштабу) или по синхронности изменений значений (корреляции), а также в зависимости от того, подчиняются ли ваши данные нормальному (гауссову) распределению (параметрические критерии, гл. 6) или нет (непараметрические критерии, гл. 7).
   Точно такой же подход применим и при сравнении любых двух альтернатив с целью решения проблемы выбора, например, деятельности двух фирм с целью вложения капитала в акции одной из них, двух способов обработки материалов, двух тактик ведения рекламной компании и т. п.
   Факторные эффекты. Далее, часто необходимо выяснить, влияет или нет некоторый фактор на интересующий нас показатель или зависимую количественную переменную (отклик). При этом фактор может быть количественным или качественным и иметь несколько градаций', например, влияние уровня инвестиций на прибыль, типа технологического оборудования на выпуск продукции, качества удобрения на урожайность и т. п. Решать такие задачи призваны методы анализа факторных эффектов или дисперсионного анализа (см. гл. 8).
   Анализ временных рядов применим к одиночным или связанным временным рядам для выделения периодичностей и взаимовлияния таких процессов, а также позволяет осуществлять прогнозирование будущего поведения временного ряда: изменение курса доллара, цен и спроса на продукцию или сырье, загрязнения окружающей среды, числа аварий и пр. Для такого временного ряда подбирают некоторое аналитическое уравнение (модель), на основании которого можно предсказать ближайшее или отдаленное будущее со строго статистически обоснованной точностью (или ошибкой) такого прогноза. Выявлению периодических процессов в поведении временных рядов и их динамических взаимосвязей служат методы кор -реляционного, спектрального и авторегрессионного анализа (см. гл. 9).
   Регрессионный анализ. Вопросы моделирования статистических зависимостей между двумя или несколькими переменными решаются в разделе регрессионного анализа (см. гл. 10). Эти методы позволяют рассчитать математическую модель, описываемую некоторым уравнением и отражающую функциональную зависимость между экспериментальными количественными переменными, а также проверяют гипотезу об адекватности модели экспериментальным данным. С помощью таких моделей можно не только построить прогноз, но и определить оптимальные области для последующего управления и контроля, например, границу, за рамками которой дальнейшее вложение капитала уже не приносит пропорционального увеличения прибыли, наиболее экономичные режимы работы механизмов, безопасное время работы в неблагоприятных условиях и т. п.
   Контроль качества. Далее, многих может интересовать, когда необходимо немедленно вмешаться в технологический или управленческий


Глава 1. Изучение прикладной статистики

процесс. Не упустить этот важный момент помогут методы контроля ка-чества (см. гл. 13), повсеместное и незамедлительное применение которых во многом определило поразительные успехи японской промышленности. Здесь мы наблюдаем изумительный пример внедрения статистических методов в широкую практику. Практикующими статистиками были сформулированы 6—8 правил оценивания динамики изменения качества продукции и их наглядного представления (так называемые контрольные карты). Эти правила выражены самими простейшими словами, и японские рабочие выучивают наизусть как молитву, после чего каждый простой рабочий знает, когда надо вызывать бригаду наладчиков, чтобы избежать многомиллионных потерь от выпуска некачественной продукции.
   Многомерные методы. Часто необходимо увидеть закономерность, структуру и группировку в необозримом множестве объектов вашего интереса, каждый из которых описывается множеством переменных. Тогда к вашим услугам многомерные методы (см. гл. 11): дискриминант -ный, кластерный, факторный анализ и шкалирование. Пусть у вас имеются данные о различных сортах баварского пива, каждый из которых характеризуется множеством переменных: содержанием алкоголя, натрия и других веществ, калорийностью, цветом и т. п. Вы хотите закупать и продавать наиболее дешевое пиво, но близкое по совокупности свойств к очень престижному и дорогому сорту. Другой пример: у вас имеются данные о некотором множестве фирм, требующих кредитования, каждая из которых характеризуется рядом переменных: размером уставного капитала, объемом оборотных средств, числом наименований выпускаемой продукции, производственной мощностью, количеством персонала и т. п. Вы хотите льготно кредитовать только организации, наиболее близкие по совокупности параметров к уже зарекомендовавшему себя кругу ваших клиентов.
   Для подобного типа задач, прежде всего, необходимо увидеть, как группируются объекты в многомерном пространстве описывающих их переменных (в нашем трехмерном мире визуализировать многомерные пространства невозможно).
   Многомерные методы исследуют различные формы ассоциации (близости, связи, подобия) между несколькими переменными и/или объектами. Существенным для этого класса методов анализа является то, что все переменные рассматриваются как равноправные, без деления на зависимые и независимые переменные.
   Факторный анализ позволяет найти в многомерном пространстве первичных переменных (значения которых регистрируются в эксперименте), сокращенную систему вторичных переменных — факторов (не путать с факторами дисперсионного анализа), повернутых относительно первичной системы и отражающих большую часть информации об исследуемом объекте или явлении. Содержательная интерпретация полученной


К покупке доступен более свежий выпуск Перейти