Анализ сетей (графов) в среде R
Покупка
Издательство:
ДМК Пресс
Автор:
Дуглас А. Люк
Перевод:
Груздев А. В.
Год издания: 2017
Кол-во страниц: 250
Дополнительно
Вид издания:
Практическое пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-97060-428-1
Артикул: 645899.02.99
Данная книга представляет собой практическое руководство по решению основных задач, связанных с анализом сетей, включая управление сетевыми данными, визуализацию сетей, их описание и моделирование. Все примеры, используемые в книге, сопровождаются программным кодом на языке R. Издание служит отличным справочным ресурсом для изучения науки о сетях.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.02: Информационные системы и технологии
- 09.03.03: Прикладная информатика
- 09.03.04: Программная инженерия
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Дуглас Люк Интернет-магазин: www.dmkpress.com Книга - почтой: orders@alians-kniga.ru Оптовая продажа: “Альянс-книга”. Тел.: (499)782-3889 books@alians-kniga.ru Анализ сетей (графов) в среде R www.дмк.рф До недавнего времени для проведения анализа сетей требовалось специализированное программное обеспечение. Однако недавно инструменты для этого появились в среде статистического программирования R. Помимо того, что методы анализа сетей стали доступны более широкому кругу специалистов по статистике, пакет R предоставил исследователям обширные возможности по управлению данными, графической визуализации и статистическому моделированию. Книга является руководством пользователя по анализу сетей в среде R. Она концентрируется на четырех основных задачах, с которыми обычно сталкивается специалист в этой области: управление сетевыми данными, визуализация сети, описание сети и моделирование сети. Все примеры сопровождаются программным кодом на языке R. Издание служит отличным справочным ресурсом для изучения науки о сетях. 9 785970 604281 ISBN 978-5-97060-428-1 Анализ сетей (графов) в среде R Руководство пользователя
Дуглас Люк Анализ сетей (графов) в среде R. Руководство пользователя
Douglas A. Luke A User’s Guide to Network Analysis in R
Дуглас Люк Анализ сетей (графов) в среде R. Руководство пользователя Москва, 2017
УДК 004.73:004.438R ББК 32.971.35 Л94 Люк Д. А. Л94 Анализ сетей (графов) в среде R. Руководство пользователя / пер. с анг. А. В. Груздева. – М.: ДМК Пресс, 2017. – 250 с.: ил. ISBN 978-5-97060-428-1 Данная книга представляет собой практическое руководство по решению основ ных задач, связанных с анализом сетей, включая управление сетевыми данными, визуализацию сетей, их описание и моделирование. Все примеры, используемые в книге, сопровождаются программным кодом на языке R. Издание служит отличным справочным ресурсом для изучения науки о сетях. УДК 004.73:004.438R ББК 32.971.35 Translation from the English language edition: A User’s Guide to Network Analysis in R by Douglas A. Luke Copyright © Springer International Publishing Switzerland 2015 This Springer imprint is published by Springer Nature The registered company is Springer International Publishing AG All Rights Reserved Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность технических ошибок все равно существует, издательство не может гарантировать абсолютную точность и правильность приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные с использованием книги. ISBN 978-3-319-23882-1 Copyright © Springer International Publishing Switzerland, 2015 ISBN 978-5-97060-428-1 © Перевод, издание, оформление, ДМК Пресс, 2017
Моей самой важной социальной сети – Сью, Алине и Эндрю – посвящается
Содержание Предисловие......................................................................................................................9 Глава 1. Введение в анализ сетей в R...................................................................11 1.1..Что.такое.сети?..............................................................................................................12 1.2..Что.такое.анализ.сетей?.................................................................................................14 1.3..Пять.серьезных.причин.проводить.анализ.сетей.в.R.......................................................15 1.3.1..Широта.возможностей.R...................................................................................15 1.3.2..Свободно.распространяемая.и.открытая.природа.R..........................................16 1.3.3..Возможности.работы.с.данными.и.проектами.в.R..............................................16 1.3.4..Широкий.выбор.пакетов.для.анализа.сетей.в.R.................................................17 1.3.5..Возможности.моделирования.сетей.в.R............................................................17 1.4..Область.применения.книги.и.ресурсы............................................................................17 1.4.1..Область.применения.........................................................................................17 1.4.2..«Дорожная.карта».книги....................................................................................18 1.4.3..Ресурсы............................................................................................................19 Часть I. ОСНОВЫ АНАЛИЗА СЕТЕЙ.........................................................................20 Глава 2. «Пятичисловая сводка» для анализа сетей......................................21 2.1..Анализ.в.R:.с.чего.начать................................................................................................22 2.2..Подготовка.....................................................................................................................22 2.3..Простая.визуализация....................................................................................................23 2.4..Базовое.описание..........................................................................................................23 2.4.1..Размер..............................................................................................................23 2.4.2..Плотность.........................................................................................................25 2.4.3..Компоненты......................................................................................................26 2.4.4..Диаметр............................................................................................................26 2.5..Коэффициент.кластеризации.........................................................................................27 Глава 3. Управление сетевыми данными в R.....................................................28 3.1..Основные.понятия.сетевых.данных.................................................................................29 3.1.1..Структуры.сетевых.данных................................................................................29 3.1.2..Информация,.хранимая.в.объектах-сетях..........................................................32 3.2..Создание.объектов-сетей.и.работа.с.ними.в.R...............................................................32 3.2.1..Создание.объекта-сети.в.statnet......................................................................33 3.2.2..Работа.с.атрибутами.узлов.и.связей..................................................................36 3.2.3.Создание.объекта-сети.в.igraph.......................................................................39 3.2.4..Переключение.между.statnet.и.igraph..............................................................41 3.3..Импорт.сетевых.данных.................................................................................................41 3.4..Общераспространенные.задачи.при.работе.с.сетевыми.данными..................................43 3.4.1..Фильтрация.сетевых.данных.на.основе.значений.атрибутов.вершин.. или.ребер...................................................................................................................43 3.4.2..Преобразование.направленной.сети.в.ненаправленную....................................50 Часть II. ВИЗУАЛИЗАЦИЯ............................................................................................53 Глава 4. Графическое представление и укладка сети..................................54 4.1..Проблема.визуализации.сети.........................................................................................55 4.2..Эстетический.вид.укладок.сетей....................................................................................57 4.3..Основные.алгоритмы.и.методы.графического.представления........................................59
Содержание 7 4.3.1..Более.точная.настройка.укладки.сети...............................................................60 4.3.2..Укладки.сетей,.построенные.с.помощью.igraph.................................................62 Глава 5. Эффективный графический дизайн сетей.......................................64 5.1..Основные.принципы.......................................................................................................65 5.2..Элементы.дизайна.........................................................................................................65 5.2.1..Цвет.узла..........................................................................................................66 5.2.2..Форма.узла.......................................................................................................71 5.2.3..Размер.узла......................................................................................................72 5.2.4..Метка.узла........................................................................................................77 5.2.5..Ширина.ребра...................................................................................................78 5.2.6..Цвет.ребра........................................................................................................79 5.2.7..Тип.ребра..........................................................................................................80 5.2.8..Легенды............................................................................................................81 Глава 6. Сложные графики сетей............................................................................83 6.1..Интерактивные.графики.сетей.......................................................................................84 6.1.1..Простые.интерактивные.сети.в.igraph...............................................................84 6.1.2..Публикация.интерактивных.веб-диаграмм.сетей...............................................85 6.1.3..Statnet.Web:.интерактивный.statnet.c.помощью.shiny.......................................87 6.2..Специализированные.диаграммы.сетей.........................................................................88 6.2.1..Дуговые.диаграммы..........................................................................................88 6.2.2..Хордовые.диаграммы........................................................................................90 6.2.3..Теплокарты.для.сетевых.данных........................................................................93 6.3..Создание.диаграмм.сетей.с.помощью.других.пакетов.R.................................................95 6.3.1..Построение.диаграмм.сетей.с.помощью.ggplot2...............................................95 Часть III. ОПИСАНИЕ И АНАЛИЗ...............................................................................99 Глава 7. Важность актора......................................................................................... 100 7.1..Введение..................................................................................................................... 101 7.2..Центральность.–.показатель.важности.для.ненаправленных.сетей............................... 101 7.2.1..Три.популярные.меры.центральности............................................................. 103 7.2.2..Меры.центральности.в.R................................................................................. 105 7.2.3..Централизация:.вычисление.индексов.центральности.для.сети.в.целом......... 106 7.2.4..Создание.отчетов.по.центральности............................................................... 107 7.3..Точки.сочленения.и.мосты............................................................................................ 111 Глава 8. Подгруппы...................................................................................................... 114 8.1..Введение..................................................................................................................... 115 8.2..Социальная.сплоченность............................................................................................ 116 8.2.1..Клики.............................................................................................................. 116 8.2.2..k-ядра............................................................................................................. 120 8.3..Обнаружение.сообществ.............................................................................................. 123 8.3.1..Модулярность................................................................................................. 125 8.3.2..Алгоритмы.обнаружения.сообществ............................................................... 127 Глава 9. Сети аффилированности........................................................................ 134 9.1..Определение.сетей.аффилированности....................................................................... 135 9.1.1..Аффилированность.в.виде.бимодальных.сетей............................................... 135 9.1.2..Двудольные.графы.(биграфы)......................................................................... 136 9.2..Основы.сетей.аффилированности................................................................................ 137 9.2.1..Создание.сетей.аффилированности.из.матриц.инцидентности....................... 137 9.2.2..Создание.сетей.аффилированности.из.списков.ребер.................................... 138
Содержание 8 9.2.3..Графическое.представление.сетей.аффилированности.................................. 140 9.2.4..Проекции........................................................................................................ 140 9.3..Пример:.актеры.Голливуда.как.пример.сети.аффилированности.................................. 143 9.3.1..Анализ.полной.сети.аффилированности.актеров.Голливуда............................ 143 9.3.2..Анализ.проекций.актеров.и.фильмов............................................................... 149 Часть IV. МОДЕЛИРОВАНИЕ.................................................................................... 155 Глава 10. Модели случайных сетей..................................................................... 156 10.1..Предназначение.моделей.сетей................................................................................. 157 10.2..Модели.формирования.и.структуры.сети................................................................... 158 10.2.1..Модель.случайного.графа.Эрдеша–Реньи..................................................... 158 10.2.2..Модель.малого.мира..................................................................................... 162 10.2.3..Свободно.масштабируемые.модели.............................................................. 165 10.3..Сравнение.моделей.случайных.графов.с.наблюдаемыми.сетями............................... 170 Глава 11. Статистические модели сетей.......................................................... 173 11.1..Введение.................................................................................................................... 174 11.2..Построение.экспоненциальных.моделей.случайных.графов....................................... 177 11.2.1..Построение.нулевой.модели......................................................................... 179 11.2.2..Включение.предикторов.узлов...................................................................... 181 11.2.3..Включение.предикторов.диад....................................................................... 183 11.2.4..Включение.предикторов.ребер...................................................................... 187 11.2.5..Включение.предикторов.локальных.структур.(зависимых.диадных.связей)..... 189 11.3..Анализ.экспоненциальных.моделей.случайных.графов............................................... 191 11.3.1..Интерпретация.модели................................................................................. 191 11.3.2..Подгонка.модели........................................................................................... 192 11.3.3..Диагностика.модели..................................................................................... 195 11.3.4..Имитационное.моделирование.сетей.на.основе.оцененной.модели.............. 195 Глава 12. Модели динамических сетей............................................................. 199 12.1..Введение.................................................................................................................... 200 12.1.1..Динамические.сети....................................................................................... 200 12.1.2..RSiena........................................................................................................... 202 12.2..Подготовка.данных..................................................................................................... 203 12.3..Спецификация.и.оценивание.модели......................................................................... 210 12.3.1..Спецификация.модели.................................................................................. 210 12.3.2..Оценивание.модели...................................................................................... 214 12.4..Анализ.модели........................................................................................................... 215 12.4.1..Интерпретация.модели................................................................................. 215 12.4.2..Качество.подгонки........................................................................................ 220 12.4.3..Имитационное.моделирование..................................................................... 224 Глава 13. Имитационные модели......................................................................... 228 13.1..Имитационные.модели.cетевой.динамики.................................................................. 229 13.1.1..Имитационное.моделирование.социальной.селекции................................... 229 13.1.2..Имитационное.моделирование.социального.влияния................................... 240 Библиография................................................................................................................ 247
Предисловие В начале 2000 года Стивен Хокинг сказал, что «следующий век будет веком сложности». Если его прогноз верен, то выходит, что нам потребуются новые научные теории, методы сбора данных и аналитические подходы, которые будут использоваться для исследования сложных систем и поведения. Наука о сетях – это подход, рассматривающий мир через призму сетей, в котором физические и социальные системы образованы разнородными акторами, соединенными друг с другом с помощью различных типов связей. Анализ сетей – это набор аналитических инструментов, используемых для изучения таких систем. В течение последних нескольких десятилетий анализ сетей приобретает все большее значение в арсенале аналитических средств, используемых социологами, врачами и физиками. До недавнего времени для проведения анализа сетей требовалось специализированное программное обеспечение (как для управления сетевыми данными, так и для последующего анализа). Однако начиная примерно с 2000 года инструменты для анализа сетей появились в среде статистического программирования R. Помимо того что благодаря этому методы анализа сетей стали доступны более широкому кругу специалистов по статистике, пакет R предоставил исследователям, занимающимся анализом сетей, обширные возможности по управлению данными, графической визуализации и статистическому моделированию. Как и предполагает название, эта книга является руководством пользователя по анализу сетей в R. В этой книге приводятся ключевые задачи в области анализа сетей, которые теперь можно выполнить в R. Книга концентрируется на четырех основных задачах, с которыми обычно сталкивается специалист в области анализа сетей: управление сетевыми данными, визуализация сети, описание сети и моделирование сети. Книга включает программный код R, который используется в конкретных примерах анализа сетей. Кроме того, к книге прилагается комплект наборов сетевых данных, использующихся в ней. (См. главу 1 для получения более подробной информации о структуре книги, а также инструкции по поводу того, как получить сетевые данные.) Книга написана для тех, кого интересует проведение анализа сетей в R. Она может использоваться в качестве вспомогательного пособия по анализу сетей или руководства по методам анализа сетей в R. Появление этой книги было бы невозможным без консультаций, поддержки, рекомендаций и советов, которые я получил за последние 30 лет благодаря своим собственным социальным сетям (личной и профессиональной). В середине 1980-х годов я закончил класс по анализу сетей у Стена Вассермана в Иллинойском университете в Урбане-Шампейне. Я помню, в каком я был восторге от этого нового метода анализа данных, но тогда думал, что вряд ли буду когда-либо использовать его в своей работе. Однако мои коллеги в области психологии и здравоохранения посоветовали мне в моей первоначальной работе рассмотреть тему использования анализа сетей для изучения и оценки данных. Среди них – Джулиан Раппапорт (Julian Rappaport), Эд Сейдман (Ed Seidman), Брюс Рапкин (Bruce Rapkin), Курт Рибисл (Kurt Ribisl), Шерон Хоман (Sharon Homan), Росс Браун