Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Байесовы технологии: их реализация в программной среде Hugin и применение в операционном риск-менеджменте в телекоммуникациях

Покупка
Новинка
Артикул: 824622.01.99
Доступ онлайн
350 ₽
В корзину
В учебном пособии рассмотрены основные типы систем интеллектуальнойподдержки принятия решений в условиях неопределенности и риска, особое внимание уделено байесовым технологиям, а именно байесовым сетям, диаграммам влияния, иерархическим байесовым сетям. Показаны механизмы реализации байесовых технологий в программной среде Hugin. Отражены особенности операционного риск-менеджмента в телекоммуникациях, а также рассмотрены возможности применения байесовых технологий при моделировании операционного риска. Пособие предназначено для студентов технических и экономических направлений подготовки, изучающих процессы автоматизации поддержки принятия решений в условиях неопределенности и риска с помощью систем искусственного интеллекта на основе байесовых сетей.
Шевцова, Ю. В. Байесовы технологии: их реализация в программной среде Hugin и применение в операционном риск-менеджменте в телекоммуникациях : учебное пособие / Ю. В. Шевцова. - 2-е изд., перераб. и доп. - Новосибирск : Сибирский государственный университет телекоммуникаций и информатики ; каф. математического моделирования бизнес-процессов, 2016. - 90 с. - Текст : электронный. - URL: https://znanium.ru/catalog/product/2136478 (дата обращения: 19.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Федеральное агентство связи 

 

Федеральное государственное бюджетное  

образовательное учреждение высшего образования 

«Сибирский государственный университет  

телекоммуникаций и информатики» 

(СибГУТИ) 

 
 
 
 

Ю.В. Шевцова  

 
 

Байесовы технологии: 

их реализация в программной среде Hugin и применение  
в операционном риск-менеджменте в телекоммуникациях   

 
 

Учебное пособие  

 

Рекомендовано УМО по образованию в области Инфокоммуникационных  

технологий и систем связи в качестве учебного пособия для студентов высших 

учебных заведений, обучающихся по направлению подготовки 11.04.02 и 

11.03.02  – Инфокоммуникационные технологии и системы связи 
(уровень высшего образования – магистратура и бакалавриат)  

 
 
 
 
 
 
 
 
 
 
 
 
 

Новосибирск 

 2016 

 
УДК 654.07.012.12 

 
 

Утверждено редакционно-издательским советом СибГУТИ 

 
 

Рецензенты: доктор техн. наук, проф. Авдеенко Т.В., 
                    доктор экон. наук, проф. Карпович А.И.  

 

 

Шевцова Ю. В.  Байесовы технологии: их реализация в программной сре-

де Hugin и применение в операционном риск-менеджменте в телекоммуникациях : 
Учебное пособие. 2-е изд., перераб. и доп. / Сибирский государственный 
университет телекоммуникаций и информатики; каф. математического моделирования 
бизнес-процессов. – Новосибирск, 2016. – 90 с. 

 

 

В учебном пособии рассмотрены основные типы систем интеллектуальной 

поддержки принятия решений в условиях неопределенности и риска, особое 
внимание уделено байесовым технологиям, а именно байесовым сетям, диаграммам 
влияния, иерархическим байесовым сетям. Показаны механизмы реализации 
байесовых технологий в программной среде Hugin. Отражены особенности 
операционного риск-менеджмента в телекоммуникациях, а также рассмотрены 
возможности применения байесовых технологий при моделировании 
операционного риска. Пособие предназначено для студентов технических и 
экономических направлений подготовки, изучающих процессы автоматизации 
поддержки принятия решений в условиях неопределенности и риска с помощью 
систем искусственного интеллекта на основе байесовых сетей. 
 
 
В авторской редакции 
 
 
 
 

© Шевцова Ю. В., 2016 
© Сибирский государственный университет 
телекоммуникаций и информатики, 2016 

 
 
 
 
ОГЛАВЛЕНИЕ 

 

1. Парадигмы экспертных систем……….……...…………………………..……4 

1.1. Экспертные системы, основанные на  правилах………………………...…4 
1.2. Нейронные сети…………………………………………………………...….5 
1.3. Байесовы сети…………………………………………………………..….…6 

2. Введение в байесовы технологии……………………………………..…….…8 

2.1. Теория Байеса и байесовы сети…………………………………………...…8 
2.2. Условная независимость переменных…………………………………......13 

    2.3. Алгоритм адаптации байесовой сети….…………………………………...17  

2.4. Диаграммы влияния…………………………………………………….…..18  
2.5. Объектно-ориентированные сети…………………………………….……22 

3. Реализация байесовых технологий в программной среде Hugin…….…..24  

3.1. Байесовы сети в Hugin.……………………………………..………………24 
3.2. Диаграммы влияния в Hugin…………………..……………………….…..32 
3.3. Объектно-ориентированные сети в Hugin……………………….......…….36 
3.4. Специальные функциональные возможности Hugin………...….……..…39 

4. Применение байесовых технологий в операционном    
    риск-менеджменте...............................................................................................58 

4.1. Понятие риска и неопределенности…………………………………….…58 
4.2. Операционный риск: определение, особенности, методы оценки…....…63 

5. Упражнения…………………………………….……………………………….77 
Список литературы…………………………………………………………….....88 
 
 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1. Парадигмы экспертных систем 

 

Естествоиспытателя приборы! 
Я, как ключи к замку, вас подбирал, 
Но у природы крепкие затворы. 

                                                  И. В. Гете «Фауст» 

 
Выделяют три основных типа систем, позволяющих учесть неопределен-

ность в процессе принятия решений: экспертные системы, основанные на правилах; 
нейронные сети и байесовы сети. 

 

1.1. Экспертные системы, основанные на  правилах 

 

Правило – есть выражение типа 
 

если А, то B, 

где A – утверждение (условие);  
     B – действие или утверждение (заключение).  
 

Например, следующие три правила могут быть составляющими набора 

правил по выявлению неисправностей в работе водных насосов: 

1) если насос отказал, то давление понизится; 
2) если насос отказал, то необходимо проверить уровень масла;  
3) если произошел сбой в подаче электроэнергии, то насос откажет. 
Система, основанная на правилах, состоит из библиотеки таких правил, ко-

торые отражают существенные отношения внутри проблемной области или, 
скорее, отражают способ  рассуждения  эксперта об этой области.  

Когда определенная информация об области становится доступной, прави-

ла позволяют сделать заключения и принять соответствующие решения. Это 
называют логическим выводом (inference). Вывод представляет собой своего 
рода цепную реакцию. Так, если в вышеупомянутом примере становится известно, 
что произошел сбой электроэнергии, то, согласно правилу 3, произойдет 
отказ работы насоса; а, согласно правилу 1, давление понизится. Правило 2 
также даст (бесполезную) рекомендацию о том, что необходимо проверить уровень 
топлива.  

Правила могут также использоваться в «противоположном направлении». 

Предположим, что становится известно, что давление понизилось, тогда, согласно 
правилу 1, причиной этого может быть отказ работы насоса, тогда как 
правило 3 заявляет, что отказ работы насоса может быть вызван сбоем в подаче 
электроэнергии.  

Часто связи, отраженные в правилах, определены не абсолютно, а накоп-

ленная информация подчинена неопределенности. В таких случаях, мера неопределенности 
добавляется как в условие, так и в заключение правила. Тогда 
правило задает функцию, которая описывает, насколько изменение неопреде-
ленности условия изменит неопределенность заключения. В самом простом виде 
это можно представить так:  

1) если А (с неопределенностью x), то B (с неопределенностью f (x))  
Предположим, что помимо правила 1, имеется следующее правило:  
2) если C (с неопределенностью x), то B (с неопределенностью g(x))  
Если мы получаем информацию о том, что A имеет меру неопределенности 

а, С – с, то каким образом в данном случае определить меру неопределенности 
B?  

Существует несколько методик, позволяющих учитывать неопределен-

ность в системах, основанных на правилах,  наиболее популярны среди них – 
нечеткая логика и функции ожиданий Демпстера-Шефера [33]. Общее у этих 
методик то, что неопределенность в них рассматривается только локально, поэтому 
во многих случаях они приводят к некорректным заключениям.  

 

1.2. Нейронные сети 

 

Нейронные сети состоят из нескольких слоев узлов: верхний слой пред-

ставлен узлами входа, нижний – узлами выхода, а между ними расположены 
скрытые слои. Все узлы данного слоя (за исключением узлов выхода) связаны 
со всеми узлами нижележащего слоя. Узел вместе с входящими в него ребрами 
называют персептроном (perceptron).  

Нейронные сети используются, например, для распознавания образов. 

Опишем кратко принцип работы нейронной сети по распознаванию рукописных 
писем. Для этого первоначально текст рукописного письма должен быть 
преобразован в ряд данных. Сеть должна иметь узел входа для каждого вида 
данных и узел выхода для каждой буквы алфавита. При поступлении в сеть набора 
данных система должна преобразовывать их в эквивалентные им буквы. 
Для этого узлам входа задается значение 0 или 1. Это значение передается узлам 
следующего слоя. Каждый из этих узлов определяет взвешенную сумму 
поступивших к нему значений, и, если эта сумма больше, чем определенный 
порог, значение данного узла принимается равным 1. Значение узлов выхода 
определяет соответствующую букву.  

Таким образом, важными параметрами нейронной сети, помимо ее архи-

тектуры (числа слоев и числа узлов в каждом слое), являются веса и пороги, которые 
устанавливаются путем обучения сети. Для этого необходимо располагать 
множеством примеров, в которых известны значения входов и выходов. 
После введения их в алгоритм обучения сети, веса и пороги определяются таким 
образом, чтобы различие между значениями выходов сети и значениями 
выходов в данных примерах было как можно меньше.  

Нейронные сети могут успешно применяться для моделирования областей, 

для которых характерна неопределенность. Если отношения неопределены (например, 
в медицинской диагностике) то нейронная сеть, при соответствующем 
обучении, способна найти наиболее вероятный диагноз при данном наборе 
симптомов. Однако нейронная сеть не позволяет получить следующий наибо-
лее вероятный диагноз и, вероятно, самый существенный ее недостаток – определить 
при каких предположениях о данной области предложенный диагноз 
является наиболее вероятным.  

 

1.3. Байесовы сети 

 

Байесовы сети (БС) (Bayesian networks) также называют сетями Байеса 

(Bayes nets), причинными вероятностными сетями (causal probabilistic networks), 
байесовыми сетями доверия (Bayesian belief networks), или сетями доверия (be-
lief networks).  

БС содержит набор узлов и направленных ребер между ними. Ребра отра-

жают причинно-следственные отношения внутри данной проблемной области. 
Эти следствия обычно не полностью детерминированы (например, болезнь → 
симптом). «Сила» причинно-следственных связей задается условной вероятностью: 


1) если тонзиллит, то P(температура> 37.9) = 0.75  
2) если коклюш, то P (температура> 37.9) = 0.65  
Эти выражения не являются правилами, они могут быть записаны и в дру-

гом виде:  

P (температура > 37.9 | коклюш) = 0.65 
БС, главным образом, используются для уточнения вероятности наступле-

ния событий по мере поступления новой информации. Математическим основанием 
такого пересчета служит теорема Байеса [6]:  

 

 P (A×B) = P (А| B) × P (B) = P (B | A) × P (A)       (1.1) 

 

Любой узел БС может быть конкретизирован1, поскольку информация при 

данном подходе может передаваться и против направления ребер сети. Кроме 
того, возможен одновременный ввод информации в несколько узлов БС.  

 

Сравнение байесовых сетей и систем, основанных на правилах 

 
В отличие от систем, основанных на правилах, БС используют глобальную 

перспективу для учета неопределенности. И, если модель и вводимая в нее информация 
корректны, может быть доказано, что байесов подход к пересчету вероятностей 
верен, с точки зрения соответствия аксиомам классической теории 
вероятностей.  

Существенная разница между системами, основанными на правилах, и 

системами, основанными на БС, состоит в том, что первые пытаются моделировать 
способ аргументации эксперта, поэтому и называются экспертными системами (
expert systems); а вторые пытаются моделировать зависимости в самой 
проблемной области, поэтому их чаще называют системами поддержки реше-

 

1 Узел БС считается конкретизированным, если его состояние становится известно. 
ний или нормативными экспертными системами (decision support systems or 
normative expert systems). 

 

Сравнение байесовых сетей и нейронных сетей  

 

Фундаментальное различие между нейронными и БС состоит в том, что в 

нейронной сети персептрон скрытого уровня не имеет содержательной интерпретации 
в терминах данной проблемной области (нейронные сети, по сути, являются 
черными ящиками), в то время как все узлы БС определены, с точки 
зрения проблемной области.  Значение каждой вершины БС может быть предметом 
дискуссии безотносительно к функции данной вершины в сети. В нейронной 
сети вершины скрытых уровней имеют значение только в контексте их 
функций в сети. Это означает, что построение БС требует детального знания 
проблемной области. Если же такое знание может быть получено только путем 
изучения серии примеров, то нейронная сеть является более предпочтительной, 
например, распознавание рукописных текстов или воссоздание лица человека 
по костям черепа.  

БС часто подвергаются критики в связи с тем, что для их использования 

необходим большой набор значений условных вероятностей.  Однако, для моделирования 
областей с помощью нейронной сети также необходимо существенное 
количество значений порогов и весов, которые могут быть получены 
только путем обучения сети. В этом и состоит существенный недостаток нейронных 
сетей – эксперт не может использовать те знания, которые он имеет заранее (
априорно).  

И, наконец, в нейронной сети направление логического вывода заранее за-

дано, с этой точки зрения БС более гибкий модельный аппарат. 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2. Введение в байесовы технологии 

 

2.1. Теория Байеса и байесовы сети 
 
Bayesian networks are a marriage between probability theory and graph theory. 
Fundamental to the idea of a graphical model is the notion of modularity – a com-
plex system is built by combining simpler parts. Probability theory provides the glue 
whereby the parts are combined, ensuring that the system as a whole is consistent. 

                                                                                            Kevin Murphy, 1998 

 
Байесовы сети  – это союз теории вероятностей и теории графов. От теории 
графов они унаследовали идею модульности: представление сложной 
системы в виде совокупности простых. Теория вероятностей же служит 
интегратором, посредством которого эти элементы соединяются, обеспечивая 
состоятельность системы в целом. 
                                                                                                 Кевин Мерфи, 1998 
 

        Томас Байес2  
         (1702-1761) 

 
Основоположником байесова подхода является английский священник и 

ученый 18-го века Томас Байес (Thomas Bayes, 1702-1761 гг.). Как и большинство 
ученых тех лет, Т. Байес наибольшее внимание уделял вопросам 
теологии и даже находился на духовной службе. Так, при его жизни не вышло 
ни одной научной работы, так или иначе посвященной вопросам математики. 
И уже после смерти Т. Байеса в 1763 г. была опубликована его работа «Эссе о 
решении проблем в теории случайных событий» («An essay towards solving a 
Problem in the Doctrine of Chance») в «Философских трудах Королевского общества» («
Philosophical Transaction»), которая и увековечила имя ученого. 

Теорема Байеса: Пусть имеется несколько несовместных событий (гипо-

тез) H1,…,Hn, вместе составляющих полную группу событий, и событие В, которое 
может наступить только при одной из этих гипотез; тогда условная апостериорная (
байесова) вероятность 
),
|
(
B
Н
Р
i
 𝑖 = 1, 𝑛
         при условии, что событие 

В произошло, выражается через априорную вероятность P(Hi) по формуле Бай-
еса [6]:  

    

P(Hi|B) = P(B|Hi) × P(Hi)

P(B)
,    

                           P(B) > 0,                 (2.1) 

 
𝑃(В) называют знаменателем формулы Байеса или свидетельством (evi-

dence) и вычисляется по формуле полной вероятности [6]:  

 

PP(В) =  P(B|Hi) × P(Hi).

n

i=1

        (2.2) 

 

2 Рисунок взят из http://www.bioquest.org/products/auth_images/422_bayes.gif (30.12.2015) 
𝑃(𝐵|𝐻𝑖) определяют как функцию правдоподобия (likelihood). Априорная 
вероятность P(Hi) показывает не реальное распределение вероятности, а лишь 
наилучшее знание (или оценку, или даже предположение) о нем.  

 
Формула Байеса отражает, что 
 

Апостериорное распределение ∝ Априорное распределение × Правдоподобие,    

 
и основывается на концепции т.н. экспертной субъективной вероятности, под 
которой стоит понимать меру доверия субъекта к утверждению, степень уверенности 
в его справедливости. При этом важно понимать, что экспертом может 
выступать не только высококвалифицированный специалист в определенной 
предметной области, но и любые накопленные неформализованные данные. 
Байесовы вероятности могут быть получены и из эмпирических данных с 
помощью специальных алгоритмов, которые будут рассмотрены далее (подраздел 
3.4.3). 

Таким образом, подход, предложенный Байесом, по сути, позволяет на ос-

новании апостериорной информации о поведении исследуемой системы уточнять 
априорные ожидания. 

Байесов подход реализуется в байесовых сетях, которые представляют со-

бой графовые модели описания отношений между переменными в проблемной 
области в условиях неопределенности.  

Пусть некоторая проблемная область 𝑈 состоит из множества переменных 

𝑈 = {𝑥1 , … , 𝑥𝑛}, тогда БС данной проблемной области представляет собой 
множество 
локальных 
распределений 
условных 
вероятностей  

𝑃(𝑥𝑖|𝑥1, … , 𝑥𝑖−1, 𝑥𝑖+1, … , 𝑥𝑛) и множество утверждений об отношениях условной 
независимости переменных (см. подраздел 2.2), которые позволяют генерировать 
ациклический направленный граф, представляющий ее структуру.  

Переменные проблемной области в БС выражаются в виде узлов (вершин), 

а условные вероятностные зависимости между ними – в виде направленных дуг 
(ребер). Количественно эти зависимости определяются через ряд распределений 
(таблиц) условных вероятностей (ТУВ).  

Следует заметить, что в традиционной постановке БС не предназначены 

для работы с непрерывными случайными переменными, однако уже разработаны 
некоторые программные решения, позволяющие применять в сетях переменные, 
подчиняющиеся нормальному закону распределения. БС, включающие 
как дискретные, так и непрерывные переменные, принято называть гибридными 
БС (Hybrid Bayesian network). 

Таким образом, БС состоит из следующих понятий и компонент: 
 множество случайных переменных и направленных причинно-

следственных связей между ними; 

 каждая переменная может принимать одно из конечного множества 

взаимоисключающих состояний; 
 переменные вместе со связями образуют ориентированный ацикличе-

ский граф; 

 каждой переменной В, имеющей А1,…,Аm переменных-предков, задает-

ся набор распределений условных вероятностей P(Вk | А11,…,Amn). 

 

 

 

Рис. 2.1. Графическая модель БС 

 
Согласно топологии БС, представленной на рис. 2.1, узлы А1,…,Аm являют-

ся предками (родителями, предшествующими узлами) узла-потомка (последующего 
узла) В. Наличие причинно-следственной связи от вершины Аj, 
𝑗 = 1, 𝑚
           к вершине B указывает на то, что нахождение Аj, 𝑗 = 1, 𝑚
          в состоянии 

i, 𝑖 = 1, 𝑛
        (Аji ) оказывает влияние на состояние B.  
Узлу В, имеющему родительские узлы А1,…,Аm, назначается набор распре-

делений P(Вk| А11,…,Amn), значения которых показывают условную вероятность 
нахождения узла в определенном состоянии, заданном определенной конфигурацией 
состояний его родителей. Задание распределений вероятностей по всем 
сочетаниям состояний родителей узла принципиально, так как в противном 
случае, будет потеряна информация об эффектах совместного влияния этих переменных. 
Таким образом, число ячеек в ТУВ узла определяется числом возможных 
состояний данного узла и числом возможных состояний его родителей: 

 

N = b ×  aj,              (2.3)

j=1,m

 

где N – число значений условных вероятностей, задаваемых  
             данному узлу; 
        b – число возможных состояний данного узла;  
        aj – число возможных состояний j-го родителя данного узла; 

                                m – число родителей данного узла.  

 

Если переменные булевы, то N = 2𝑛+1. Таким образом, задача задания 

значений распределений условных вероятностей экспоненциально зависит от 
количества предков узла. Поэтому, БС стараются строить так, чтобы минимизировать 
число предков у каждого узла.  

Для узлов, не имеющих родительских переменных, используются распре-

деления маргинальных (безусловных) вероятностей. 

 
 
 

А1

B

Аm
…..
Итак, строго БС представляет собой набор [33, 34] 
 

𝑁 = (𝐺, 𝑋, 𝑃), где 

– G = (V, E) – ациклический направленный граф с узлами V = (v1, … , vn) 

и направленными дугами E, задающими отношения условной независимости 
переменных сети так, что если два узла vi и vj d-разделены3 при свидетельстве 
ε, то P(vi|ε) = P(vi|vj, ε); 

– X – набор случайных переменных, представляющих узлы V =

(v1, … , vn) графа G; 

– P – набор распределений условных вероятностей P(xV|xpa(V)) для каж-

дой случайной переменной xv ∈ X. 

 
Рассмотрим пример БС, ставший уже классическим – «Яблоня» [32]. Про-

блемная область данного примера – маленький сад, принадлежащий Джеку. 
Однажды Джек обнаружил, что его самая лучшая яблоня лишилась листвы. Он 
хочет выяснить причину произошедшего. Джек знает, что часто листва опадает 
в случае, если дерево засыхает из-за недостатка влаги, или, если дерево болеет. 

Данная ситуация может быть смоделирована БС, содержащей три узла: 

Sick (Болеет), Dry (Засохло) и Loses (Облетело) (рис. 2.2). 

 

 

Рис. 2.2. Пример «Яблоня» 

 

Каждый узел данной БС может принимать два возможных состояния: узел  

Болеет – состояние «болеет» (sick) и «нет» (not), узел Засохло – состояние «засохло» (
dry) и «нет» (not), узел Облетело – состояние «да» (yes) и «нет» (not).    

  Рассматриваемая БС моделирует факт того, что имеется причинно-

следственная связь от события Болеет к событию Облетело и от события Засохло 
к событию Облетело. В БС это отображено стрелками. 

На рис. 2.2 дано графическое представление БС. Однако это только качест-

венное представление БС.  Для того чтобы определить сеть как БС, необходимо 
ее дополнить количественными данными, то есть ТУВ.  

 

Табл. 2.1. P(Sick) 

Sick=«sick»
Sick=«not»

0.1
0.9

Табл. 2.2. P(Dry)

Dry=«dry»
Dry=«not»

0.1
0.9

 

3 Понятие d-разделения узлов сети вводится в подразделе 2.2. 
Доступ онлайн
350 ₽
В корзину