Логические нейронные сети
Покупка
Издательство:
ИНТУИТ
Автор:
Барский А. Б.
Год издания: 2016
Кол-во страниц: 354
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-94774-646-4
Артикул: 828752.01.99
На основе положений математической логики событий исследуется возможность построения логических нейронных сетей, выполняющих операции вывода в составе систем искусственного интеллекта, имитирующих механизмы работы мозга.
Предлагаются методы построения обученных нейронных сетей, созданных «под задачу», простые методы обучения-трассировки, методы преобразования описаний систем принятия решений для повышения достоверности выводов. Рассматривается возможность применения логических нейронных сетей в самообучающихся системах управления, а также в различных системах экономики, транспорта, безопасности, защиты информации, при решении задач интеллектуального отображения, в бизнесе туризма и развлечений, при политическом и социальном прогнозировании и в других задачах науки и искусства.
Тематика:
ББК:
УДК:
- 004: Информационные технологии. Вычислительная техника...
- 621: Общее машиностроение. Ядерная техника. Электротехника. Технология машиностроения в целом
ОКСО:
- ВО - Бакалавриат
- 13.03.02: Электроэнергетика и электротехника
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Логические нейронные сети 2-е издание, исправленное Барский А.Б. Национальный Открытый Университет “ИНТУИТ” 2016 2
УДК 004.032.26(07) ББК 8 Б26 Логические нейронные сети / Барский А.Б. - M.: Национальный Открытый Университет “ИНТУИТ”, 2016 (Основы информационных технологий) ISBN 978-5-94774-646-4 На основе положений математической логики событий исследуется возможность построения логических нейронных сетей, выполняющих операции вывода в составе систем искусственного интеллекта, имитирующих механизмы работы мозга. Предлагаются методы построения обученных нейронных сетей, созданных «под задачу», простые методы обучения-трассировки, методы преобразования описаний систем принятия решений для повышения достоверности выводов. Рассматривается возможность применения логических нейронных сетей в самообучающихся системах управления, а также в различных системах экономики, транспорта, безопасности, защиты информации, при решении задач интеллектуального отображения, в бизнесе туризма и развлечений, при политическом и социальном прогнозировании и в других задачах науки и искусства. (c) ООО “ИНТУИТ.РУ”, 2007-2016 (c) Барский А.Б., 2007-2016 3
Математическая логика событий Приводятся основные положения раздела математической логики - алгебры высказываний. Совершается переход от булевых значений переменных - высказываний - к действительным переменным, отображающим достоверность высказываний о событиях. Представляются основные положения и выводы, необходимые при построениях в области логических нейронных сетей. 1.1 Булева концепция алгебры высказываний о событиях ” Ученые объяснения большей частью производят то впечатление, что бывшее ясно и понятно становится темно и запутанно”. Определение 1. Предполагаемое или свершившееся действие, его фигурант, результат, а также условия свершения, называются событием . Определение 2. Событие выражается высказыванием о его свершении. Высказыванию о событии (далее - просто высказывание, считая событие и высказывание о нем синонимами) можно поставить в соответствие переменную, которая в рамках булевой концепции может принимать значение ИСТИНА (1) или ЛОЖЬ (0). Например: x = <поезд опоздал на пять минут>; y = <в данной операции принимал участие Вася> (достаточно сообщить лишь имя); z = <скорость автомобиля принадлежит диапазону (120-140 км/ч)> (достаточно кратко обозначить диапазон в известном контексте, как условие свершения некоторого действия, приведшего к автокатастрофе). Очевидно, что каждая переменная x, y, z может принимать одно из двух значений - 0 или 1. Над высказываниями производятся логические операции. В рамках последующих построений потребуются четыре операции: отрицание ( , НЕx, x ), конъюнкция ( И, AND, x ), дизъюнкция ( ИЛИ, OR ), импликация или операция следования ( ). Результаты операций определяются таблично. Предполагая достаточные знания слушателей, можно напомнить: одноместная операция отрицания меняет значение переменной на противоположное; двуместная операция конъюнкции над двумя и (рекурсивно) более переменными порождает значение 1 тогда и только тогда, когда все переменные имеют значение 4
1; двуместная операция дизъюнкции над двумя и (рекурсивно) более переменными порождает значение 1, когда хотя бы одна переменная имеет значение 1; переменная справа от знака операции следования (импликации) принимает значение 1 тогда и только тогда, когда выражение слева от этого знака имеет значение 1. Кроме того, ниже используется операция ИСКЛЮЧАЮЩЕЕ ИЛИ, предполагающая возможность лишь единственного вхождения переменной со значением 1 в операцию дизъюнкции, объединяющую несколько переменных. Переход от высказываний к их булевой интерпретации, к булевым переменным, вводит в действие все законы, свойства и правила эквивалентных преобразований, известные из булевой алгебры. Закон коммутативности: (1.1) Закон ассоциативности: (1.2) Закон дистрибутивности: (1.3) Закон де Моргана: (1.4) Закон идемпотенции: (1.5) Закон поглощения: (1.6) Закон склеивания: (1.7) 5
Операция переменной с инверсией: (1.8) Операция с константами: (1.9) Двойное отрицание: (1.10) Несмотря на наличие дистрибутивных операций, существует ранжирование операций в сторону понижения (ранга) слева направо: , То есть если написано без скобок , то с помощью эквивалентного обозначения и скобок можно выявить следующий порядок действий: . 1.2. Логические функции высказываний Множество логических переменных - высказываний о событиях {x1, x2, …, xn} в контексте некоторого приложения образует пространство событий размерности n. Точка этого пространства является ситуацией. Можно записать произвольную композицию на основе заданного множества переменных-высказываний и логических операций, например, , . Почему первую композицию следует считать бессмысленной? По-видимому, потому, что она содержит конструкции, не определенные в терминах алгебры логики, и не может быть исчерпывающим образом преобразована в таковые на основе применения (1)-(10). Тогда вторая приведенная композиция имеет смысл, т.к. полностью подвержена основным определениям операций алгебры логики и правилам преобразования в ней. Высказывания (о событиях ) в качестве переменных могут входить в состав сложных формирований - логических функций, принимающих (булевы) значения 1 (ИСТИНА) или 0 (ЛОЖЬ). Определение 3. Имеющая смысл линейно-скобочная композиция операций над переменными-высказываниями x1, x2, …, xn, образующими пространство событий, задает логическую функцию f(x1, x2, …, xn), принимающую для различных ситуаций, т.е. наборов значений переменных, значения 0 или 1. Таким образом, логическая функция является булевой функцией ситуаций. В классической теории булевых функций [1] показывается, что каждая такая функция может быть представлена дизъюнктивной и (или) конъюнктивной нормальной формой. В первом случае ее структура выражается как дизъюнкция конъюнкций, во втором 6
как конъюнкция дизъюнкций. Рассмотрим две логические функции и . Выражение Y представлено дизъюнктивной нормальной формой ( ДНФ ). Выражение Z соответствует конъюнктивной нормальной форме (КНФ), практически не применяемой. Преобразуем . (Учитывается, что .) Это - дизъюнктивная нормальная форма. Практически, например, при конструировании электронных устройств, известно наперед, какой сигнал на отдельно взятом выходе должен формироваться при различных значениях сигналов на входе. Тогда значения логической функции, описывающей формирование сигнала на данном выходе, задаются таблично, в зависимости от всех возможных ситуаций на входе. По такой таблице аналитическое выражение для искомой логической функции формируется в виде совершенной дизъюнктивной нормальной формы (СДНФ). Ее общий вид продемонстрируем на примере трех переменных: (1.11) Для всех значений переменных рассчитаем значения приведенных выше логических функций Y и Z (табл. 1.1). Таблица 1.1. Значения логических функций x1 x2 x3 Y Z 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 0 1 1 1 0 1 0 0 1 1 1 0 1 1 0 1 1 0 1 1 7
1 1 1 1 Попытаемся построить приведенные выше функции Y и Z на основе их СДНФ, т.е. проверим правильность такого подхода: После эквивалентных преобразований (начинающихся с вынесения x1 “за скобку”) получим , что совпадает с видом Y. Аналогично, После эквивалентных преобразований находим Из табл. 1.1 видно, что все значения Z и Z* от одних и тех же наборов значений переменных совпадают. Однако Z* образуется только двумя “слагаемыми” Z. Конъюнкция оказалась “лишней”, не влияющей на результат. Это говорит о том, что формирование аналитического вида логической функции по ее табличному заданию, с помощью СДНФ, позволяет получить простейшее (лаконичное) представление, без лишних конструкций, не влияющих на результаты вычислений. В заключение этого раздела представим обобщение, построенное над СДНФ, - в соответствии с теоремой разложения, широко используемой при конструировании электронных схем на основе стандартного набора элементов. Как и ранее, продемонстрируем суть данной теоремы на примере четырех переменных: 1.3. Исчерпывающее множество событий Следующие ниже определения не могут не затронуть смысловых особенностей высказываний о событиях. Кроме чисто формальных свойств высказываний, выражающихся в их истинности или ложности, невозможно полностью абстрагироваться от содержательной сути или от контекста, в котором они звучат. Определение 4. Исчерпывающее множество событий (ИМС) образуют те события, совокупность высказываний, о которых покрывает весь возможный смысловой диапазон проявления объекта высказывания, и каждая допустимая ситуация характеризуется тем, что значение ИСТИНА (1) может принимать единственное высказывание из этой совокупности. (Значение 0 могут принимать все высказывания.) 8
Рассмотрим примеры. 1. В состав редколлегии входят трое: Иванов, Петров, Сидоров. Тогда провозглашение фамилий этих фигурантов определяет исчерпывающее множество событий при выдвижении единственного представителя коллектива в президиум собрания. 2. Наказуемое превышение скорости автомобиля делится на диапазоны: до 10%, от 10% до 20%, свыше 20%. Однако если в регламентирующем документе заданы только диапазоны до 10% и от 10% до 100%, то это не будет соответствовать исчерпывающему множеству событий. Такие нестрогие определения возможного диапазона ситуаций являются причиной юридической казуистики, требующей дальнейшего исследования прецедента. Итак, ИМС, которому соответствует множество высказываний А= {x1, …, xn}, характеризуется тем, что при соответствующих обстоятельствах одно и только одно высказывание из этого множества может принимать значение 1. Это и определяется операцией ИСКЛЮЧАЮЩЕЕ ИЛИ, которую будем обозначать . Очевидны главные свойства высказываний о событиях из ИМС: (1.12) (1.13) Теорема. Логическая функция от переменных-высказываний о событиях, образующих исчерпывающее множество событий, преобразуется в дизъюнкцию ИСКЛЮЧАЮЩЕЕ ИЛИ переменных-высказываний о событиях из этого множества. Доказательство. Поясним доказательство теоремы анализом примера. На множестве высказываний {x1, x2, x3}, СДНФ имеет вид Применив (1.12) и воспользовавшись свойством дистрибутивности (“раскрыв скобки”) в соответствии с (1.3), обнаружим, что каждая вновь полученная конъюнкция может принимать значение некоторой переменной, согласно (1.13), тогда и только тогда, когда эта переменная входит в нее ровно 3 раза (п раз). Это возможно лишь в тех конъюнкциях исходной СДНФ, где переменная, а не ее отрицание, входит при условии, что другие переменные входят со знаком отрицания. На такую ситуацию указывают те значения f, которые отмечены единственной единицей в составе переменных. Для приведенного примера СДНФ принимает вид: 9
Теорема доказана. Чтобы подчеркнуть, что задание ситуаций подчиняется условию операции , используем обозначение этой операции для получения окончательного вида СДНФ логической функции, заданной на ИМС: (1.14) Отметим важные свойства выражения (1.14). 1. Каждая переменная, участвующая в формировании этого выражения, входит в него единственный раз. 2. Единственность вхождения переменных достигнута на основе применения закона дистрибутивности с учетом свойств высказываний на исчерпывающем множестве событий. Назовем преобразование логической функции, приведшее к единственности вхождения переменных в каждую образующую его конъюнкцию, дистрибутивным. В чем еще смысл Теоремы 1? Представим себе ход рассуждения следователя, сокращающего круг подозреваемых. Первоначально он установил, что преступником мог быть либо Иванов, либо Петров, либо Сидоров, первоначально составляющие ИМС. Однако, исследовав некоторую логическую функцию f алиби или участия в преступлении, он установил, что f(Иванов = 1, Петров = 0, Сидоров = 0) = 0, в то время как f(Иванов = 0, Петров = 1, Сидоров = 0) = 1, f(Иванов = 0, Петров = 0, Сидоров = 1) = 1. Таким образом, f(Иванов, Петров, Сидоров) = Петров Сидоров. Это резко сужает круг подозреваемых, т.к. скорректированным исчерпывающим множеством событий является {Петров, Сидоров}. 1.4. Композиция исчерпывающих множеств событий. Дерево логических возможностей. Факторное пространство событий Для строгого логического мышления, исключающего неопределенность, приходится оперировать не отдельными событиями и даже не исчерпывающими множествами таких событий (высказываниями о них), а композициями таких множеств. Между событиями, принадлежащими различным множествам, возможна зависимость, порождающая сложные высказывания. Да и сами ИМС могут определяться и инициироваться обстоятельствами, обусловленными событиями из других ИМС. Связи между ИМС, образующие сложные высказывания, отображаются деревом логических возможностей. Рассмотрим пример. Пансионат для ветеранов труда обеспечивает постояльцам активный отдых круглый 10