Введение в системное проектирование интеллектуальных баз знаний
Покупка
Тематика:
Общенаучное знание и теории
Издательство:
Горячая линия-Телеком
Авторы:
Баркалов Сергей Алексеевич, Душкин Александр Викторович, Колодяжный Сергей Александрович, Сумин Виктор Иванович
Под ред.:
Новосельцев Виктор Иванович
Год издания: 2017
Кол-во страниц: 108
Дополнительно
Вид издания:
Монография
Уровень образования:
ВО - Магистратура
ISBN: 978-5-9912-0589-4
Артикул: 660634.02.99
Книга вводит читателя в новую область теории и практики информатизации человеческой деятельности - системное проектирование интеллектуальных баз знаний. Издание содержит семь основных разделов - системные принципы построения интеллектуальных баз знаний; языковые средства представления знаний; технологии представления знаний; нейросетевые методы представления знаний; типовые методы поиска решений в интеллектуальных базах знаний; оценка качества проектов по созданию интеллектуальных баз знаний; основы управления проектами по созданию интеллектуальных баз знаний. В основу монографии положены авторские методики, успешно апробированные при проектировании и разработке ряда информационно-коммуникационных систем в различных отраслях народного хозяйства. Для научных работников и специалистов в области автоматизированных систем управления. Будет полезна аспирантам и студентам старших курсов, специализирующимся в области проблем информатизации социальных, экономических, технологических и других процессов.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Магистратура
- 02.04.02: Фундаментальная информатика и информационные технологии
- 09.04.01: Информатика и вычислительная техника
- 09.04.02: Информационные системы и технологии
- 09.04.03: Прикладная информатика
- 10.04.01: Информационная безопасность
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Москва Горячая линия - Телеком 2017 Под общей редакцией доктора техн. наук, профессора В. И. Новосельцева
УДК 004.89 ББК 32.813 В24 Р е ц е н з е н т ы : начальник кафедры высшей математики Воронежского института МВД России, доктор физ.-мат. наук, профессор В. В. Меньших; декан факультета прикладной математики, информатики и механики Воронежского государственного университета, доктор техн. наук, профессор А. И Шашкин. А в т о р ы : Баркалов С. А., Душкин А. В., Колодяжный С. А., Сумин В. И. В24 Введение в системное проектирование интеллектуальных баз знаний / С. А. Баркалов, А. В. Душкин, С. А. Колодяжный и др.; Под общей редакцией доктора техн. наук, профессора В. И. Новосельцева. – М.: Горячая линия – Телеком, 2017. – 108 с: ил. ISBN 978-5-9912-0589-4. Книга вводит читателя в новую область теории и практики информатизации человеческой деятельности – системное проектирование интеллектуальных баз знаний. Издание содержит семь основных разделов – системные принципы построения интеллектуальных баз знаний; языковые средства представления знаний; технологии представления знаний; нейросетевые методы представления знаний; типовые методы поиска решений в интеллектуальных базах знаний; оценка качества проектов по созданию интеллектуальных баз знаний; основы управления проектами по созданию интеллектуальных баз знаний. В основу монографии положены авторские методики, успешно апробированные при проектировании и разработке ряда информационно-коммуникационных систем в различных отраслях народного хозяйства. Для научных работников и специалистов в области автоматизированных систем управления. Будет полезна аспирантам и студентам старших курсов, специализирующимся в области проблем информатизации социальных, экономических, технологических и других процессов. ББК 32.813 Научное издание Баркалов Сергей Алексеевич, Душкин Александр Викторович, Колодяжный Сергей Александрович, Сумин Виктор Иванович Введение в системное проектирование интеллектуальных баз знаний Под общей редакцией доктора техн. наук, профессора В. И. Новосельцева Монография Тиражирование книги начато в 2017 г. Все права защищены. Любая часть этого издания не может быть воспроизведена в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения правообладателя © ООО «Научно-техническое издательство «Горячая линия – Телеком» www.techbook.ru © Авторы
Введение Наше время — это эпоха интенсивного внедрения информационных технологий практически во все сферы человеческой деятельности. Ожидается, что такая тенденция не только сохранится, но будет прогрессировать в обозримом будущем. В практическом плане эти технологии реализуются в виде различных информационнокоммуникационных систем, типа ГАС РФ «Выборы» и «Правосудие», разнообразных отраслевых АСУ, действующих в общесоюзных, республиканских, краевых и областных министерствах и ведомствах, многочисленных информационных и экспертных систем предприятий, организаций и фирм. Неотъемлемой составной частью, а точнее душой всех систем этого типа становятся интеллектуальные базы знаний, которые в первом приближении можно определить как особого рода информационно-программные комплексы, способные напрямую (без посредников) вести диалог с человеком и оперировать при этом не только данными, но, главным образом, знаниями (метаданными). В настоящее время для построения интеллектуальных баз знаний используются готовые программные продукты типа Oracle, MSSQL, SyBASE и другие, дополняемые различными программными модулями, в которые по схеме «естественный язык → компьютерная программа» закладываются знания о проблемной области. В результате получается некий бессистемный конгломерат, в котором первичной выступает программная среда, отражающая в основном предметные и частично лингвистические данные, а декларативные, процедурные и лингвистические знания присутствуют постольку, поскольку это допускают возможности данного программного продукта и квалификация программистов-разработчиков. Другими словами, основу существующей технологии поддержки проектных решений при создании интеллектуальных баз знаний составляет принцип: «делаем то, что можем, а не то, что нужно». Негативные последствия такого подхода очевидны: конечный пользователь, владеющий максимальными знаниями о предметной области, фактически исключается из процесса проектирования и разработки баз знаний. В результате на выходе проекта он получает не то, что ему нужно для обеспечения профессиональной деятельности, а то, что могут сделать программистыразработчики, используя имеющиеся программные платформы. И обусловлено это не квалификацией программистов и не низкими функциональными возможностями используемых программных продуктов, а самой технологией поддержки проектных решений по созданию интеллектуальных баз знаний.
Введение Если исключить из рассмотрения многочисленные подробности «технического» плана, то смысл и сущность традиционной технологии проектирования баз знаний заключается в непосредственном переводе описаний предметной области с естественного языка на математикопрограммный язык, «понятный» компьютеру. А такой перевод фактически исключает конечного пользователя из процесса проектирования баз знаний, оставляя ему только «начало» — формирование замысла проекта, и «конец» — приемку готового проекта. Именно ограниченность палитры используемых языковых средств обусловливает все те трудности, которые приходится преодолевать разработчикам проектов по созданию интеллектуальных баз знаний, и предопределяет те неудачи, которые фактически превращают компьютеры не в интеллектуальных партнеров человека, а в «хранилище» данных, печатающие машинки или в быстродействующие логарифмические линейки. Таким образом, в настоящее время имеет место и все более прогрессирует реальное противоречие между насущной потребностью широкого внедрения и использования интеллектуальных баз знаний и несовершенством применяемых технологий их проектирования. При этом негативное последствие заключается в том, что конечный пользователь, оставаясь в стороне от процесса проектирования баз знаний, в конечном счете получает не актуального помощника, а некоторый программный продукт, кое-как подстроенный под его нужды. Вместе с тем в современной теории искусственного интеллекта происходит интенсивное развитие новых языковых средств, в частности реляционного и ролевого типов. Эти языки позволяют записывать и генерировать правила логического вывода (то есть работать с декларативными знаниями), а также создавать управляющие структуры, обеспечивающие вывод новых знаний (то есть оперировать с процедурными знаниями). Их использование открывает новые возможности по описанию фактов и закономерностей предметной области, и позволяет предложить более совершенную технологию поддержки принятия проектных решений в процессе проектирования и создания интеллектуальных баз знаний, свободную от указанных выше недостатков. Однако специалисты в области информатизации еще не полностью преодолели инерцию традиционного мышления. Многие из них по-прежнему рассматривают проектирование интеллектуальных баз знаний как искусство программирования с ориентацией на существующие программные продукты (языки программирования, стандартные базы данных, типовые интерфейсы и т.п.), но не как науку, опирающуюся на системную методологию, технологию, модели анализа и оптимизации проектных решений. В преодолении этой порочной традиции
авторы видели свою основную задачу при написании монографии. Монография содержит семь глав, в которых обобщен опыт более чем двадцатилетней деятельности авторов в области системного проектирования интеллектуальных баз знаний в составе объектов автоматизации различного (в том числе и военного) назначения. Первая глава посвящена описанию системных принципов построения интеллектуальных баз знаний, включая такие вопросы, как: организация общения между пользователем и базой знаний; модели машинного понимания входных текстов; структура интеллектуальной базы знаний и режимы ее работы. Во второй главе проводится анализ существующих и перспективных языковых средств представления знаний. В качестве объектов анализа рассматриваются: язык Кодда, логические языки, язык нечетких множеств, контекстно-свободный плекс-язык, язык RX-кодов, язык семантических сетей, язык ролевых фреймов, тензорный язык Крона. Суть анализа заключалась в упорядочении указанных языков по двум критериям: выразительности и мощности его инструментальных средств. Третья глава посвящена технологиям представления знаний. Рассматривается общая технология, базирующаяся на принципах этапности, последовательного наращивания уровня формализации представления знаний при переходе от этапа к этапу, поддержки проектных решений путем использования четырех частных технологий, а именно: представления знаний ролевыми фреймами, на основе концептуальных и терминальных семантических сетей, а также построения процедурной компоненты базы знаний. Раскрывается содержание этих технологий и показывается, что они обладают по сравнению с традиционно используемой процедурой «естественный язык → компьютерная программа» тем преимуществом, что позволяют заменить эвристические соображения строго формальными методами задания единиц знаний, снизить требования к языкам программирования, а также более полно использовать знания конечного пользователя о предметной области. В четвертой главе рассматриваются нейросетевые методы представления знаний, включая такие вопросы, как: основные идеи нейроинформатики применительно к построению интеллектуальных баз знаний; базовые элементы и архитектура нейросетей. В пятой главе описываются типовые методы поиска решений, которые, целесообразно реализовывать при системном проектировании интеллектуальных базах знаний, а именно: поиск решений на семантических сетях, ситуационный поиск решений, многокритериальный поиск решений и поиск решений на основе генетических алгоритмов.
Введение Первые два метода применяются в тех предметных областях, в которых оперируют не столько числами, сколько понятиями и нестрогими категориями. Два других метода эффективны в тех случаях, когда предметную область удается описать числами и строгими математическими соотношениями. Шестая глава посвящена описанию методов оценки качества интеллектуальных баз знаний. В отличие от существующих фрагментарных подходов, предлагаемые в монографии методы обеспечивают всесторонний и комплексный учет социальных, функциональных, эргономических, прагматических, экономических, технических и технологических критериев качества интеллектуальных баз знаний, выраженных как в числовых, так и в понятийных категориях. В седьмой главе рассматриваются вопросы управления проектами по созданию интеллектуальных баз знаний, включая особенности, концепцию и технологию управления данными проектами, а также неопределенности при управлении проектами и способы их учета.
Глава 1 Системные принципы построения интеллектуальных баз знаний 1.1. Понятие интеллектуальной базы знаний Под интеллектуальной базой знаний (ИБЗ) понимается управляемый комплекс языковых, алгоритмических, программных и технических средств, предназначенных для восприятия, обработки, хранения и выдачи (отображения) знаний о предметной области, включающий четыре компоненты: 1) упорядоченные каким-либо способом факты и данные, отражающие модель профессиональной сферы (предметные данные); 2) правила, модели, алгоритмы и программы, позволяющие рассчитывать определенные показатели объектов профессиональной сферы, строить цепочки логических выводов и на этой основе делать обобщения и заключения, а также вызывать определенные ассоциации (декларативные знания); 3) управляющая и интерпретирующая структура, определяющая порядок и способы применения моделей и правил логического вывода для получения или трансформации информации (процедурные знания); 4) правила морфологического, синтаксического и семантического анализа входных и выходных текстов, а также списки основ слов, которые используются для организации диалога между базой знаний и пользователем (лингвистические знания). Если оставить в стороне практически бесплодные рассуждения о том, чем данные отличаются от знаний, то с точки зрения системотехники различия между понятиями «база данных» и «база знаний» можно выразить в виде следующих формул: «база данных» = «предметные данные» + «управление данными» + + «лингвистические единицы»; «интеллектуальная база знаний» = «предметные данные» + +«декларативные знания» + «процедурные знания» + +«лингвистические знания». Как видно из приведенного определения, ИБЗ, охватывая традиционное понимание баз данных, представляют собой их дальнейшее развитие и наращивание по следующим главным направлениям: – интеллектуализации общения с конечным пользователем в форме, не требующей участия в диалоге посредника-программиста;
Глава 1 – формирование моделей проблемных ситуаций по их содержательному описанию, представленному пользователем; – расширения понятия «данные» от уровня чисел, текстов, схем и других простейших информационных атрибутов до уровня закономерностей, правил, алгоритмов и других операций, обеспечивающих интеллектуальную поддержку принятия управленческих решений в условиях неопределенности; – обеспечение семантической целостности знаний и данных, их проверку на полноту, корректность и определенность; – усложнения алгоритмов обработки информации до уровня имитации таких интеллектуальных механизмов мышления человека как: анализ и обобщение информации, построение логических цепочек вывода новых утверждений, генерация альтернативных вариантов решений, поиск оптимальных решений и других; – планирование вычислений и логической обработки данных с целью решения сформулированных пользователем задач количественного и качественного анализа моделей проблемных ситуаций; – оформление, интерпретация и отображение результатов решения задач в удобном для пользователя виде. Таким образом, ИБЗ, будучи реализованной в компьютере, предоставляет пользователю следующие возможности. Пользователь на своем профессиональном языке (разумеется, по необходимости ограниченном и формализованном) вводит в компьютер описание проблемной ситуации, ставит задачи ее анализа и задает исходные данные. После чего компьютер сам формирует программу решения этих задач, решает задачи, производит анализ результатов и выдает ответы в удобном для пользователя виде (графическом, текстовом, картографическом и др.). При этом основной эффект перехода от баз данных к интеллектуальным базам знаний заключается в более полном удовлетворении потребностей пользователя информацией, необходимой ему для принятия решений, за счет повышения статуса компьютера и компьютерных сетей, поставляющих конечному пользователю не только информацию к размышлению, но и мотивированные варианты возможных решений. Естественно, что речь идет не об однократном решении какой-либо задачи, а о диалоговом общении пользователя с ИБЗ при многократном повторением цикла: подготовка исходных данных, решение задачи, анализ решения, коррекция исходных данных.
Системные принципы построения интеллектуальных баз знаний 9 1.2. Принцип организации общения между пользователем и ИБЗ Под общением понимается процесс обмена информацией между пользователем и ИБЗ, обусловленный необходимостью последовательного и/или параллельного выполнения человеком и машиной действий по совместному решению какой-либо задачи. Наиболее распространенным и интересным с позиции проектирования видом общения является диалог, инициируемый ИБЗ при решении задач, поставленных пользователем. Традиционная схема такого диалога века показана на рис. 1.1. t%!,!%"=…,2/ ,=%= o=…,!%"=…,b/K%! ƒ==, o%ƒ%"=2hag b/K%! "=!,=…2= ,“.%…/. =……/. o!%"!*= C%…%2/ ,“.%…/. =……/. p…,ƒ==, `…=,ƒ !…, j%!!*2,!%"*= ,“.%…/. =……/. o!,/L "=!,=…2 !…, ƒ==, b/C%……,C%%2%",2…/. %C!=,L Рис. 1.1. Схема диалога, инициируемого ИБЗ при решении задач, поставленных пользователем Здесь предполагается, что вся совокупность информации, необходимой для решения прикладной задачи, доступна пользователю. Однако в действительности каждого пользователя интересует сравнительно небольшое количество так называемых персонально-ориентированных задач, и он в состоянии варьировать лишь некоторой частью параметров, описывающих предметную область, и критериев выбора решений.
Глава 1 В результате при полном доступе пользователю может поступать излишняя информация, на которую тратятся вычислительные ресурсы, а время между введением новой корректировки параметров и получением решения может оказаться неприемлемо большим. Этого можно избежать, если при построении ИБЗ использовать принцип гибкого формирования персонально-ориентированных задач с соответствующим уровнем детализации и специализацией информации, предоставляемой пользователю, как показано на рис. 1.2. o%ƒ%"=2, "!.…% 3!%"… o%ƒ%"=2, …,›…% 3!%"… o!“%…=…% %!,…2,!%"=……/ƒ==, …,›…% 3!%"… o!“%…=…% %!,…2,!%"=……= ƒ=== "!.…% 3!%"… h“.%…= ƒ=== hag Рис. 1.2. Принцип формирования персонально-ориентированных задач при построении ИБЗ На этом рисунке в персонально-ориентированных задачах нижнего уровня оставлены без изменения некоторые параметры исходной задачи, а остальные параметры подвергнуты агрегированию. Такие задачи можно назвать частично агрегированными. Они позволяют конкретному пользователю, работая с ИБЗ, оперировать только тем набором информации, который его интересует и входит в его компетенцию. Внесение изменений в частично агрегированные задачи позволяет исследовать определенный аспект проблемной области, проанализировать внутренние взаимосвязи и выбрать наиболее эффективные решения. Персонально-ориентированная задача верхнего уровня строится в терминах агрегированных параметров, состав и способ построения