Интелектуальные информационные технологии
Учеб. пособие
Покупка
Год издания: 2005
Кол-во страниц: 304
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 5-7038-25-44
Артикул: 065825.02.99
Интеллектуальные информационные технологии — одна из наиболее перспективных и быстро развивающихся научных и прикладных областей информатики. В учебном пособии рассматриваются ее основные направления: обработка текстов на естественном языке, моделирование знаний и базы знаний, управление знаниями, распознавание образов, нейротехнологии, интеллектуализация Internet, концептуальное программирование и др. Основное внимание уделяется математическим моделям, методам и инструментальным средствам разработки программного обеспечения интеллектуальных автоматизированных систем.
Содержание учебного пособия основано на материалах, используемых авторами в учебном процессе в МГТУ им. Н.Э. Баумана и МЭИ (ТУ).
Для студентов высших технических учебных заведений, изучающих информационные технологии и методы их интеллектуализации. Может быть полезно аспирантам и специалистам, занимающимся данной проблематикой.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Информатика в техническом университете
Информатика в техническом университете Серия основана в 2000 году РЕДАКЦИОННАЯ КОЛЛЕГИЯ: чл.-кор. РАН КБ. Федоров — главный редактор д-р техн. наук КП. Норенков — зам. главного редактора д-р техн. наук Ю.М. Смирнов — зам. главного редактора д-р техн. наук В.В. Девятков д-р техн. наук В.В. Емельянов канд. техн. наук КП. Иванов д-р техн. наук В.А. Матвеев канд. техн. наук КВ. Медведев д-р техн. наук В. В. Сюзев д-р техн. наук Б.Г. Трусов д-р техн. наук В.М. Черненький д-р техн. наук В.А. Шахнов
А.и. Башмаков, И.А. Башмаков Интеллектуальные информационные технологии Допущено Министерством образования и науки Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки дипломированных специалистов «Информатика и вычислительная техника» Москва Издательство МГТУ имени Н.Э. Баумана 2005
УДК 004.8:681.3.06(075.8) ББК 32.813+32.973.26-018.2я73 Б336 Р е ц е н з е н т ы : д-р техн. наук, профессор И.П. Норенков (Московский государственный технический университет им. Н.Э. Баумана); кафедра «Компьютерные технологии и системы» Московского государственного университета прикладной биотехнологии (зав. кафедрой профессор Ю.А. Ивашкин); кафедра «Вычислительные машины, системы и сети» Московского энергетического института (технического университета) (зав. кафедрой профессор И.И. Ладыгин) Башмаков А.И., Башмаков И.А. Интеллектуальные информациБ336 онные технологии: Учеб. пособие. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. - 304 с : ил. — (Информатика в техническом университете). ISBN 5-7038-2544-Х Интеллектуальные информационные технологии — одна из наиболее перспективных и быстро развивающихся научных и прикладных областей информатики. В учебном пособии рассматриваются ее основные направления: обработка текстов на естественном языке, моделирование знаний и базы знаний, управление знаниями, распознавание образов, нейротехнологии, интеллектуализация Internet, концептуальное программирование и др. Основное внимание уделяется математическим моделям, методам и инструментальным средствам разработки программного обеспечения интеллектуальных автоматизированных систем. Содержание учебного пособия основано на материалах, используемых авторами в учебном процессе в МГТУ им. Н.Э. Баумана и МЭИ (ТУ). Для студентов высших технических учебных заведений, изучающих информационные технологии и методы их интеллектуализации. Может быть полезно аспирантам и специалистам, занимающимся данной проблематикой. УДК 004.8:681.3.06(075.8) ББК 32.813+32.973.26-018.2я73 © А.И. Башмаков, И.А. Башмаков, 2005 ISBN 5-7038-2544-Х © МГТУ им. Н.Э. Баумана, 2005
ОГЛАВЛЕНИЕ ПРЕДИСЛОВИЕ 8 СПИСОК ОСНОВНЫХ СОКРАЩЕНИЙ 11 СТРУКТУРА ИССЛЕДОВАНИЙ В ОБЛАСТИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 15 ВВЕДЕНИЕ 17 1. ТЕХНОЛОГИЯ КОНЦЕПТУАЛЬНОГО ПРОГРАММИРОВАНИЯ 21 1.1. Основы теории концептуального профаммирования 21 1.2. Инструментарий концептуального профаммирования 28 Вопросы для самопроверки 29 2. ТЕХНОЛОГИИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ОБРАЗОВ 32 2.1. Основные понятия теории автоматического распознавания образов 32 2.2. Примеры программной реализации OCR-систем 35 Вопросы для самопроверки 40 3. АВТОМАТИЗАЦИЯ РАБОТЫ СО ЗНАНИЯМИ, ПРЕДСТАВЛЕННЫМИ В ТЕКСТОВОМ ВИДЕ 41 3.1. Основы гипертекстовой информационной технологии 41 3.1.1. Основные понятия гипертекстовой информационной технологии 42 3.1.2. Формализованная модель гипертекста 44 3.1.3. Условно-типовая модель гипертекста 47 3.1.4. Инструментальные средства для создания гипертекста 49 3.1.5. Гипертекстовые информационно-поисковые системы 55 3.1.6. Методы извлечения знаний для построения гипертекста 61 3.1.7. Автоматизация построения гипертекста 62 3.1.8. Место гипертекстовой информационной технологии среди технологий искусственного интеллекта 63 Вопросы для самопроверки 66 3.2. Автоматизированное извлечение знаний из текста 67 3.2.1. Проблема понимания текста на естественном языке 67 5
Оглавление Ъ22. Компьютерные методы поиска в тексте 69 Вопросы для самопроверки 76 3.3. Автоматическое реферирование и аннотирование 77 Вопросы для самопроверки 89 3.4. Машинный перевод 90 Вопросы для самопроверки 96 3.5. Автоматическая классификация документов 96 Вопросы для самопроверки 99 3.6. Комплексные интеллектуальные программные системы для обработки текстов 100 3.6.1. Комплексный смысловой анализатор текста Text Analyst 100 3.6.2. Промышленная информационно-поисковая система Excalibur RetrievalWare 107 3.6.3. Пакет NeurOK Semantic Suite 113 Вопросы для самопроверки 118 4. МЕТАДАННЫЕ ДЛЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ 120 4.1. Системы и модели метаданных 120 4.2. Семантический web и платформа XML 128 Вопросы для самопроверки 133 5. МОДЕЛИРОВАНИЕ ЗНАНИЙ О ПРЕДМЕТНЫХ ОБЛАСТЯХ КАК ОСНОВА ИНТЕЛЛЕКТУАЛЬНЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ 135 5.1. Категория знания 135 Вопросы для самопроверки 146 5.2. Модели знаний 147 Вопросы для самопроверки 156 5.3. Сетевые модели знаний 157 5.3.1. Модель Ml —расширенные семантические сети 157 5.3.2. Модель Ml — неоднородные семантические сети 160 5.3.3. Модель МЬ — нечеткие семантические сети 162 5.3.4. Модель Л/4 — обобщенная модель представления знаний о предметной области 164 Вопросы для самопроверки 172 5.4. Онтологический подход и его использование 173 5.4.1. Понятие онтологии 173 5.4.2. Основные задачи, решаемые с помощью онтологии 175 5.4.3. Модель онтологии 181 5.4.4. Методики построения онтологии и требования к средствам их спецификации 184 5.4.5. Обзор наиболее известных онтологических проектов 191 5.4.6. Примеры использования онтологии 194 Вопросы для самопроверки 197 5.5. Основы технологии баз знаний 198 5.5.1. Общие положения 198 6
Оглавление 5.5.2. Система операций для работы со знаниями в базе знаний 200 5.5.3. Элементарные операции 200 5.5.4. Комплексные операции 206 Вопросы для самопроверки 230 6. НЕЙРОННЫЕ СЕМИОТИЧЕСКИЕ СИСТЕМЫ 231 6.1. Общая характеристика направления 231 6.2. Нейропакеты 237 6.3. Модели сенсорных и языковой систем человека 246 Вопросы для самопроверки 251 7. СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ 253 7.1. Общая характеристика направления 253 Вопросы для самопроверки 256 7.2. Технологии хранилищ данных и интеллектуального анализа данных 256 7.2.1. Основные понятия 256 7.2.2. Технология OLAP и многомерные модели данных 258 7.2.3. Глубинный анализ данных 262 Вопросы для самопроверки 265 7.3. Системы поддержки инновационной деятельности 266 Вопросы для самопроверки 279 ЗАКЛЮЧЕНИЕ 280 СПИСОК ОСНОВНОЙ ЛИТЕРАТУРЫ 282 СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ 283 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 298
к 175-летию МГТУ имени Н.Э. Баумана ПРЕДИСЛОВИЕ Эволюция информационных технологий и систем все в большей степени определяется их интеллектуализацией. Интеллектуальные информационные технологии — одна из наиболее перспективных и быстро развивающихся научных и прикладных областей информатики. Она оказывает существенное влияние на все научные и технологические направления, связанные с использованием компьютеров, и уже сегодня дает обществу то, что оно ждет от науки, — практически значимые результаты, многие из которых способствуют кардинальным изменениям в сферах их применения. Целями интеллектуальных информационных технологий являются, во-первых, расширение круга задач, решаемых с помощью компьютеров, особенно в слабоструктурированных предметных областях, и во-вторых, повышение уровня интеллектуальной информационной поддержки современного специалиста. Ключевым компонентом научного фундамента интеллектуальных информационных технологий является искусственный интеллект (ИИ). Для создания и развития ИИ как научного направления за рубежом много сделали И. Винер, У. Маккаллох, У. Питтс, Д. Маккарти (который впервые ввел термин «artificial intelligence»), Ф. Розенблат, А. Сазерленд, М. Минский, С. Пейперт, А. Ньюэлл, Г. Саймон, Дж. Шоу, Э. Фейгенбаум, А. Кольмероэ, Н. Хомский, Т. Виноград, М. Куиллиан, Р. Шенк, И. Кильсон, П. Уинстон, Л. Заде, Р. Редди, Д. Ленат, Дж. Хинтон, Дж. Андерсон, Ж.-Л. Лорьер и многие другие. В СССР, а затем в России со становлением и развитием ИИ связывают имена А.А. Ляпунова, А.И. Берга, Г.С. Поспелова, М.Л. Цетлина, М.М. Бонгарда, М.А. Гаврилова, А.П. Ершова, В.Н. Пушкина, Л.Т. Кузина, А.С. Нариньяни, А.И. Половинкина, В.В. Чавчанидзе, В.К. Финна, Э.В. Попова, Э.Х. Тыугу, Н.Н. Непейводы, И.П. Кузнецова, О.И. Ларичева, А.И. Галушкина, А.Н. Горбаня, А.В. Чечкина и многих других. Следует отметить исключительную роль Д.А. Поспелова и его научной школы: В.Н. Вагина, Т.А. Гавриловой, А.П. Еремеева, Г.С. Осипова, В.Ф. Хорошевского и др. Настоящее учебное пособие предназначено для студентов вузов, изучающих информационные технологии и методы их интеллектуализации, а также аспирантов и специалистов, занимающихся данной проблематикой. Оно основано на материалах, используемых авторами в учебном процессе в
Предисловие МГТУ им. Н.Э. Баумана и МЭИ (ТУ). Его содержание в значительной мере охватывает вопросы, связанные с интеллектуализацией информационных технологий и систем, входящие в учебные программы дисциплин «Системы искусственного интеллекта», «Информационные технологии», «Интеллектуальные подсистемы САПР», «Представление знаний в информационных системах», «Технология разработки программного обеспечения интеллектуальных автоматизированных систем», «Интеллектуальные системы», «Основы искусственного интеллекта», «Интеллектуальные информационные системы» и других дисциплин в рамках направлений подготовки «Информатика и вычислительная техника» (ОКСО 230100), «Информационные системы» (ОКСО 230200), «Информационные технологии» (ОКСО 010400), «Прикладная математика и информатика» (ОКСО 010500), «Прикладная математика» (ОКСО 230400). Основными задачами учебного пособия являются: 1) формирование представлений о классах и структуре программного обеспечения (ПО) интеллектуальных автоматизированных систем (ИАС), в особенности об инвариантном к предметной области ядре ПО ИАС; 2) создание представлений о методах, математическом аппарате и инструментальных средствах разработки ПО ИАС во взаимосвязи с обеспечивающими подсистемами ИАС: комплексом технических средств, а также математическим, лингвистическим и информационным обеспечениями; 3) приобретение знаний и умений, связанных с технологическим подходом к разработке ПО ИАС. Использование технологического подхода к разработке ПО обеспечивает: • концептуальное единство всех частей программного проекта; • интеграцию и координацию деятельности отдельных исполнителей, в том числе программистов, в рамках единого проекта; • совмещение разработки программной документации с ходом реализации проекта; • повышение производительности труда программистов; • повышение надежности и качества программного продукта; • снижение стоимости разработки программного продукта; • повышение границы сложности программных проектов. Учебное пособие состоит из введения, семи глав и заключения. Во введении представлены задачи учебного пособия, укрупненная функциональная модель интеллектуальной системы и структура исследований в области ИИ. Главы и параграфы пособия соотносятся с направлениями данной структуры. В первой главе изложены теоретические основы технологии концептуального программирования и дана характеристика ее реализации в серии программных решателей пакета решения инженерных задач (ПРИЗ).
Предисловие Во второй главе отражены основные понятия технологии автоматического распознавания образов. Вопросы ее реализации рассмотрены на примерах ведущих российских систем оптического чтения текстов. Третья глава посвящена автоматизации работы со знаниями, представленными в текстовом виде. В ней описаны гипертекстовые модели и системы, методы извлечения знаний из текста и компьютерного поиска в тексте, технологии автоматического реферирования и аннотирования, машинного перевода и автоматической классификации документов. Завершает главу характеристика комплексных интеллектуальных программных систем для обработки текстов: комплексного смыслового анализатора текста Text Analyst, промышленной информационно-поисковой системы ЕхсаИЬш" RetrievalWare, пакета NeurOK Semantic Suite. В четвертой главе отражено современное состояние работ в области метаданных для информационных ресурсов. Главное внимание уделено роли метаданных в обеспечении интеллектуализации WWW. Охарактеризованы универсальная система метаданных «Дублинское ядро» и модель RDF. Рассмотрены направления интеллектуализации Internet (концепция семантического web). Приведен перечень стандартов и спецификаций, составляющих ядро платформы XML, служащей технологической основой семантического web. Пятая глава пособия является главной. Она посвящена вопросам моделирования знаний о предметных областях и роли этих моделей и методов в ИАС. Изложены современные представления о категории знаний. Приведен обзор базовых моделей знаний. Рассмотрены четыре модели семантических сетей. Дана развернутая характеристика онтологического подхода. Описаны концептуальные основы технологии баз знаний. Шестая глава представляет технологии нейронных семиотических систем. Рассмотрены основные понятия нейротехнологий, структура работ в области нейрокибернетики, классификация, характеристики и примеры нейропакетов, а также подход к моделированию сенсорных и языковой систем человека искусственными нейронными сетями. Седьмая глава посвящена системам управления знаниями. В ней дана характеристика технологий хранилищ данных и интеллектуального анализа данных, а также систем поддержки инновационной деятельности в технических областях. 10