Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Информатика и лингвистика

Покупка
Основная коллекция
Артикул: 363600.06.01
К покупке доступен более свежий выпуск Перейти
Данное учебное пособие предназначено для изучения дисциплины «Информатика и лингвистика». В нем рассматриваются основные аспекты построения информационных, экспертных и лингвистических систем; основные аспекты информационной безопасности различных информационных систем, а особенно САПР. При этом особое внимание уделяется следующим подсистемам: • лингвистическое обеспечение, в частности для САПР с экспертным сопровождением; • информационное обеспечение; • информационная безопасность. Соответствует требованиям Федерального государственного образовательного стандарта высшего образования последнего поколения. Учебное пособие ориентировано на читателей, не знакомых с теоретическими аспектами лингвистики. Программа одноименной дисциплины предполагает, что материалы изучаются в курсе по выбору, со значительной долей самостоятельности. Пособие предназначено для студентов, дипломников и аспирантов технических вузов.

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №34 Вашего печатного экземпляра.

Волосатова, Т. М. Информатика и лингвистика : учебное пособие / Т.М. Волосатова, Н.В. Чичварин. — Москва : ИНФРА-М, 2021. — 196 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — DOI 10.12737/16175. - ISBN 978-5-16-010977-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1212524 (дата обращения: 22.11.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов
ИНФОРМАТИКА 
И ЛИНГВИСТИКА

УЧЕБНОЕ ПОСОБИЕ

Т.М. ВОЛОСАТОВА
Н.В. ЧИЧВАРИН

Москва
ИНФРА-М
2021

Рекомендовано в качестве учебного пособия 
для студентов высших учебных заведений,
обучающихся по направлениям подготовки 
09.03.01 «Информатика и вычислительная техника»,
10.03.01 «Информационная безопасность» 
(квалификация (степень) «бакалавр»)

УДК 004(075.8)
ББК 73я73
 
В68

Волосатова Т.М.

Информатика и лингвистика : учебное пособие / Т.М. Волосатова, 

Н.В. Чичварин. — Москва : ИНФРА-М, 2021. — 196 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — DOI 10.12737/16175.

ISBN 978-5-16-010977-0 (print)
ISBN 978-5-16-103015-8 (online)
Данное учебное пособие предназначено для изучения дисциплины 

«Информатика и лингвистика». В нем рассматриваются основные аспекты построения информационных, экспертных и лингвистических систем; 
основные аспекты информационной безопасности различных информационных систем, а особенно САПР. При этом особое внимание уделяется 
следующим подсистемам:

• лингвистическое обеспечение, в частности для САПР с экспертным 

сопровождением;

• информационное обеспечение;
• информационная безопасность.
Соответствует требованиям Федерального государственного образова
тельного стандарта высшего образования последнего поколения.

Учебное пособие ориентировано на читателей, не знакомых с теорети
ческими аспектами лингвистики.

Программа одноименной дисциплины предполагает, что материалы 

изучаются в курсе по выбору, со значительной долей самостоятельности. 
Пособие предназначено для студентов, дипломников и аспирантов технических вузов.

УДК 004(075.8)

ББК 73я73

В68

ISBN 978-5-16-010977-0 (print)
ISBN 978-5-16-103015-8 (online)

Подписано в печать 16.10.2020. 

Формат 6090/16. Бумага офсетная. Гарнитура Newton. 

Печать цифровая. Усл. печ. л. 12,25.

ППТ20. Заказ № 00000

ТК 363600-1212524-251115

Отпечатано в типографии ООО «Научно-издательский центр ИНФРА-М»

127214, Москва, ул. Полярная, д. 31В, стр. 1

Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29

Материалы, отмеченные знаком 
, доступны 

в электронно-библиотечной системе Znanium.com

© Волосатова Т.М., 

Чичварин Н.В., 2016

ФЗ 

№ 436-ФЗ

Издание не подлежит маркировке 
в соответствии с п. 1 ч. 4 ст. 11

Введение

Данная книга обобщает опыт преподавания дисциплин «Лингвистическое обеспечение САПР», «Информационная безопасность», 
«Стеганография», «Криптография». Перечисленные дисциплины 
обобщаются в направлении «Информационные технологии». Наиболее близкой по сути и формальным признакам является дисциплина «Компьютерная лингвистика», которая в настоящее время 
становится сложившимся результатом органичного синтеза методов 
информатики и классической лингвистики. Перед компьютерной 
лингвистикой стоят прежде всего задачи лингвистического обеспечения процессов сбора, накопления, обработки и поиска информации. Наиболее важными из них являются:
 
• автоматизация составления и лингвистической обработки машинных словарей;
 
• автоматизация процессов обнаружения и исправления ошибок 
при вводе данных в ЭВМ;
 
• автоматическое индексирование документов и информационных 
запросов;
 
• автоматическая классификация, спецификация и реферирование 
документов, в частности проектных документов;
 
• лингвистическое обеспечение процессов поиска данных в одноязычных и многоязычных базах данных;
 
• построение лингвистических процессоров, обеспечивающих 
общение пользователей с автоматизированными интеллектуальными информационными системами (в частности, с экспертными системами) на естественном языке или на языке, близком 
к естественному.
Среди множества перечисленных направлений дисциплины пока 
не рассматриваются в полном объеме вопросы, связанные с автоматизированным проектированием различных технических объектов, 
т.е. систем автоматизированного проектирования (САПР) и САПР 
с экспертными компонентами. Основной проблемой развития собственно САПР является проблема облегчения доступа проектантов 
к средствам проектирования. Поэтому вопросы, связанные с построением интеллектуального интерфейса в среде САПР, становятся все 
более актуальными. Данное пособие названо «Информатика и лингвистика», что подчеркивает неформальную и глубокую связь между 
теоретическими и прикладными проблемами информатики и лингвистики. 

Следует заметить, что два вида обеспечений САПР называются 
информационным и лингвистическим. Нарастающие проблемы 
безопасности информационных систем требуют решения проблемы 
разработки подсистем САПР, обеспечивающих информационную 
безопасность. В настоящее время вопросам безопасности информационных систем уделяется нарастающее внимание. Решающую 
роль в этом направлении играет руководство Российской Федерации. 
В указе Президента РФ от 10.01.2000 «О концепции национальной 
безопасности Российской Федерации» определена необходимость 
дальнейших разработок в этом направлении. Если в области безопасности информационных систем так называемого общего назначения 
уже накоплен большой теоретический и практический опыт, то в области информационной безопасности (ИБ) САПР специальных 
комплексных разработок не ведется. Становится актуальной задача 
защиты сообщений, передаваемых по открытым и закрытым каналам 
связи. Характерный пример: в США спущены на воду три подводные 
лодки. Одна из них — «Дж. Картер» — предназначена для перехвата 
сообщений, передаваемых по волоконным линиям связи. По радиоканалу перехваченный сигнал передается на Землю. Известно, что 
в штате Юта (США) расположен центр приема, обработки и хранения данных. Емкость СУБД составляет 130 Йбайт. 
Типичная процедура перехвата сообщений заключается в следующем: батискаф обеспечивает возможность «втягивать» кабель 
на борт лодки. Затем кабель взрезается и вытаскивается волокно. 
Волокно подвергается механическому воздействию, например изгибу. Как известно, при изгибе волокна нарушается полное внутреннее отражение и происходит утечка излучения. Мощности излучения достаточно для перехвата передаваемых данных по радиоканалу с помощью специальных радиостанций даже из-под воды. 
Данный пример показывает, что для понимания задач выработки 
методов и средств защиты от несанкционированного доступа необходимо понимание вопросов передачи сигналов по различным 
каналам, а также средств обеспечения информацией различных 
систем. В связи с этим перечисленным ранее вопросам уделяется 
значительное внимание на кафедрах «САПР», «Информацонная безопасность» и на многих других кафедрах МГТУ им. Н.Э. Баумана. 
Исторически сложившийся «русский метод» подготовки инженеров основан на самостоятельном изучении разнородных дисциплин и методов проектирования технических объектов.

Перечень основных сокращений

ВОЛС — волоконно-оптическая линия связи
ИБ — информационная безопасность
КПС — канал передачи сообщений
НДВ — недокументированные возможности
НСД — несанкционированный доступ
ОВ — оптическое волокно
САПР — система автоматизированного проектирования
CALS — сопровождение объекта проектирования в период жизненного 
цикла изделия

Глава 1. 
ЦЕЛИ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ

Основная цель изучения дисциплины — освоение знаний об информационных и лингвистических системах. Классификация информационных систем (ИС) представлена на рис. 1.1.

Рис. 1.1. Классификация информационных систем, рассматриваемых в книге

Наиболее яркий пример рассматриваемых задач — обеспечение 
ИБ САПР. Практическое применение методов решения рассматриваемых задач заключается в решении задач САПР, систем связи, 
способов кодирования и шифрования сообщений, передаваемых 
по различным линиям связи, защиты от несанкционированного 
доступа. Как уже отмечалось ранее, для организации защиты сообщений от несанкционированного доступа необходима постоянная 
поддержка безопасности открытых каналов передачи сообщений. 
Она необходима при использовании технологии поддержки проекта 
в период всего жизненного цикла изделия. 
Классификация основных лингвистических систем представлена 
на рис. 1.2 (именно с учетом этой структуры произведен аналитический обзор доступных публикаций).
Суть концепции PLM заключается в обеспечении информационной и организационной поддержки всех этапов жизненного цикла 
изделия. «Выпадение» даже одного этапа препятствует сквозному 
течению потока информации и не позволяет цифровой модели полноценно существовать. В машиностроительной отрасли такой разрыв 
наиболее часто происходит между стадиями проектирования изделия 
и производства. По большей части проблемы возникают в области 
технологической подготовки производства из-за традиционного 
разделения сфер ответственности между конструкторскими бюро 
и серийными заводами, ограниченной возможности реализации тех
Информационные системы

Автоматизированные 
системы (АС)

Системы автоматизированного проектирования

Системы (каналы) передачи 
сообщений

Экспертные 
системы (ЭС)

Лингвистика

Теоретическая лингвистика

Системы машинного 
перевода
Средства тайнописи
Лингвистические 
подсистемы САПР

Экспериментальная лингвистика

Рис. 1.2. Классификация основных лингвистических систем

Среда облачных 
вычислений

Экспертная компонента

Организационное 
обеспечение

Методическое обеспечение

Математическое 
и программное обеспечение

Лингвистическое 
обеспечение

Программно-аппартное обеспечение 
(включая обеспечение 
линий связи)

Информационное 
обеспечение
(включая архив прототипов)

Обеспечение
информационной 
безопасности

Рис. 1.3. Cтруктура среды САПР/PLM

процессов в PLM-системах или просто из-за недостатка внимания 
к этой области. 
Анализ доступных публикаций показал, что, опираясь только 
на возможности PLM-платформ (даже таких комплексных, как 
Teamcenter от Siemens PLM Software, Windchill от PTC и Enovia 
от Dassault Systemes), как правило, не удается полноценно реализовать поддержку технологической подготовки производства, правильно и точно описать технологические процессы и управлять ими. 
На деле это означает, что формирование документации по технологической подготовке производства, ее передача в электронном виде 
между конструкторскими и производственными подразделениями, 
а также поддержание документации в актуальном состоянии как минимум затруднены или вовсе неосуществимы. Из-за этого возникает 
целый ряд ограничений — например, когда на этапе проектирования 
нет возможности учитывать особенности технологии изготовления 
или ограничения производственной базы предприятия. 
На рис. 1.3 не показана структура технологической подготовки, 
так как она является структурой самостоятельной системы. В идеальной архитектуре решения для автоматизации предприятия САПР 
технологических процессов (ТП) являются частью (самостоятельным 
модулем) PLM-системы, обеспечивая двустороннюю передачу информации. В настоящее время существует множество локальных 
САПР ТП, которые успешно решают задачи в своей области. Наиболее известными являются «Вертикаль» от АСКОН, Timeline от SDI 
Solutions, TECHCARD от Intermech. Анализ показал, что интеграция 
САПР ТП с системами управления данными об изделии (Product 
Data Management, PDM) во многих случаях может быть осуществлена штатными средствами, особенно если обе системы от одного 
производителя.

Глава 2. 
МОДЕЛЬНОЕ ПРЕДСТАВЛЕНИЕ 
ИНФОРМАЦИОННЫХ И ЛИНГВИСТИЧЕСКИХ 
СИСТЕМ

2.1. ЭЛЕМЕНТЫ ТЕОРИИ СИСТЕМ

Строгого определеления термина «система» пока нет. С учетом 
специфики настоящей системы предлагается принять следующее 
определение: «Система — это взаимосвязанная и необходимая совокупность функционально законченных компонент, каждая из которых в той или иной мере определяет функциональное назначение».
Научной базой системного подхода (в широком смысле) является 
математическая теория систем, представляющая собой развивающуюся область прикладной математики, которая находится на стыке 
теории информации, теории управления и теории автоматов. Вопросы, которые она изучает, связаны с исследованием сложных реальных технических макрообъектов (систем), состоящих из большого числа разнообразных элементов, которые обмениваются между 
собой входными и выходными сигналами.
Однако науку о системах нельзя считать сложившейся, так как существует много направлений системных исследований, нет единства 
терминологии. Как правило, в упомянутых выше и других публикуемых работах рассматривается один из подходов или методов системных исследований, одна из точек зрения. Отсутствуют работы, 
в которых были бы объединены подходы и концепции разных авторов, изучено обобщенное представление о развиваемых методах 
и применяемых моделях системных исследований, даны рекомендации по выбору подхода и метода в конкретных условиях. Поэтому 
в данной главе дан краткий обзор определяющих понятий математической теории систем, освещена разработка ее новых ведущих, 
прежде всего структуралистских, положений в таком плане, в каком 
они могут быть использованы для описания структуры и поведения 
исследуемой структуры.
Далее в работе принято следующее определение: «информация — 
мера неопределенности в пространстве событий». Далее будет показано, что в работе различаются следующие меры:
 
• вероятностная (по Шеннону);
 
• структурная (по Хартли);
 
• семантическая;

• прагматическая. (Эта мера вводится авторами как разновидность 
семантической меры. И та и другая рассматриваются в приложениях лингвистики.)
Сообщение может передаваться (храниться) следующими носителями: книга, видео и аудио, сигнал.
Таким образом, принимается, что сообщение может быть логическим носителем информации. Передача сообщений осуществляется по некоторому каналу в виде сигналов (кодов сообщений). 
Состав сигнала характеризуется следующей иерархией (сверху вниз):
 
• собственно сигнал (программа для ЭВМ, книга);
 
• предложение (часть книги, оператор программы, музыкальная 
фраза и т.д.);
 
• слово;
 
• буква, нота (терминальный элемент).
Канал передачи сообщений на архитектурном уровне абстрагирования представляет собой заданную совокупность средств передачи 
(рис. 2.1). На рис. 2.2 представлена логическая структура КПС.

Рис. 2.2. Логическая структура КПС

2.2. ИНФОРМАЦИОННАЯ И ЛИНГВИСТИЧЕСКАЯ СТРУКТУРЫ

Информационная и лингвистическая структуры принимаются 
как совокупность воззрений на язык и методов его исследования, 
в основе которых лежит понимание языка как знаковой системы. 
Понятие «структуры» используется и в программировании. Именно 

Первичное пространство событий

Пространство 
сообщений

Вторичное пространство событий

Рис. 2.1. Архитектурная схема канала передачи сообщений

Индуктор
Линия связи

Источники активных и пассивных помех, 
дезинформации

Перципиент

К покупке доступен более свежий выпуск Перейти