Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Информатика и лингвистика

Покупка
Основная коллекция
Артикул: 363600.08.01
Доступ онлайн
от 236 ₽
В корзину
Данное учебное пособие предназначено для изучения дисциплины «Информатика и лингвистика». В нем рассматриваются основные аспекты построения информационных, экспертных и лингвистических систем; основные аспекты информационной безопасности различных информационных систем, а особенно САПР. При этом особое внимание уделяется следующим подсистемам: • лингвистическое обеспечение, в частности для САПР с экспертным сопровождением; • информационное обеспечение; • информационная безопасность. Соответствует требованиям Федерального государственного образовательного стандарта высшего образования последнего поколения. Учебное пособие ориентировано на читателей, не знакомых с теоретическими аспектами лингвистики. Программа одноименной дисциплины предполагает, что материалы изучаются в курсе по выбору, со значительной долей самостоятельности. Пособие предназначено для студентов, дипломников и аспирантов технических вузов.

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №34 Вашего печатного экземпляра.

Волосатова, Т. М. Информатика и лингвистика : учебное пособие / Т.М. Волосатова, Н.В. Чичварин. — Москва : ИНФРА-М, 2023. — 196 с. + Доп. материалы [Электронный ресурс]. — (Высшее образование: Бакалавриат). — DOI 10.12737/16175. - ISBN 978-5-16-010977-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1939086 (дата обращения: 29.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
ИНФОРМАТИКА 
И ЛИНГВИСТИКА

УЧЕБНОЕ ПОСОБИЕ

Т.М. ВОЛОСАТОВА
Н.В. ЧИЧВАРИН

Москва

ИНФРА-М

202Рекомендовано в качестве учебного пособия 

для студентов высших учебных заведений,
обучающихся по направлениям подготовки 

09.03.01 «Информатика и вычислительная техника»,

10.03.01 «Информационная безопасность» 

(квалификация (степень) «бакалавр»)

УДК 004(075.8)
ББК 73я73
 
В68

Волосатова Т.М.

Информатика и лингвистика : учебное пособие / Т.М. Волосатова, 

Н.В. Чичварин. — Москва : ИНФРА-М, 2023. — 196 с. + Доп. материалы [
Электронный ресурс]. — (Высшее образование: Бакалаври-
ат). — DOI 10.12737/16175.

ISBN 978-5-16-010977-0 (print)
ISBN 978-5-16-103015-8 (online)
Данное учебное пособие предназначено для изучения дисциплины 

«Информатика и лингвистика». В нем рассматриваются основные аспекты 
построения информационных, экспертных и лингвистических систем; 
основные аспекты информационной безопасности различных информационных 
систем, а особенно САПР. При этом особое внимание уделяется 
следующим подсистемам:

• лингвистическое обеспечение, в частности для САПР с экспертным 

сопровождением;

• информационное обеспечение;
• информационная безопасность.
Соответствует требованиям Федерального государственного образовательного 
стандарта высшего образования последнего поколения.

Учебное пособие ориентировано на читателей, не знакомых с теоретическими 
аспектами лингвистики.

Программа одноименной дисциплины предполагает, что материалы 

изучаются в курсе по выбору, со значительной долей самостоятельности. 
Пособие предназначено для студентов, дипломников и аспирантов технических 
вузов.

УДК 004(075.8)

ББК 73я73

В68

ISBN 978-5-16-010977-0 (print)
ISBN 978-5-16-103015-8 (online)

Подписано в печать 01.12.2022. 

Формат 6090/16. Бумага офсетная. Гарнитура Newton. 

Печать цифровая. Усл. печ. л. 12,25.

ППТ40. 

ТК 363600-1939086-251115

Отпечатано в типографии ООО «Научно-издательский центр ИНФРА-М»

127214, Москва, ул. Полярная, д. 31В, стр. 1

Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29

Материалы, отмеченные знаком 
, доступны 

в электронно-библиотечной системе Znanium

© Волосатова Т.М., 

Чичварин Н.В., 2016

ФЗ 

№ 436-ФЗ

Издание не подлежит маркировке 
в соответствии с п. 1 ч. 4 ст. 11

Введение

Данная книга обобщает опыт преподавания дисциплин «Лингвистическое 
обеспечение САПР», «Информационная безопасность», 
«Стеганография», «Криптография». Перечисленные дисциплины 
обобщаются в направлении «Информационные технологии». Наи-
более близкой по сути и формальным признакам является дисци-
плина «Компьютерная лингвистика», которая в настоящее время 
становится сложившимся результатом органичного синтеза методов 
информатики и классической лингвистики. Перед компьютерной 
лингвистикой стоят прежде всего задачи лингвистического обес-
печения процессов сбора, накопления, обработки и поиска инфор-
мации. Наиболее важными из них являются:
 
• автоматизация составления и лингвистической обработки ма-
шинных словарей;
 
• автоматизация процессов обнаружения и исправления ошибок 
при вводе данных в ЭВМ;
 
• автоматическое индексирование документов и информационных 
запросов;
 
• автоматическая классификация, спецификация и реферирование 
документов, в частности проектных документов;
 
• лингвистическое обеспечение процессов поиска данных в одно-
язычных и многоязычных базах данных;
 
• построение лингвистических процессоров, обеспечивающих 
общение пользователей с автоматизированными интеллектуаль-
ными информационными системами (в частности, с эксперт-
ными системами) на естественном языке или на языке, близком 
к естественному.
Среди множества перечисленных направлений дисциплины пока 
не рассматриваются в полном объеме вопросы, связанные с автома-
тизированным проектированием различных технических объектов, 
т.е. систем автоматизированного проектирования (САПР) и САПР 
с экспертными компонентами. Основной проблемой развития соб-
ственно САПР является проблема облегчения доступа проектантов 
к средствам проектирования. Поэтому вопросы, связанные с постро-
ением интеллектуального интерфейса в среде САПР, становятся все 
более актуальными. Данное пособие названо «Информатика и линг-
вистика», что подчеркивает неформальную и глубокую связь между 
теоретическими и прикладными проблемами информатики и линг-
вистики. 

Следует заметить, что два вида обеспечений САПР называются 
информационным и лингвистическим. Нарастающие проблемы 
безопасности информационных систем требуют решения проблемы 
разработки подсистем САПР, обеспечивающих информационную 
безопасность. В настоящее время вопросам безопасности инфор-
мационных систем уделяется нарастающее внимание. Решающую 
роль в этом направлении играет руководство Российской Федерации. 
В указе Президента РФ от 10.01.2000 «О концепции национальной 
безопасности Российской Федерации» определена необходимость 
дальнейших разработок в этом направлении. Если в области безопас-
ности информационных систем так называемого общего назначения 
уже накоплен большой теоретический и практический опыт, то в об-
ласти информационной безопасности (ИБ) САПР специальных 
комплексных разработок не ведется. Становится актуальной задача 
защиты сообщений, передаваемых по открытым и закрытым каналам 
связи. Характерный пример: в США спущены на воду три подводные 
лодки. Одна из них — «Дж. Картер» — предназначена для перехвата 
сообщений, передаваемых по волоконным линиям связи. По ради-
оканалу перехваченный сигнал передается на Землю. Известно, что 
в штате Юта (США) расположен центр приема, обработки и хра-
нения данных. Емкость СУБД составляет 130 Йбайт. 
Типичная процедура перехвата сообщений заключается в сле-
дующем: батискаф обеспечивает возможность «втягивать» кабель 
на борт лодки. Затем кабель взрезается и вытаскивается волокно. 
Волокно подвергается механическому воздействию, например из-
гибу. Как известно, при изгибе волокна нарушается полное внут-
реннее отражение и происходит утечка излучения. Мощности из-
лучения достаточно для перехвата передаваемых данных по радио-
каналу с помощью специальных радиостанций даже из-под воды. 
Данный пример показывает, что для понимания задач выработки 
методов и средств защиты от несанкционированного доступа не-
обходимо понимание вопросов передачи сигналов по различным 
каналам, а также средств обеспечения информацией различных 
систем. В связи с этим перечисленным ранее вопросам уделяется 
значительное внимание на кафедрах «САПР», «Информацонная без-
опасность» и на многих других кафедрах МГТУ им. Н.Э. Баумана. 
Исторически сложившийся «русский метод» подготовки инже-
неров основан на самостоятельном изучении разнородных дисци-
плин и методов проектирования технических объектов.

Перечень основных сокращений

ВОЛС — волоконно-оптическая линия связи
ИБ — информационная безопасность
КПС — канал передачи сообщений
НДВ — недокументированные возможности
НСД — несанкционированный доступ
ОВ — оптическое волокно
САПР — система автоматизированного проектирования
CALS — сопровождение объекта проектирования в период жизненного 
цикла изделия

Глава 1. 
ЦЕЛИ И ЗАДАЧИ ИЗУЧЕНИЯ ДИСЦИПЛИНЫ

Основная цель изучения дисциплины — освоение знаний об ин-
формационных и лингвистических системах. Классификация ин-
формационных систем (ИС) представлена на рис. 1.1.

Рис. 1.1. Классификация информационных систем, рассматриваемых в книге

Наиболее яркий пример рассматриваемых задач — обеспечение 
ИБ САПР. Практическое применение методов решения рассмат-
риваемых задач заключается в решении задач САПР, систем связи, 
способов кодирования и шифрования сообщений, передаваемых 
по различным линиям связи, защиты от несанкционированного 
доступа. Как уже отмечалось ранее, для организации защиты сооб-
щений от несанкционированного доступа необходима постоянная 
поддержка безопасности открытых каналов передачи сообщений. 
Она необходима при использовании технологии поддержки проекта 
в период всего жизненного цикла изделия. 
Классификация основных лингвистических систем представлена 
на рис. 1.2 (именно с учетом этой структуры произведен аналити-
ческий обзор доступных публикаций).
Суть концепции PLM заключается в обеспечении информаци-
онной и организационной поддержки всех этапов жизненного цикла 
изделия. «Выпадение» даже одного этапа препятствует сквозному 
течению потока информации и не позволяет цифровой модели пол-
ноценно существовать. В машиностроительной отрасли такой разрыв 
наиболее часто происходит между стадиями проектирования изделия 
и производства. По большей части проблемы возникают в области 
технологической подготовки производства из-за традиционного 
разделения сфер ответственности между конструкторскими бюро 
и серийными заводами, ограниченной возможности реализации тех-

Информационные системы

Автомати-
зированные 
системы (АС)

Системы авто-
матизирован-
ного проекти-
рования

Системы (ка-
налы) передачи 
сообщений

Экспертные 
системы (ЭС)

Лингвистика

Теоретическая лингвистика

Системы машинного 
перевода
Средства тайнописи
Лингвистические 
подсистемы САПР

Экспериментальная лингвистика

Рис. 1.2. Классификация основных лингвистических систем

Среда облачных 
вычислений

Экспертная компонента


Организационное 
обеспечение

Методическое обеспечение


Математическое 
и программное обеспечение


Лингвистическое 
обеспечение

Программно-ап-
партное обеспечение 
(включая обеспечение 
линий связи)

Информационное 
обеспечение
(включая архив прототипов)


Обеспечение
информационной 
безопасности

Рис. 1.3. Cтруктура среды САПР/PLM

процессов в PLM-системах или просто из-за недостатка внимания 
к этой области. 
Анализ доступных публикаций показал, что, опираясь только 
на возможности PLM-платформ (даже таких комплексных, как 
Teamcenter от Siemens PLM Software, Windchill от PTC и Enovia 
от Dassault Systemes), как правило, не удается полноценно реализовать 
поддержку технологической подготовки производства, правильно 
и точно описать технологические процессы и управлять ими. 
На деле это означает, что формирование документации по технологической 
подготовке производства, ее передача в электронном виде 
между конструкторскими и производственными подразделениями, 
а также поддержание документации в актуальном состоянии как минимум 
затруднены или вовсе неосуществимы. Из-за этого возникает 
целый ряд ограничений — например, когда на этапе проектирования 
нет возможности учитывать особенности технологии изготовления 
или ограничения производственной базы предприятия. 
На рис. 1.3 не показана структура технологической подготовки, 
так как она является структурой самостоятельной системы. В иде-
альной архитектуре решения для автоматизации предприятия САПР 
технологических процессов (ТП) являются частью (самостоятельным 
модулем) PLM-системы, обеспечивая двустороннюю передачу ин-
формации. В настоящее время существует множество локальных 
САПР ТП, которые успешно решают задачи в своей области. Наи-
более известными являются «Вертикаль» от АСКОН, Timeline от SDI 
Solutions, TECHCARD от Intermech. Анализ показал, что интеграция 
САПР ТП с системами управления данными об изделии (Product 
Data Management, PDM) во многих случаях может быть осуще-
ствлена штатными средствами, особенно если обе системы от одного 
производителя.

Глава 2. 
МОДЕЛЬНОЕ ПРЕДСТАВЛЕНИЕ 
ИНФОРМАЦИОННЫХ И ЛИНГВИСТИЧЕСКИХ 
СИСТЕМ

2.1. ЭЛЕМЕНТЫ ТЕОРИИ СИСТЕМ

Строгого определеления термина «система» пока нет. С учетом 
специфики настоящей системы предлагается принять следующее 
определение: «Система — это взаимосвязанная и необходимая со-
вокупность функционально законченных компонент, каждая из ко-
торых в той или иной мере определяет функциональное назначение».
Научной базой системного подхода (в широком смысле) является 
математическая теория систем, представляющая собой развиваю-
щуюся область прикладной математики, которая находится на стыке 
теории информации, теории управления и теории автоматов. Во-
просы, которые она изучает, связаны с исследованием сложных ре-
альных технических макрообъектов (систем), состоящих из боль-
шого числа разнообразных элементов, которые обмениваются между 
собой входными и выходными сигналами.
Однако науку о системах нельзя считать сложившейся, так как су-
ществует много направлений системных исследований, нет единства 
терминологии. Как правило, в упомянутых выше и других публи-
куемых работах рассматривается один из подходов или методов си-
стемных исследований, одна из точек зрения. Отсутствуют работы, 
в которых были бы объединены подходы и концепции разных ав-
торов, изучено обобщенное представление о развиваемых методах 
и применяемых моделях системных исследований, даны рекомен-
дации по выбору подхода и метода в конкретных условиях. Поэтому 
в данной главе дан краткий обзор определяющих понятий матема-
тической теории систем, освещена разработка ее новых ведущих, 
прежде всего структуралистских, положений в таком плане, в каком 
они могут быть использованы для описания структуры и поведения 
исследуемой структуры.
Далее в работе принято следующее определение: «информация — 
мера неопределенности в пространстве событий». Далее будет пока-
зано, что в работе различаются следующие меры:
 
• вероятностная (по Шеннону);
 
• структурная (по Хартли);
 
• семантическая;

• прагматическая. (Эта мера вводится авторами как разновидность 
семантической меры. И та и другая рассматриваются в приложе-
ниях лингвистики.)
Сообщение может передаваться (храниться) следующими носи-
телями: книга, видео и аудио, сигнал.
Таким образом, принимается, что сообщение может быть ло-
гическим носителем информации. Передача сообщений осуще-
ствляется по некоторому каналу в виде сигналов (кодов сообщений). 
Состав сигнала характеризуется следующей иерархией (сверху вниз):
 
• собственно сигнал (программа для ЭВМ, книга);
 
• предложение (часть книги, оператор программы, музыкальная 
фраза и т.д.);
 
• слово;
 
• буква, нота (терминальный элемент).
Канал передачи сообщений на архитектурном уровне абстрагиро-
вания представляет собой заданную совокупность средств передачи 
(рис. 2.1). На рис. 2.2 представлена логическая структура КПС.

Рис. 2.2. Логическая структура КПС

2.2. ИНФОРМАЦИОННАЯ И ЛИНГВИСТИЧЕСКАЯ СТРУКТУРЫ

Информационная и лингвистическая структуры принимаются 
как совокупность воззрений на язык и методов его исследования, 
в основе которых лежит понимание языка как знаковой системы. 
Понятие «структуры» используется и в программировании. Именно 

Первичное про-
странство событий

Пространство 
сообщений

Вторичное про-
странство событий

Рис. 2.1. Архитектурная схема канала передачи сообщений

Индуктор
Линия связи

Источники ак-
тивных и пас-
сивных помех, 
дезинформации

Перципиент

Доступ онлайн
от 236 ₽
В корзину