Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Программные продукты и системы, 2016, том 29, № 3

международный научно-практический журнал
Покупка
Основная коллекция
Артикул: 706083.0001.99
Программные продукты и системы : международный научно-практический журнал. - Тверь : НИИ Центрпрограммсистем, 2016. - Т. 29, № 3. - 216 с. - ISSN 0236-235X. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1016267 (дата обращения: 08.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Научно-исследовательский институт

«Центрпрограммсистем»

Программные

продукты и системы

МЕЖДУНАРОДНЫЙ НАУЧНО-ПРАКТИЧЕСКИЙ ЖУРНАЛ

№ 3, 2016

(год издания двадцать девятый)

Главный редактор

С.В. ЕМЕЛЬЯНОВ, академик РАН

Тверь

PROGRAMMNYE PRODUKTY

I SISTEMY

(SOFTWARE & SYSTEMS)

International research and practice journal

2016, vol. 29, no. 3

Editor-in-Chief 

S.V. EMELYANOV, Academician of the Russian Academy of Sciences

Tver

Russian Federation

Research Institute CENTERPROGRAMSYSTEM

 ПРОГРАММНЫЕ ПРОДУКТЫ И СИСТЕМЫ

2016, Т. 29, № 3, DOI: 10.15827/0236-235X.115

Международный научно-практический журнал

Главный редактор 
С.В. ЕМЕЛЬЯНОВ, академик РАН (г. Москва, Россия)

Научные редакторы:
Н.А. СЕМЕНОВ, д.т.н., профессор ТвГТУ 
(г. Тверь, Россия)
В.Н. РЕШЕТНИКОВ, д.ф.-м.н., профессор, МАИ 
(г. Москва, Россия)

Рецензенты: 
А.Н. Сотников, д.ф.-м.н., профессор МСЦ РАН (г. Москва, Россия)
А.В. Язенин, д.ф.-м.н., профессор ТвГУ (г. Тверь, Россия)
И.А. Бессмертный, д.т.н., профессор ИТМО 
(г. Санкт-Петербург, Россия)
В.Б. Тарасов, к.т.н., доцент МГТУ им. Баумана (г. Москва, Россия)
А.А. Рахманов, д.т.н., профессор, Концерн «РТИ Системы» (г. Москва, Россия)

Издатель НИИ «Центрпрограммсистем»

(г. Тверь, Россия)

Учредители: МНИИПУ (г. Москва, Россия),
Главная редакция международного журнала 
«Проблемы теории и практики управления»

(г. Москва, Россия),

Закрытое акционерное общество 

«Научно-исследовательский институт 

«Центрпрограммсистем» (г. Тверь, Россия)

Журнал зарегистрирован

в Комитете Российской Федерации

по печати 26 июня 1995 г.

Регистрационное

свидетельство № 013831

Подписной индекс в каталоге

Агентства «Роспечать» 70799

ISSN 0236-235X (печатн.)
ISSN 2311-2735 (онлайн)

МЕЖДУНАРОДНАЯ РЕДАКЦИОННАЯ КОЛЛЕГИЯ

Семенов Н.А. – д.т.н., профессор Тверского государственного технического университета, заместитель главного 
редактора (г. Тверь, Россия)
Решетников В.Н. – д.ф.-м.н., профессор Московского авиационного института
(национального исследовательского университета), заместитель главного редактора (г. Москва, Россия)
Арефьев И.Б. – д.т.н., профессор Морской академии Польши (г. Щецин, Польша)
Афанасьев А.П. – д.ф.-м.н., профессор Московского физико-технического института (технического университета), 
заведующий Центром распределенных вычислений Института проблем передачи информации РАН (г. Москва, Россия)
Баламетов А.Б. – д.т.н., профессор Азербайджанского научно-исследовательского и проектно-изыскательского института
энергетики (г. Баку, Азербайджан)
Батыршин И.З. – д.т.н., профессор Мексиканского института нефти (г. Мехико, Мексика)
Вагин В.Н. – д.т.н., профессор Московского энергетического института (технического университета) 
(г. Москва, Россия)
Голенков В.В. – д.т.н., профессор Белорусского государственного университета информатики и радиоэлектроники 
(г. Минск, Беларусь)
Еремеев А.П. – д.т.н., профессор Московского энергетического института (технического университета)
(г. Москва, Россия)
Котов А.С. – кандидат наук, ассистент профессора университета Уэйна (штат Мичиган) (г. Детройт, США)
Кузнецов О.П. – д.т.н., профессор Института проблем управления РАН (г. Москва, Россия)
Курейчик В.М. – д.т.н., профессор Инженерно-технологической академии Южного федерального университета 
(г. Таганрог, Россия)
Лисецкий Ю.М. – к.т.н., генеральный директор «S&T Ukraine» (г. Киев, Украина)
Мамросенко К.А. – к.т.н., доцент Московского авиационного института
(национального исследовательского университета), руководитель Центра визуализации и спутниковых 
информационных технологий НИИСИ РАН (г. Москва, Россия)
Мейер Б. – доктор наук, профессор, заведующий кафедрой Высшей политехнической школы – ETH (г. Цюрих, Швейцария)
Нгуен Тхань Нги – д.ф.-м.н., профессор, проректор Ханойского открытого университета (г. Ханой, Вьетнам)
Николов Р.В. – доктор наук, профессор Университета библиотековедения и информационных технологий Софии
(г. София, Болгария)
Осипов Г.С. – д.ф.-м.н., профессор, заместитель директора Института системного анализа РАН (г. Москва, Россия)
Палюх Б.В. – д.т.н., профессор Тверского государственного технического университета (г. Тверь, Россия)
Рахманов A.A. – д.т.н., профессор, заместитель генерального директора Концерна «РТИ Системы» (г. Москва, Россия)
Серов В.С. – д.ф.-м.н., профессор Университета прикладных наук Оулу (г. Оулу, Финляндия)
Сотников А.Н. – д.ф.-м.н., профессор, Межведомственный суперкомпьютерный центр РАН (г. Москва, Россия)
Сулейманов Д.Ш. – академик АН Республики Татарстан, д.т.н., профессор Казанского государственного 
технического университета (г. Казань, Республика Татарстан, Россия)
Тарасов В.Б. – к.т.н., доцент Московского государственного технического университета им. Н.Э. Баумана (г. Москва, Россия)
Таратухин В.В. – доктор философии, управляющий директор Европейского исследовательского центра 
в области информационных систем (ERCIS) Вестфальского университета им. Вильгельма (г. Мюнстер, Германия)
Хорошевский В.Ф. – д.т.н., профессор Московского физико-технического института (технического университета) 
(г. Москва, Россия)
Язенин А.В. – д.ф.-м.н., профессор Тверского государственного университета (г. Тверь, Россия)

АССОЦИИРОВАННЫЕ ЧЛЕНЫ РЕДАКЦИИ

Московский энергетический институт (технический университет), г. Москва, Россия
Технологический институт Южного федерального университета, г. Таганрог, Россия
Тверской государственный технический университет, г. Тверь, Россия
Научно-исследовательский институт «Центрпрограммсистем», г. Тверь, Россия

АДРЕС РЕДАКЦИИ
Россия, 170024, г. Тверь, пр. 50 лет Октября, 3а
Телефон (482-2) 39-91-49
Факс (482-2) 39-91-00
E-mail: red@cps.tver.ru
www.swsys.ru

Подписано в печать 15.08.2016 г.

Отпечатано ООО ИПП «Фактор и К»

Россия, 170028, г. Тверь, ул. Лукина, д. 4, стр. 1

Выпускается один раз в квартал. Общее количество выпусков 115. 
Год издания двадцать девятый. Формат 6084 1/8. Объем 216 стр.

Заказ № 27. Тираж 1000 экз. Цена 257,40 руб.

Автор статьи отвечает за подбор, оригинальность и точность приводимого фактического материала.
Авторские гонорары не выплачиваются. При перепечатке материалов ссылка на журнал обязательна.

 PROGRAMMNYE PRODUKTY I SISTEMY (SOFTWARE & SYSTEMS)

2016, vol. 29, no. 3, DOI: 10.15827/0236-235X.115

International research and practice journal

Editor-in-chief 
S.V. Emelyanov, Academician of the Russian Academy of Sciences (Mosсow, Russian Federation)

Science editors:
N.A. Semenov, Dr.Sc. (Engineering), Professor TSTU (Tver, Russian Federation)
V.N. Reshetnikov, Dr.Sc. (Physics and Mathematics), Professor MAI (Moscow, Russian Federation)

Reviewers: 
A.N. Sotnikov, Dr.Sc. (Physics and Mathematics), Professor JSCC RAS (Moscow, Russian Federation)
A.V. Yazenin, Dr.Sc. (Physics and Mathematics), Professor TSU (Tver, Russian Federation)
I.A. Bessmertny, Dr.Sc. (Engineering), Professor ITMO University (St. Petersburg, Russian Federation)
V.B. Tarassov, PhD (Technical), Associate Professor BMSTU (Moscow, Russian Federation)
A.A. Rakhmanov, Dr.Sc. (Engineering), Professor, JSC RTI (Moscow, Russian Federation)

Publisher Research Institute 
CENTERPROGRAMSYSTEM 

(Tver, Russian Federation)

The Founders: International Scientific 

and Research Institute 
for Management Issues 

(Moscow, Russian Federation),

the Chief Editorial Board 

of International Magazine Theoretical 
and practical issues of management

(Moscow, Russian Federation),

Research Institute 

CENTERPROGRAMSYSTEM 

(Tver, Russian Federation)
The magazine is on record 

in Russian committee

on press 26th of June 1995

Registration certificate № 013831

ISSN 0236-235X (print)

ISSN 2311-2735 (online)

INTERNATIONAL EDITORIAL BOARD

Semenov N.A. – Dr.Sc. (Engineering), Professor of Tver State Technical University, Deputy Editor-in-Chief
(Tver, Russian Federation)
Reshetnikov V.N. – Dr.Sc. (Physics and Mathematics), Professor of Moscow Aviation Institute (National Research University), 
Deputy Editor-in-Chief (Mosсow, Russian Federation)
Arefev I.B. – Dr.Sc. (Engineering), Professor of Poland Szczecin Maritime Academy (Szczecin, Poland)
Afanasiev A.P. – Dr.Sc. (Physics and Mathematics), Professor of Moscow Institute of Physics and Technology, 
Head of Centre for Distributed Computing of Institute for Information Transmission Problems (Moscow, Russian Federation)
Balametov A.B. – Azerbaijan Scientific-Research & Design-Prospecting Power Engineering Institute (Baku, Azerbaijan)
Batyrshin I.Z. – Dr.Sc. (Engineering), Professor of Mexican Petroleum Institute (Mexico City, Mexico)
Vagin V.N. – Dr.Sc. (Engineering), Professor of Moscow Power Engineering Institute (Technical University) 
(Mosсow, Russian Federation)
Golenkov V.V. – Dr.Sc. (Engineering), Professor of Belarusian State University of Informatics and Radioelectronics 
(Minsk, Republic of Belarus)
Eremeev A.P. – Dr.Sc. (Engineering), Professor of Moscow Power Engineering Institute (Technical University) 
(Moscow, Russian Federation)
Kotov A.S. – Ph.D. (Computer Science), Assistant Professor, Wayne State University (Detroit, MI, USA)
Kuznetsov O.P. – Dr.Sc. (Engineering), Professor of the Institute of Control Sciences of the Russian Academy of Sciences
(Moscow, Russian Federation)
Kureichik V.M. – Dr.Sc. (Engineering), Professor of Academy of Engineering and Technology Southern Federal University 
(Taganrog, Russian Federation)
Lisetskiy Yu.M. – Ph.D.Tech.Sc., CEO of S&T Ukraine (Kiev, Ukraine)
Mamrosenko K.A. – Ph.D. (Engineering), Associate Professor of Moscow Aviation Institute (National Research University), 
Head of Center of Visualization and Satellite Information Technologies SRISA RAS (Moscow, Russian Federation)
Meyer B. – Dr.Sc., Professor, Head of Department in Swiss Federal Institute of Technology in Zurich, ETH 
(Zurich, Switzerland)
Nguyen Thanh Nghi – Dr.Sc. (Physics and Mathematics), Professor, Vice-Principal of Hanoi Open University (Hanoi, Vietnam)
Nikolov R.V. – Full Professor of the University of Library Studies and Information Technology (Sofia, Bulgaria)
Osipov G.S. – Dr.Sc. (Physics and Mathematics), Professor, Deputy of the Principal of Institute of Systems Analysis 
of the Russian Academy of Sciences (Mosсow, Russian Federation)
Palyukh B.V. – Dr.Sc. (Engineering), Professor of Tver State Technical University (Tver, Russian Federation)
Rakhmanov A.A. – Dr.Sc. (Engineering), Professor, Deputy of the CEO of Concern RTI Systems
(Mosсow, Russian Federation)
Serov V.S. – Dr.Sc. (Physics and Mathematics), Professor of the Oulu University of Applied Sciences (Oulu, Finland)
Sotnikov A.N. – Dr.Sc. (Physics and Mathematics), Professor, Joint Supercomputer Center of the Russian Academy 
of Sciences (Moscow, Russian Federation)
Suleimanov D.Sh. – Academician of TAS, Dr.Sc. (Engineering), Professor of Kazan State Technical University
(Kazan, Republic of Tatarstan, Russian Federation)
Tarassov V.B. – Ph.D. (Engineering), Associate Professor of Bauman Moscow State Technical University
(Mosсow, Russian Federation)
Taratoukhine V.V. – Ph.D. (Engineering), Dr.Ph., Managing Director of the Competence Centre ERP and ERCIS Lab
Russia of the ERCIS (Muenster, Germany)
Khoroshevsky V.F. – Dr.Sc. (Engineering), Professor of Moscow Institute of Physics and Technology
(Moscow, Russian Federation)
Yazenin A.V. – Dr.Sc. (Physics and Mathematics), Professor of Tver State University (Tver, Russian Federation)

ASSOCIATED EDITORIAL BOARD MEMBERS

Moscow Power Engineering Institute (Technical University), Moscow, Russian Federation
Technology Institute at Southern Federal University, Taganrog, Russian Federation
Tver State Technical University, Tver, Russian Federation
Research Institute CENTERPROGRAMSYSTEM, Tver, Russian Federation

EDITORIAL OFFICE ADDRESS
50 let Oktyabrya Ave. 3а, Tver, 170024, Russian Federation
Phone: (482-2) 39-91-49  Fax: (482-2) 39-91-00
E-mail: red@cps.tver.ru
www.swsys.ru

Passed for printing 15.08.2016

Printed in printing-office “Faktor i K”

Lukina St. 4/1, Tver, 170028, Russian Federation

Published quarterly. 29th year of publication

Format 6084 1/8. Circulation 1000 copies

Prod. order № 27. Wordage 216 pages. Price 257,40 rub.

Вниманию авторов

Международный журнал «Программные продукты и системы» публикует материалы научного и научно-практического 

характера по новым информационным технологиям, результаты академических и отраслевых исследований в области использования средств вычислительной техники. Практикуются выпуски тематических номеров по искусственному интеллекту, системам автоматизированного проектирования, по технологиям разработки программных средств и системам защиты, а также специализированные выпуски, посвященные научным исследованиям и разработкам отдельных вузов, 
НИИ, научных организаций. 

Решением Президиума Высшей аттестационной комиссии (ВАК) Министерства образования и науки РФ международ
ный журнал «Программные продукты и системы» внесен в Перечень ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученых степеней 
кандидата и доктора наук.

Информация об опубликованных статьях по установленной форме регулярно предоставляется в систему Российского 

индекса научного цитирования (РИНЦ), в CrossRef и готовится для передачи в международные базы цитирования.

Условия публикации

К рассмотрению принимаются ранее нигде не опубликованные материалы, соответствующие тематике журнала 

(специализация 05.13.ХХ – Информатика, вычислительная техника и управление) и отвечающие редакционным требованиям.

Работа представляется в электронном виде в формате Word. При обилии сложных формул обязательно наличие 

статьи и в формате PDF. Формулы должны быть набраны в редакторе формул Word (Microsoft Equation или MathType). 
Объем статьи вместе с иллюстрациями – не менее 10 000 знаков. Диаграммы, схемы, графики должны быть доступными 
для редактирования (Word, Visio, Exel). Все иллюстрации для полиграфического воспроизведения представляются в 
черно-белом варианте. Цветные, тонированные, отсканированные, не подлежащие редактированию средствами Word рисунки и экранные формы следует присылать в хорошем качестве для их дополнительного размещения на сайте журнала в 
макете статьи с доступом по ссылке. (Публикация материалов с использованием гипертекста, графики, аудио-, видео-, 
программных средств и др. возможна в электронном издании «Программные продукты, системы и алгоритмы», сайт 
www.swsys-web.ru.) Заголовок должен быть информативным; сокращения, а также терминологию узкой тематики желательно в нем не использовать. Количество авторов на одну статью – не более 4, количество статей одного автора в номере, 
включая соавторство, – не более 2. Список литературы (оформленный в соответствии с ГОСТ Р 7.05–2008), наличие которого обязательно, должен включать не менее 10 пунктов.

Необходимы также аннотация (не менее 200 слов), ключевые слова (7–10) и индекс УДК. Название статьи, аннота
ция и ключевые слова должны быть переведены на английский язык (машинный перевод недопустим), а фамилии авторов, 
названия и юридические адреса организаций (если нет официального перевода), пристатейные списки литературы – транслитерированы по стандарту BGN/PCGN. 

Вместе со статьей следует прислать отзыв-рекомендацию в произвольной форме, экспертное заключение, лицензи
онное соглашение, а также сведения об авторах: фамилия, имя, отчество, название и юридический адрес организации, 
должность, ученые степень и звание (если есть), контактный телефон, электронный адрес, почтовый адрес для отправки 
бесплатного авторского экземпляра журнала. 

Порядок рецензирования

Все статьи, поступающие в редакцию (соответствующие тематике и оформленные согласно требованиям к публи
кации), подлежат обязательному рецензированию в течение месяца с момента поступления. 

В редакции есть устоявшийся коллектив рецензентов, среди которых члены международной редколлегии журнала, 

эксперты из числа крупных специалистов в области информатики и вычислительной техники ведущих вузов страны, а 
также ученые и специалисты НИИ «Центрпрограммсистем» (г. Тверь).

Рецензирование проводится конфиденциально. Автору статьи предоставляется возможность ознакомиться с тек
стом рецензии. При необходимости статья отправляется на доработку.

Рецензии обсуждаются на заседаниях рабочей группы, состоящей из членов научного совета журнала. Заседания 

проводятся раз в месяц в НИИ «Центрпрограммсистем» (г. Тверь), где принимается решение о целесообразности публикации статьи.

Статьи, одобренные редакционным советом, публикуются бесплатно в течение года с момента одобрения, а отправ
ленные на доработку – с момента поступления после устранения замечаний.

Редакция международного журнала «Программные продукты и системы» в своей работе руководствуется сводом 

правил Кодекса этики научных публикаций, разработанным и утвержденным Комитетом по этике научных публикаций.

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

5

УДК 004.5
Дата подачи статьи: 22.03.16

DOI: 10.15827/0236-235X.115.005-009

ЕСТЕСТВЕННО-ЯЗЫКОВОЙ ПОЛЬЗОВАТЕЛЬСКИЙ ИНТЕРФЕЙС 

ДИАЛОГОВОЙ СИСТЕМЫ

(Исследование выполнено при финансовой поддержке Фонда содействия развитию малых форм предприятий 

в научно-технической сфере в рамках научно-исследовательского проекта № 7369ГУ2015)

Р.В. Посевкин, аспирант, rus_posevkin@mail.ru; 

И.А. Бессмертный, д.т.н., профессор, igor_bessmertny@hotmail.com
(Санкт-Петербургский национальный исследовательский университет 
информационных технологий, механики и оптики (Университет ИТМО), 

Кронверкский просп., 49, г. Санкт-Петербург, 197101, Россия)

Множество людей ежедневно взаимодействуют с различными программными системами. В результате внедрения 

компьютерных систем во все сферы человеческой жизни все больше проявляется проблема перехода от визуальных и 
командных интерфейсов к естественно-языковым. В статье рассмотрены методы компьютерной лингвистики и обработки естественного языка. Представлено полное описание всех стадий обработки естественного языка, таких как 
морфологический, синтаксический и семантический анализ. Рассмотрен ограниченный язык как подмножество естественного языка, на котором текст хорошо воспринимается носителем естественного языка без дополнительных усилий. Подобное решение позволяет сократить время анализа естественно-языковых элементов в диалоговой системе, а 
также помогает избежать неоднозначностей на лингвистическом уровне. Методы для работы с естественным языком 
могут применяться в программных системах машинного перевода, поисковых системах, системах автоматического 
реферирования и в экспертных системах. Представлено формальное описание диалоговой системы в контексте марковского процесса принятия решений. Разработан прототип естественно-языкового пользовательского интерфейса,
который производит преобразования пользовательского запроса на естественном языке в SQL-запрос к БД. Интерфейс 
взаимодействует с БД, содержащей информацию о существующих программных библиотеках и фреймворках. Таким 
образом, использование методов обработки естественного языка позволяет разработать естественно-языковой пользовательский интерфейс для взаимодействия с диалоговой системой.

Ключевые слова: диалоговая система, обработка естественного языка, пользовательский интерфейс, БД.

Существует большое количество программных 

систем, каждая из которых обладает характерными 
именно для нее принципами взаимодействия. В результате свободное использование системы затрудняется и увеличивается время, необходимое на обучение пользователя работе с ней.

Одним из вариантов решения проблемы взаи
модействия с компьютерной системой является использование естественного языка, более привычного для пользователя.

Такое решение имеет следующие преимуще
ства: 


минимальная подготовка пользователя для 

работы с системой;


высокая скорость и простота формирования 

произвольных запросов к системе.

Простота при работе с естественно-языковым 

пользовательским интерфейсом достигается путем
применения пользователем языка, используемого в 
ежедневной коммуникации [1].

Для естественно-языкового пользовательского 

интерфейса диалоговых систем возможно использование ограниченной лексики и грамматики 
языка. При этом не происходит серьезного ухудшения функциональности и производительности вопросно-ответной системы.

Ограниченный естественный язык – это под
множество естественного языка, на котором текст 
воспринимается носителем естественного языка 
без дополнительных усилий. При этом не требуется изучение ограниченной версии языка для 

составления текстов. Данный язык обладает сокращенным набором лексики и грамматики, что позволяет сократить время анализа естественно-языковых элементов в диалоговой системе, а также 
избежать неоднозначностей на лингвистическом 
уровне [2].

Цикл работы естественно-языкового пользова
тельского интерфейса начинается с ввода пользователем текста сообщения на естественном языке. 
На основе введенного текста строится его формальное описание. При этом все предшествующие результаты анализа используются при анализе последующих запросов, что позволяет системе сохранять нить диалога с пользователем и разрешать 
неоднозначные и спорные моменты, связанные с 
различным использованием одних и тех же слов в 
разных предметных областях [3].

В процессе обработки естественно-языкового 

текста последовательно выполняется морфологический, синтаксический и семантический анализ. 
Общая схема работы системы представлена на рисунке 1.

На первом этапе обработки пользовательского 

запроса осуществляется морфологический и морфемный анализ. Для каждого слова предложения в 
формальной записи строятся отношения, задающие 
соответствия для значений грамматических категорий [4].

В результате морфологического анализа опре
деляются морфологические характеристики каждого слова, такие как падеж, склонение, часть речи 

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

6

и т.д. Количество и наличие морфологических характеристик слов и допустимых значений зависят 
от конкретного языка. Однако некоторые характеристики, например часть речи, существуют во многих языках.

Для проведения морфологического анализа тек
ста существуют следующие подходы: четкая морфология, нечеткая морфология, вероятностный 
подход.

При обработке естественно-языковых текстов 

на русском языке наиболее часто применяется подход, основанный на четкой морфологии и базирующийся на словаре Зализняка. В этом словаре описаны основные словоформы для слов русского
языка. Каждой такой словоформе сопоставляется 
определенный код. Существует система правил, в 
соответствии с которой для слова можно построить 
все остальные формы [5]. В качестве исходных 
данных используются начальная словоформа и соответствующий ей код. В случае использования 
четкого подхода в процессе морфологического анализа необходимо иметь в наличии словарь всех 
словоформ и слов для данного языка. Словарь на 
входе принимает форму слова, а на выходе представляет морфологические характеристики конкретной словоформы. 

Возможно построение словаря на основе сло
варя Зализняка по следующему алгоритму. Сначала перебираются все слова, содержащиеся в словаре. Для каждого из этих слов выделяются все 
допустимые словоформы и сохраняются в формируемом словаре. В процессе морфологического 
анализа конкретного слова достаточно найти его в 
словаре. В результате будут получены точные значения всех морфологических характеристик анализируемого слова.

При морфемном анализе для каждого слова вы
деляются морфемы: приставка, корень, суффикс, 
окончание. В словаре морфем русского языка для 
каждого слова указано разделение на составные части. При этом в словаре не указываются типы каждой из составных частей. Таким образом, достоверно неизвестно, какая из частей является суффиксом, а какая корнем. 

Совокупность всех возможных корней слов 

русского языка представляет собой открытое множество. В то же время множество всех приставок, 
суффиксов и окончаний ограничено. Также известен порядок следования морфем в составе слова 
на русском языке: приставки, затем корни, суффиксы и окончания. Таким образом, с помощью 
словаря морфем русского языка можно построить 
словарь, содержащий информацию как о разбиении слова на составные части, так и о типе каждой 
из морфем. В результате для проведения морфемного анализа слова достаточно использовать 
разработанный словарь.

В случае отсутствия слова в словаре возможен

непосредственный анализ на основе стандартного 
строения слов русского языка (приставка – корень 
– суффикс – окончание) и множества всех приставок, суффиксов и окончаний [6].

На этапе синтаксического анализа выделяются 

отношения синтаксических связей внутри предложения. Далее определяются главные и второстепенные члены предложения, тип предложения. 
Синтаксический анализ выполняется поэтапно: 
при описании формальной структуры предложения 
используется полученная на этапе морфологического анализа информация. На данном этапе используются синтаксические и лексические правила 
анализируемого языка.

Далее следует наиболее сложная часть обра
ботки естественно-языкового текста – этап семантического анализа, который можно рассматривать 
как обработку семантической сети. В свою очередь, семантическая сеть представляет собой результат анализа естественно-языкового текста на
предыдущих этапах и присутствующих в системе 
знаний о предметной области и языке программной 
системы. На данном этапе анализируются соотношения лингвистической конструкции и хранимых 
в памяти системы конструкций, предназначенных 
для выявления отношений соответствия.

В процессе построения семантической модели 

слова учитывается его многозначность. Смысл 
слова рассматривается как множество различных 
значений. Вся совокупность этих значений в целом 
или каждое из них реализуется в определенном 
контексте. Результатом семантического анализа 
является конструкция запроса к информационной 
системе. 

Система преобразования естественно-языко
вого текста в запрос к БД является частью диалоговой системы. Рассмотрим диалоговую систему в 
контексте марковского процесса принятия решений. Данный процесс представлен в виде диалога, 
конечная цель которого – получение пользователем списка библиотек за наименьшее количество 
возможных итераций. В рассматриваемом примере 
пользователь формирует запрос с использованием 
значений «язык программирования» и «тип лицензий» в качестве фильтра.

Пользовательский 

запрос

Морфологический 

и морфемный 

анализ

Синтакси
ческий 
анализ

Семанти
ческий 
анализ

Запрос к информационной 

системе

Рис. 1. Общая схема обработки 
естественно-языкового текста

Fig. 1. General scheme of natural language processing

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

7

Марковский процесс принятия решений описы
вается в терминах пространства состояний, набора 
действий и стратегии. Состояния диалоговой системы затрагивают все ресурсы, с которыми взаимодействует пользователь [7]. 

Полный набор состояний диалоговой системы 

может включать в себя:


одно начальное состояние;


различные комбинации списков библиотек, 

формируемых в зависимости от начальных значений и используемого фильтра;


специальное
состояние, 
обозначающее

окончание работы текущей диалоговой сессии.

В данном примере рассматриваются такие со
стояния диалоговой системы, как список библиотек, выбранных с применением фильтров «язык 
программирования» и «тип лицензии».

В качестве возможных действий с диалоговой 

системой рассматриваются взаимодействие пользователя с системой (например, ввод пользователем запроса к системе, предоставление системой 
ответа на пользовательский запрос, уведомления),
взаимодействие системы с внешними ресурсами 
(например, отправка запроса к БД), внутренняя обработка данных [8].

В предлагаемом примере возможен следующий

набор действий с диалоговой системой.

1. Пользовательский запрос к системе на полу
чение списка программных библиотек для определенного языка программирования.

2. Пользовательский запрос к системе на полу
чение списка программных библиотек, распространяемых в соответствии с запрашиваемым типом 
лицензии.

3. Пошаговые запросы, когда пользователь за
прашивает список программных библиотек для 
конкретного языка программирования, а затем отбирает из них только библиотеки с определенным 
типом лицензии (или в обратном порядке).

4. Финальное действие, завершающее теку
щую сессию диалога с программной системой.

Когда действие a производится над системой в 

состоянии s, система переходит в состояние s’. 
В подобной ситуации вероятность перехода описывается формулой

PT (s(t+1) = s’ | s(t) = s, a(t) = a).
(1)

Диалоговая сессия представляет собой длину 

пути при переходе пользователя из начального в 
конечное состояние диалоговой системы. При этом 
диалоговая стратегия отображает, какое действие 
будет совершено для перехода в каждое последующее состояние программной системы.

Производительность системы можно измерить 

с помощью целевой функции C, где веса Ci представляют собой расстояние до достижения конечной цели. Таким образом, эффективность взаимодействия пользователя с диалоговой системой рассчитывается по формуле

C = ∑ Ci.
(2)

В целом веса в марковском процессе принятия 

решений описываются условным распределением

PC (c(t) = c | s(t) = s, a(t) = a).
(3)

Совокупность из четырех состояний системы, 

набора вариантов взаимодействий с системой, вероятностей перехода и распределения весов определяют марковский процесс принятия решений. 
Для рассматриваемого примера целевая функция 
представлена как

C = Wi × <# interactions> + We × 

×<# errors> + Wf × <# incomplete values>.
(4)

Целевая функция включает в себя три компо
нента: первый – ожидаемая продолжительность 
диалога, второй – предполагаемое количество ошибок в полученных данных, третий – предполагаемое расстояние до получения пользователем целевого результата от диалоговой системы.

В зависимости от соответствия целевой функ
ции диалоговой модели возникает связь веса c с совершаемым взаимодействием a пользователя с системой, находящейся в состоянии s.

Вес включает в себя любое из первых трех дей
ствий с диалоговой системой: Wi + We × number of
errors. Рассмотрим понятие веса ошибок для определения значений с применением фильтров по отдельности (для действий 1 и 2) – это p1, и совместно 
(для действия 3) – это p2, при этом p2 > p1. Тогда 
ожидаемый вес для взаимодействий 1 и 2 будет 
представлен как Wi +We × p1, для действия 3 – Wi + 
+ 2 × We × p2. Для действия 4 (закрытие диалоговой 
сессии) вес зависит от состояния диалоговой системы, в котором произошло взаимодействие. Так, 
для начального состояния вес будет выражен как 
Wi + 2 × Wf. Для случаев, когда был применен 
только один из фильтров («язык программирования» или «тип лицензии»), вес определяется как 
Wi + Wf. В случае применения обоих фильтров вес 
представлен как Wi.

На рисунке 2 отображены три различные стра
тегии пользовательского взаимодействия с диалоговой системой. Оптимальная стратегия стремится 
к минимизации целевой функции. В данном случае 
C1 = Wi + 2 × Wf. В соответствии со стратегией 1, 
когда пользователь первым же действием закрывает диалоговую сессию, оптимальной является ситуация со слишком большим весом ошибок: 
p1 > (Wf − Wi)/We.

В стратегии 2 пользователь запрашивает список 

библиотек с использованием одного из фильтров, а
затем закрывает диалоговую сессию. В данном случае C2 = 2 × Wi + 2× p2 × We. 

В стратегии 3 пользователь запрашивает список 

программных библиотек с использованием как 
фильтра «язык программирования», так и «тип лицензии» и после этого закрывает диалоговую сессию. В текущей ситуации целевая функция имеет 
следующий вид: C3 = 3 × Wi + 2 × p1 × We. Стратегия 3 оптимальна, когда верно выражение p2 − p1 >
> Wi / 2 × We.

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

8

Существуют различные методы вычисления оп
тимальной стратегии с учетом корректных параметров модели (вероятности перехода и распределения весов), среди которых алгоритм итераций по 
критерию или итерации по стратегиям. Данные 
подходы основаны на динамическом программировании, которое может быть использовано благодаря марковскому характеру представленной модели [9]. Подходы основаны на следующем определении: оптимальное значение V(s) состояния 
диалоговой системы s представляет собой минимальный ожидаемый вес, формируемый начиная с 
момента, когда система перешла из состояния s, и 
до тех пор, пока не достигла финального (конечного) состояния. Оптимальное значение функции 
уникально и может быть определено как решение 
системы уравнений:

 


 
,
  
( | , ) 
 ,
a
T

S

V s
min
C s a
P s s a V s








 



(5)

где C(s, a) – ожидаемый вес для взаимодействия 
a в состоянии s [10].

В рамках исследований разработан прототип 

программной системы, реализующей естественноязыковой пользовательский интерфейс к структурированному источнику данных. 

В качестве исходных данных представлена 

БД MySQL, которая содержит информацию о существующих программных библиотеках и фреймворках. Тестовая БД содержит в себе таблицу, 
имеющую следующие поля: уникальный идентификатор, имя, ссылка на официальный сайт или репозиторий, дата создания, автор, тип лицензии, тип 
записи (библиотека или фреймворк), размер, список зависимостей, язык программирования, наличие активного сообщества разработчиков.

Значением, получаемым на выходе програм
мной системы, является SQL-запрос к БД. Одно из 
необходимых условий для работы системы – наличие структуры данных, описывающей содержимое 
БД. В частности, необходимо описание таблицы и 
входящих в нее полей.

Сложные предложения на естественном языке 

не используются в пользовательском запросе к базе 
в рамках естественно-языкового пользовательского интерфейса. Несмотря на то, что требуется 
создание лингвистического анализатора в виде 
преобразователя, состоящего из двух видов абстракции – морфологической и синтаксической 
[11], каждый из уровней абстракции должен иметь 
в наличии компонентную модель с набором правил 
и библиотек и определенный образ запросов в виде 
морфологических и синтаксических структур.

Также не требуется фаза семантического ана
лиза за счет того, что известна предметная область. 
Таким 
образом, 
лингвистический 
анализатор 

можно назвать лингвистическим преобразователем
(транслятором).

Добиться приемлемого уровня обработки ес
тественного языка возможно без использования 
полного грамматического анализа. Достаточно 
извлечь наиболее информативные части предложения, такие как ключевые слова, фразы и фрагменты. Следующим шагом является создание морфологических и синтаксических моделей с использованием морфологических и синтаксических 
методов анализа.

Например, пользовательский запрос на есте
ственном языке «Показать библиотеки для С++» 
будет преобразован в SQL-запрос к БД SELECT
Name, Url FROM Data WHERE Type=’library’ AND
Language=’cpp’ .

Таким образом, естественно-языковой пользо
вательский запрос на русском языке преобразуется 
в SQL-запрос, который в дальнейшем может быть 
отправлен к БД.

В результате разработанная программная си
стема реализует естественно-языковой пользовательский интерфейс к БД. Подобная система может 
применяться в областях, где требуется обеспечить
доступ пользователя к информации из определенной предметной области. Например, возможна реализация естественно-языкового интерфейса для 
аналитической программной системы. Введя запрос на естественном языке, пользователь получает отчет, выборку по данным за определенный 
временной период. В результате, применяя методы 
обработки естественно-языкового текста, можно 
создать программный интерфейс, обеспечивающий взаимодействие пользователя с программной 
системой на естественном языке.

Литература

1.
Bessmertny I. On constructing intellectual systems in ter
nary logic. Programming and Computer Software, 2014, vol. 40, 
no. 1, pp. 43–46.

2.
Deshpande A.K., Devale P.R. Natural language query pro
cessing using probabilistic context free grammar. Intern. Journ. of 
Advances in Engineering & Technology. 2012, vol. 3, no. 2, 
pp. 568–573.

3.
Житко В.А. Пользовательский интерфейс интеллекту
альных вопросно-ответных систем // NB: Кибернетика и программирование. 2012. № 1. С. 23–30.

—
Конечное 
состояние

Список 
платных 
библиотек 
для C++

—

Список 

библиотек 
для C++

Конечное 
состояние

Библиотеки 

для С++
Спасибо

—

Список 

библиотек 
для C++

Библиотеки 

для С++

Только 
платные

Конечное 
состояние

Спасибо

1.

2.

3.

Спасибо

Рис. 2. Стратегии взаимодействия пользователя 

с диалоговой системой

Fig. 2. Strategies of interactions between a user 

and a dialogue system

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

9

4.
Крайванова В.А. Модель естественно-языкового интер
фейса для систем управления сложными техническими объектами и оценка эффективности алгоритмов на ее основе // Управление большими системами. М.: Изд-во ИПУ РАН, 2009. 
Вып. 26. С. 158–178. 

5.
Damljanovic D., Agatonovic M., and Cunningham H. 

FREyA: An interactive way of querying Linked Data using natural 
language. Proc. 8th Intern. conf. on the Semantic Web: ESWC 2011. 
Springer Berlin Heidelberg, 2012, pp. 125–138.

6.
Селезнев К. Обработка текстов на естественном языке 

// Открытые системы. 2003. № 12; URL: http://www.osp.ru/os/
2003/12/183694/ (дата обращения: 27.02.2016).

7.
Li F., Jagadish H.V. NaLIR: An interactive natural language 

interface for querying relational databases. Proc. 2014 ACM 
SIGMOD Intern. conf. on Management of data, ACM, 2014, 
pp. 709–712. 

8.
Dezhao S., Schilder F., Smiley C., Brew C., Zielund T., 

Bretz H., Martin R., Dale C., Pomerville S., Duprey J., Miller T., and 
Harrison J. TR Discover: a natural language interface for querying 
and analyzing interlinked datasets. Proc. 14th Intern. conf. on the Semantic Web: ISWC 2015, Springer Intern. Publ., 2015, pp. 21–37.

9.
Kesavan S., Giudice N.A. Indoor scene knowledge acquisi
tion using a natural language interface. SKALID 2012 – Spatial 
Knowledge Acquisition with Limited Information Displays, 2012, 
pp. 1–6.

10. Levin E., Pieraccini R., Eckert W. Learning dialogue stra
tegies within the Markov decision process framework. Automatic 
Speech Recognition and Understanding IEEE Proc., 1997, 
pp. 72–79.

11. Елисеева О.Е. Естественно-языковой интерфейс интел
лектуальных систем: учеб. пособие. Минск: Изд-во БГУИР, 
2009. С. 84–85.

DOI: 10.15827/0236-235X.115.005-009
Received 22.03.16

NATURAL LANGUAGE USER INTERFACE OF A DIALOGUE SYSTEM

(Acknowledgements. The research was partially supported by FASIE (Fund for Assistance to Small Innovative Enterprises), 

research project no. 7369GU2015)

1Posevkin R.V., Postgraduate Student, rus_posevkin@mail.ru
1Bessmertny I.A., Dr.Sc. (Engineering), Professor, igor_bessmertny@hotmail.com
1 The National Research University of Information Technologies, Mechanics and Optics,
Kronverksky Ave. 49, St. Petersburg, 197101, Russian Federation

Аbstract. Many people interact with software every day. Due to computer systems expansion to all fields of people’s 

activity the problem of transition from visual and command interfaces to natural language user interfaces is becoming more 
and more relevant. The article describes computational linguistics and natural language processing methods. It considers all 
phases of natural language processing such as morphological, syntactic and semantic analysis. Limited language is represented 
as a subset of natural language. This language allows avoiding linguistic uncertainty and decreases natural language elements
processing time. Translation system is a part of a dialogue system. Methods of natural language manipulation are applied in 
machine translation software systems, search engines, data exchange, automatic abstracting and expert systems. The paper 
represents a formal definition of a dialogue system as a Markov decision process. The authors developed a prototype of natural 
language user interface for a structured data source. It converts natural language user’s query into SQL query to database. User 
interface interacts with a database that contains information about existent program libraries and frameworks. Consequently, 
using natural language processing methods makes it possible to develop natural language user interface providing a capability 
to interact with a dialogue system.

Keywords: dialogue system, natural language processing, user interface, database.

References

1.
Bessmertny I. On constructing intellectual systems in ternary logic. Programming and Computer Software. 2014, 

vol. 40, no. 1, pp. 43–46.

2.
Deshpande A.K., Devale P.R. Natural language query processing using probabilistic context free grammar. Int. Journ.

of Advances in Engineering & Technology. 2012, vol. 3, no. 2, pp. 568–573.

3.
Zhitko V.A. Intelligent user interface for question answering systems. NB: Kibernetika i programmirovanie [Cyber
netics and Programming]. 2012, no. 1, pp. 23–30 (in Russ.).

4.
Krayvanova V.A. Model of natural-language interface for complex technical objects control systems and efficiency 

evaluation of model-based algorithms. Upravlenie bolshimi sistemami [Large-scale Systems Control]. Moscow, Institute of 
Control Sciences Publ., 2009, vol. 26, pp. 158–178 (in Russ.). 

5.
Damljanovic D., Agatonovic M., Cunningham H. FREyA: An interactive way of querying Linked Data using natural 

language. The Semantic Web: ESWC 2011 Workshops. Springer Berlin Heidelberg Publ., 2012, pp. 125–138.

6.
Seleznev K. Text processing on a natural language. Otkrytye sistemy [Open Systems]. 2003, no. 12. Available at: 

http://www.osp.ru/os/2003/12/183694/ (accessed February 27, 2016) (in Russ.).

7.
Li F., Jagadish H.V. NaLIR: An interactive natural language interface for querying relational databases. Proc. 2014 

ACM SIGMOD Int. Conf. on Management of Data. ACM Publ., 2014, pp. 709–712. 

8.
Dezhao S. TR Discover: A Natural Language Interface for Querying and Analyzing Interlinked Datasets. The Semantic 

Web-ISWC 2015. Springer Int. Publ., 2015, pp. 21–37.

9.
Kesavan S., Giudice N.A. Indoor Scene Knowledge Acquisition using a Natural Language Interface. SKALID 2012 –

Spatial Knowledge Acquisition with Limited Information Displays. 2012, pp. 1–6.

10. Levin E., Pieraccini R., Eckert W. Learning dialogue strategies within the Markov decision process framework. Auto
matic Speech Recognition and Understanding IEEE Proc. 1997, pp. 72–79.

11. Eliseeva O.E. Estestvenno-yazykovoy interfeys intellektualnykh sistem [Natural Language Interface of Intellectual Sys
tems]. Study guide. Minsk, BGUIR Publ., 2009, pp. 84–85.

Программные продукты и системы / Software & Systems
№ 3, том 29, 2016

10

УДК 004.89
Дата подачи статьи: 01.03.16

DOI: 10.15827/0236-235X.115.010-014

ИСПОЛЬЗОВАНИЕ ВЕРОЯТНОСТНОГО ВЫВОДА 
В СЛАБОФОРМАЛИЗОВАННЫХ БАЗАХ ЗНАНИЙ

(Работа выполнена в рамках темы НИР № 615869

«Методы проектирования ключевых систем информационной инфраструктуры»)

Е.А. Полещук, аспирант, eapoleschuk@corp.ifmo.ru; 
А.В. Платонов, аспирант, avplatonov@corp.ifmo.ru

(Санкт-Петербургский национальный исследовательский университет 
информационных технологий, механики и оптики (Университет ИТМО), 

Кронверкский просп., 49, г. Санкт-Петербург, 197101, Россия)

В статье рассматривается процесс вероятностного вывода в слабоформализованных базах знаний. В качестве такой 

базы выбрана графическая модель представления знаний – семантическая сеть. Выбор обусловлен удобством представления автоматически извлеченных данных в виде графа со связями, а также удобством дальнейшего использования 
(чтения, изменения и поиска ошибок) данного графа. Также проводится сравнение широко используемого на данный 
момент продукционного подхода с предложенным, указываются основные недостатки продукционного подхода, которые необходимо учитывать при разработке подобных систем извлечения знаний. 

Целью исследования является извлечение новых знаний из автоматически полученных данных. Для достижения 

этой цели на графических моделях обычно производится логический вывод. Поскольку модель, а также способ получения данных (в данном случае автоматически или полуавтоматически) накладывают ограничения на механизм вывода, алгоритм вынужден работать в условиях неопределенности. Отсюда следует, что стандартные механизмы логического вывода, предусмотренные для данной модели, становятся неактуальными. 

В статье предлагается использовать вероятностный вывод и, следовательно, вероятностный язык логического про
граммирования для его реализации. Также делается сравнение нескольких существующих языков вероятностного логического программирования, таких как PRISM, ICL и ProbLog. По результатам сравнения производится выбор языка 
вероятностного программирования для осуществления вывода. В качестве такого языка выбран язык ProbLog (в частности система ProbLog2), являющийся вероятностным расширением языка Prolog. 

Ключевые слова: вероятностный вывод, семантические сети, слабоформализованные базы знаний, ProbLog, ве
роятностное логическое программирование, неопределенность данных, неопределенность отношений.

Одним из популярных подходов к представле
нию знаний является продукционный подход. Продукционная модель – это модель, в которой знания 
представлены с помощью правил «ЕСЛИ – ТО» [1]. 
Эта модель довольно просто интерпретируется человеком, так как правила в ней схожи с предложениями на естественном языке. Положительными 
сторонами данной модели являются также простота создания и интерпретации отдельных правил 
(ЕСЛИ X – человек, ТО Х смертен), изменения правил и пополнение базы правилами, довольно простой и прозрачный механизм логического вывода.

Однако, помимо сильных сторон, у данной мо
дели имеются и слабые:


не ясно, каким образом правила соотносятся 

между собой;


довольно сложно составить целостную кар
тину знаний по отдельным правилам;


продукционная модель отличается от струк
туры знаний человека;


в логическом выводе отсутствует гибкость.

Таким образом, задачи, решаемые с помощью 

продукционной модели, должны быть небольшими 
(оперировать небольшим объемом знаний) и не 
требующими гибкого вывода [2].

Ответ на интересующий вопрос можно полу
чить в БЗ, основанных на продукционной модели, с 
помощью логического вывода (прямого или обрат
ного). Обратный логический вывод осуществляет 
поиск от целей к данным. При прямом выводе происходит поиск от данных к целям [3]. Прямой вывод используется тогда, когда по исходным данным 
требуется вывести все следствия (задача интерпретации или прогнозирования), тогда как обратный 
вывод применяется в случае необходимости проверки определенной гипотезы на соответствие фактам (задача диагностики). Подробные примеры 
приведены в [3]. 

Так как продукционная БЗ, как и программа на 

языке Problog, состоит из правил, соответственно, 
можно создавать программы, написанные на этом 
языке и осуществляющие логический вывод в этой 
БЗ. Такое соответствие на примере задачи поиска 
всех братьев, если известны имена людей и родственные отношения между ними, проиллюстрировано в таблице 1.

Продукционную модель можно представить в 

виде графа (рис. 1 и 2).

Однако следует отметить, что логический вывод 

плохо работает с данными в условиях неопределенности. Далее речь пойдет о вариантах решения этой 
проблемы.

Построение более или менее больших БЗ тре
бует очень больших затрат ресурсов, так как это в 
основном выпоняется вручную. Поэтому логичным кажется использование методов машинного 
обучения для построения таких БЗ [4]. Эти методы,