Семантическая обработка документов: сборник заданий и упражнений
Покупка
Тематика:
Наука. Науковедение
Издательство:
ФЛИНТА
Составитель:
Санникова Инна Иннокентьевна
Год издания: 2020
Кол-во страниц: 123
Дополнительно
Вид издания:
Практическое пособие
Уровень образования:
ВО - Бакалавриат
ISBN: 978-5-9765-2491-0
Артикул: 716626.02.99
Дисциплина «Семантическая обработка документов» посвящена процессам информационного анализа и синтеза для формирования вторичных документов. В пособие включены контрольные материалы, а также даны задания и упражнения по каждой теме. Также пособие снабжено списком рекомендуемой литературы и приложениями.
Для студентов и преподавателей.
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Семантическая обработка документов Сборник упражнений Москва Издательство «ФЛИНТА» 2020 2-е издание, стереотипное
УДК 811.161.1’27(076.5) ББК 81.2Рус-923 С30 С30 Семантическая обработка документов [Электронный ресурс]: сборник заданий и упражнений / сост. И.И Санникова. — 2-е изд., стер. — М.: ФЛИНТА, 2020. — 123 с. ISBN 978-5-9765-2491-0 Дисциплина «Семантическая обработка документов» посвящена процессам информационного анализа и синтеза для формирования вторичных документов. В пособие включены контрольные материалы, а также даны задания и упражнения по каждой теме. Также пособие снабжено списком рекомендуемой литературы и приложениями. Для студентов и преподавателей. УДК 811.161.1’27(076.5) ББК 81.2Рус-923 ISBN 978-5-9765-2491-0 © Санникова И.И., 2015 © Издательство «ФЛИНТА», 2015
СОДЕРЖАНИЕ Часть I. Текст как объект семантической обработки Информационное свертывание. Виды информационного обслуживания.........4 Текст и его общая характеристика.........................................................................6 Синтаксическая структура текста..........................................................................9 Коммуникативная структура текста....................................................................13 Семантическая структура текста.........................................................................15 Информативная структура текста........................................................................20 Аспектная структура текста.................................................................................27 Функционально-смысловая структура текста....................................................35 Часть II. Виды семантической обработки документов. Библиографическое описание..............................................................................41 Аннотирование......................................................................................................46 Реферирование.......................................................................................................52 Обзорно-аналитическая деятельность.................................................................62 Индексирование.....................................................................................................71 Перевод...................................................................................................................75 Автоматизация видов семантической обработки документов..........................79 Контрольные материалы……………………………………………………...…93 Список использованной литературы………………………………………….119 Список рекомендуемой литературы…………………………………………..120 3
ЧАСТЬ I. ТЕКСТ КАК ОБЪЕКТ СЕМАНТИЧЕСКОЙ ОБРАБОТКИ Информационное свертывание. Виды информационного обслуживания 1. Определите вид свертывания, выбрав из ряда вариантов: семантическое свертывание в языке, семантическое свертывание в речи (обобщение), семантическое свертывание в речи (перевод в другую знаковую систему), лексическое свертывание в языке (опущение), лексическое свертывание в языке (совмещение), лексическое свертывание в языке (замещение). Первый вид 1) Пытаясь определить, или, как говорят криминалисты, идентифицировать голову Большого Сфинкса, американский египтолог М. Лернер использовал компьютер - Он ввел в его память сведения о конфигурации головы Большого Сфинкса и описания дошедших до нас статуй египетского фараона, в том числе Хефрена. 2) В результате компьютер выявил сходство лиц Сфинкса и Хефрена. - Это помогло Лернеру восстановить, хотя и только на компьютере, изображение утраченных деталей головы Сфинкса. 3) Эксурсовод - гид Второй вид 1) Синонимы - слова, отличающиеся друг от друга звуковой формой, стилистической окраской, но совпадающие, сходные или очень близкие по значению, выражающие одно и то же понятие. - Синонимы - разные знаки, имеющие общий денотат. Третий вид 1) Новый метод производства в отличие от уже существующих не требует больших материальных затрат, что положительно сказывается на себестоимости продукции - новый метод производства экономически выгоднее традиционных. 2) Температура повышается, когда увеличивается давление - температура повышается при увеличении давления. Четвертый вид 1) Сколько у вас сегодня занятий. - Три. 2) Я приду в два. 3) Моя старшая сестра любит читать детективы, а младший брат - фантастику. Пятый вид 4
1) Место иерархических, предметных и дескрипторных языков в функционировании электронных каталогов. - Место различных информационно поисковых языков в функционировании электронных каталогов. Шестой вид 2) Электронная вычислительная машина- компьютер. Приносящий прибыль – рентабельный [Блюменау: 2002. С. 22]. 2. Определите вид обслуживания: документальное, фактографическое, концептографическое. 1) Рекомендательная аннотация 2) Библиографическое описание 3) Реферат 4) Библиографический обзор 5) Конспект 6) Рецензия 7) Реферативный обзор 8) Развернутый реферат 9) Аналитический обзор 10) Аннотация 11) Фактографическое описание 3. Определите подход к свертыванию информации: метанформативный и информативный: 1) Автореферат диссертации 2) Реферативный обзор 3) Библиографический обзор 4) Информативный реферат 5) Справочный аппарат издания 6) Экспресс-информация 7) Отчет 8) Информационный листок 9) Цитата 10) Статья 11) Аннотация 12) Краткое сообщение 13) Самостоятельные фрагменты текстов 14) Библиографическое описание 5
15) Фактографическая справка 16) Предисловие к книге 17) Программа учебного курса Текст и его общая характеристика 1. Оцените текст с точки зрения наличия или отсутствия основных его свойств. ИНФОРМАЦИОННЫЕ СИСТЕМЫ В УПРАВЛЕНИИ ПРЕДПРИЯТИЕМ Современная экономика основана на диктате потребителя, и в таких условиях компании вынуждены искать все возможные способы сокращения издержек, реализации упущенных возможностей и повышения уровня обслуживания. Решением этой задачи стал перевод взаимоотношений на уровне бизнес-бизнес (business-to-business - В2В) и бизнес-потребитель (business-to-consumer - В2С) в электронную форму. Меры по информатизации бизнеса в той или иной мере принимаются на любом предприятии, однако важность этого процесса в вертикально интегрированных отраслях привела к необходимости построения стройных и всеобъемлющих информационных систем. Существует два подхода к построению информационных систем: но распределенному принципу и централизованному. Для распределенной архитектуры характерна работа с локальной базой данных на каждом объекте учета. Это требует об мена информацией между различными объектами с определенной дискретностью, что приводит к необходимости ведения управления дискретным образом. Централизованный подход подразумевает наличие единой базы данных и удаленного интерактивного режима работы с ней из любого объекта сети. Построение централизованной информационной системы является предпочтительным, поскольку такая архитектура обеспечивает прозрачность рабочих процессов, экономию издержек за счет отсутствия необходимости тиражирования издержек на персонал и оборудование в случае расширения предприятия, а также возможность ведения непрерывного управленческого процесса, благодаря организации работы с информационной системой в режиме реального времени. Это позволяет в любой момент иметь только актуальную информацию, а значит, повысить скорость принимаемых решений и улучшить их качество; интенсифицировать все внутренние логистические процессы, исключить возможность двойного ввода и двойного контроля информации. Информационные системы важны не только на уровне отдельных предприятий, но и на уровне целых отраслей, где развиты вертикальные связи (телекоммуникации, 6
энергетика, нефтегазовая отрасль, металлургия, правительственные структуры, сложное производство, розничные торговые сети). В российских условиях наибольший интерес представляет электроэнергетическая отрасль, где создание единого информационного пространства может способствовать успешному проведению реформы, повысить эффективность работы энергопредприятий всех звеньев и установить прозрачную систему взаимоотношений между участниками рынка (Т.А. Борисова) [Цит. по книге: Молодые ученые Якутии в стратегии устойчивого развития Российской Федерации: материалы конференции.- СПб., 2000. С. 120-121]. 1. Информативность Фактуальная - Концептуальная - 2. Смысловая целостность Есть ли связь между предложениями? Нет ли отступлений от темы? Является ли текст законченным? 3. Синтаксическая связность Лексические: Морфологические: Синтаксические: 4. Литературная обработанность - 5. Закрепленность на материальном носителе - 2. Прочитайте абзацы текста «Природные ресурсы», расположите их в определенной логической последовательности, создавая единый связный текст. ПРИРОДНЫЕ РЕСУРСЫ Воспринимая природу как объект эксплуатации и основной источник развития общества, производство стремится взять у природы как можно больше. Достижения научно-технического прогресса сделали возможным на определенном этапе вовлечение в производство огромной массы природных ресурсов с меньшими затратами. Эти тенденции привели к значительному ухудшению качества запасов полезных ископаемых и состояния окружающей природной среды. Из различных классификаций природных ресурсов наиболее широко используется классификация по их принадлежности к тем или иным компонентам окружающей среды, функциональному назначению, способности к естественному восстановлению или сохранению, т.е. истощаемости. 7
Природные ресурсы человек использует непосредственно или в переработанном виде. Само понятие ресурса появилось в то время, когда началась хозяйственная деятельность человека и возникла необходимость широкого и разнообразного использования природных богатств и объектов окружающей среды. Источником существования человеческого общества служат природные ресурсы, являющиеся важнейшими компонентами окружающей его естественной среды. Все они связаны с литосферой, гидросферой, атмосферой, биосферой, космосом. Это минеральные ресурсы, земля, вода, растительность, живые организмы, газы, солнечная радиация и др. Природные ресурсы выступают и как компоненты природы, и как экономическая категория. Естественные ресурсы, вовлеченные в процесс общественного производства, в конечном итоге входят в качестве составной части в производительные силы общества. Рассмотрим природные ресурсы Земли по способности к естественному восстановлению или сохранению. Их делят на неисчерпаемые и почерпаемые. К исчерпаемым ресурсам относятся ресурсы, которые расходуются и уничтожаются в процессе их потребления человеком. С позиций воспроизводства их разделяют на возобновимые и невозобновимые. Неисчерпаемые ресурсы могут быть использованы многократно и запасы их практически неограниченны. К этим ресурсам относят водные, атмосферный воздух, космические, энергию морских приливов и т.д., а также климатические ресурсы. Перечисленные виды ресурсов обладают способностью к возобновлению. Однако усиливающаяся в последнее время антропогенная нагрузка на природную среду может существенно ухудшить качество таких ресурсов, как воздух и вода. А ухудшение, например, качества атмосферы посредством ее загрязнения может привести к изменению климата на Земле. Невозобновимые ресурсы — это минеральные ресурсы недр, запасы которых совершенно не восстанавливаются или восстанавливаются медленнее, чем происходит их использование человеком. Возобновимые ресурсы характерны тем, что обладают способностью восстанавливаться по мере их использования. Они включают почву, растительность, животный мир, поверхностные и подземные воды, а также некоторые виды минеральных ресурсов (например, соли, осаждающиеся в озерах и лагунах). Ресурсы солей можно воссоздать из соленых вод и искусственным путем. К минеральным ресурсам, которые совершенно не восстанавливаются, прежде всего относятся месторождения, возникшие в результате кристаллизации рудных минералов непосредственно из магмы — расплавленной глубинной массы. Это также и 8
метаморфические залежи, создание которых связано с процессами преобразования структуры и состава горных пород под влиянием ряда физико-химических факторов. В связи с этим возникает необходимость решения задачи взаимосвязанного обеспечения воспроизводства ресурсов и охраны природы, а также экологической безопасности существования общества. К возобновимым в отдаленном будущем минеральным ресурсам можно отнести некоторые топливно-энергетические вещества: нефть, уголь, сланец, торф, а также строительные материалы: гравий, песок, глины. Однако темпы их образования необоз римо медленнее, чем темпы добычи [Проскурякова: 2004. С.268-270.]. Синтаксическая структура текста 1. Найдите в тексте средства связи, определите их вид. ПОИСКОВЫЕ СИСТЕМЫ Поисковые системы (их называют также поисковыми машинами) — это полностью автоматизированные интерактивные службы поиска информации в Интернете по введенному пользователем текстовому запросу. Создав и разместив в Интернете веб-сайт, разработчик регистрирует его адрес в поисковой системе, то есть вносит URL стартовой странички в соответствующее поле на поисковом сервере. Вслед за этим специальная программа поисковой системы, назы ваемая роботом, или спайдером (от англ. spider — паук), просматривает данный документ, проходит по всем обнаруженным на нем гиперссылкам и вносит информацию об обнаруженных страницах в базу данных поисковой системы, которая носит название индекса. Этот процесс называется индексацией веб-страниц. Как правило, индекс поискового сервера содержит только адреса веб-страниц и краткую аннотацию (70—150 символов), поясняющую их содержимое и почерпнутую из текста самих индексируемых документов. Спустя некоторое время робот автоматически проводит переиндексацию, в ходе которой удаляет из базы данных устаревшие и более недействительные ссылки. Пользователь, обращаясь к поисковой машине, просто вводит в поле текстового запроса ключевые слова, характеризующие предмет его интересов. После того как он нажмет кнопку «Искать», поисковый сервер передает управление другой программе, которая называется поисковым механизмом. Эта программа сравнивает введенные ключевые слова с содержимым индекса, выявляя возможные соответствия. Например, получив запрос «идти», поисковый механизм может расширить диапазон поиска, включив в список ключевых слов глаголы «пойти», «шел», «шла», «пойдет» и т.д. Ссылки, в описании которых обнаруживаются подобные совпадения, автоматически включаются 9
поисковым механизмом в файл отчета, предоставляемый пользователю в виде списка гиперссылок на найденные ресурсы с краткими текстовыми аннотациями для каждой из них. Степень соответствия обнаруженных таким образом ссылок исходному запросу называется релевантностью поиска. Интерфейс большинства поисковых машин интуитивно понятен даже неподготовленному пользователю. Однако качество работы большинства поисковых систем все же не идеально, и релевантность предоставляемых ими отчетов зачастую оставляет желать лучшего. Поисковый механизм — не живой человек и какие бы совершенные эвристические методы анализа информации он не использовал, понимание многозначности некоторых слов и свойственное нам интуитивное восприятие разговорной речи ему, увы, недоступно. Поэтому в ответ на запрос «закон» вы можете получить и полный текст Гражданского кодекса РФ, и формулировку закона всемирного тяготения, и список законов всемирного свинства небезызвестного Мерфи, и русскую народную пословицу про закс и дышло [Цит. по книге: Пособие по научному стилю речи. – М. :Флинта: Наука, 2009. С. 68-69.]. 2. Устраните в тексте однообразие средств связи. ЭЛЕКТРОННАЯ ПОЧТА Электронная почта (E-mail) – наиболее распространенный и эффективный сервис Интернета. Электронная почта – типичный сервис отложенного чтения (off-line). Вы посылаете ваше сообщение, как правило, в виде обычного текста, адресат получает его на свой компьютер через какой-то, возможно достаточно длительный, промежуток времени и читает ваше сообщение тогда, когда ему будет удобно. E-mail очень похож на обычную бумажную почту, обладая теми же достоинствами и недостатками. Обычное письмо состоит из конверта, на котором написан адрес получателя и стоят штампы почтовых отделений пути следования и содержимого - собственно письма. Электронное письмо также состоит из заголовков, содержащих служебную информацию (об авторе письма, получателе, пути прохождения по сети и т.д.), играющих роль конверта, и собственно содержимого письма. Вы можете вложить в обычное письмо что-нибудь, например, фотографию; аналогично вы можете послать файл с данными электронным письмом. Вы можете подписать обычное письмо – можно подписать электронное письмо. Обычное письмо может не дойти до адресата или дойти слишком поздно, как и электронное письмо. Обычное письмо весьма дешево, и электронная почта самый дешевый вид связи. 10