Языки информационного обмена
Покупка
Новинка
Издательство:
ИНТУИТ
Автор:
Кищенко О. Н.
Год издания: 2016
Кол-во страниц: 178
Дополнительно
В данном курсе изучаются язык разметки XML и принципы построения и использования Webсервисов.
Тематика:
ББК:
УДК:
ОКСО:
- ВО - Бакалавриат
- 09.03.01: Информатика и вычислительная техника
- 09.03.02: Информационные системы и технологии
- 09.03.03: Прикладная информатика
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Языки информационного обмена 2-е издание, исправленное Кищенко О.Н. Национальный Открытый Университет “ИНТУИТ” 2016 2
Языки информационного обмена/ О.Н. Кищенко - М.: Национальный Открытый Университет “ИНТУИТ”, 2016 В данном курсе изучаются язык разметки XML и принципы построения и использования Webсервисов. (c) ООО “ИНТУИТ.РУ”, 2007-2016 (c) Кищенко О.Н., 2007-2016 3
Предисловие Данный курс предназначен для студентов 3 курса, имеющих навыки программирования в среде Microsoft Visual Studio .Net. В результате прохождения данного курса студент должен приобрести следующие знания: 1. Что такое языки разметки. Для чего они используются. Историю развития языков разметки. 2. Принципы моделирование данных с использованием XML. 3. Web службы. Построение Web служб: SOAP, UDDI, USDL, WSFL. Концепция .NET . А также научиться: 1. Использовать языки разметки. 2. Разрабатывать, отображать содержимое и извлекать необходимую информацию из XML-документов. 3. Разрабатывать и в дальнейшем использовать web-сервисы. В данном курсе использовались материалы: Хабибуллин И.Ш. “Самоучитель XML”, Шапошников И.В. “Web- сервисы Microsoft .Net”, Бумфрей Ф., Дирецо О., Дакетт Й. и др. “XML. Новые перспективы WWW”, Дидье Мартин, Марк Бирбек, Майкл Кэй и др. “XML для профессионалов”, Алекс Феррара, Мэтью Мак-Дональд “Программирование web-сервисов для .NET”, материалы сайта ссылка: http://www.citforum.ru/ 4
Языки разметки. Введение в XML Рассматривается основные понятия языков разметки. История их развития. Более подробно рассматриваются основные особенности языка разметки XML. Язык разметки (markup languages) - это набор специальных инструкций, называемых тэгами, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры. Другими словами разметка показывает, какая часть документа является заголовком, какая подзаголовком, что следует считать именем автора и т. д. Разметка разделяется на стилистическую разметку, структурную и семантическую. Стилистическая разметка Стилистическая разметка отвечает за внешний вид документа. Например, в HTML к данному типу разметки относятся такие теги как <I> </I> (курсив), <B> </B> (жирный), <U> </U> (подчеркивание), <S> </S> (перечеркнутый текст) и т.д. Структурная разметка Структурная разметка задает структуру документа. В HTML за данный тип разметки отвечают, например, теги <P> </P> (параграф), <H?> </H?> (заглавие), <DIV> </DIV> (секция) и т.д. Семантическая разметка Семантическая разметка информирует о содержании данных. Примерами данного типа разметки являются теги <TITLE> </TITLE> (имя документа), <CODE> </CODE> (код, используется для листингов кода), <VAR> </VAR> (переменная), <ADDRESS> </ADDRESS> (адрес автора). Основными понятиями любого языка разметки являются теги, элементы и атрибуты. Тэги и элементы. Значения понятий тэги и элементы часто путают. Тэги, или, как их еще называют, управляющие дескрипторы, служат в качестве инструкций для программы, производящей показ содержимого документа на стороне клиента как поступить с содержимым тега. Для того чтобы выделить тег относительно основного содержимого документа используются угловые скобки: тег начинается со знака “меньше” (<) и завершается знаком “больше” (>), внутри которых помещаются название инструкций и их параметры. Например, в языке HTML тег <I> указывает на 5
то, что следующий за ним текст должен быть выведен курсивом. Элемент - это тэги в совокупности с их содержанием. Следующая конструкция является примером элемента: <I> Это текст выделен курсивом </I>. Элемент состоит из открывающего тега (в нашем примере это тег <I> ), содержимого тега (в примере это текст “Это текст, выделен курсивом”) и закрывающего тега( </I> ), правда иногда в HTML, закрывающий тег можно опустить. Атрибуты Для того чтобы при определении элемента задать какие-либо параметры, уточняющие характеристики данного элемента используются атрибуты. Атрибуты состоят из пары “название” = “значение”, которую можно задавать при определении элемента в начальном тэге. Слева и справа от символа равенства можно оставлять пробелы. Значение атрибута указывается в виде строки, заключенной в одинарные или двойные кавычки. Любой тэг может иметь атрибут, если этот атрибут определен. В случае использования атрибута элемент принимает следующую форму: <имя_тега атрибут = “значение”> содержимое тега </имя_тега> Пример: <p ALIGN=“CENTER”> текст выравнивается по центру </p> В одном открывающемся теге может содержаться несколько атрибутов, например: <FONT SIZE = 7 color = “RED”> Указан размер и цвет текста </FONT> История развития языков разметки. Понятие гипертекста было введено В.Бушем в 1945 году а, начиная с 60-х годов, стали появляться первые приложения, использующие гипертекстовые данные. Однако основное развитие данная технология получила, когда возникла реальная необходимость в механизме объединения множества информационных ресурсов, обеспечения возможности создания, просмотра нелинейного текста. В 1986 году ISO был утвержден универсальный стандартизированный язык разметки (Standardized Generalized Markup Language). Этот язык предназначен для создания других языков разметки, он определяет допустимый набор тэгов, их атрибуты и внутреннюю структуру документа. Таким образом имеется возможность создавать 6
свои собственные тэги, связанные с содержанием документа. Теперь становится очевидно, что такие документы трудно интерпретировать без определения языка разметки, которое хранится в определении типа документа ( DTD - Document Type Definition). В DTD сгруппированы все правила языка в стандарте SGML. Другими словами в DTD описывается связь тегов между собой и правила их применения. Причем для каждого класса документов определяется свой набор правил, описывающих грамматику соответствующего языка разметки. Таким образом, только при помощи DTD можно проверить правильность использования тегов а, следовательно, его нужно посылать вместе с SGML-документом или включать в документ. В то время кроме SGML существовали еще несколько конкурирующих между собой подобных языков, однако популярность (HTML, который является одним из его потомков) дала SGML неоспоримое преимущество перед своими собратьями. С помощью SGML можно описывать структурированные данные, организовывать информацию, содержащуюся в документах, представлять эту информацию в некотором стандартизованном формате. Но из-за своей сложности, SGML использовался, в основном, для описания синтаксиса других языков, и немногие приложения работали с SGML -документами напрямую. SGML обычно применяется лишь в крупных проектах, например, для создания единой системы документооборота крупной фирмы. Язык разметки HTML гораздо более простой и удобный, чем SGML, его инструкции в первую очередь предназначены для управления процессом вывода содержимого документа на экране. Язык HTML как способ разметки технических документов был создан Тимом Бернерсом-Ли (Tim Berners-Lee) в 1991 году специально для научного сообщества. Первоначально он был всего лишь одним из SGML -приложений. Не смотря на то, что единственное, что умеет HTML - классифицировать части документа и обеспечивать его правильное отображение в браузере, он является самым популярным языком разметки. Это связано с тем, что HTML достаточно легок для изучения. Все, что от вас требуется, - изучить команды HTML. DTD для HTML хранится в браузере. К тому же надо заметить, что HTML спроектирован для работы на самых разных платформах. Но у него есть ряд существенных ограничений: 1. HTML имеет фиксированный набор тэгов, и данный набор нельзя расширить или изменить; 2. теги языка HTML показывают только как должны быть представлены данные, то есть внешний вид документа. HTML не несет информации о значении содержания, заключенного в тэгах, структуре документа. В 1996 общественной организацией World Wide Web Consortium ( W3C ) началась разработка XML (Extensible Markup Language) который стал золотой срединой между языками SGML и HTML. Язык XML позволяет разработчику создавать свои собственные теги, но в отличие от SGML он достаточно прост. На основе языка XML был создан язык разметки для беспроводных устройств WML. Данный язык позволяет описать пользовательский интерфейс на устройствах с 7
ограниченными возможностями представления данных, например, мобильных телефонах. Все представленное множество языков разметки удобно для наглядности представить в виде следующего “генеалогического дерева” языков разметки: Введение в XML Как появился XML Разработка XML началась в 1996 году. Консорциум World Wide Web ( W3C ) выделил средства группе экспертов по языку SGML, возглавляемой Джоном Боузэком (Jon Bosak) из компании Sun Microsystems, для создания подмножества языка SGML, которое могло бы быть принято Web-сообществом. В результате работы несущественные возможности SGML были удалены, в результате чего язык, разработанный таким образом, оказался значительно более доступным, чем оригинал. В 1998 году консорциум выпустил спецификацию XML версии 1.0. Она постоянно совершенствуется, последний вариант спецификации всегда находится по адресу ссылка: http://www.w3c.org/TR/rec-xml. Необходимо отметить, что язык XML был разработан таким образом, что любой действительный документ XML является действительным документом SGML. Что такое XML Свое название расширяемый язык разметки XML (Extensible Markup Language) получил по той причине, что в нем нет фиксированного формата, как в HTML. В то время как язык HTML ограничивается набором твердо закрепленных тегов, пользователи XML могут создавать свои собственные тэги, которые бы отвечали тематике документа. Таким образом, XML - это метаязык. Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов. Документ XML выглядит во многом похожим на HTML. В XML существуют открывающие, закрывающие и пустые тэги. Однако, в отличие от HTML, правила относительно тегов более строгие, например, смысл тега зависит от регистра, а каждый 8
открывающий тег должен во всех случаях иметь парный закрывающий тег. Теги в документе могут быть вложены друг в друга. Теги начала и конца элемента являются основными используемыми в XML разметками, но ими дело не исчерпывается. Так же как и в HTML тэги могут иметь атрибуты, причем количество атрибутов зависит от фантазии автора. Документы XML могут содержать ссылки на другие объекты. Ссылки представляют собой строку, начинающуюся с амперсанта и заканчивающуюся точкой с запятой. Ссылки позволяют, в частности, вставить в документ специальные символы, включение которых самих по себе могло бы сбить с толку программу разбора. К тому же ссылки могут ссылаться на определенные автором разделы текста в том же самом или в другом документе. Для того чтобы используемые вами в документе теги понимали и другие необходимо составить определения типов документов (Document Type Definition, DTD). Хранимые в начале файла XML или внешним образом в виде файла, эти определения описывают информационную структуру документа. DTD перечисляют возможные имена элементов, определяют имеющиеся атрибуты для каждого типа элементов и описывают иерархию элементов. Сам XML документ не несет информацию о том как находящиеся в нем данные должны отображаться на экране, за это отвечает таблица стилей. Таким образом, в документе имеется разграничение между оформлением и содержанием. Подводя итоги можно сказать, что основными достоинствами XML являются: 1. возможность создания собственных тэгов, относящихся к содержанию документа; 2. XML несет информацию только о структуре и смысле документа, оставляя форматирование элементов таблице стилей; 3. способность объединять несколько ХМL - документов в один большой документ. Язык XML в качестве данных Разметка ХМL отражает содержание документа, его можно использовать как универсальный формат в любых приложениях. Таким образом, XML-файл может быть не только воспроизведен на браузере, но, поскольку XML интегрирован в ряд других приложений, с его помощью можно предоставить пользователю данные для их дальнейшей обработки. XML, как язык разметки документов, приобретает все большую популярность в качестве формата хранения различных материалов. Однако XML не всегда удобен для хранения больших групп записей, так как кроме всего прочего необходимо хранить и описание тегов. В данном случае обычно используют традиционную базу данных, а по мере необходимости преобразовывать ее содержимое в XML. Взаимодействие с машиной Поскольку XML-файлы несут информацию о своем содержании, машинные пользовательские агенты способны обрабатывать информацию, помещенную в файл. Это означает, что в частном случае применения поисковых машин они обеспечивают значительно более точные результаты по запросам. В то время как HTML стал форматом представления, XML действует в качестве общепринятого синтаксиса, 9
позволяя значительно большему числу машинных пользовательских агентов использовать хранимые в XML файлах данные для различных целей. 10