Современные базы данных. Основы. Часть 1
Покупка
Основная коллекция
Тематика:
Базы и банки данных. СУБД
Издательство:
НИЦ ИНФРА-М
Автор:
Дадян Эдуард Григорьевич
Год издания: 2017
Кол-во страниц: 88
Дополнительно
Вид издания:
Учебное пособие
Уровень образования:
Профессиональное образование
ISBN-онлайн: 978-5-16-106526-6
Артикул: 681963.01.99
В пособии рассмотрены и проанализированы концепции баз данных, архитектура реляционных баз данных, операции над таблицами реляционных баз, вопросы использования языка ER-диаграмм для построения инфологических моделей (диаграммы “сущность - связь", информационное моделирование, методология IDEFIX, этапы разработки инфологической модели данных); организации доступа к данным (средства ускоренного доступа к данным, язык запросов, обработка транзакций, средства восстановления после сбоев); построения систем, ориентированных на анализ данных (хранилища данных; модели данных, используемые при построении хранилищ данных).
Предназначено в качестве учебного пособия для студентов, обучающихся по специальностям "Финансы и кредит", "Бухгалтерский учет, анализ и аудит", "Мировая экономика", "Налоги и налогообложение", а также для магистрантов и слушателей ИПК.
Тематика:
ББК:
УДК:
ОКСО:
- 09.00.00: ИНФОРМАТИКА И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА
- ВО - Бакалавриат
- 09.03.02: Информационные системы и технологии
ГРНТИ:
Скопировать запись
Фрагмент текстового слоя документа размещен для индексирующих роботов
Э.Г. Дадян Современные базы данных. Основы Часть 1 Москва Инфра-М 2017
Э.Г. Дадян Современные базы данных. Основы Часть 1 Москва Инфра-М; Znanium.com 2017
УДК 338.2(075.8) ББК 32.973.23 Д12 Дадян, Э.Г. Современные базы данных. Основы. Часть 1: Учебное пособие / Э.Г. Дадян. – М.: Инфра-М; Znanium.com, 2017. – 88 с. ISBN 978-5-16-106526-6 (online) В пособии рассмотрены и проанализированы концепции баз данных, архитектура реляционных баз данных, операции над таблицами реляционных баз, вопросы использования языка ER-диаграмм для построения инфологических моделей (диаграммы “сущность связь", информационное моделирование, методология IDEFIX, этапы разработки инфологической модели данных); организации доступа к данным (средства ускоренного доступа к данным, язык запросов, обработка транзакций, средства восстановления после сбоев); построения систем, ориентированных на анализ данных (хранилища данных; модели данных, используемые при построении хранилищ данных). Предназначено в качестве учебного пособия для студентов, обучающихся по специальностям "Финансы и кредит", "Бухгалтерский учет, анализ и аудит", "Мировая экономика", "Налоги и налогообложение", а также для магистрантов и слушателей ИПК. ISBN 978-5-16-106526-6 (online) © Э.Г. Дадян, 2004, 2017 (переизд.)
О г л а в л е н и е Введение.................................................................................................... 5 1. БАЗЫ ДАННЫХ И СУБД .................................................................. 7 1.1. Данные и ЭВМ........................................................................ 7 1.2. Концепция баз данных. Архитектура СУБД..................... 8 1.2.1. Инфологическая модель данных.......................................... 9 1.2.2. Даталогическая модель данных........................................... 10 1.2.3. Физическая модель данных................................................... 10 1.3. Типы даталогических моделей данных........................... 11 1.3.1. Иерархическая даталогическая модель............................... 11 1.3.2. Сетевая даталогическая модель.......................................... 12 1.3.3. Даталогическая модель на основе инвертированных списков. 13 1.3.4. Реляционная даталогическая модель.................................. 13 1.3.5. Объектно-реляционная даталогическая модель................. 15 2. РЕЛЯЦИОННЫЕ БАЗЫ ДАННЫХ.................................................. 16 2.1. Основные понятия реляционных баз данных ............... 16 2.1.1. Тип данных............................................................................... 16 2.1.2. Домен........................................................................................ 17 2.1.3. Схема отношения, схема базы данных................................. 17 2.1.4. Кортеж, отношение.................................................................. 18 2.2. Целостность реляционных баз данных .......................... 19 2.3. Основные свойства отношений реляционных баз данных..................................................................................... 20 2.3.1. Отсутствие кортежей-дубликатов.......................................... 20 2.3.2. Отсутствие упорядоченности кортежей................................ 20 2.3.3. Отсутствие упорядоченности атрибутов............................... 20 2.3.4. Атомарность значений атрибутов......................................... 21 3. ОПЕРАЦИИ С ТАБЛИЦАМИ РЕЛЯЦИОННЫХ БАЗ ДАННЫХ..... 22 3.1. Некоторые операции теории множеств........................... 22 3.1.1. Ограничение отношения......................................................... 23 3.1.2. Проекция отношения............................................................... 23 3.1.3. Объединение отношений........................................................ 23 3.1.4. Пересечение отношений......................................................... 23 3.1.5. Разность отношений................................................................ 24 3.1.6. Произведение отношений..................................... 24 3.1.7. Деление отношений.................................................. 25 3.1.8. Соединение отношений.............................................. 25 3
3.2. Нормализация отношений реляционных баз данных.... 25 3.2.1. Пример декомпозиции исходной "универсальной" таблицы на простые отношения............................................ 26 3.2.2. Проблемы, возникающие при использовании универсального отношения................................................... 28 3.2.3. Первая нормальная форма (1NF)......................................... 30 3.2.4. Вторая нормальная форма (2NF).................................... 32 3.2.5. Третья нормальная форма (3NF)..... 34 3.2.6. Нормальная форма Бойса-Кодда (BCNF)............................ 36 3.2.7. Четвертая нормальная форма (4NF). Пятая нормальная форма (нормальная форма проекции-соединения (5NF или PJ/NF).................................................................. 37 4. ИСПОЛЬЗОВАНИЕ ЯЗЫКА ER-ДИАГРАММ ДЛЯ ПОСТРОЕНИЯ ИНФОЛОГИЧЕСКИХ МОДЕЛЕЙ...................................................... 37 4.1. Диаграммы "сущность-связь"........................................... 37 4.2. Методология IDEF1X............................................................ 41 4.3. Этапы разработки инфологической модели данных..... 44 4.3.1. Анализ выходных форм ........................................................ 44 4.3.2. Выделение сущностей .......................................................... 45 5. ОРГАНИЗАЦИЯ ДОСТУПА К ДАННЫМ ......................................... 47 5.1. Средства ускоренного доступа к данным....................... 47 5.2. Язык запросов....................................................................... 49 5.2.1. Язык SQ L................................................................................ 49 5.2.2. Состав SQL-оператора.......................................................... 49 5.2.3. SQL-оператор SELECT.......................................................... 50 5.2.4. SQL-оператор DELETE.......................................................... 67 5.2.5. SQL-оператор INSERT .......................................................... 68 5.2.6. SQL-оператор UPDATE .............................................. 68 5.3. Обработка транзакций ........................................................ 69 5.4. Средства восстановления после сбоев........................... 73 6. ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ, ОРИЕНТИРОВАННЫХ НА АНАЛИЗ ДАННЫХ ........................................................................... 74 6.1. Хранилища данных ............................................................. 74 6.2. Модели данных, используемые при построении хранилищ данных................................................................. 76 Заключение ............................................................................................... 82 Список литературы................................................................................... 83 Приложение. Список сокращений, наиболее часто встречающихся в литературе по автоматизации интеллектуальной деятельности... 84 4
В в е д е н и е О создании и функционировании систем управление базами данных (СУБД1) написано немало книг. Но большинство из н и х- англоязычные издания, вышедшие за рубежом и недостаточно знакомые российскому читателю. Литературы на русском языке, посвященной тематике СУБД, очень немного. Невозможно рекомендовать какое-либо издание, содержание которого покрывало бы весь материал курса "Базы данных". К числу лучших относятся книги К. Дейта "Введение в системы баз данных" (М.: Наука, 1980) и "Руководство по реляционной СУБД ОВ2" (М.: Финансы и статистика, 1988), а также книга Дж. Ульмана "Основы систем баз данных" (М.: Финансы и статистика, 1983). Хотя эти книги несколько устарели (на английском языке вышло уже несколько дополненных изданий), тем не менее они содержат информацию, которая будет интересна пользователям ПЭВМ, специализирующимся в области разработки и проектирования баз данных. Задача данного учебного пособия - систематизировать и представить методически в доступной для первоначального изучения и освоения форме материал, в объеме и по содержанию отвечающий требованиям программы курса "Базы данных". Пособие состоит из шести взаимосвязанных разделов, в которых последовательно, шаг за шагом, рассмотрены следующие вопросы: 1) концепция баз данных, архитектура СУБД (инфологическая модель данных, даталогическая модель данных, физическая модель данных, типы даталогических моделей данных, иерархическая даталогическая модель, сетевая даталогическая модель, даталогическая модель на основе инвертированных списков, реляционная даталогическая модель, объектно-реляционная даталогическая модель); 1 Список сокращений, наиболее часто встречающихся в литературе по автоматизации интеллектуальной деятельности, дан в Приложении к учебно-методическому пособию. 5 1*-201
2) реляционные базы данных (основные понятия реляционных баз данных, тип данных, домен, схема отношения, схема базы данных, кортеж, отношение, целостность реляционных баз данных, основные свойства отношений реляционных баз данных); 3) операции над таблицами реляционных баз данных (операции теории множеств, нормализация отношений реляционных баз данных); 4) использование языка ЕК-диаграмм для построения инфоло- гических моделей (диаграммы "сущность - связь", информационное моделирование, методология ЮЕР1Х, этапы разработки инфо- логической модели данных); 5) организация доступа к данным (средства ускоренного доступа к данным, язык запросов, обработка транзакций, средства восстановления после сбоев); 6) принципы построения систем, ориентированных на анализ данных (хранилища данных, модели данных, используемые при построении хранилищ данных). 0<>0 6
1. БАЗЫ ДАННЫХ И СУБД 1.1. Данные и ЭВМ Восприятие реального мира можно соотнести с последовательностью разных, хотя иногда и взаимосвязанных явлений. С давних времен люди пытались описать эти явления. Такое описание называют данными. Традиционно фиксация данных осуществляется с помощью конкретного средства общения (например, с помощью естественного языка или изображений} на конкретном носителе (например, камне или бумаге). Обычно данные (факты, явления, события, идеи или предметы) и их интерпретация (семантика) фиксируются совместно, так как естественный язык достаточно гибок для представления того и другого Примером может служить утверждение "Стоимость авиабилета - 128 рублей". Здесь "128 рублей" - данное, а "Стоимость авиабилета" - его семантика. Нередко данные и интерпретация разделены. Например, "Расписание движения самолетов" может быть представлено в виде таблицы (рис. 1), в верхней части которой (отдельно от данных) приводится их интерпретация. Такое разделение затрудняет работу с данными (попробуйте быстро получить сведения из нижней части таблицы) (см. рис. 1). Интерпретация Но мор рейса Дни недели Пункт отправления Время вылета Пункт назначения Время прибытия Тип самолета . Стоимость билета Данные 138 2 4 7 Баку 21.12 Москва 0.52 ИЛ-86 115.00 57 3_6 Ереван 7.20 Киев 9.25 ТУ-154 92.00 1234 2_6 Казань 22.40 Баку 23.50 ТУ-134 73.50 .... Рис. 1. Расписание движения самолетов. Данные и их интерпретация, оформленные в виде таблицы Применение ЭВМ для ведения (сопровождения, поддержки) и обработки данных обычно приводит к еще большему разделению данных и интерпретации. ЭВМ имеет дело главным образом с данными как таковыми. Большая часть интерпретирующей информации вообще не фиксируется в явной форме (ЭВМ не "знает", является ли "21.50" стоимостью авиабилета или временем вылета). Почему же это произошло? Существует по крайней мере две исторические причины, по которым применение ЭВМ привело к отделению данных от интерпретации. Во-первых, ЭВМ не обладали достаточными возможностями 7
для обработки текстов на естественном языке - основном языке интерпретации данных. Во-вторых, стоимость памяти ЭВМ была первоначально весьма велика. Память использовалась для хранения самих данных, а интерпретация традиционно возлагалась на пользователя. Пользователь закладывал интерпретацию данных в свою программу, которая "знала", например, что шестое вводимое значение связано с временем прибытия самолета, а четвертое - с временем его вылета. Это существенно повышало роль программы, так как вне интерпретации данные представляют собой не более чем совокупность битов на запоминающем устройстве. Жесткая зависимость между данными и использующими их программами создает значительные неудобства для их использования. 1.2. Концепция баз данных. Архитектура СУБД Активная деятельность по отысканию приемлемых способов обобществления непрерывно растущего объема информации привела к созданию в начале 60-х годов специальных программных комплексов, названных системами управления базами данных (СУБД). СУБД- это программное обеспечение, осуществляющее создание базы данных, поддержание ее в рабочем состоянии и обеспечение эффективного доступа к данным базы для пользователей и для приложений. Основная особенность СУБД - наличие процедур для ввода и хранения не только самих данных, но и описаний их структуры. Файлы, снабженные описанием хранимых в них данных и находящиеся под управлением СУБД, стали называть банками данных, а затем базами данных (БД). Таким образом, База данных - это отражение предметной области в форме структурированной совокупности данных. Хранящиеся в ней данные характеризуют состав объектов предметной области, их свойства и взаимосвязи. СУБД должна предоставлять доступ к данным любым пользователям, включая и тех, кого не интересуют такие подробности ее функционирования, как: • физическое размещение в памяти данных и их описаний; • механизмы поиска запрашиваемых данных; • проблемы, возникающие при одновременном запросе одних и тех же данных многими пользователями (прикладными программами); • способы обеспечения защиты данных от некорректных обновлений и (или) несанкционированного доступа; • технология поддержания баз данных в актуальном состоянии и т.д. При выполнении основных из этих функций СУБД должна использовать различные описания данных. А как создавать эти описания? 8
Естественно, что работу над проектом базы данных надо начинать с анализа предметной области и выявления требований к ней отдельных пользователей (сотрудников организации, для которых создается база данных). Проектирование обычно поручается человеку (группе лиц) - администратору базы данных (АБД). Им может быть как специально выделенный сотрудник организации, так и будущий пользователь базы данных, достаточно хорошо знакомый с машинной обработкой данных. 1.2.1. Инфологическая модель данных Объединяя частные представления о содержимом базы данных, полученные в результате опроса пользователей, и свои представления о данных, которые могут потребоваться в будущих приложениях, АБД сначала создает обобщенное неформальное описание создаваемой базы данных. Описание, которое выполнено с использованием естественного языка, математических формул, таблиц, графиков и других средств, понятных всем людям, работающим над проектированием базы данных, называют инфологической моделью данных (см. рис. 2). П р е д м е т н а я о б л а с т ь Рис. 2. Уровни моделей данных 9