Основные понятия (2-4)
8 База данных (БД) – это специальным образом организованная и хранящаяся на внешнем носителе совокупность взаимосвязанных данных о некотором объекте, используемая различными задачами в рамках некоторой единой автоматизированной информационной системы.
Теория управления базами данных как самостоятельная дисциплина начала развиваться приблизительно с начала 50-х годов двадцатого столетия. За это время в ней сложилась определенная система фундаментальных понятий. Приведем некоторые из них.
8 Объектом называется элемент информационной системы, сведения о котором хранятся в базе данных. Иногда объект также называют сущностью (от англ., entity).
8 Классом объектов называют их совокупность, обладающую одинаковым набором свойств.
8 Атрибут (поле, элемент) - это информационное отображение свойств объекта. Каждый объект характеризуется некоторым набором атрибутов.
8 Записьданных (англ. эквивалент record) — это совокупность значений атрибутов (элементов данных), принадлежащих отдельному экземпляру объекта.
8 Ключевым элементом данных называется такой атрибут (или группа атрибутов), который позволяет определить значения других элементов данных.
8 Первичный ключ — это атрибут (или группа атрибутов), который уникальным образом идентифицирует каждый экземпляр объекта (запись). 8 Вторичным ключом называется атрибут (или группа атрибутов), значение которого может повторяться для нескольких записей (экземпляров объекта). Прежде всего, вторичные ключи используются в операциях поиска записей.
8 Чтобы лучше понять сущность баз данных, рассмотрим пример.
Университет – 8 база данных, содержащая сведения о студентах. 8 Полями (атрибутами, элементами) базы данных будут являться столбцы таблицы с уникальными именами. 8 Записями данных – строки таблицы. На каждого студента – 1 запись. 8 № зачетной книжки в данном случае будет являться первичным ключом для записей базы данных.
8 Процедуры хранения данных в базе должны подчиняться некоторым общим принципам, среди которых в первую очередь следует выделить:
• 8 целостность и непротиворечивость данных, под которыми понимается как физическая сохранность данных, так и предотвращение неверного использования данных, поддержка допустимых сочетаний их значений, защита от структурных искажений и несанкционированного доступа;
• 8 минимальная избыточность данных обозначает, что любой элемент данных должен храниться в базе в единственном виде, что позволяет избежать необходимости дублирования операций, производимых с ним.
8 Программное обеспечение, осуществляющее операции над базами данных, получило название 8 СУБД - система управления базами данных. Его работа должна быть организована таким образом, чтобы реализовывались перечисленные принципы.
Модели организации данных (5-9)
Набор принципов, определяющих организацию логической структуры хранения данных в базе, получил название модели данных. 8 Модели баз данных определяются тремя компонентами:
• 8 допустимой организацией данных;
• ограничениями целостности;
• множеством допустимых операций.
8 В теории систем управления базами данных выделяют модели трех основных типов: 8 иерархическую, сетевую и реляционную.
8 В иерархической модели все записи образуют иерархически организованный набор, то есть такую структуру, в которой все элементы связаны отношениями подчиненности и при этом запись-потомок должна иметь только одного предка (может подчиняться только одному какому-нибудь другому элементу). Такую форму зависимости удобно изображать с помощью древовидного графа (схемы, состоящей из точек и стрелок, которая связна и не имеет циклов). 8 Схема иерархической структуры базы данных приведен на рис. 1., 8 а на рис. 2 приведен пример, описывающий объект "Университет".
Типичным представителем семейства баз данных, основанных на иерархической модели, является Information Management System (IMS) фирмы IBM, первая версия которой появилась в 1968 г.
8 Концепция сетевой модели данных 8 связана с именем Чарльза Бахмана. Сетевой подход к организации данных является расширением иерархического. В сетевой структуре данных потомок может иметь любое число предков 8 (рис. 3). 8
Сетевая БД состоит из набора записей и набора связей между этими записями, точнее, из набора экземпляров записей заданных типов (из допустимого набора типов) и набора экземпляров из заданного набора типов связи.
Примером системы управления данными с сетевой организацией является Integrated Database Management System (IDMS) компании Cullinet Software Inc., разработанная в середине 70-х годов.
8 Достоинства БД, основанных на сетевой или иерархической модели:
þ 8компактность;
þ высокое быстродействие.
8 Недостатки БД, основанных на сетевой или иерархической модели:
ý 8 неуниверсальность;
ý высокая степень зависимости от конкретных данных.
8 Концепции реляционной модели впервые были сформулированы в работах 8 американского ученого Э. Ф. (Эдгар Фрэнк) Кодда. Откуда происходит ее второе название - модель Кодда.
В реляционной модели объекты и взаимосвязи между ними представляются с помощью таблиц 8 (рис. 5). 8 Для ее формального определения используется фундаментальное понятие " отношения ". Собственно говоря, термин "реляционная" происходит от английского relation - отношение.
При работе с реляционными БД используют понятия поля и записи.
Поле – это столбец таблицы, имеющий свое уникальное имя. В поле файла реляционной БД могут содержаться данные только одного типа.
Запись – это строка таблицы, представляющая собой совокупность данных, записанных в полях базы. Соответственно, в записи может содержаться неоднородная информация (данные разных типов).
В реляционной базе данных каждая таблица должна иметь первичный ключ (ключевой элемент) - поле или комбинацию полей, которые единственным образом идентифицируют каждую запись в таблице.
Основным достоинством реляционной модели является ее простота. Именно благодаря ей она положена в основу подавляющего большинства реально работающих СУБД.