Этапы проектирования баз данных:
1. Системный анализ предметной области
2. Инфологическое проектирование
3. Выбор СУБД
4. Датологическое проектирование
5. Физическое проектирование
I Системный анализ предметной области
На первом этапе проектирования баз данных рассматриваются цели и задачи с помощью которой они будут решатся. Анализируются информационные потребности будущих пользователей баз данных. Рассматриваются формы входных и выходных потоков, которые будут составлять основу баз данных. Затем уточняются алгоритмы и процедуры обработки данных хранимой в базе данных. Формируются требования, которым должна удовлетворять проектируемая база данных и определяется примерный список объектов предметной области, свойства которых будут использоваться при разработке базы данных.
II Инфологическое проектирование
На второй стадии проектирования выполняется моделирование данных. Моделирование данных – это процесс создания логической структуры данных.
Существует два подхода к моделированию данных:
1. Модель «Сущность-связь»
2. Семантическая объектная модель
Эти модели представляют собой языки для описания структуры данных и их связей в представлениях пользователей. Моделирование данных, подобно блок-схемам, отражают логику программы.
Модель «Сущность-Связь».
Сущность – это объект, идентифицируемый в рабочей среде пользователя за которым пользователь хотел бы наблюдать. Класс сущностей – это совокупность сущностей, которая описывается структурой, либо форматом сущностей, составляющих этот класс.
Экземпляр сущности – представляет собой конкретную сущность.
Атрибуты сущности – это свойства сущности, которые описывают характеристики сущности.
Идентификаторы – это атрибуты, с помощью которых экземпляры именуются или идентифицируются.
Если идентификатор указывает на один экземпляр сущности, то его значение называется уникальным. Если идентификатор не является уникальным, то его значение определяется некоторым множеством экземпляров сущности.
Связи – это взаимоотношения сущностей выраженная связями.
Модель «Сущность-Связь» включает в себя классы связей и экземпляры связей. Классы связей – это взаимоотношения между классами сущностей. Экземпляры связей – это взаимоотношения между экземплярами сущностей.
Типы связей:
1). Связь один к одному (1:1) – одиночный экземпляр сущности одного типа связан с одиночным экземпляром сущности другого типа.
2). Связь один ко многим (1:М) – один экземпляр сущности связан со многими экземплярами другой сущности.
3). Связь многие ко многим (М:N) – несколько экземпляров одной сущности связаны с несколькими экземплярами другой сущности.
Модель «Сущность-Связь» или ER-диаграммы включают в себя изображения сущностей в виде прямоугольников (или прямоугольников с закругленными углами), а связей в виде ромбиков (или ромбиков с закругленными углами).
На ER-диаграммах атрибуты обозначаются эллипсами. Если атрибутов у сущности много, то чтобы не загружать ER-диаграмму, атрибуты помещают в прямоугольник, в котором идет перечисление всех атрибутов сущности.
Семантическая объектная модель
Данная модель используется для моделирования данных на этапе инфологического моделирования. Семантический или смысловой объект – это объект, который в определенной степени моделирует смысл пользовательских данных. Они более точно моделируют представления пользователей.
У семантических объектов есть имя, а также есть имя и у класса, отличающего его от других объектов и классов. Семантическая модель имеет набор атрибутов. Атрибуты описывают те характеристики объекта, которые необходимы для удовлетворения информационных потребностей в аспекте решаемых задач.
Для моделирования данных в семантических объектах используется объектные диаграммы. Такие диаграммы используются разработчиками баз данных для описания и визуального представления структуры объектов. Объекты в них отражаются в вертикально ориентированных прямоугольниках. Имя объекта указывается внутри прямоугольника в верхней его части, а затем следует список атрибутов по порядку их значимости для этого объекта.
Для описания типов семантических объектов используются следующие понятия:
1. Однозначный атрибут - атрибуты с максимальным кардинальным числом равным 1.
2. Многозначный атрибут – атрибут, имеющий максимальное кардинальное число большее 1.
3. Необъектный атрибут – это простой или групповой атрибут.
Типы объектов: простые, композитные, составные, гибридные, ассоциативные, родитель.
III Выбор СУБД
При выборе СУБД руководствуются следующими соображениями:
- аппаратное обеспечение, на котором в дальнейшем будет работать проектируемая база данных;
- системное программное обеспечение, с которым будет в последствии работать проектируемая база данных и соответствующее ей приложения;
- методология и подходы, к программированию реализованные в той или иной СУБД;
- модель данных, которая встроена в конкретную СУБД;
Выбор СУБД полностью определяется на II этапе построения базы данных, т. к. оно зависит от той модели данных, которая встроена в выбранную СУБД.
IV Датологическое проектирование
После того, как выбор СУБД завершён, необходимо приступить к проектированию датологической модели базы данных. При формировании датологической схемы, каждая из определённых в концептуальной схеме сущностей отображается в таблицу, которая является одним отношением. При этом следует учитывать ограничения на размер таблиц, которые накладывает конкретная СУБД.
V Физическое проектирование
На этом этапе необходимо на конкретной СУБД, которую выбрали ранее, реализовать базу данных по той информации, которую собрали, обработали и подготовили (на предыдущих этапах проектирования базы данных). Описываются модули, их назначение, а также структура модулей.