Классификация инфо. Системы классификации.
Для представления информации, содержащейся в документах, в форме, удобной для ввода и обработки данных с помощью компьютеров, используются классификация инфо. Классификация –это расп-е множ-ва объектов на подмножества в соответств-и с основанием(установл. признак-и сходства или различия).
Существует две системы классификации – иерархическая и фасетная.
В фасетной системе заданное множество объектов делится на группировки по нескольким независимым признакам (фасетам). Дост: гибк-ть структуры. Пример классификации по такой системе – это классификация промышленной продукции «Одежда». Она подразделяется:
по сезону– на зимняя, летняя и т.д..;
по виду– на эксклюзивная, повседневная и т.д.;
по половозрастному признаку – на мужскую, женскую, детскую и т.д.;
Иерархическая система применяется в случае, когда какое-либо множество объектов подразделяется на классы, подклассы, группы и т.д. последовательно по взаимоподчиненным основаниям.
Классификаторы инфо, их назначение, виды.
Классификаторы – это систематизированные своды наименований объектов, признаков классификации и их кодовых обозначений. Прим. для разного рода проставления кодов в документах и для размещения в памяти машины в качестве словарного фонда. Виды: общегосударственные. Они разрабатываются централизованно и являются едиными для всей страны. Например, классификатор отраслей народного хозяйства; отраслевые. Они едины для какой-то отрасли. Например, классификатор видов оплат и удержаний из заработной платы в пищевой промыш-ти; локальные. характерны для данного эк. объекта. Например, классификатор структурных подразделений предприятия.
кодирование инфо. Методы кодирования.
Кодирование информации – это образование и присвоение кодового обозначения объекту классификации, признаку классификации и (или) классиф-ной группировке. Коды позволяют: уменьшить объем информации, вводимой в компьютер; облегчить запись на машинные носители; осуществить поиск и сортировку; обеспечить наглядность выходных документов.
Одно из важнейших назначений кодирования- обеспечение уникальной идентификации объекта. Виды: по форме представления (цифровые, алфавитно-цифровые), длине (однознач. и многознач.), методу образования (порядковый,серийно-порядковый, разрядный). В случае порядк. метода объектам присваив. порядк. номера, начиная с 1; серийно-порядк. -выделяется серия номеров, а внутри серии- присваив.порядк. номера. Разряд. кажд. признаку классиф-и отвод. опред. комбиниров.
6. внутримашинная организация ЭИ: файловая организация данных и базы данных. Преимущ-ва баз данных. Внутримашинная часть ЭИсодержится на машинных носителях и может состоять из отдельных файлов или представлять собой базу данных.
При этом важнейшей задачей всегда была задача представления и хранения данных на машинных носителях. Одной из первых идей была идея хранить данные в текстовых файлах. Основным достоинством текстовых файлов являлось их простота и возможность доступа без специальных программных средств. Недостатки файловой организации данных относится: 1) при поиске данных файловая система последовательно (построчно) просматривает все символы, записанные в файл что при больших объемах информации существенно снижает быстродействие; 2) невозможность нескольким пользователям изменить одновременно содержание файла, т.е. следующий пользователь может изменить файл, если предыдущий закончил изменения и закрыл этот файл. Поскольку хранение данных в текстовых файлах является малоэффективным, то возникли базы данных. БД– именованная совокупность данных, хранящаяся в компьютера, отображающая состояние объектов реального мира и их отношений в рассматриваемой предметной области. Преимущества: 1. Информация хранится централизованно 2. Обеспечение независимости данных в БД от программ их обрабатывающих 3. Вести быстрый поиск необходимых данных по запросам пользователя 4. Обеспечение защиты секретных данных от постороннего вмешательства.
7. Объемы современных баз данных и устройства для их размещения. Современные БД имеют большие объемы, измеряемые в Терабайтах (1 Тб=1024 Гб) и даже Петабайтах (1 Пб=1024 Тб).
Устройство Емкость БД
Жесткие диски (винчестеры) до 0,5 Тб
RAID-массивы от 2 Тб и более
CD-ROM до 800 Мб
DVD от 4,7 до 17 Гб
Оптические библиотеки от нескольких десятков Гб до 5-6 Тб
Роботизированные библиотеки от единиц до десятков Тб
8. Приложения и компоненты базы данных. Словарь данных. Приложения: Запрос – это требование пользователя на отбор данных из базы и/или на выполнение определенных действий; Форма – это шаблон на экране, предназначенный, главным образом, для ввода, просмотра и редактирования данных базы; Отчет – это представление информации из БД в виде, удобном для ее восприятия и анализа пользователем; Web-страницы, предназначенные для публикации базы данных в Интернет; Прикладные программы – программы, работающие с БД, и написанные на языке программ-я. компоненты: 1. данные пользователей предст. набор таблиц, сотоящ из строк(записей) и столбцов (полей); 2. метаданные предст. описание структуры базы данных ч/з системные таблицы; 3. Индексы – сред-во ускорения операций поиска необх. инфы в базах данных; 4. Метаданные приложения описания стр-ры и формата пользов-х запросов, форм, отчетов и других приложений, выполненное СУБД. Словарь данных (СД ) предст собой подсистему БД, предназн для централ-го хранения инфы о стр-х данных, взаимосвязях файлов БД друг с другом, типах данных и форматах их представления и т.п.
9.Пользователи БД. Пользователь БД – лицо или прикладная программа, которые могут обращаться с командами и/или запросами к БД и получать от нее результаты обращений. Люди, работающие с БД – конечные пользователи БД и обслуживающий персонал. Конечные пользователи БД – это специалисты предметной области, которым требуется информация из БД для выполнения прямых служебных обязанностей. Н-р, конечными пользователями БД могут быть бухгалтер, руководитель, менеджер отдела продаж.
Обслуживающий персонал – люди, ответственные за работу БД (администраторы БД) и соответствующего прикладного ПО (разработчики прикладного ПО). Разработчики прикладного ПО – посредники между БД и конечными пользователями, так как создают удобный GUI в рамках конкретного приложения.
10. трехуровневая модель организации БД. В настоящее время используется трехуровневая система организации баз данных (архитектура баз данных), предложенная в 1975 году комитетом по стандартизации ANSI. Внешний уровень определяет точку зрения на базу данных отдельных приложений или пользователей. Каждое приложение видит и обрабатывает только те данные, которые необходимы этому приложению. Н-р, прикладная программа, используемая отделом кадров, обраб-т сведения о сотрудниках, их адресе, стаже работы и не оперирует данными о заработной плате. Концептуальный уровень – центральное управляющее звено. Здесь база данных представлена в наиболее общем виде, обедняющем данные, используемые всеми приложениями. Фактически это обобщенная модель предметной области (объектов реального мира). Отражает только существенные особенности объектов реального мира. Внутренний уровень (физический) – собственно данные, расположенные в памяти компьюетера.
11. Понятие модели данных. Иерархическая модель, её достоинства и недостатки. Модель данных – сов-сть принципов организации данных в БД. В иерархической модели связи между данными можно представить с помощью дерева. Данные в такой модели расположены на разных иерархических уровнях и называются сегментами. Самый высокий сегмент называется корневым. Сегменты, расположенные на более низком уровне называются сегментами-потомками. Сегменты, расположенные на более высоком уровне, называются сегментами-предками. Каждый сегмент может иметь только одного предка на более высоком уровне и одного или несколько потомков на более низком уровне. Каждый сегмент может иметь только одного предка на более высоком уровне и одного или несколько потомков на более низком уровне. Доступ к определенному сегменту осуществляется по цепочке, от сегмента-предка к сегменту-потомку, начиная слева.
Недостатком: ее громоздкость для обработки данных со сложными логическими связями.
Достоинствам: эффективное использование памяти компьютера при хранении данных.
12. сетевая модель явл развитием иерархической модели. В отличие от иерархич модели в сетевой модели потомок может иметь любое количество предков. Сегменты, которые называются в сетевой модели наборами записей,связываются между собой не только по принципу «сверху вниз», но и «по горизонтали» с помощью наборов связей.
Достоинствам: возможность образования произвольных связей и быстрый доступ к данным.
Недостатками: сложность ее понимания для обычного пользователя и большие объемы памяти компьютера на хранение данных.
13. Реляционная модель – модель данных, основанная на математическом понятии отношения и представлении отношений в форме таблиц.
Отношение – именованная структура данных, представл собой подмножество декартова произведения заданных доменов.
Домен – набор допустимых значений атрибута (столбцы, поля). Кортеж (строка; запись) – строка таблицы, являющейся отношением.
Схема – список имен атрибутов отношения.
Степень отношения – кол-во атрибутов в отношении.
Мощность отношения – кол-во кортежей в отношении.
Достоинство: проста для понимания, наглядна, имеет строгое математич обоснование.
Недостаток: не допускает представления объектов со сложной структурой, поскольку в ее рамках возможно моделирование лишь в помощью двумерных таблиц; данные об объектах содержатся во многих таблицах, извлечение инфо о каждом таком объекте требует выполнения многих операций соединения, что значит замедляет обработку данных.
14. Связь между таблицами в реляц модели делают их более информативными, чем они явл. В отдельности связь устанавливается посредством связи ключевых полей, содержащих общую инфо для обеих таблиц. Пусть таблица Р1 связывается с Р2. тогда Р1называется главной, а Р2 – подчиненной. Ключевое поле основной таблицы называется первичным ключом, а подчиненной – внешним.
Одна запись основной таблицы м.б. связана с одной или несколькими записями подчиненной таблицы. При этом значения первичного ключа уникальны, а внешнего – могут повторяться.
Графическое изображение связи между таблицами наз схемой данных.
Реляционная целостность
В реляц модели должны выполняться условия целостности данных. Условие целостности отношений накладывает ограничения на значения первичного ключа, кот д.б. уникальными и непустыми. Отсюда: не каждое поле м.б. выбрано в качестве первичного ключа.
Условие ссылочной целостности предполагает, что каждое значение внешнего ключа д. совпадать с одним из значений первичного ключа.
16. Операции реляционной алгебры. Объеденением двух отношений R1 U R2 называется отношение R, содержащее множество кортежей, принадлежащих либо R1, либо R2, либо обоим отношениям R1, R2 одновременно. Пересечением отношений R1 Ç R2 называется отношение R, которое содержит множество кортежей, принадлежащих одновременно и R1, и R2. при декартовомпроизведении двух отношений получ новое отношение, кортежи кот. являются сцепление кортежей перго и второго отношения. Разностью отношений R1 и R2 называется отношение R, содержащее множество кортежей, принадлежащих R1 и не принадлежащих R2. При проекции отношений на заданный набор его атрибутов получ. новое отношение, созд. Путем извлечения из исходн отношения кортежей, содер указан атрибуты. Выборка позволяет выбрать из отношения только те картежи, кот. удовлетворяют задан условию. Соеденение прим. к 2 отношениям имеющ общ атрибут, результатом явл отношение, содерж картежи кот явл сочетанием 1-го и 2-го отношения удовлетворяющ указан. условию. Деление предпол наличие 2-х отношений: 1 бинарое (2 атрибута) и унарное(1 атрибут), в результате получ отношение состоящ из кортежей, кот включ кортежей 1-го атрибута1-го отношения, но только таких картежи кот 2-го атрибута соотв. картежам 2-го отношения.
17. Постреляционная модель. Постреляционная модель данных в общем случае представляет собой расширенную реляционную модель, снимающую ограничение неделимости значений полей, т.е. допускаются многозначные поля, значения которых состоят из подзначений.
Достоинствами постреляционной модели данных являются: 1) возможность представления связанных реляционных таблиц одной постреляционнной таблицей. Это обеспечивает высокую наглядность представления данных и повышение эффективности их обработки; 2)отсутствие ограничений на длину полей и их количество в записях таблицы.
Недостатком постреляционнной модели является сложность в обеспечении целостности данных.
18. Объектно-ориентированная модель – структура, кот можно изобразить графически в виде сети, узлами котор.явл объекты.Осн. понятия:
Объекты – отражение сущности реального мира средствами БД. Каждый объект имеет 2 характеристики: состояние и поведение. Состояние объектов определяется множеством значений его атрибутов. Поведение объекта описывает методы, которые могут изменить состояние объекта
Классы – множество объектов, схожих по поведению и другим свойствам.
Наследование – создание нового класса объектов можно образовать на основе уже существующего класса. Инкапсуляция – способ доступа к данным не произвольным образом, а только по строго определенным правилам Расширяемость – возможность добавлять в БД новые объекты и правила их поведения Полиморфизм – способность объекта по-разному реагировать на одно и то же событие в окружающем мире Достоинства – возможность отображения информации о сложных взаимосвязях объектов Недостатки – высокая понятийная сложность, неудобства обработки данных и невысокая скорость обработки запросов.
19. Объектно-реляционная модель включ в себя основн дост-ва объектно ориент модели и унаследовала простату реляц модели. Отличительная особенность объектно-реляционной модели от объектно-ориентированной состоит в том, что она основана на стратегии реляционной модели. К сожалению, разработчики технологий баз данных не пришли к единому мнению о том, как следует определять данную модель и о включении объектов в реляционную модель можно говорить только как об общем направлении развития баз данных. 1. Объекты, видимые на внешнем интерфейсе, отображаются в таблицы поддерживающей реляционной БД. И наоборот, объекты воспроизводятся из их представления в табличной среде хранения, когда они запрашиваются пользователями или приложениями (гибридный подход). Такой подход был популярен в конце 80-х гг. и воплотился в программных продуктах для автоматизации программирования (CASE), для автоматизации проектирования (CAD), в репозитариях (БД, предназначенных для хранения не пользовательских, а системных данных).
2. Внутренние реляционные механизмы СУБД управления данными расширяются объектно-ориентированными возможностями (расширенный реляционный подход).Этот подход технологически более продвинутый и предпочитаемый в настоящее время большинством разработчиков реляционных СУБД. Он воплотился в 1996-1997 гг. в ряде объектно-реляционных серверов БД.
20. Многомерность модели означает многомерное логическое представление структуры информации. предназначена для аналитической обработки инфо.
Агрегируемость данных означает возможность их рассмотрения с различным уровнем обобщения.
Историчность обеспечивает высокий уровень статичности (неизменяемости) данных и их взаимосвязей, а также в обязательном порядке привязку данных к временным точкам. Прогнозируемость данных подразумевает задание функций прогнозирования и применение их к различным интервалам времени.
Измерение – это множество однотипных данных, образующих одну из граней многомерного гиперкуба. (примеры:дни, месяцы, кварталы и годы. города, районы, регионы и страны.
Ячейка – это поле, значение которого однозначно определяется фиксированным набором измерений. В многомерной модели данных используется два варианта организации данных – гиперкубическая и поликубическая. В гиперкубической все кубы определяются одним и тем же набором измерений (максимально возможным). В поликубической определяются несколько гиперкубов с различной размерностью и различными измерениями в качестве граней.
Достоинством многомерной моделиявляется удобство и эффективность аналитической обработки больших объемов данных, связанных с временными интервалами. При организации таких же данных по реляционной модели происходит рост трудоемкости операций выборки и существенное увеличение затрат памяти компьютера на хранение данных. Недостатком является громоздкость для простейших задач оперативной обработки информации.
21. Проектирование базы данных – это процесс создания проекта базы данных, предназначенной для поддержки функционирования экономического объекта и способствующей достижению его целей. Оно представляет собой трудоемкий процесс, требующий совместных усилий аналитиков, проектировщиков и пользователей.
Требования:
-Целостность базы данных. (Требование полноты и непротиворечивости данных).
-Многократное использование данных.
-Быстрый поиск и получение информации по запросам пользователей.
-Простота обновления данных.
-Уменьшение излишней избыточности данных.
-Защита данных от несанкционированного доступа, от искажения и уничтожения.
22. Жизненный цикл базы данных (ЖЦБД) – это процесс проектирования, реализации и поддержки базы данных. ЖЦБД состоит из следующих этапов:
1. Предварительное планирование базы данных. собир инфа об испол-х и наход-ся в процессе разработки прикладных программах и файлах, связанных с ними. 2. Проверка осуществимости. Она предполагает подготовку отчетов по трем вопросам: -есть ли технология? (технологическая осуществимость); -имеются ли персонал, средства и эксперты? (операционная осуществимость); -окупится ли? (экономическая эффективность). 3. Определение требований. На этом этапе опред-ся: цели бд; инфор-ные потр-ти разл струк-х подразделений и их руководителей; требования к оборудованию; требования к программному обеспечению. 4.Концептуальное проектирование. На этом этапе создаются подробные модели пользовательских представлений данных предметной области. Затем они интегрируются в концептуальную модель, которая фиксирует все элементы корпоративных данных, подлежащих загрузке в базу данных. Эту модель называют еще концептуальной схемой базы данных. 5.Логическое проектирование. На этом этапе осущ выбор типа модели данных. Концептуальная модель отображается в логическую. 6.Физическое проектирование. На этом этапе предусматривается принятие разработчиком окончательного решения о способах реализации создаваемой базы данных.
7.Оценка и поддержка базы данных. опрос пользователей на предмет выяснения, какие их информационные потребности остались неучтенными.
23. Средством моделирования предметной области на этапе концептуального проектирования является модель «сущность–связь» (ER-модель) В ней моделирование структуры данных предметной области базируется на использовании графических средств – ER-диаграмм В наглядном виде они представляют связи между сущностями.
Сущность – это некоторый объект реального мира, который может существовать независимо. Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию.
Атрибут – это свойство сущности. Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключом. Может быть составной ключ, представляющий комбинацию нескольких атрибутов.
В реальном мире существуют связи между сущностями. Связь представляет взаимодействие между сущностями. Она характеризуется мощностью, которая показывает, сколько сущностей участвует в связи.
В рассматриваемой предметной области ФИРМА ( имеющ сущности: филиал, менеджер, заказ, клиент) можно выделить три связи (ромб «управляет»):
МЕНЕДЖЕР – УПРАВЛЯЕТ – ФИЛИАЛ
ФИЛИАЛ – ОБРАБАТЫВАЕТ – ЗАКАЗ
КЛИЕНТ – ДЕЛАЕТ – ЗАКАЗ
24. Типы связей. Связь представляет взаимодействие между сущностями. Она характеризуется мощностью, которая показывает, сколько сущностей участвует в связи. Связь между двумя сущностями называется бинарной, а связь между более чем с двумя сущностями – n -арной.
На ER-диаграмме связь изображается ромбом.
Важной характеристикой связи является тип связи (кардинальность). Рассмотрим типы связей.
"один-к-одному" (1:1). МЕНЕДЖЕР – УПРАВЛЯЕТ – ФИЛИАЛ
"один-ко-многим" (1:М). ФИЛИАЛ – ОБРАБАТЫВАЕТ – ЗАКАЗ
"многие-ко-многим" (М:N). КЛИЕНТ – ДЕЛАЕТ – ЗАКАЗ
25. класс принадлежности сущности. Если каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А является обязательным. Этот факт отмечается на ER-диаграмме черным кружочком, помещенным в прямоугольник, смежный с прямоугольником сущности А.
Если не каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А является необязательным. Этот факт отмечается на ER-диаграмме черным кружочком, помещенным на линии связи возле прямоугольника сущности А.
26. Правила преобрахования ER-диаграмм в реляц таблицы в случае связи1:1. Для каждой сущности создается таблица. Причем каждому атрибуту сущности соответствует столбец таблицы.Правила опираются на два основных фактора – тип связей и класс принадлежностей сущности.
1 Если связь типа 1:1 и класс принадлежности обеих сущностей является обязательным, то необходима только одна таблица. Первичным ключом этой таблицы может быть первичный ключ любой из двух сущностей.
2 Если связь типа 1:1 и класс принадлежности одной сущности является обязательным, а другой – необязательным, то необходимо построить таблицу для каждой сущности. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Первичный ключ сущности, для которой класс принадлежности является необязательным, добавляется как атрибут в таблицу для сущности с обязательным классом принадлежности.
3 Если связь типа 1:1 и класс принадлежности обеих сущностей является необязательным, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи среди своих атрибутов должна иметь ключи обеих сущностей.
27. Правила преобразования ER-диаграмм в реляц таблицы в случае связи1:М, М:М.
4 Если связь типа 1:М и класс принадлежности сущности на стороне М является обязательным, то необходимо построить таблицу для каждой сущности. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Первичный ключ сущности на стороне 1 добавляется как атрибут в таблицу для сущности на стороне М.
5 Если связь типа 1:М и класс принадлежности сущности на стороне М является необязательным, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи среди своих атрибутов должна иметь ключи обеих сущностей.
6 Если связь типа М:N, то необходимо построить три таблицы – по одной для каждой сущности и одну для связи. Первичный ключ сущности должен быть первичным ключом соответствующей таблицы. Таблица для связи среди своих атрибутов должна иметь ключи обеих сущностей.
28. Нормализация таблиц, ее цель. Первая нормальная форма. Вторая нормальная форма. Третья нормальная форма. Реляционная база данных считается эффективной, если все ее таблицы находятся как минимум в 3НФ. Нормализация таблиц – это процесс, позвол. миниз. избыточность данных. 1НФ. Таблица находится в 1НФ, если все ее поля содержат только неделимые значения. На практике. Если в клетках столбца содержится несколько значений, то каждое из них следует представить отдельной записью. 2 НФ, если она находится в 1 НФ и ее не ключевые поля зависят от первичного ключа. На практике. Неключевые поля, находящиеся в частичной ФЗ от некоторого подмножества первичного ключа, удаляются из таблицы и помещаются в новую таблицу совместно с подмножеством первичного ключа, от которого они зависят. Функциональная зависимость (ФЗ)– это семантическое понятие, отображающее определенную семантическую связь между полями таблицы. 3НФ если в таблице не имеется транзитивных зависимостей между не ключевыми полями, т.е. значение любого поля таблицы, не входившего в первичный ключ, не зависит от значения другого поля, не входившего в первичный ключ.
Преимущества нормальных форм таблиц: устранение избыточности таблиц; независимость записей в таблице с первичным ключом от записей в таблице с соответствующим внешним ключом, т.е. записи в таблице с внешним ключом (detail -таблицы) могут быть изменены (удалены) без нарушений в master – таблицы.
29. Цель этапа концептуального проектирования – создание концептуальной модели данных исходя из представлений пользователей о предметной области. Для ее достижения выполняется ряд последовательных процедур.
1. Определение сущностей и их документирование. Для идентификации сущностей определяются объекты (сущности), которые существуют независимо от других. Имена и описания сущностей заносятся в словарь данных. 2. Определение связей между сущностями и их документирование. 3. Создание ER-модели предметной области. Для представления сущностей и связей между ними используются ER-диаграммы. На их основе создается единый наглядный образ моделируемой предметной области – ER-модель предметной области. 4. Определение атрибутов и их документирование. Выявляются все атрибуты, описывающие сущности созданной ER-модели. 5. Определение значений атрибутов и их документирование. Для каждого атрибута сущности, участвующей в ER-модели, определяется набор допустимых значений и ему присваивается имя. 6. Определение первичных ключей для сущностей и их документирование. 7. Обсуждение концептуальной модели данных с конечными пользователями.
30. Цель этапа логического проектирования – преобразование концептуальной модели на основе выбранной модели данных в логическую модель, не зависимую от особенностей используемой в дальнейшем СУБД для физической реализации базы данных. Процедуры:
1. Выбор модели данных. Чаще всего выбирается реляционная модель данных в связи с наглядностью табличного представления данных и удобства работы с ними.
2. Определение набора таблиц исходя из ER-модели и их документирование.
3. Нормализация таблиц. На этом шаге проектировщик проверяет корректность структуры таблиц, созданных на предыдущем шаге, посредством применения к ним процедуры нормализации.
4. Проверка логической модели данных на предмет возможности выполнения транзакций. Если во время выполнения транзакции произойдет сбой в работе компьютера, то база данных окажется в противоречивом состоянии, так как некоторые изменения уже будут внесены, а остальные еще нет. Поэтому все частичные изменения должны быть отменены для возвращения базы данных в прежнее непротиворечивое состояние.
5. Определение требований поддержки целостности данных и их документирование. Эти требования представляют собой ограничения, которые вводятся с целью предотвратить помещение в базу данных противоречивых данных.
6. Создание окончательного варианта логической модели данных и обсуждение его с пользователями.
31. Цель этапа физического проектирования – описание конкретной реализации базы данных, размещаемой во внешней памяти компьютера.
1. Проектирование таблиц базы данных средствами выбранной СУБД.
2. Реализация бизнес-правил в среде выбранной СУБД.
3. Проектирование физической организации базы данных. На этом шаге выбирается наилучшая файловая организация для таблиц. Выявляются транзакции, которые будут выполняться в проектируемой базе данных, и выделяются наиболее важные из них.
4. Разработка стратегии защиты базы данных.
5. Организация мониторинга функционирования базы данных и ее настройка.
32. Семантическая объектная модель (СОМД). В основе СОМД лежит понятие семантического объекта. Семантический означает "смысловой" и семантический объект – это объект, который в определенной степени моделирует смысл пользовательских данных. Семантический объект – это представление некоторой вещи, идентифицируемой в рабочей среде пользователя. Подобно сущностям семантический объект имеет набор атрибутов, являющийся достаточным описанием объекта, т.е. он описывает все характеристики, необходимые пользователям для работы.
Есть три типа атрибутов. Простые атрибуты состоят из одного элемента. Н-р, Код клиента. Групповые – совокупности нескольких атрибутов. Н-р, Адрес (Улица, Город, Республика, Индекс). Семантические объектные атрибуты – это атрибуты, которые устанавливают связь между двумя семантическими объектами.
Домен – набор всевозможных значений атрибута.
На объектных диаграммах объекты изображаются в вертикально ориентированных прямоугольниках
Экземпляр объекта- атрибут получивш конкрет знач-е. В СОМД объектные атрибуты должны быть парными. Если один объект содержит в себе другой, то этот другой содержит в себе первый. Так, объект УНИВЕРСИТЕТ должен содержать объект КАФЕДРА. СОМД в качестве базовых элементов рассматривает не сущности, а семантические объекты. Она содержит больше информации о значении данных, чем модель "сущность-связь".
33. Case-средства для моделирования данных. Назначения и функ-ные возможности ERwin. ER-модели получили широкое распространение в CASE - средствах. Эти средства предназначены для автоматизированного проектирования реляционных баз данных. Их графические средства моделирования предметной области дают возможность наглядно изучать концептуальную модель данных и перестраивать ее соответственно поставленным целям и имеющимся ограничениям. Проект БД готовится в реальном масштабе времени.