Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Классификация по среде постоянного хранения

· Во вторичной памяти, или традиционная (англ.conventionaldatabase): средой постоянного хранения является периферийная энергонезависимая память (вторичная память) - как правило жёсткий диск. В оперативную память СУБД помещает лишь кэши данные для текущей обработки.

· В оперативной памяти (англ.in-memorydatabase, memory-residentdatabase, mainmemorydatabase): все данные на стадии исполнения находятся в оперативной памяти.

· В третичной памяти (англ.tertiarydatabase): средой постоянного хранения является отсоединяемое от сервера устройство массового хранения (третичная память), как правило на основе магнитных лент или оптических дисков.

· Во вторичной памяти сервера хранится лишь каталог данных третичной памяти, файловый кэш и данные для текущей обработки; загрузка же самих данных требует специальной процедуры.

Классификация по содержимому

Примеры:

· Географическая

· Историческая

· Научная

· Мультимедийная

· Клиентская.

Классификация по степени распределённости

Централизованная, или сосредоточенная (англ.centralizeddatabase): БД, полностью поддерживаемая на одном компьютере.

Распределённая БД(англ.distributeddatabase) - составные части которой размещаются в различных узлах компьютерной сети в соответствии с каким-либо критерием.

Неоднородная (англ.heterogeneousdistributeddatabase): фрагменты распределённой БД в разных узлах сети поддерживаются средствами более одной СУБД.

Однородная (англ.homogeneousdistributeddatabase): фрагменты распределённой БД в разных узлах сети поддерживаются средствами одной и той же СУБД.

Фрагментированная, или секционированная (англ.partitioneddatabase): методом распределения данных является фрагментирование (партиционирование, секционирование), вертикальное или горизонтальное.

Тиражированная (англ.replicateddatabase): методом распределения данных является тиражирование (репликация).

Другие виды БД

Пространственная(англ.spatialdatabase): БД, в которой поддерживаются пространственные свойства сущностей предметной области. Такие БД широко используются в геоинформационных системах.

Временная, или темпоральная (англ.temporaldatabase): БД, в которой поддерживается какой-либо аспект времени, не считая времени, определяемого пользователем.

Пространственно-временная (англ.spatial-temporaldatabase) БД: БД, в которой одновременно поддерживается одно или более измерений в аспектах как пространства, так и времени.

Циклическая(англ.round-robindatabase): БД, объём хранимых данных которой не меняется со временем, поскольку в процессе сохранения новых данных они заменяют более старые данные. Одни и те же ячейки для данных используются циклически.

Сверхбольшая база данных (англ.VeryLargeDatabase, VLDB) - это база данных, которая занимает чрезвычайно большой объём на устройстве физического хранения. Термин подразумевает максимально возможные объёмы БД, которые определяются последними достижениями в технологиях физического хранения данных и в технологиях программного оперирования данными.

Количественное определение понятия «чрезвычайно большой объём» меняется во времени. Так, в 1997 году самой большой в мире была текстовая база данных KnightRidder’s DIALOG объёмом 7 терабайт. В 2001 году самой большой считалась база данных объёмом 10,5 терабайт, в 2003 году - объёмом 25 терабайт. В 2005 году самыми крупными в мире считались базы данных с объёмом хранилища порядка сотни терабайт. В 2006 году поисковая машина Googleиспользовала базу данных объёмом 850 терабайт.

К 2010 году считалось, что объём сверхбольшой базы данных должен измеряться по меньшей мере петабайтами.

В 2011 году компания Facebookхранила данные в кластере из 2 тыс. узлов суммарной ёмкостью 21 петабайт; к концу 2012 года объём данных Facebook достиг 100 петабайт, а в 2014 году - 300 петабайт.

К 2014 году по косвенным оценкам компания Google хранила на своих серверах до 10-15 эксабайтданных в совокупности.

По некоторым оценкам, к 2025 году генетики будут располагать данными о геномахот 100 миллионов до 2 миллиардов человек, и для хранения подобного объёма данных потребуется от 2 до 40 эксабайт.

В целом, по оценкам компании IDC, суммарный объём данных «цифровой вселенной» удваивается каждые два года и изменится от 4,4 зеттабайтав 2013 году до 44 зеттабайт в 2020 году.

Исследования в области хранения и обработки сверхбольших баз данных VLDBвсегда находятся на острие теории и практики баз данных. В частности, с 1975 года проходит ежегодная конференция InternationalConferenceonVeryLargeDataBases(«Международная конференция по сверхбольшим базам данных»). Большинство исследований проводится под эгидой некоммерческой организации VLDB Endowment(Фонд целевого капитала «VLDB»), которая обеспечивает продвижение научных работ и обмен информацией в области сверхбольших БД и смежных областях.

Банкданных – автоматизированнаяинформационнаясистемацентрализованногохраненияиколлективногоиспользованияданных. Всоставбанкаданных входятоднаилинесколькобазданных, справочникбазданныхСУБД, атакжебиблиотекизапросовиприкладныхпрограмм.

Банк данных (БнД) - это автоматизированная система специальным образом организованных данных - баз данных, программных, технических, языковых, организационно-методических средств и персонала, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.

Банк данных призван обеспечивать интегрированность и цело­стность баз данных, независимость и минимальную избыточность хранимых данных, их защиту от несанкционированного доступа или случайного уничтожения.

В общем случае банк данных состоит из базы данных (или нескольких баз данных), системы управления базами данных (СУБД), словаря данных, администратора, компьютерной системы и обслуживающего персонала (рисунок 1).

Рисунок 1.Состав банка данных

 

Пользователями компьютерной БД могут быть различные при­кладные программы, программные комплексы, специалисты пред­метной области, выступающие в роли потребителей или источников информации.

Организация данных в базе данных требует предварительного мо­делирования, т.е. построения логической модели данных.

Модель данных - это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет разработчикам и пользователям трактовать их уже как информацию - сведения, содержащие не только данные, но взаимосвязь между ними. Главное назначение модели данных - систематизация разнообразной информации и отражение ее свойств по содержанию, структуре, объему, связям, динамике с учетом удовлетворения информационных потребностей всех категорий пользователей.

К классическим моделям представления данных относят иерар­хическую, сетевую и реляционную.

Иерархическая модель данных представляет информационные отображения объектов реального мира - сущности и их связи в виде ориентированного графа, или дерева.

В иерархической модели отношения между Данными бывают типа «родитель - потомки», т.е. у каждого объекта только один родитель (у корневого объекта нет родителя), но в принципе может быть несколь­ко потомков.

Такие отношения принято изображать в виде дерева, где ребро между объектами отображает наличие некоторого отношения, причем название отношения пишется на ребре. Например, между объектами «клиент» и «заказ» может быть отношение, которое называется «делает», а между «заказ» и «товары» - отношение «состоит из».

В случае, когда граф отношений между объектами может представляться не только древовидными структурами, имеют дело с сетевой моделью данных. Сетевая модель организации данных является расширением иерархической модели.

Сетевая модель, как более общая, предоставляет большие возможности по сравнению с иерархической, однако она сложнее в реализации и использовании.

В настоящее время наибольшее распространение при разработке БД полу­чила реляционная модель данных. Понятие реляционной модели данных (от англий­ского relation - отношение) связано с разработками Е. Кодца. Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата реляционной алгебры и реляционного исчисления для обработки данных.

Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

• каждый элемент таблицы — один элемент данных;

  Рисунок 2. Структура иерархической модели

 

• все столбцы в таблице однородные, т.е. все элементы в столб­це имеют одинаковый тип (числовой, символьный или другой) и длину;

• каждый столбец имеет уникальное имя;

• одинаковые строки в таблице отсутствуют;

• порядок следования строк и столбцов может быть произволь­ным.

Отношения представлены в виде таблиц, строки которых соответствуют записям, а столбцы - полям.

Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом. Если записи одно­значно определяются значениями нескольких полей, то такая таблица базы данных имеет составной ключ. Чтобы связать две реляционные таблицы, необходимо ключ первой таблицы ввести в состав ключа второй таблицы или ввести в структуру первой таблицы внешний ключ - ключ второй таблицы.

Проектирование реляционной БД состоит из трех самостоятельных этапов: концептуального, логического и физического проектирования.

Целью концептуального проектирования является разработка БД на основе описания предметной области. Описание должно содержать совокупность документов и данных, необходимых для загрузки в БД, а также сведения об объектах и процессах, характеризующих предметную область. Разработка БД начинается с определения состава данных, подлежащих хранению в БД для обеспечения выпол­нения запросов пользователя. Затем производятся их анализ и структурирование.

Логическое проектирование осуществляется с целью выбора конкретной СУБД и преобразования концептуальной модели в логическую. Разрабатываются структуры таблиц, связи между ними и определяются ключевые реквизиты.

Этап физического проектирования дополняет логическую модель характеристиками, которые необходимы для определения способов физического хранения и использования БД, объема памяти и типа устройств для хранения.

При физической организации баз данных имеют дело не с пред­ставлением данных в прикладных программах, а с их размещением на запоминающих устройствах.

При выборе физической организации решающим фактором является эффективность, причем на первом месте стоит обеспечение эффективности поиска, далее идут эффективность операций занесения и удаления и затем обеспечение компактности данных. Кроме того, в последнее время большую актуальность приобрели проблемы защиты данных от несанкционированного доступа.

В результате проектирования БД должна быть разработана ин­формационно-логическая модель данных, т.е. определен состав реляционных таблиц, их структура и логические связи. Структура реляционной таблицы определяется составом полей, типом и размером каждого поля, а также ключом таблицы.

В последние годы появились и активно внедряются постреляционная, многомерная и объектно-ориентированная модели данных, разрабатываются системы, основанные на других моделях данных, расширяющих существующие: объектно-реляционные, семантические и др. Некоторые их них служат для интеграции баз данных, баз зна­ний и языков программирования.

Система управления базами данных (СУБД) - комплекс программ­ных и языковых средств, предназначенный для создания, ведения и совместного использования БД многими пользователями. СУБД различают по используемой модели данных. Они обеспечивают многоцелевой характер использования БД, защиту и восстановление данных. Наличие развитых диалоговых средств и языка запросов делает СУБД удобным средством для конечного пользователя.

Язык структурированных запросов SQL (StructuredQueryLanguage) является стандартным языком запросов по работе с реляционными БД. Он предназначен для выполнения операций над таблицами (создание, удаление, изменение структуры) и над данными таблиц (выборка, изменение, добавление и удаление). SQL не содержит операторов управления, организации подпрограмм, ввода-вывода и поэтому автономно не используется. Обычно он погружен в среду встроенного языка программирования СУБД (например, VBA -VisualBasicforApplications СУБД MS Access и др.).

Стандарт языка SQL поддерживает современные реализации ряда языков программирования. В специализированных системах разработки приложений типа клиент-сервер среда программирования, кроме того, обычно дополнена коммуникационными средствами, средствами разработки пользовательских интерфейсов, средствами проектирования и отладки.

Основным назначением языка SQL является подготовка и выполнение запросов пользователей.

К наиболее важным признакам классификации современных СУБД могут быть отнесены:

• среда функционирования - класс компьютеров и ОС для работы СУБД;

• тип поддерживаемой в СУБД модели данных;

• возможности встроенного языка СУБД, его переносимость в другие приложения (SQL, VisualBasic и др.);

• наличие развитых диалоговых средств конструирования таблиц, форм, запросов, отчетов, макросов и средств работы с БД;

• возможность работы с нетрадиционными данными в корпоративных сетях (страницы HTML, сообщения электронной почты, звуковые файлы, изображения и др.);

• уровень использования - локальная СУБД (для настольных систем), архитектура клиент-сервер, многопроцессорная СУБД (с параллельной обработкой данных);

• использование объектной технологии OLE (ObjectLinkingandEmbedding - связывание и внедрение объектов);

• возможности интеграции данных из разных СУБД;

• степень поддержки языка SQL и возможности работы с сервером баз данных (SQL-сервером);

• наличие средств приложений, позволяющих не проводить полной инсталляции СУБД для тиражируемых приложений пользователя.

Приложение - программа или комплекс программ, которые обеспечивают автоматизацию обработки данных для прикладной задачи пользователя, работающего с БД. В общем случае с одной БД могут работать несколько различных приложений. Например, если БД моделирует некоторое предприятие, то для работы с ней могут быть созданы приложения: одно - обслуживающее подсистему учета кадров, другое - подсистему расчета заработной платы сотрудников, третье - подсистему складского учета и т.д. Предпо­лагается, что приложения, работающие с одной БД, могут работать параллельно и независимо друг от друга, и именно СУБД призвана обеспечить их работу с БД так, чтобы каждое из них выполнялось корректно и учитывало все изменения в БД, вносимые другими приложениями.

Приложения создаются с помощью системы программирования, использующей средства доступа к БД.

Услугами банка данных пользуется большое число пользователей. Поэтому в банке данных предусматривается словарь данных - подсистема банка данных, предназначенная для хранения информации о структурах данных, взаимосвязях файлов БД друг с другом, типах данных и форматах их представления, кодах защиты и разграничения доступа и т.п.

Функционирование банка данных невозможно без участия специалистов - администраторов БД. Это группа пользователей, отве­чающих за выработку требований к БД, ее проектирование, создание, эффективное использование и сопровождение. Для выполнения функций администратора в СУБД предусмотрены различные служебные программы. При работе в компьютерной сети администратор БД, как правило, взаимодействует с администратором сети.

Компьютерная система, на базе которой функционирует банк данных, представляет собой совокупность взаимосвязанных и согласованно действующих компьютеров и других устройств, обеспечивающих автоматизацию процессов приема, обработки и выдачи информации пользователям. Используемая система должна иметь процессоры с приемлемой мощностью, достаточный объем оперативной и внешней памяти.

Обслуживающий персонал банка данных (программисты, инжене­ры по техническому обслуживанию компьютеров, административный аппарат) призван поддерживать технические и программные средства в работоспособном состоянии, осуществлять обеспечение совместимо­сти и взаимодействия всех составляющих, контроль за работой банка данных, за качеством информации.

Банк данных и БД в случае расположения на одном компьютере называются локальными, при расположении на нескольких компьютерах, соединенных компьютерной сетью, распределенными.

Локальные базы и банки данных предназначены для организации более простого и дешевого способа информационного обслуживания пользователей, работающих с небольшими объемами данных при решении несложных задач.

Системы распределенных баз данных состоят из набора узлов, связанных вместе коммуникационной сетью, в которой:

1) каждый узел обладает своими собственными системами баз данных;

2) узлы работают согласованно, поэтому пользователь может получить доступ к данным на любом узле сети, как будто все данные находятся на его собственном узле. На рисунке 2 приведен пример распределенной базы данных.

 

Рисунок 2.Распределенная база данных

 

Распределенные банки и базы данных предоставляют более гибкие формы обслуживания многочисленных удаленных пользователей при работе со значительными объемами данных в условиях географической или структурной разобщенности.



<== предыдущая лекция | следующая лекция ==>
Тема 2.1 Комплексный характер проблемы систематизации и автоматизации информации о качестве продукции | Логическое проектирование БД
Поделиться с друзьями:


Дата добавления: 2018-10-18; Мы поможем в написании ваших работ!; просмотров: 434 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

В моем словаре нет слова «невозможно». © Наполеон Бонапарт
==> читать все изречения...

4192 - | 4146 -


© 2015-2026 lektsii.org - Контакты - Последнее добавление

Ген: 0.009 с.