Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ћодели данных, используемые дл€ хранилищ




—уществует два основных подхода к построению хранилищ данных: подход, основанный на многомерной модели баз данных, и подход, использующий рел€ционную модель баз данных.

ѕри использовании многомерной модели данные хран€тс€ не в виде плоских таблиц, как в рел€ционных базах данных, а в виде гиперкубов Ч упор€доченных многомерных массивов. “акое представление €вл€етс€ нагл€дным и позвол€ет резко уменьшить врем€ поиска в хранилище данных, поскольку отсутствует необходимость многократно соедин€ть таблицы. —реднее врем€ ответа на ложный аналитический запрос при использовании многомерных —”Ѕƒ обычно в 10Ч100 раз меньше, чем в случае рел€ционной —”Ѕƒ с нормализованной структурой.

ќсновные пон€ти€ многомерной модели Ч измерение и значение (€чейка). »змерение Ч это множество, образующее одну из граней гиперкуба (аналог домена в рел€ционной модели). »змерени€ играют роль индексов, используемых дл€ идентификации конкретных значений в €чейках гиперкуба. «начени€ Ч это подвергаемые анализу количественные или качественные данные, которые наход€тс€ в €чейках гиперкуба (рис. 44).

¬ многомерной модели ввод€тс€ следующие основные операции манипулировани€ измерени€ми: 1) сечение; 2) вращение; 3) детализаци€; 4) свертка.

ѕри выполнении операции сечени€ формируетс€ подмножество гиперкуба, в котором значение одного или более измерений фиксировано. Ќапример, если на рис. 43 зафиксировать значение измерени€ Ђ¬рем€ї равным Ђ€нварь 1993 годаї, то получитс€ двухмерна€ таблица с информацией о значени€х всех параметров дл€ всех субъектов –‘ в €нваре 1993 г.

ќпераци€ вращени€ измен€ет пор€док представлени€ измерений. ќна обычно примен€етс€ к двухмерным таблицам, обеспечива€ представление их в более удобной дл€ воспри€ти€ форме. ≈сли в исходной таблице по горизонтали были расположены субъекты –‘, а по вертикали Ч параметры социально-экономической сферы, то после операции вращени€ параметры будут размещены по горизонтали, а названи€ субъектов –‘ Ч по вертикали.


–ис. 44. ѕредставление данных в виде гиперкуба: 1 Ч значение Ђѕараметра ћї дл€ Ђ—убъекта –‘ 1ї в €нваре 1993 г.

ƒл€ выполнени€ операций свертки и детализации должна существовать иерархи€ значений измерени€, т. е. некотора€ подчиненность одних значений другим. Ќапример, 12 мес€цев образуют год, субъекты –‘ образуют регионы. ѕри выполнении операции свертки одно из значений измерени€ замен€етс€ значением более высокого уровн€ иерархии. Ќапример, аналитик, узнав значени€ параметров дл€ €нвар€ 2004 г., желает получить их значени€ за весь 2004 г. „тобы это сделать, необходимо выполнить операцию свертки. ќпераци€ детализации Ч это операци€, обратна€ свертке. ќна обеспечивает переход от обобщенных к детализированным данным.

ќднако у многомерных баз данных имеютс€ серьезные недостатки, сдерживающие их применение. ћногомерные —”Ѕƒ неэффективно по сравнению с рел€ционными используют пам€ть, поскольку заранее резервируетс€ место дл€ всех значений, даже если часть из них заведомо будет отсутствовать. »спользование многомерной —”Ѕƒ целесообразно только в том случае, когда объем базы данных невелик и гиперкуб использует стабильный во времени набор измерений.

ќсновой при построении хранилища данных может служить и традиционна€ рел€ционна€ модель данных. ¬ этом случае гиперкуб эмулируетс€ —”Ѕƒ на логическом уровне. ¬ отличие от многомерных рел€ционные —”Ѕƒ способны хранить огромные объемы данных, однако они проигрывают по скорости выполнени€ аналитических запросов.

ѕри использовании рел€ционных —”Ѕƒ дл€ организации хранилищ данных данные организуютс€ специальным образом. „аще всего используетс€ так называема€ радиальна€ схема. ƒругое ее название Ч Ђзвездаї. ¬ этой схеме используютс€ два типа таблиц: таблица фактов (фактологическа€ таблица) и несколько справочных таблиц (таблицы измерений).

¬ таблице фактов обычно содержатс€ данные, наиболее интенсивно используемые дл€ анализа. ≈сли проводить аналогию с многомерной моделью, то запись фактологической таблицы соответствует €чейке гиперкуба. ¬ справочной таблице перечислены возможные значени€ одного из измерений гиперкуба.  аждое измерение описываетс€ своей собственной справочной таблицей. ‘актологическа€ таблица индексируетс€ по сложному ключу, скомпонованному из индивидуальных ключей справочных таблиц. Ёто обеспечивает св€зь справочных таблиц с фактологической по ключевым атрибутам.

Ќа базе рел€ционных —”Ѕƒ стро€тс€ системы аналитической обработки данных ROLAP (Relation On-Line Analytical Processing), служащие дл€ св€зи с системами прин€ти€ решений. ¬ таких системах доставкой информации конечному пользователю занимаютс€ системы аналитической обработки данных в реальном времени (On-Line Analytical Processing), которые обеспечивают исключительно простой доступ к данным за счет удобных средств генерации запросов и анализа результатов.

¬ OLAP-системах ценность информации увеличиваетс€ благодар€ применению разнообразных методов анализа и статистической обработки.  роме того, эти системы оптимизированы с точки зрени€ скорости извлечени€ данных, сбора обобщенной информации и ориентированы на р€довых пользователей, так как имеют интуитивно пон€тный интерфейс.

¬ насто€щее врем€ средства анализа данных используют базы данных, составл€ющие основу OLAP-систем, позвол€ющие обслуживать сотни и тыс€чи пользователей; современные программные средства дл€ оперативной аналитической обработки позвол€ют осуществл€ть доступ к базе данных OLAP из системы Web или корпоративной сети Intranet.

—итуаци€, когда дл€ анализа необходима вс€ информаци€, наход€ща€с€ в хранилище, возникает довольно редко. ќбычно каждый аналитик или аналитический отдел обслуживает одно из направлений де€тельности организации, поэтому в первую очередь ему необходимы данные, характеризующие именно это направление. –еальный объем этих данных не превосходит ограничений, присущих многомерным —”Ѕƒ. ¬озникает иде€ выделить данные, которые реально нужны конкретным аналитическим приложени€м, в отдельный набор. “акой набор мог бы быть реализован в многомерной базе данных. »сточником данных дл€ него должно быть центральное хранилище организации.

≈сли проводить аналогии с производством и реализацией продукции, то многомерные базы данных играют роль мелких складов. ¬ концепции хранилищ данных их прин€то именовать киосками данных.  иоск данных Ч это специализированное тематическое хранилище, обслуживающее одно из направлений де€тельности организации. Ћогическа€ схема —ѕѕ–, использующа€ центральное ’ƒ организации и киоски данных аналитических отделов, представлена на рис. 45.

“ака€ схема позвол€ет эффективно использовать возможности рел€ционных —”Ѕƒ по хранению огромных объемов информации и способность многомерных —”Ѕƒ обеспечивать высокую скорость выполнени€ аналитических запросов.

—истемы, использующие хранилище данных, как правило, стро€тс€ на основе архитектуры Ђклиент-серверї. ’ранилище данных размещаетс€ на специальном сервере (сервере хранилища данных). ƒл€ его реализации используетс€ мощные многопроцессорные вычислительные системы таких производителей, как IBM, Hewlett-Packard, DEC, NCR и др.

¬ качестве —”Ѕƒ примен€етс€ одна из —”Ѕƒ, поддерживающих параллельную обработку запросов: Teradata (фирма NCR), DB/2 (фирма IBM), Oracle, Informix и др.  иоски данных реализуютс€ с использованием серверов многомерных Ѕƒ: Essbase (Arbor Software), Oracle Express (Oracle), Gentium (Planning Sciences) и др.


–ис. 45. Ћогическа€ схема —ѕѕ–, использующа€ ’ƒ и киоски данных





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-12-05; ћы поможем в написании ваших работ!; просмотров: 954 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќачинать всегда стоит с того, что сеет сомнени€. © Ѕорис —тругацкий
==> читать все изречени€...

534 - | 429 -


© 2015-2023 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.01 с.