Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ѕринципы построени€ систем, ориентированных на анализ данных




ѕри построении 1-й очереди ≈ј»— акцент делалс€ на классические методы проектировани€ базы данных, т. е. на системы, ориентированные на обработку транзакций в реальном времени (On-Line Transaction Processing Ч OLTP).

OLTP-системы ориентированы на выполнение транзакций, информаци€ в них носит оперативный характер. «аписи в OLTP-системах могут регул€рно добавл€тьс€, удал€тьс€ и редактироватьс€. OLTP-система выдает ответы на простые вопросы типа Ђ аков был уровень импорта товара N в регионе ћ в €нваре 2004 года?ї. “радиционные системы OLTP оперируют такими пон€ти€ми, как сущность, св€зь, функциональна€ декомпозици€ и анализ изменени€ состо€ний.

¬ системах OLTP информаци€ хранитс€ в виде, пригодном дл€ детальной ревизии данных. ≈сли пользовател€ интересует кредитный счет экспортера, он должен получить подробную информацию о каждой операции. — этим прекрасно справл€етс€ система OLTP, котора€ обеспечивает строжайшую секретность и максимальную закрытость. Ќеудивительно поэтому, что с помощью таких систем невозможно получить ответ на аналитические вопросы типа ЂЅудет ли получена от этого прибыль?ї, Ђ акие участники ¬Ёƒ наиболее выгодны с позиции таможенных платежей и почему?ї или Ђ акие возможности в технологии валютного контрол€ упускаютс€?ї. ¬ рел€ционных модел€х св€зи отображаютс€ €вно. ѕон€тие ЂсущностьЧсв€зьї составл€ет основу рел€ционной модели. Ќапример, €вное описание св€зи между потребител€ми и заказами закладываетс€ в саму конструкцию рел€ционной Ѕƒ.

  сожалению, размещаема€ в базах данных OLTP-систем информаци€ мало пригодна дл€ глобального прогнозировани€ состо€ни€ системы. ѕоэтому данные с разных информационных Ђконвейеровї отправл€ютс€ (т. е. копируютс€) на Ђсклады данныхї, называемые Ђинформационными хранилищами данныхї.

’ранилища данных

ƒл€ получени€ интересующей их информации лица, принимающие решение, или аналитики обращаютс€ к —ѕѕ– с запросами. Ёти запросы в большинстве случаев более сложные, чем те, которые примен€ютс€ в системах операционной обработки данных, например: ЂЌайти среднее значение промежутка времени между выставлением счета и оплатой его участником ¬Ёƒ в текущем и прошедшем году отдельно дл€ разных групп участников ¬Ёƒї.

¬ большинстве случаев сложный аналитический запрос невозможно сформулировать в терминах €зыка SQL, поэтому дл€ получени€ информации примен€ют специальные €зыки, ориентированные на аналитическую обработку данных.   их числу можно, например, отнести €зык Express 4GL фирмы Oracle. “акже дл€ выполнени€ запросов могут быть использованы приложени€, написанные специально дл€ решени€ тех или иных задач.

ƒл€ того чтобы можно было извлекать полезную информацию из данных, они должны быть организованы особым образом. —в€зано это со следующими факторами.

¬о-первых, дл€ выполнени€ аналитических запросов необходима обработка больших информационных массивов. „ем выше степень нормализации базы данных и чем больше в ней таблиц, тем медленнее выполн€етс€ анализ. ѕроисходит это, прежде всего, потому, что увеличиваетс€ число операций соединени€ отношений. Ќормализаци€ таблиц базы данных позвол€ет устранить избыточность данных, уменьшив тем самым объем действий, необходимых при обновлении информации. ѕоэтому в них нет необходимости мен€ть одни и те же значени€ в различных отношени€х. ¬ аналитических системах данные практически не обновл€ютс€ Ч в системе производитс€ лишь их накопление и чтение. ѕоэтому проблема нормализации базы данных в них не столь актуальна.

¬о-вторых, выполнение некоторых аналитических запросов, например анализ тенденций и прогнозирование, требует хронологической упор€доченности данных. –ел€ционна€ модель не предполагает существовани€ пор€дка записей таблицы.

¬-третьих, при обслуживании аналитических запросов чаще используютс€ не детальные, а обобщенные (агрегированные) данные. “ак, например, дл€ прогнозировани€ объема импорта в некотором регионе будет излишним иметь информацию о каждом пересекающим таможенную границу контейнере, достаточно знать значение прогнозируемой величины за несколько предыдущих лет.

ѕеречисленные особенности —ѕѕ– привели к тому, что данные, используемые дл€ анализа, стали выдел€ть в отдельные базы данных, получившие название хранилищ данных (’ƒ).

 онцепци€ информационных хранилищ данных (первоначально она так и называлась Ч Information WareHouse) зародилась в 80-х гг. XX в. в недрах корпорации IBM, но все же Ђотцомї технологии считаетс€ Ѕилл »нмон, технический директор компании Prism.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-12-05; ћы поможем в написании ваших работ!; просмотров: 845 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќаглость Ц это ругатьс€ с преподавателем по поводу четверки, хот€ перед экзаменом уверен, что не знаешь даже на два. © Ќеизвестно
==> читать все изречени€...

918 - | 680 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.013 с.