OLAP-системы
Хранилища лишь предоставляют данные в виде, удобном для анализа. Сам анализ обычно осуществляется средствами, построенными на базе сопутствующих технологий. Наиболее известными технологиями анализа данных в настоящее время являются – OnlineAnalysisProcessing (OLAP - “оперативный анализ”) и DataMining (“добывание данных”) или, как еще принято называть – интеллектуальный анализ данных.
В OLAP-технологиях средства оперативного анализа базируются на концепции многомерного представления данных. Это связано с тем, что каждое числовое значение, содержащиеся в хранилище, имеет до нескольких десятков атрибутов (например, количество продаж таким-то менеджером в таком-то регионе, такого-то числа). Вследствие этого, можно считать, что мы имеем дело с многомерными структурами данных – многомерными кубами. Именно это допущение и делается при построении OLAP – инструментария. OLAP системы обычно обладают двумя отличительными способностями:
- анализ осуществляется над многомерными структурами данных – кубами.
- предоставляются гибкие средства навигации по указанным структурам – так называемые OLAP – манипуляции.
OLAP системы обычно реализуются на базе киосков данных, поскольку организация хранилища масштаба предприятия в многомерную структуру нецелесообразна из-за большого количества возможных атрибутов. Многомерную структура строится на базе либо реляционной СУБД с дополнительным интерфейсом доступа (MRDB – MultiRelationalDatabase), либо с использованием специальной многомерной СУБД (MDDB – MultiDimensionalDatabase).
Фактически все операции, которые относятся к OLAP, можно реализовать путем создания запросов на языке SQL к базам данных. Однако современные средства OLAP позволяют реализовать это гораздо проще, к тому же полученная информация представляется в графическом виде, что позволяет нагляднее увидеть зависимости между выбранными параметрами.
Техника OLAP обычно реализуется как дополнительная возможность в уже существующих программных продуктах. В частности, практически все ведущие СУБД, включая Oracle, Informix, Microsoft SQL Server и др. имеют встроенные средства для OLAP-анализа данных. В той или иной мере эти возможности заложены и во многие другие продукты, используемые для работы с информацией в рамках ИСП.
Технология DataMining – “добывание данных” - процесс выявления тенденций, трендов, взаимных корреляций данных, находящихся в хранилище с использованием средств искусственного интеллекта или статистического анализа. Технология DataMining возникла буквально в последние годы и сейчас находится на пике своего развития.
Основная цель DataMining – обнаружить скрытые зависимости и тенденции, незаметные на первый взгляд, и обратить внимание менеджера на них. Таким образом, средства этого типа позволяют не только анализировать данные, но и представить данные под таким образом, чтобы явно наблюдались тенденции и зависимости.
Технологии DataMining могут быть полезны при построении систем принятия решений на предприятиях, которые сталкиваются с проблемой анализа огромных потоков данных.
Примерами таких предприятий могут служить авиакомпании, железные дороги, страховые компании, предприятия-производители, поставщики услуг(телефонные компании, Internet-провайдеры), маркетинговые компании и т.д.
В указанных случаях построение информационных систем поддержки принятия решений на базе технологии построения хранилищ в сочетании со средствами DataMining и OLAP может вывести предприятия на совершенно новый уровень понимания того, что происходит на самом деле, что, в конечном счете, является залогом процветания бизнеса.
Существующие системы DataMining можно подразделить на исследовательские, ориентированные на специалистов и предназначенные для работы с новыми типами проблем, и прикладные, рассчитанные на непрограммирующих пользователей (аналитиков, менеджеров, технологов и т.д.) и решающие типовые задачи. Тем не менее, исследовательские системы DataMining, как и информационные технологии в целом быстро эволюционируют в сторону упрощения работы с ними, что дает возможность использования их менеджерами различных уровней управления.