База данных – совокупность предназначенных для машинной обработки данных, которая служит для удовлетворения нужд большого количества пользователей (в рамках одной или нескольких организаций). Более формальное определение базы данных (БД) – поименованная, целостная, единая система данных, организованная по определенным правилам, которые предусматривают общие принципы описания, хранения и обработки данных.
Создание информационной инфраструктуры требует создания особенно больших баз данных, способных обслуживать одновременно тысячи пользователей. Данные в базе данных располагаются так, чтобы их можно было легко найти и обработать. Эти задачи выполняются системой управления базами данных. Система управления базами данных – специальный комплекс программ, осуществляющий централизованное управление базой данных. СУБД позволяет управлять данными в базе данных, вести базы данных, обеспечивает многопользовательский доступ к данным.
База знаний – это формализованная система сведений о некоторой предметной области, содержащая данные о свойствах объектов, закономерностях процессов и явлений и правила использования в задаваемых ситуациях этих данных для принятия новых решений. Другими словами, база знаний – это корпус информации, которую пользователь или программа использует для выполнения определенных действий.
В отличие от базы данных в базах знаний располагаются познаваемые сведения, содержащиеся в документах, книгах, статьях, отчетах. В базе знаний, в соответствии с принятой в ней методологией классификации, располагаются объекты познания, образующие совокупность знаний. В любом объекте представляется набор элементов знаний. Элементы знаний, благодаря концептуальным связям, предоставляемым гиперсредой1, объединяются, образуя базу знаний. Такие связи бывают 4-х видов:
- общность – связь 2-х элементов по содержанию их характеристик;
- партитивность – подразумевает соотношение целого и его частей;
- противопоставление – встречается в элементах, которые имеют положительные и отрицательные характеристики;
- функциональная взаимосвязь – взаимная зависимость элементов.
Базы данных и базы знаний являются ядром автоматизированного банка данных. Автоматизированный банк данных – база данных, объединенная с системой управления базой данных.
Банк данных предназначен для хранения больших массивов информации, быстрого поиска нужных сведений и документов. Банк данных ограничен в своих возможностях, поэтому он собирает информацию в определенных областях науки, технологии, продукции. Персонал, работающий в банке данных, делится на три группы: сотрудники банка, администратор банка и пользователи. Задача сотрудников – сбор и запись в базу всей первичной информации, определяемой тематикой этой базы. Сотрудники должны также удалять устаревшую информацию. Наряду с этим обновление информации может быть разрешено и некоторым пользователям. Сотрудники и некоторые пользователи составляют программы, позволяющие из первичной информации получать необходимые вторичные сведения, составлять отчеты. Администратор обеспечивает руководство банком. Он решает вопросы, связанные с бесперебойной и надежной работой, хранением информации и безопасностью данных. Пользователи банка взаимодействуют с необходимыми им банками.
Для поиска информации в базах данных и базах знаний используется информационно-поисковая система. Информационно-поисковая система опирается на базу данных (знаний), в которой осуществляется поиск нужных документов по заявкам пользователей.
По характеру выдаваемой информации информационно-поисковые системы делятся на два типа. Документальная система по заданию пользователя выдает необходимые ему документы (книги, статьи, законы, патенты, отчеты и т.д.). В задании могут указываться сведения об искомых документах: автор, наименование, время издания, издательство и т.д. Более сложной является фактографическая информационно-поисковая система. Ее задача – поиск в документах интересующих пользователя сведений (фактов), например типы, характеристики и технология изготовления сталей. Поиск в информационно-поисковой системе документов и сведений (фактов) осуществляется на естественном языке (русском, английском и др.).
Классификация баз данных
Различаются централизованные и распределенные базы данных. Централизованная база данных хранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе данных – доступ к ней пользователей различных ЭВМ данной сети. Такой способ использования баз данных часто применяют в локальных сетях персональных ЭВМ.
Появление сетей ЭВМ позволило наряду с централизованными создавать и распределенные базы данных. Распределенная база данных состоит из нескольких, возможно, пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Однако пользователь распределенной базы данных не обязан знать, каким образом ее компоненты размещены в узлах сети, и представляет себе эту базу данных как единое целое. Работа с такой базой данных осуществляется с помощью системы управления распределенной базой данных (СУРБД). Данные, содержащиеся в распределенной базе данных, их представление на всех уровнях архитектуры СУРБД и размещение в сети описываются в системном справочнике, который сам может быть декомпозирован и размещен в различных узлах сети.
Части распределенной базы данных, размещенные на отдельных ЭВМ сети, управляются собственными (локальными) СУБД и могут использоваться одновременно как самостоятельные локальные базы данных. Локальные СУБД не обязательно должны быть одинаковыми в разных узлах сети. Объединение неоднородных локальных баз данных в единую распределенную базу данных является сложной научно-технической проблемой. Ее решение потребовало проведения большого комплекса научных исследований и экспериментальных разработок.
Базы данных можно разделить на базы данных первого поколения: иерархические, сетевые; второго поколения:реляционные; третьего поколения:объектно-ориентированные, обектно-реляционные.