Традиционно в представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов I порядка, когда предметная область или задача описывается в виде набора аксиом. Мы же опустим описание этих моделей по следующим причинам. Исчисление предикатов I порядка в промышленных экспертных системах практически не используется. Эта логическая модель применима в основном в исследовательских "игрушечных" системах, так как предъявляет очень высокие требования и ограничения к предметной области.
Фреймы
Фрейм - структура знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование.
Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреимы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных.
Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через:
• фреймы-структуры, для обозначения объектов и понятий (заем, залог, вексель);
• фреймы-роли (менеджер, кассир, клиент);
• фреимы-сценарии (банкротство, собрание акционеров, празднование именин);
• фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.
Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся, значения аналогичных слотов.
34. Этапы проектирования базы знаний и их процедуры.
База знаний — это один или несколько специальным образом организованных файлов, хранящих систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области.
База знаний является основным компонентом интеллектуальных систем: информационных, обучающих, систем программирования, а также экспертных систем.
Под экспертной системой (ЭС) понимается система, объединяющая возможности компьютера со знаниями и опытом эксперта в такой форме, что система может предложить разумный совет или осуществить разумное решение поставленной задачи. Дополнительно желаемой характеристикой такой системы является способность системы пояснять по требованию ход своих рассуждений в понятной для спрашивающего форме.
База данных предназначена для временного хранения фактов или гипотез, являющихся промежуточными решениями или результатом общения системы с внешней средой, в качестве которой обычно выступает человек, ведущий диалог с экспертной системой.
Процесс построения БЗ на основе информации эксперта состоит из трех этапов:· описание предметной области;· выбор способа и модели представления знаний;· приобретение знаний.
35. Требования, предъявляемые к базе знаний.
36. Продукционные модели и их примеры. Модель бюджетирования
Продукционная модель, или модель, основанная на правилах, позволяет представлять знания в виде предложений типа:
Если (условие), то (действие).
Записываются эти правила обычно в виде:
ЕСЛИ А1,А2,…,Аn ТО В.
В качестве условия может выступать любая совокупность суждений, соединенных логическими связками И, ИЛИ.
Под условием понимается некоторое предложение – образ, по которому осуществляется поиск в базе знаний, а под действием – действия, выполняемые при успешном исходе поиска (они м.б. промежуточными, выступающими далее как условие, и терминальными или целевыми, завершающими работу системы).
37. Системы обработки многопользовательских баз знаний.
38. Этапы жизненного цикла базы знаний.
Жизненный цикл базы данных (ЖЦБД) – это процесс проектирования, реализации и поддержки базы данных. ЖЦБД состоит из следующих семи этапов:
1) предварительное планирование;
2) проверка осуществимости;
3) определение требований;
4) концептуальное проектирование;
5) логическое проектирование;
6) физическое проектирование;
7) оценка работы и поддержка базы данных.
Опишем главные задачи каждого этапа.
1. Предварительное планирование базы данных. Это важный этап в процессе перехода от разрозненных к интегрированным данным. На этом этапе собирается информация об используемых и находящихся в процессе разработки прикладных программах и файлах, связанных с ними. Она помогает установить связи между текущими приложениями и то, как используется информация приложений. Кроме того, позволяет определить будущие требования к базе данных.
2. Проверка осуществимости. Она предполагает подготовку отчетов по трем вопросам:
1) есть ли технология – необходимое оборудование и программное обеспечение – для реализации запланированной базы данных? (технологическая осуществимость);
2) имеются ли персонал, средства и эксперты для успешного осуществления плана создания базы данных? (операционная осуществимость);
3) окупится ли запланированная база данных? (экономическая эффективность).
3. Определение требований. На этом этапе определяются:
· цели базы данных;
· информационные потребности различных структурных подразделений и их руководителей;
· требования к оборудованию;
· требования к программному обеспечению.
4.Концептуальное проектирование. На этом этапе создаются подробные модели пользовательских представлений данных предметной области. Затем они интегрируются в концептуальную модель, которая фиксирует все элементы корпоративных данных, подлежащих загрузке в базу данных. Эту модель называют еще концептуальной схемой базы данных.
5.Логическое проектирование. На этом этапе осуществляется выбор типа модели данных. Концептуальная модель отображается в логическую модель, основанную уже на структурах, характерных для выбранной модели. Так, если выбрана реляционная модель, то разрабатываются структуры таблиц, определяются их ключи, устанавливается связь между таблицами, оптимизируется созданная модель базы данных (минимизируется избыточность данных). Наиболее распространенным методом при оптимизации является метод нормальных форм или, другими словами, нормализация данных
6.Физическое проектирование. На этом этапе предусматривается принятие разработчиком окончательного решения о способах реализации создаваемой базы данных. Логическая модель расширяется характеристиками, необходимыми для определения способов физического хранения базы данных, типа устройств для хранения, методов доступа к данным базы, требуемого объема памяти, правил сопровождения базы данных и др.
7.Оценка и поддержка базы данных. Оценка включает опрос пользователей на предмет выяснения, какие их информационные потребности остались неучтенными. При необходимости в спроектированную базу данных вносятся изменения. Пользователи обучаются работе с базой данных. По мере расширения и изменения потребностей бизнеса поддержка базы данных обеспечивается путем внесения изменений, добавления новых данных, разработки новых прикладных программ, работающих с базой данных.
39. Семантические сети, сети и отношения.
Семантическая сеть – это модель, в которой структура знаний предметной области формализуется в виде ориентированного графа с помеченными вершинами и дугами. Вершины графа обозначают понятия различных категорий: объекты, события, свойства, операции, а дуги – отношения между ними.
(Семантика - значение единиц языка).
Семантические сети вначале использовались для представления смысла выражений естественного языка человека, откуда и появилось название этого класса сетей. Теперь же они используются в качестве структуры, пригодной для представления информации общего вида, – узлы представляют некоторые концепты (понятия), а связи – отношения между концептами. При построении семантической сети отсутствуют ограничения на число связей и на сложность сети. Поэтому систематизация отношений между объектами в сети необходима для дальнейшей формализации.
В качестве понятий выступают абстрактные или конкретные объекты.
Наиболее часто в семантических сетях используются следующие отношения:
1) связи типа “часть-целое” (например, “класс-подкласс'', “элемент-множество” и т.п.);
2) функциональные связи, определяемые обычно глаголами (производит, влияет и др.);
3) количественные (>, <, = и др.);
4) пространственные (далеко от, близко от, за, под, на и др.);
5) временные (раньше, позже, в течение и др.);
6) атрибутивные (иметь свойство, иметь значение и др.);
7) логические (и, или, не);
8) лингвистические и др.
Поиск решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, отражающий поставленный запрос к базе.
40. Модель «сущность–связь».
Средством моделирования предметной области на этапе концептуального проектирования является модель «сущность–связь». Часто ее называют ER-моделью (Entity – сущность, Relation – связь). В ней моделирование структуры данных предметной области базируется на использовании графических средств – ER-диаграмм (диаграмм «сущность–связь»). В наглядном виде они представляют связи между сущностями.
Основные понятия ER-диаграммы – сущность, атрибут, связь.
Сущность – это некоторый объект реального мира, который может существовать независимо. Сущность имеет экземпляры, отличающиеся друг от друга значениями атрибутов и допускающие однозначную идентификацию.
Атрибут – это свойство сущности. Например, сущность КНИГА характеризуется такими атрибутами, как автор, наименование, цена, издательство, тираж, количество страниц. Конкретные книги являются экземплярами сущности КНИГА. Они отличаются значениями указанных атрибутов и однозначно идентифицируются атрибутом «наименование». Атрибут, который уникальным образом идентифицирует экземпляры сущности, называется ключом. Может быть составной ключ, представляющий комбинацию нескольких атрибутов.
41. Системы управления базами знаний.(бред, ну тут так, чтоб прочитать)
База знаний – это один или несколько специальным образом организованных файлов, хранящих систематизированную совокупность понятий, правил и фактов, относящихся к некоторой предметной области. Содержимое баз знаний оформляется, связывается между собой и представляется таким образом, чтобы на его основе можно было с помощью специальных программ осуществлять рассуждения и делать выводы, получая сведения, которые в явном виде могут не присутствовать в базах знаний.
Для построения баз знаний применяются методы искусственного интеллекта, специальные языки описания знаний и интеллектуальный интерфейс.
Базы знаний являются основной содержательной частью интеллектуальных систем: информационных, обучающих, систем программирования, экспертных систем, где с их помощью представляются навыки и опыт экспертов – специалистов в данной предметной области.
Традиционные БД являются пассивными. Они играют организующую роль, направленную на обеспечение хранения данных. Вся процедурная логика, включая выборку и модификацию данных, координируется вне сферы управления данными.
Среда активных БД поддерживает инициацию действий над данными базы и управление ими внутри среды БД в соответствии с предварительно установленными правилами, без необходимости получения каких-либо управляющих воздействий от приложений или от каких-либо других внешних источников. В создании активных БД используется несколько основных конструкций БД: ограничения, утверждения, хранимые процедуры и триггеры.
Ограничения – это относительно простые конструкции языка SQL, используемые для встраивания бизнес-правил в БД вместо логики приложения. В реляционной СУБД ограничения ассоциируются с конкретными объектами БД, такими, как таблицы или ее поля. Примером ограничений могут быть ограничения на поля таблицы, допускаемые в команде CREATE TABLE языка SQL (см. формат этой команды, описанный в теме 9).
Более общим типом ограничений являются утверждения. Утверждение – это самостоятельная конструкция языка SQL, используемая для спецификации ограничения, которое может затрагивать более чем одну таблицу. Бизнес-правила, относящиеся к двум или более таблицам, могут быть естественным образом представлены в теле самого утверждения.
Во многих случаях конструкции ограничений и утверждений оказываются неадекватными для выражения сложных бизнес-правил, и СУБД поддерживают хранимые процедуры. Хранимая процедура – это модуль прикладной программы с той лишь разницей, что он относится к БД, а не к внешней программной системе, использующей эту БД. Посредством хранимых процедур встраивается процедурная логика в среду БД. Хранимые процедуры могут определяться относительно одной или более таблиц БД и вызывать друг друга. Они выполняются сервером баз данных и могут читать и изменять данные в таблицах. Их можно вызвать из клиентского приложения, работающего с БД.
Ключевыми компонентами, обеспечивающими превращение БД в активную среду, являются триггеры. Триггер – это процедура БД, запускаемая в случае, если над объектом БД, с которым она ассоциирована, выполняется одна из заданных в спецификации операций. После операций вставки, обновления и/или удаления может быть запущен триггер, который приведет в результате к вычислению бизнес-правил или к выполнению определенных действий. Триггеры, в отличие от хранимых процедур, нельзя вызвать из клиентского приложения.
Активная БД может быть охарактеризована как система, следующая правилам Событие-Условие-Действия. Технология активной БД реализована, в частности, в объектно-реляционной СУБД POSTGRES, разработанной на базе СУБД INGRES в калифорнийском университете Беркли в 1986-1994 гг.
Возможности существующих в настоящее время технологий активных БД распространяются на сферу интеллектуальных баз данных. Можно считать, что активные БД открывают двери на пути к пока еще неуловимому будущему интеллектуальных баз данных с высоким уровнем искусственного интеллекта.
42. Фреймовые модели, слоты и протофреймы.
Фрейм является единицей представления знаний об объекте, которую можно описать некоторой совокупностью понятий и сущностей. Под фреймом понимается абстрактный образ или ситуация. В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушателя образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2». Из этого описания ничего нельзя убрать (например, убрав окна, мы получим чулан, а не комнату), но в нем есть «дырки», или «слоты», - это незаполненные значения некоторых атрибутов – количество окон, цвет стен, высота потолка, покрытие пола и т.д.
Фрейм имеет определённую внутреннюю структуру, состоящую из множества элементов, называемых слотами. Каждый слот в свою очередь, представляется определенной структурой данных, процедурой, или может быть связан с другим фреймом. Значением слота может быть практически что угодно (числа или математические соотношения, тексты на естественном языке или программы, правила вывода или ссылки на другие слоты данного фрейма или других фреймов).
Фрейм можно определить и как формализованную модель для отображения образа.
Во фреймовых моделях фиксируется жестка структура информационных единиц, которая называется протофреймом (фреймы-образцы)
В качестве значения слота может выступать набор слотов более низкого уровня, что позволяет во фреймовых представлениях реализовать "принцип матрешки".
При конкретизации фрейма ему и слотам присваиваются конкретные имена и происходит заполнение слотов. Таким образом, из протофреймов получаются фреймы - экземпляры. Переход от исходного протофрейма к фрейму - экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов.
Структуру фрейма можно представить так:
ИМЯ ФРЕЙМА:(имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота), (имя N-го слота: значение N-го слота).
Фрейм может содержать процедуры, которые будут выполняться при определенных условиях (при записи или удалении информации из слота, при обращении к слоту, в котором отсутствуют данные и т.д.) С каждым слотом может быть связано любое количество процедур. Процедуры, связанные с определенным слотом фрейма, зависят от конкретной прикладной системы, использующей фреймовые структуры для представления знаний.
Существует несколько способов получения слотом значений во фрейме-экземпляре:
-по умолчанию от фрейма-образца; -через наследование свойств от фрейма, указанного в слоте АКО (A-Kind-Оf, это); -по формуле, указанной в слоте; -через присоединенную процедуру; -явно из диалога с пользователем; -из базы данных.
В качестве значения слота может выступать имя другого фрейма. Тогда образуются сети фреймов. Существование сетей фреймов обусловлено тем, что между различными объектами можно провести некоторые аналогии. Поэтому фреймы, представляющие такие образы, выстраиваются в иерархическую систему. При этом сложные объекты представляются комбинацией нескольких подчиненных фреймов. В сетях фреймов происходит наследование свойств по АКО-связям. Слот АКО указывает на фрейм более высокого уровня, откуда неявно наследуются (переносятся) значения слотов. Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Кроме того, отмечают однородность представления знаний и возможность их типового текстового описания с помощью специальных языков. В сетях фреймов используются такие специальные языки представления знании, как FRL (Frame Representation Language) и KRL (Knowledge Representation Language). Они позволяют эффективно строить промышленные экспертные системы. Широко известны такие фрейм-ориентированные экспертные системы, как ANALYST, МОДИС, TRISTAN, ALTERID.
43. Нормализация данных и знаний в реляционных таблицах.
Нормализация представляет собой процесс реорганизации данных в реляционных таблицах путем ликвидации повторяющихся групп и иных противоречий в хранении данных с целью приведения таблиц к виду, позволяющему осуществить корректное редактирование данных.
Таблица находится в той или иной нормальной форме, если она удовлетворяет определенному набору требований.
Теоретически существуют 5 нормальных форм, хотя на практике используются три нормальные формы, которые рассмотрим более подробно.
Первой нормальной формой называется реляционная таблица, в которой все значения полей являются атомарными, т.е. любая реляционная база данных находится в первой нормальной форме.
Реляционная таблица соответствует второй нормальной форме, если она находится в первой нормальной форме, и ее не ключевые поля зависят от первичного ключа.
Реляционная таблица соответствует третьей нормальной форме,если в таблице не имеется транзитивных зависимостей между не ключевыми полями, т.е. значение любого поля таблицы, не входившего в первичный ключ, не зависит от значения другого поля, не входившего в первичный ключ.
44. Преобразование ER- модели в реляционную.
Концептуальные модели (модели «сущность–связь») позволяют более точно представить предметную область, чем реляционные и другие более ранние модели. Но в настоящее время существует немного СУБД, поддерживающих эти модели. На практике наиболее распространены системы, реализующие реляционную модель. Поэтому необходим метод перевода концептуальной модели в реляционную. Такой метод основывается на формировании набора предварительных таблиц из ER-диаграмм.
Для каждой сущности создается таблица. Причем каждому атрибуту сущности соответствует столбец таблицы.
Правила генерации таблиц из ER-диаграмм опираются на два основных фактора – тип связи и класс принадлежности сущности. + таблица учебника стр 18-19.
45. Формальные логические модели. Наследие свойств моделей.
46. Эволюция концепций обработки данных и знаний.
Обработка данных со временем претерпела некоторую эволюцию. В развитии концепций обработки данных можно выделить следующие этапы:
· обработка БД на мэйнфреймах с помощью СУБД;
· обработка БД с помощью систем удаленной обработки данных;
· обработка локальных БД на ПК с помощью настольных СУБД;
· использование систем совместного использования (работа с централизованной базой данных с помощью сетевых версий настольных СУБД);
· использование клиент/серверных систем;
· использование систем обработки распределенных баз данных.
В общем случае обработка данных вкл. в себя ввод данных по каким-либо критериям и вывод данных и результат их обраб. в любом виде. Концепции обраб. данных прошли эволюцион. путь развития, связанный с развитием вычислительн. техники в целом. Исторически можно выделить сл. концепции обработки данных: