Билет №36. Использование служб интернета в практике врача.
Интернет представляет собой всемирную информационную компьютерную сеть, которая объединяет в единое целое множество компьютерных сетей, работающих по единым правилам. Компьютерная сеть — это объединение компьютеров, линий связи между ними (кабели, телефонные линии, радиосвязь, оптоволоконные линии) и программ, обеспечивающих обмен информацией. Пользователи Интернета подключаются к сети через компьютеры специальных организаций, которые называются поставщиками услуг Интернета. К сети могут быть подключены как отдельный компьютер, так и локальная сеть. Соединение может быть постоянным или
временным. Поставщики услуг Интернета имеют множество линий для подключений пользователей и высокоскоростные линии для связи с остальной частью Интернета. Все организации, соединенные друг с другом высокоскоростными линиями связи, образуют базовую часть сети, или хребет Интернета, так называемый Backbon. Если поставщик подключен непосредственно к хребту, то скорость передачи информации будет максимальной. Компьютеры, подключенные к Интернету, часто называют узлами Интернета, или сайтами (site — местонахождение). Свой уникальный адрес имеет любой компьютер, подключенный к Интернету. Даже при временном соединении по коммутируемому каналу компьютеру выделяется уникальный адрес. Сетевой протокол предписывает правила работы компьютерам, которые подключены к сети. Описать в одном протоколе все правила взаимодействия практически невозможно. Поэтому сетевые протоколы строятся по многоуровневому принципу. На нижнем уровне используются два основных протокола: IP — Internet Protocol (протокол Интернета) и TCP — Transmission Control Protocol (протокол управления передачей).Так как эти два протокола тесно взаимосвязаны, то часто их объединяют и базовым протоколом является TCP/IP. С помощью протокола IP все части информации передаются получателю, где с помощью протокола TCP проверяется, вся ли информация получена. В Интернете имеется ряд протоколов, построенных на базовых протоколах TCP/IP и предлагающих разнообразный сервис. Перечислим основные направления использования Интернета.
Сервис Telnet (Телнет)— позволяет превратить компьютер в удаленный терминал другого компьютера. Терминал от обычного компьютера отличается тем, что не выполняет собственные вычисления. Все, что вводится на компьютере, передается удаленному компьютеру, а получаемые результаты передаются обратно и выводятся на монитор. В качестве удаленных компьютеров в основном используются машины, работающие под управлением операционной системы Unix. Большинство пользователей в последнее время сервис Telnet не применяют. Это связано с тем, что для работы в режиме удаленного терминала требуется знание основных команд данной операционной системы. Многие информационные системы, ранее доступные исключительно с помощью Telnet, в настоящее время доступны из всемирной паутины. В Интернете популярностью пользуются группы новостей Usenet.Их иногда называют телеконференциями или электронными досками объявлений. В отличие от электронной почты получаемые письма доступны для общего обозрения. Для удобства дискуссий образованы различные группы, участники которых посылают и принимают сообщения по определенной тематике. Группы новостей позволяют обмениваться мнениями с единомышленниками, живущими в любой точке земного шара. Для поиска информации только в группе новостей используют специализированные системы, например Deja
News. Данная система позволяет искать нужные сообщения в архиве новостей без подключения к серверу новостей.
Интернет является крупнейшим хранилищем файлов в мире.
Сервис FTP — File Transfer Protocol (протокол передачи файлов) позволяет получать и передавать файлы. Этот сервис остается одним из основных способов распространения бесплатных про-
грамм и различных дополнений и исправлений к коммерческим версиям программ. В последнее время наиболее популярным сервисом в Интернете стал сервис WWW — World Wide Web (всемирная паутина). В основу данной системы положено понятие гипертекста, то есть множества отдельных текстов, которые имеют ссылки друг на друга. Слова, находящиеся в одном документе, как бы «привязаны» к другим документам. Таким образом, это единое информационное
пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на web-серверах. Отдельные документы, составляющие пространство web, называют web-страницами. Группы тематически объединенных web-страниц называют web-узлами (web-7сайт или просто сайт). Две основные особенности отличают WWW — использование гипертекста и возможность клиентов взаимодействовать с другими приложениями Internet. Гипертекст — текст, содержащий в себе связи с другими текстами, графической, видео- или звуковой информацией.
Все серверы WWW используют специальный язык HTML (Hypertext Markup Language — язык разметки гипертекста). HTML-документы представляют собой текстовые файлы, в которые встроены специальные команды. WWW обеспечивает доступ к сети как клиентам, требующим
только текстовый режим, так и клиентам, предпочитающим работу в режиме графики. В первом случае используется программа Lynx, во втором — Mosaic. Отображенный на экране гипертекст представляет собой сочетание алфавитно-цифровой информации в различных форматах и стилях и некоторые графические изображения. Связь между гипертекстовыми документами осуществляется с помощью ключевых слов. Найдя ключевое слово, пользователь может перейти в другой документ, чтобы получить дополнительную информацию. Новый документ также будет иметь гипертекстовые ссылки. Работать с гипертекстами предпочтительнее на рабочей станции клиента, подключенной к одному из web-серверов, чем на страницах учебника. Работая с web-сервером, можно выполнить удаленное подключение Telnet, послать абонентам сети электронную почту, получить файлы с помощью FTP-анонима и выполнить ряд других приложений (прикладных программ) Internet. Это дает возможность считать WWW интегральной службой Internet.
Создание страниц WWW. Так как создание собственного сервера WWW является сложным и дорогостоящим, то многие пользователи сети Internet могут размещать свою информацию на уже
существующих серверах. Собственные страницы WWW можно создавать с помощью таких средств, как Microsoft Intertet Assistant for Word и Netscape Navigator Gold. Редактор страниц Microsoft Intertet Assistant представляет собой набор макрокоманд, на базе которого создаются документы HTML. В диалоговом режиме пользователь может создать свой документ. Редактор при этом обеспечивает:
— ввод заголовка документа;
— вставку графического изображения или видеофрагмента;
— вставку гипертекстовой ссылки;
— вставку закладки;
— просмотр страниц WWW.
Редактор, встроенный в навигатор Netscape Navigator Gold, содержит средства для работы с языком Java. Этот язык позволяет интерпретировать программы, полученные из сети, на локальном компьютере пользователя. Java:— язык объектно-ориентированного программирования. Он используется для передового способа создания приложений для Internet — программирования аплетов (аплет — небольшое приложение). С помощью аплетов можно со-
здавать динамичные web-страницы. Программы для просмотра web-страниц называют броузерами. Броузер выполняет отображение документа на экране, руководствуясь командами, которые автор документа внедрил в его текст. Такие команды называются тегами. Существуют специальные теги для внедрения графических и мультимедийных объектов (звук, музыка, видеоклипы). Почти 97% многомиллионной армии пользователей Internet работают с броузерами фирмы Netscape Communications — Netscape Communicator 4.x: Netscape Navigator (NN) и фирмы
Micrisoft — Internet Explorer.
Популярным сервисом в Интернете является IRC - Internet Chat Relay (беседа через Интернет). Эта система похожа на группы новостей, но обмен сообщениями в ней ведется без задержек. Подключившись к группе обсуждающих ту или иную проблему, можно набрать сообщение, и оно мгновенно становится доступным для других участников разговора. Непосредственным, или разговором в реальном времени, данный сервис называется из-за того, что между посылкой сообщения и ответом на него проходит около секунды. Для ведения разговоров через Интернет требуются специальные программы. Наиболее популярная из них — mIRC.
Поисковые системы, работающие во всемирной паутине, позволяют легко переходить по многочисленным ссылкам для поиска нужной информации. С ростом объемов информации в Интернете значение поисковых систем все время возрастает. Многие поисковые системы позволяют искать информацию не только на web-страницах, но и в группах новостей и хранилищах файлов. При выполнении запроса поисковая система не ищет документы непосредственно в Интернете. Она обращается к своей базе данных, где в компактном виде собраны данные об информации в Интернете. Реальное состояние Интернета несколько отличается от того, что хранится в базе данных. Поисковые системы постоянно пополняют и обновляют свои базы данных, чтобы минимизировать такое несовпадение.
Рассмотрим распространенные поисковые системы. Поисковая система Alta Vista принадлежит корпорации Digital и открыта для свободного использования в конце 1995 года. Система обеспечивает поиск как во всемирной паутине, так и в группах новостей.
Принципиальное отличие поисковой системы Yahoo! от других систем в том, что можно найти информацию без использования запросов, а просто переходя по ссылкам разделов встроенного справочника и последовательно уточняя область интересов. Не надо знать правила формирования запросов, достаточно просто переходить по ссылкам в нужные разделы. Однако для русскоязычного поиска данная система не слишком удобна, так как в справочнике Yahoo! содержится намного меньше ссылок на русскоязычные документы, чем в базе данных Alta Vista. Поисковая система Infoseek внешне напоминает систему Yahoo!. В ней можно искать информацию с помощью запросов или последовательно переходя по ссылкам. Поисковая система Hot Bot отличается возможностью поиска информации и через каталог, и по запросу. В настоящее время система находится еще в опытной эксплуатации и работает не слишком стабильно. Поисковая система Rambler выгодно отличается от других оригинальным оформлением. Кроме красивого оформления машина поиска Rambler обладает и удобной системой поиска и выдачи найденной информации. Список найденных страниц удобно организован. Вначале расположены ссылки на страницы; наиболее соответствующие критериям поиска. Степень соответствия определяется количеством шариков, нарисованных рядом со ссылкой. Кроме того, в кратком фрагменте текста найденного документа выделены обнаруженные ключевые слова. В системе Rambler можно посмотреть слова, которые наиболее часто используются в запросах пользователей. Кроме того, Rambler ведет список наиболее популярных российских узлов Интернета. Вся информация в
системе представлена на русском языке. Русскоязычной системой поиска является и Апорт. Особенностью данной системы является то, что в запросах можно использовать русские слова в любой грамматической форме. Интеллектуальный механизм преобразования запросов трансформирует самые сложные фразы для удачного поиска информации.
Русская машина поиска, Поиск в русском Интернете — это примеры систем, предназначенных для поиска информации в русскоязычной части Интернета.
К специальным медицинским поисковым системам можно отнести следующие:
— Achoo (адрес http://www.achoo.com);
— CliniWeb;
— HealthAtoZ Search Engine (адрес http://www.HealthAtoZ.com);
— MedBot (адрес http://medworld.stanford.edu/medbot/) — поисковая система Стэнфордского университета США;
— MedFinder Smart Medical Web Search;
— McdExplorer (адрес http://www.medexplorer.com/) — поисковая система «Здоровье и медицина в Интернете». Позволяет осуществить поиск медицинской информации, проводить поиск работы, конференций, возможностей продолжения образования;
— Medical Matrix (адресhttp://slackinc.com/matrix; http://www.medmatrix.org/index.asp)—крупнейший каталог по медицинской тематике. Русская версия «Медицинской матрицы» находится на сервере http://slackinc.com/matrix и http://www.friends-partners.org/friends/
health/nismed/matrix/horhepage.htmopttables-unix-russian-koi8;
— MedSeek (адрес http://www.medseek.com/) — поисковая система информации о практикующих врачах и лечебных учреждениях;
— Medical World Search (адрес http://www.mwsearch.com) — эта поисковая система находит полные тексты в большом объеме медицинской информации;
— RxList - The Internet Drug Index (адрес http://www.rxlist.com/) —это система поиска лекарственных веществ;
— Search MedWeb (адрес http://www.gen.emory.edu/MEDWEB/ search.html) — это поисковая система библиотеки;
— Московский медицинский рынок (адрес http://www.mr.ru) — поисковая система по лекарствам, медицинскому оборудованию.
Сервис Archi позволяет найти файл в Интернете по его имени. Поиск файла в данной системе похож на отыскивание информации в поисковых системах. Еще одной системой для поиска файлов является программа CuteFTP, а также Filez. Существуют специальные поисковые программы для получения информации в Интернете о высшем образовании. Сервер
Braintrack (адрес http://www.braintrack.com) содержит информацию о высших учебных заведениях пяти континентов. В этой программе есть адреса и некоторые сведения об университетах, описывается порядок поступления в университеты, стоимость учебы, имеющиеся стипендии, есть перечень предоставляемых специальностей, дипломов, сертификатов. Каждая страна имеет свои национальные информационные системы по учебным заведениям. Например, в Германии — Deutscher Akademischer Austauschdienst (DAAD) (адрес http://www.daad.org), Немецкая служба по вузовскому обмену способствует обмену студентами и молодыми исследователями между учебными заведениями, содержит раздел для иностранцев для учебы в Германии и др. Американская информационная система CollegeNet (адрес http://www.CollegeNet.com) позволяет произвести всю процедуру поступления в учебное заведение от заполнения документов ДО оплаты всех расходов, через Интернет. Аналогичную роль в Англии выполняет служба National Information Services and Systems (NISS) (адрес http://www.niss.ac.uk). Сведения о вузах России представляют несколько информационных систем: база данных «Вузы России» (адрес http://www.informatika.ru/wmdows/goscom/vuzrus/index.html и http://db.informatika.ru/VR/).
В базах данных присутствует раздел по выбору вуза и в направлении подготовки аспирантов, и по специализированному совету для защиты диссертации. При рассмотрении кандидатур будущих студентов-иностранцев их знания, подтвержденные отечественными дипломами, подвергаются еще и независимой оценке при помощи стандартизированных тестов, которые необходимо пройти в одном из центров тестирования, открытых службой образовательного тестирования во всем мире (Educational Testing Service (ETS) — адрес http://www.ets.org). Наиболее распространенные тесты находятся на следующих адресах:
— Graduate Record Examinations (GRE) - адрес http://www.gre.org;
— Test of English as a Foreign Lanquage (TOEFL) - адрес http://www.toefl.org.
Первый тест проверяет знания и умения по специальностям, а второй — знание английского языка у людей, для которых английский язык не является родным.
С помощью Интернета для медицинского обучения можно использовать специальный учебный материал. Например, ресурс Voxel-Man (адрес http://users.ox.ac.uk/~uzdl0037/voxman.html) предо-
ставляет в пользование компьютеризированный трехмерный атлас человека, подготовленный сотрудниками Оксфордского университета. На сервере Human Anatomy Online (адрес http://www.innerbody.com) содержатся озвученные анимационные картинки и диаграммы по
анатомии. Информацию о разнообразных учебных программах содержит сервер World Wide Web Medical Education Resource (адрес http://www.meducation.com/).
В настоящее время трудоустройство через Интернет стало распространенной услугой. Одним из крупных центров по трудоустройству и профессиональной ориентации является Career Mosaic
(адрес http://canada.careermosaic.com/cml.html). Эта система предлагает услуги тем, кто ищет работу, и тем, кто ее предоставляет. Можно осуществить поиск вакансий в базе данных, дать объявление о себе, посмотреть информацию о предлагаемых видах работы. В соответствии с общепринятыми международными стандартами составить резюме о себе помогает центр подготовки резюме — Resume Writing Center (адрес http://canada.careermosaic.com/cm/rwc/
rwcl.html). Для того чтобы созданное резюме смогли увидеть работодатели практически всего мира, его нужно послать в Resume СМ (адрес http://canada.careermosaic.com/cm7cm40.html).
Иногда в Интернете используется система Gopher. Эта система вложенных меню была прообразом всемирной паутины. Система WAIS — Wide Area Information Service (информационный сервис широкой области) также является альтернативой всемирной паутины для осуществления поиска. В настоящее время данная система почти не используется.
Система адресации в I n t e r n et
Internet самостоятельно осуществляет передачу данных. К адресам станций предъявляются специальные требования. Адрес должен иметь формат, позволяющий вести его обработку автоматически, и должен нести некоторую информацию о своем владельце. С этой целью для каждого компьютера устанавливаются два адреса: цифровой IP-адрес (межсетевой протокол) и доменный адрес. Оба эти адреса могут применяться равноценно. Цифровой адрес удобен для обработки на компьютере, а доменный адрес — для восприятия пользователем. Цифровой адрес имеет длину 32 бита. Для удобства он разделяется на четыре блока по 8 бит, которые можно записать в десятичном виде. Два блока определяют адрес сети, а два другие — адрес компьютера внутри этой сети. Последовательность компонентов адреса следующая: адрес сети, адрес подсети, адрес компьютера в подсети. Например, в двоичном коде цифровой адрес записывается следующим образом: 10000000001011010000100110001000. В десятичном коде он имеет вид: 192.45.9.200. Адрес сети — 192.45; адрес подсети — 9; адрес компьютера — 200.
Доменный адрес определяет область, представляющую ряд хост-компьютеров (компьютеры, самостоятельно подключенные к Internet). В отличие от цифрового адреса он читается в обратном
порядке. Вначале идет имя компьютера, затем имя сети, в которой он находится. В системе адресов Internet приняты домены, представленные географическими регионами. Они имеют двухбуквенное имя. Например, Франция — fr, Канада — са, США — us, Россия — ru. Существуют и домены, разделенные по тематическим признакам. Такие домены имеют трехбуквенное название. Например, учебные заведения — edu, правительственные учреждения — gov,
коммерческие организации — com. Компьютерное имя включает как минимум два уровня доменов. Каждый уровень отделяется от другого точкой. Слева от домена верхнего уровня располагаются другие имена. Все имена, находящиеся слева, — поддомены для общего домена. Например, существует имя tutor.sptu.edu. Здесь edu — общий домен для школ и университетов, tutor — поддомен sptu, который является поддоменом edu.
Для пользователей Internet адресами могут быть просто их регистрационные имена на компьютере, подключенном к сети. За именем следует знак Все это слева присоединяется к имени компьютера. Например, пользователь, зарегистрировавшийся под именем victor на компьютере, имеющем в Internet имя tutor.sptu.edu, будет иметь адрес: victor@tutor.sptu.edu.
В Интернете могут использоваться не только имена отдельных людей, но и имена групп. Для обработки пути поиска в доменах имеются специальные серверы имен. Они преобразовывают доменное имя в соответствующий цифровой адрес. Локальный сервер передает запрос на глобальный сервер, имеющий связь с другими локальными серверами имен. Поэтому пользователю просто нет необходимости знать цифровые адреса. Сервер предоставляет станциям вычислительной сети доступ к общим системным ресурсам (вычислительным мощностям, базам
данных, библиотекам программ, принтерам, факсам и др.) и распределяет эти ресурсы. Такой универсальный сервер часто называют сервером приложений. Серверы в сети часто специализируются. Специализированные серверы используются для устранения наиболее узких мест в работе сети: создание и управление базами данных и архивами данных, поддержка многоадресной факсимильной связи и электронной почты, управление многопользовательскими терминалами (принтеры, плоттеры и др).
Итак, для выхода в Internet необходимо знать адрес сервера, с которым нужно установить связь.
IP-адреса и доменного имя недостаточно, чтобы найти на компьютере конкретный документ при, обращении через сеть. Требуется указать, какой протокол должен применяться для доступа к информации. Все перечисленные элементы (протокол, описывающий метод доступа, адрес компьютера, путь к файлу, его имя) содержатся в уникальном адресе каждого информационного ресурса, называемом URL — универсальный указатель ресурсов (или адрес ресурса, или просто адрес). Полный адрес содержит следующие элементы:
Протокол://адрес сервера/путь/имя файла
Протокол или метод доступа — это первая часть адреса, которая отделяется от остальной его части двоеточием и двумя наклонными чертами://. Метод доступа может быть задан, например, как http, ftp, telnet, news. Адрес сервера — это доменное имя компьютера, на котором
размещены данные. Путь — это последовательность имен каталогов и подкаталогов, в последнем из которых содержится нужный файл. Имена каталогов разделяются наклонной чертой /.
Имя файла — имя конечного файла. Оно имеет определенное расширение: имена web-страниц имеют расширение html, имена файлов, в которых хранятся статьи в формате Adobe Acrobat Reader, — расширение pdf, имена мультимедиа-документов — расширения gif, jpeg (графика), wav, au (звук), avi (видео).
Все биомедицинские ресурсы Интернета по характеру предлагаемой информации можно разделить на научные, клинические и учебные. Рассмотрим медицинские ресурсы Интернета, классифицированные по принципу медицинской специальности.
Билет №37. Чем экспертная система отличается от обычных программ? Чем гибридные экспертные системы отличаются от систем с классической архитектурой? В чем заключается особенность технологии создания экспертных систем? По каким критериям можно оценить точность работы экспертной системы? Существуют ли подходы к построению программ, имитирующих мыслительную деятельность человека, отличные от технологии экспертных систем?
Экспертная система отличается от прочих прикладных программ наличием следующих признаков.
- Моделирует не столько физическую (или иную) природу определенной проблемной области, сколько механизм мышления человека применительно к решению задач в этой проблемной области. Это существенно отличает экспертные системы от систем математического моделирования или компьютерной анимации. Нельзя, конечно, сказать, что программа полностью воспроизводит психологическую модель специалиста в этой предметной области (эксперта), но важно, что основное внимание все-таки уделяется воспроизведению компьютерными средствами методики решения проблем, которая применяется экспертом, -т.е. выполнению некоторой части задач так же (или даже лучше), как это делает эксперт.
- Система, помимо выполнения вычислительных операций, формирует определенные соображения и выводы, основываясь на тех знаниях, которыми она располагает. Знания в системе представлены, как правило, на некотором специальном языке и хранятся отдельно от собственно программного кода, который и формирует выводы и соображения. Этот компонент программы принято называть базой знаний.
- При решении задач основными являются эвристические и приближенные методы, которые, в отличие от алгоритмических, не всегда гарантируют успех. Эвристика, по существу, является правилом влияния (rule of thumb), которое в машинном виде представляет некоторое знание, приобретенное человеком по мере накопления практического опыта решения аналогичных проблем. Такие методы являются приблизительными в том смысле, что, во-первых, они не требуют исчерпывающей исходной информации, и, во-вторых, существует определенная степень уверенности (или неуверенности) в том, что предлагаемое решение является верным.
Экспертные системы отличаются и от других видов программ из области искусственного интеллекта.
- Экспертные системы имеют дело с предметами реального мира, операции с которыми обычно требуют наличия значительного опыта, накопленного человеком. Множество программ из области искусственного интеллекта являются сугубо исследовательскими и основное внимание в них уделяется абстрактным математическим проблемам или упрощенным вариантам реальных проблем (иногда их называют "игрушечными" проблемами), а целью выполнения такой программы является "повышение уровня интуиции" или отработка методики. Экспертные системы имеют ярко выраженную практическую направленность в научной или коммерческой области.
- Одной из основных характеристик экспертной системы является ее производительность, т.е. скорость получения результата и его достоверность (надежность). Исследовательские программы искусственного интеллекта могут и не быть очень быстрыми, можно примириться и с существованием в них отказов в отдельных ситуациях, поскольку, в конце концов, — это инструмент исследования, а не программный продукт. А вот экспертная система должна за приемлемое время найти решение, которое было бы не хуже, чем то, которое может предложить специалист в этой предметной области.
- Экспертная система должна обладать способностью объяснить, почему предложено именно такое решение, и доказать его обоснованность. Пользователь должен получить всю информацию, необходимую ему для того, чтобы быть уверенным, что решение принято "не с потолка". В отличие от этого, исследовательские программы "общаются" только со своим создателем, который и так (скорее всего) знает, на чем основывается ее результат. Экспертная система проектируется в расчете на взаимодействие с разными пользователями, для которых ее работа должна быть, по возможности, прозрачной.
Зачастую термин система, основанная на знаниях (knowledge-based system), используется в качестве синонима термина экспертная система, хотя, строго говоря, экспертная система — это более широкое понятие. Система, основанная на знаниях, — это любая система, процесс работы которой основан на применении правил отношений к символическому представлению знаний, а не на использовании алгоритмических или статистических методов. Таким образом, программа, способная рассуждать о погоде, будет системой, основанной на знаниях, даже в том случае, если она не способна выполнить метеорологическую экспертизу. А вот чтобы иметь право называться метеорологической экспертной системой, программа должна быть способна давать прогноз погоды (другой вопрос — насколько он будет достоверен).
Суммируя все сказанное, отметим — экспертная система содержит знания в определенной предметной области, накопленные в результате практической деятельности человека (или человечества), и использует их для решения проблем, специфичных для этой области. Этим экспертные системы отличаются от прочих, "традиционных" систем, в которых предпочтение отдается более общим и менее связанным с предметной областью теоретическим методам, чаще всего математическим. Процесс создания экспертной системы часто называют инженерией знаний (knowledge engineering) и он рассматривается в качестве "применения методов искусственного интеллекта" (см. [Feigenbaum, 1977]). Далее, в главах 2 и 3, мы более пристально рассмотрим отличие между общепринятым в программировании подходом к решению проблем и тем, который предлагается при проектировании экспертных систем.
Архитектура экспертной системы:
Архитектура гибридной экспертной системы:
Гибридные экспертные системы:
1) используют разные модели представления знаний;
2) такие, которые кроме БД и БЗ, включают и прикладные программы конкретной предметной области.
При создании ЭС основные усилия должны быть сконцентрированы на проектировании БЗ, в рамках которого выбирается язык представления знаний, способы логического вывода и пр. В случае же если в качестве инструментального средства используется оболочка ЭС, этап программирования вообще исключается из процедуры создания ЭС.
Учитывая вышесказанное, технологию разработки ЭС можно представить схемой, включающей следующие этапы (Рисунок 1-2. Этапы разработки ЭС.):
1. Предварительный этап – этот этап включает деятельность предшествующую решению о разработке новой ЭС. В рамках этого этапа осуществляются конкретизация задачи, подбор экспертов в данной предметной области для совместной работы, выбор подходящих инструментальных средств. Главной особенностью этого этапа является то, что может быть принято решение о нецелесообразности разработки ЭС для выбранной
задачи.
2. Этап прототипирования – в ходе этого этапа создается прототип ЭС, предназначенный проверки правильности выбранных средств и методов разработки новой ЭС. К прототипу системы не предъявляются высокие требования. Основная его задача состоит в иллюстрации возможностей будущей системы для специалистов, непосредственно участвующих в разработке, а также для потенциальных пользователей. На этом этапе может быть осуществлена корректировка проекта, уточнены время,
стоимость и необходимые ресурсы для завершения работы.
3. Этап доработки – это по сути основной, наиболее рутинный и продолжительный этап работы над ЭС. Все компоненты многократно тестируются и доводятся до соответствия требованиям проекта. Наибольшую сложность вызывает доработка и доказательство адекватности и эффективности БЗ, так как количество записей в ней может быть на порядок больше, чем в прототипе.
Большое количество применяемых эвристик, интуитивный подход к решению задач экспертами делают процесс создания ЭС творческим. Еще одной особенностью
разработки ЭС является поэтапное ее внедрение. Первые версии новой ЭС начинают эксплуатироваться в ограниченном объеме уже на этапе прототипирования.
Экспертные системы оцениваются главным образом для того, чтобы проверить точность работы программы и ее полезность. Оценку можно проводить, исходя из критериев следующих категорий:
- критерии пользователей (понятность и «прозрачность» работы системы, удобство интерфейсов и др.);
- критерии приглашенных экспертов (оценка советов-решений, предлагаемых системой, сравнение ее с собственными решениями, оценка подсистемы объяснений и др.);
-собственные критерии коллектива разработчиков (эффективность реализации, производительность, время отклика, дизайн, широта охвата предметной области, непротиворечивость БЗ, количество тупиковых ситуаций, когда система не может принять решение, анализ чувствительности программы к незначительным изменениям в представлении знаний, весовых коэффициентах, применяемых в механизмах логического вывода, данных и т.п.).
Наряду с технологией экспертных систем в области искусственного интеллекта разрабатываются и другие подходы к решению интеллектуальных задач. Также как и в случае с ЭС эти подходы основаны на имитации умственной деятельности человека. Но, если ЭС – имитируют процесс рассуждения на понятийном уровне, не затрагивая
физиологических и психологических процессов, то альтернативные экспертным системам подходы как раз пытаются воспроизвести механизмы мышления, происходящие в мозгу человека.
Существуют различные способы классификации интеллектуальных технологий. Но наиболее существенным, по всей видимости, является разделение по признаку способности к самообучению. ЭС в классическом варианте просто копируют знания эксперта-человека. Но человеку, прежде всего, присуща способность к обучению. Человеческий мозг постоянно обрабатывает огромное количество сенсорной информации. На основании этой информации, человек вырабатывает определенные реакции, ведущие к достижению текущей цели. Если реакция неверна, то в аналогичной
ситуации в будущем, как правило, человек учитывает опыт прошлого и определенным образом изменяет свою реакцию. Существенно, что такая схема поведения верна не только для человека, но и для животных, действующих на уровне рефлексов. Таким образом, интеллектуальное поведение и обучение заложены в самой структуре мозга, обеспечивающей процессы мышления.
Билет №38. Как происходит обучение нейронной сети? Что именно для этого необходимо? На каких операциях основан эволюционный подход к генерации новых структур знаний? Что понимается под представлением знаний? Какие требования предъявляются к языку представления знаний? Можно ли утверждать, что представление знаний это кодирование информации на каком-либо формальном языке?
В наиболее простом виде персептрон состоит из совокупности чувствительных (сенсорных) элементов (S-элементов), на которые поступают входные сигналы. S-
элементы случайным образом связаны с совокупностью ассоциативных элементов (А-элементов), выход которых отличается от нуля только тогда, когда возбуждено достаточно большое число S-элементов, подающих сигналы на входы А-элемента. А-элементы соединены с реагирующими элементами (R-элементами) связями, коэффициенты усиления (v) которых переменны и изменяются в процессе обучения. Взвешенные комбинации выходов R-элементов составляют реакцию системы, которая указывает на принадлежность распознаваемого объекта определенному образу. Если
распознаются только два образа, то в персептроне устанавливается только один R-элемент, который обладает двумя реакциями – положительной и отрицательной. Если образов больше двух, то для каждого образа устанавливают свой R-элемент, выходная реакция которого представляет линейную комбинацию связанных с ним выходов A-элементов:
R j = Q j + v i j x i
где Rj – реакция j -го R-элемента; xi – реакция i -го A-элемента; vij – вес связи от i -го A-элемента к j -му R элементу;Q j – порог j -го R-элемента. Аналогично записывается уравнение i -го A-элемента:
xi = Q j + y k
Здесь сигнал yk может быть непрерывным, но чаще всего он принимает только два значения: 0 или 1. Сигналы от S-элементов подаются на входы А-элементов с постоянными весами равными единице, но каждый А- элемент связан только с группой случайно выбранных S-элементов. Предположим, что требуется обучить персептрон различать два образа V1 и V2. Будем считать, что в персептроне существует два R-элемента, один из которых предназначен образу V1, а другой – образу V2. Персептрон
будет обучен правильно, если выход R1 превышает R2, когда распознаваемый объект принадлежит образу V1, и наоборот. Разделение объектов на два образа можно провести и с помощью только одного R- элемента. Тогда объекту образа V1 должна соответствовать положительная реакция R-элемента, а объектам образа V2 – отрицательная. Персептрон обучается путем предъявления обучающей последовательности изображений объектов, принадлежащих образам V1 и V2. В процессе обучения изменяются веса vi А-элементов. В частности, если применяется система подкрепления с коррекцией ошибок, прежде всего учитывается правильность решения, принимаемого персептроном. Если решение правильно, то веса связей всех сработавших А-элементов, ведущих к R-элементу, выдавшему правильное решение, увеличиваются, а веса не сработавших А-элементов остаются неизменными. Можно
оставлять неизменными веса сработавших А-элементов, но уменьшать веса не сработавших. В некоторых случаях веса сработавших связей увеличивают, а не сработавших – уменьшают. После процесса обучения персептрон сам, без учителя, начинает классифицировать новые объекты. Если персептрон действует по описанной схеме и в нем допускаются лишь связи, идущие от бинарных S-элементов к A-элементам и от A-элементов к единственному R-элементу, то такой персептрон принято называть
элементарным -персептроном. Обычно классификация задается учителем. Персептрон должен выработать в процессе обучения классификацию, задуманную учителем.
Довольно большое распространение получил и эволюционный или генетический подход. Подобно нейронным сетям, генетические алгоритмы основываются на свойствах биологических систем. В рамках этого подхода самообучение рассматривается как конкуренция внутри популяции между эволюционирующими кандидатами на роль решения задачи. Генетический
подход позволяет получать новое решение задач на основе заданного множества исходных посылок. Более того, в процессе работы алгоритма поиска решения формируется цепочка поколений решений, каждое из которых, по крайней мере, не хуже своего предшественника. Таким образом, в процессе поиска система «обучается» и «совершенствует» свои возможности решить поставленную задачу. Суть этого подхода характеризуют некоторые биологические
аналогии, копирующие идеи Дарвина, Менделя и других исследователей, развивавших идеи эволюции: выживание сильнейших особей популяции в процессе ее развития. Одной из первых теоретических разработок в данном направлении стал генетический алгоритм Холланда. Этот
алгоритм работает на множестве произвольных структур, которыми могут быть логические формулы, высказывания, нейронные сети, или любые другие формализмы. Главное, чтобы для этих структур существовала какая-либо оценочная функция их эффективности. На основании этой
функции осуществляется оценка, будет ли этот экземпляр участвовать в следующем поколении решений или нет. Таки образом осуществляется отбор кандидатов на роль решения. Затем с помощью генетических операций, аналогичных трансформациям генотипа в процессе биологического воспроизводства, создается новое поколение решений- кандидатов.
Первоначальный алгоритм включает следующие шаги:
1. Случайным образом создать начальную популяцию из M структур.
2. Вычислить и запомнить для каждой структуры показатель эффективности ее работы. Если их среднее значение достаточно высокое, то остановить эти вычисления и выдать текущую популяцию структур в качестве результата.
3. Для каждой структуры подсчитать вероятность ее выбора
р = е / Е (среднее значение, черта вверху над Е)
где е – индивидуальный показатель эффективности, а E – суммарный показатель для всех М структур в популяции.
4. Создать следующую популяцию структур в соответствии с вычисленной вероятностью выбора, а также применяя генетические операторы.
5. Повторить, начиная со второго шага.
Таким образом, среднее число «потомков» каждой структуры в следующем поколении пропорционально измеренной эффективности при решении стоящей перед системой задачей: выживают наиболее приспособленные. Генетическими операторами, используемыми на шаге четыре, являются кроссинговер, мутация и инверсия. Кроссинговер (перекрест) – это операция, при которой новые структуры получаются посредством случайного взаимозамещения компонентов в начальных структурах. Мутации, модифицирующие произвольным образом одну или несколько компонент в структуре, предназначены для введения в популяцию принципиально новой информации. Инверсия изменяет характер связей и последовательность компонентов внутри структуры. Генетический алгоритм позволяет генерировать новые структуры,
которые обладают характеристиками, во всяком случае, не хуже, а в большинстве случаев превосходящими существующие. Еще одним важным свойством генетических алгоритмов является параллельная природа поиска – альтернативные решения, при переходе из
поколения в поколение сходятся к точкам оптимума в пространстве поиска решений. В ходе эволюции формируется множество решений, каждое из которых вносит свой независимый вклад в поиск лучшего решения. Различные методы машинного обучения показали высокую
эффективность при решении практических задач. В последнее время наметилась тенденция к объединению этих методов с технологией ЭС, что позволяет создавать высокоэффективные гибридные интеллектуальные системы.
Основные требования к языку представления знаний в ЭС:
1. Организация знаний на основе концептуальных объектов – для систематизированного управления сложными знаниями большого объема.
2. Комбинация декларативных и процедурных знаний при описании концептуальных объектов – в целях увеличения гибкости системы.
3. Применение иерархических структур представления знаний - для описания концептов с учетом степени абстракции.
4. Наличие функций учета ситуаций для выбора тех или иных стратегий вывода при разрешении неоднозначностей.
5. При разработке сред проектирования интеллектуальных систем необходимо предусматривать возможность свободного проектирования и испытания пользователем различных способов
управления выводом.
6. Расширяемость языка представления знаний.
Ошибочно считать, что представление знаний – это простое кодирование информации. Замена одних символов на другие не решает проблемы неоднозначности, присущей человеческому языку. Так многие задачи, легко решаемые человеком, с трудом реализуются на машине. В
качестве примера можно привести фразу, описывающую тривиальную бытовую ситуацию:
«Молоток ударил о графин, и он разбился»
Для человека очевиден ответ на вопрос «что разбилось?». Но чтобы на этот вопрос смогла ответить машина, следует ввести какое-либо правило, связывающее местоимение «он» с представленными в данной фразе объектами. Например, можно задать очередность следования
предметов во фразе, и считать что второй предмет – графин – должен разбиться. Однако, очевидно, что этот подход работает не всегда:
«Графин ударился о камень, и он разбился»
Для человека очевидно, что и в первом, и во втором случае разбиться должен именно графин. Это объясняется тем, что начиная с первых лет жизни люди накапливают предварительное знание о мире. Но чрезвычайно трудно такие знания представлять в машинной памяти.
Билет №39. Что такое таблица операторов? Можно ли с помощью таблицы операторов представить любое действие робота? Как выполняется поиск цели в системе STRIPS?
Это один из языков представления знаний (наряду с таблицей решений, семантическими сетями и фреймами), применявшийся в первых экспертных системах. таблица операторов представляет собой множество возможных операций для последовательности действий интеллектуальных агентов, автономных роботов и беспилотных аппаратов и др (если говорить в общем или для робота, если в частности). Для использования таблицы операторов необходима модель мира, которая является совокупностью выражений предикат-аргумент.
Описать действия робота при помощи таблицы операторов можно, но при наличии модели мира.
Задачей системы STRIPS является формирование плана действий робота для достижения цели. Таким образом, результатом работы системы должна быть последовательность операторов, применение которых к исходной модели мира позволяет
достичь целевой модели. Зная целевое состояние среды можно было бы перебирать последовательно или случайно комбинации операторов, пока цель не будет достигнута. Но экспоненциальный рост количества вариантов при каждой новой проверке делает такой подход неприемлемым на практике. Для предотвращения экспоненциального роста вариантов возможных решений в качестве основы для работы системы был предложен метод «анализ целей и средств», идея которого состоит в том, чтобы с каждой новой операцией отличие между текущим состоянием и целевым уменьшалось. Это предполагает наличие меры оценки «расстояния» в пространстве решений.
Например, если очередная подцель сформулирована в виде предиката:
at(box1, roomА),
а ящик box1 находится в комнате roomВ, то перемещение робота из комнаты roomА в комнату roomС не приблизит текущее состояние к целевому (для модели W1). А перемещение из комнаты roomА в комнату roomВ, наоборот, уменьшит расстояние между текущим и целевым состоянием, так как позволит на следующем шаге переместить ящик box1 в комнату roomА. Алгоритм поиска требуемых операторов системы STRIPS основан на сопоставлении очередной подцели и списков добавления в таблице операторов. Новые подцели выбираются из списка предварительного
условия найденного оператора. Так, например, цель at(box1, roomА) соответствует элементу at(X, Z) в списке добавлений оператора push(X, Y, Z). Сопоставление этих двух предикатов (Х соответствует box1, а Z – roomA) позволяет выбрать из предварительного условия оператора новые подцели:
at(robot, Y), at(box1, Y).
Далее необходимо найти в модели мира предикат, содержащий объект (в данном случае это комната), который можно сопоставить с символом Y. Таким предикатом может быть, например, at(box1, roomB). Поставив в соответствие с символом Y объект roomB можно окончательно
сформулировать очередные подцели:
at(robot, roomB) и at(box1, roomB).
Теперь первый элемент в этом списке указывает желаемое (целевое) положение робота, а второй элемент уже присутствует в модели мира W1. Следовательно, после применения оператора push к модели мира W1, необходимо добавить at(robot, roomB) и удалить at(robot, roomA). В результате получится новая модель:
W2 = { at(robot, roomB), at(box1, roomB), at(box2, roomC) }.
Описанная процедура повторяется до тех пор, пока очередная модель не будет соответствовать целевой.
Билет №40. Можно ли с помощью языка графов описать любые понятия? Что представляют узлы и связи в семантической сети? Какие основные типы отношений должны быть представлены в семантической сети? Приведите пример. Опишите с помощью семантической сети работу университетской библиотеки.
Как следует из названия семантическая сеть, этот метод представления знаний позволяет описывать объекты, явления и понятия предметной области с помощью теории графов (семантика – это наука, устанавливающая отношения между символами и объектами, которые они
обозначают, или наука, определяющая смысл знаков; сеть – разновидность графа). Семантические сети первоначально были разработаны для использования их в качестве психологических моделей человеческой памяти, но впоследствии с успехом стали применяться в экспертных системах.
Терминология теории графов позволяет описывать практически любые структуры абстрактных данных. Коротко суть этой теории можно сформулировать следующим образом. Для построения графа используются два основных вида примитивов: узлы и связи. Узлы и связи могут быть
дополнительно промаркированы. Связи могут быть также направленными и нет.
Семантическая сеть представляет собой ориентированный граф, где узлы представляют понятия предметной области, а связи – отношения между понятиями. В качестве понятий обычно выступают абстрактные или конкретные объекты, концепты или события, а отношения – это связи
следующих видов:
1. связи, определяющие тип объектов ("это есть" или "класс- подкласс", "иметь частью" или "часть-целое", "принадлежать" или "элемент-множество" и т.п.);
2. функциональные связи (определяемые обычно глаголами "производит", "влияет" …);
3. количественные ("больше", "меньше", "равно" …);
4. пространственные ("далеко от", "близко от", "за", "под", "над"...);
5. временные ("раньше", "позже", "в течение" …);
6. атрибутивные связи (иметь свойство, иметь значение ...);
7. логические связи ("и", "или", "не") и др.
Характерной особенностью семантических сетей является обязательное наличие в одной сети трех типов отношений:
- класс - элемент класса (роза - это цветок);
- свойство – значение (цвет имеет значение желтый);
- экземпляр элемента класса (роза, например, чайная).
Билет №41. Чем отличаются семантические сети и фреймы? Что их объединяет? Какова роль прототипов в теории фреймов? Приведите пример описания прототипа какого-либо объекта или понятия и нескольких фреймов для данного прототипа. Опишите основную идею фреймового подхода к представлению знаний.
«Фрейм – это структура данных, представляющая стереотипную ситуацию, вроде нахождения внутри некоторого рода жилой комнаты, или сбора на вечеринку по поводу дня рождения ребенка. К каждому фрейму присоединяется несколько видов информации. Часть этой информации – о том, как использовать фрейм. Часть о том, чего можно ожидать далее. Часть о том, что следует делать, если эти ожидания не подтвердятся». (Понятие ввел Марвин Минский в 70-е годы)
Семантическая сеть - это метод представления знаний позволяет описывать объекты, явления и понятия предметной области с помощью теории графов (семантика – это наука, устанавливающая отношения между символами и объектами, которые они обозначают, или наука, определяющая смысл знаков; сеть – разновидность графа).
По своей организации фрейм похож на семантическую сеть, так как является моделью организации памяти человека. Но, в сравнении с сетью, фрейм представляет собой более естественную форму для отображения иерархически организованных знаний. Такого рода знания базируются на понятии абстрактного образа или ситуации.
Существует предположение, что представление понятий в мозге человека не требует четкого определения набора свойств, а базируется на понятии типа или класса, объединяющего в себе наиболее общие свойства. Сущности, соответствующие классам получили название прототипа.
Прототип – это уже не абстрактный образ, а наиболее типичный представитель своего класса, с обобщенными, но вполне конкретными, значениями своих свойств. Например, прототип понятия четырехугольник можно определить как фигуру, имеющую четыре угла. Возникает желание
задать значения величин углов «по умолчанию» одинаковыми. И этому есть вполне убедительное объяснение. Рассматривая различные примеры фигур слева направо, кажется, что «типичность» объектов увеличивается. Четырехугольник, не обладающий выпуклостью, кажется менее типичным чем прямоугольник, возможно потому, что понятие площадь фигуры в нашем сознании коррелирует с длиной периметра. А это лучше просматривается у фигуры с равными внутренним углами. Прототип может быть основой для описания любой сущности данного класса в случае неполноты информации, так как представляет обобщенные свойства большинства разновидностей объектов класса. Так, если требуется оценить площадь более или менее прямоугольного участка земли, для которого известны длины сторон, то можно оценить площадь,
предполагая, что внутренние углы его контура равны. В худшем случае, если предположение о равенстве углов будет нарушено, то значение площади будет завышено, что в большинстве случаев вполне допустимо.
Приведите пример описания прототипа какого - либо объекта или понятия и нескольких фреймов для данного прототипа.
Основная идея фреймового подхода заключается в сосредоточении всей информации, относящейся к одному объекту в одной структуре данных, вместо распределения ее по базе знаний. Структура фрейма достаточно проста: с представляемым понятием связывается список именованных атрибутов, называемых слотами. Каждый слот может иметь значение по умолчанию. Также со слотом могут быть связаны произвольные процедуры, выполняемые при смене его значения. Эти процедуры в литературе иногда именуются «демонами». Со слотом можно связать любое количество процедур, но наиболее часто используются следующие:
1. Процедура на событие «если добавлено» (IF-REMOVED). Выполняется, когда новая информация записывается в слот.
2. Процедура на событие «если удалено» (IF-ADDED). Выполняется, когда информация удаляется из слота.
3. Процедура на событие «по требованию» (IF-NEEDED). Выполняется, когда запрашивается информация из пустого слота.
Таблица 2-3. Структура фрейма.
Название понятия (имя фрейма) | ||
Слоты: | Значения: | Список связанных процедур: |
Имя слота 1 | Значение 1 | Процедура 1 |
Имя слота 2 | Значение 2 | Процедура 2 |
… | … | … |
Имя слота N | Значение N | Процедура N |
Фреймы-прототипы, хранящиеся в базе знаний, позволяют реализовать наследование свойств одних фреймов от других. Аналогично тому, как в семантической сети наследование происходит по транзитивным отношениям («имеет частью», «это есть»), фреймы- экземпляры могут наследовать свойства фреймов-прототипов через специальные слоты АКО (A-Kind-Of = «это есть»). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, то
есть переносятся, список и значения слотов. Фреймы-экземпляры создаются в БЗ для отображения реальных объектов и ситуаций на основе поступающих данных. Возможно наследование свойств от нескольких прототипов. Такой вид наследования получи название «множественное наследование».
Билет №42. Какова структура и применение классов в «чистой» объектно-ориентированной парадигме? Приведите определения понятий «наследование», «инкапсуляция» и «полиморфизм». Каково назначение метаклассов в объектно-ориентированных языках?
Представление концептуальных понятий в объектно-ориентированном языке осуществляется с помощью классов, задача которых – объединить связанные данные и поведение. Эти классы могут наследовать некоторые или все свойства своих родителей – суперклассов, они также могут определять свои собственные атрибуты (данные) и методы (поведение). Классы, как правило, выступают в качестве шаблонов (аналогично прототипам для фреймов) для создания экземпляров классов – объектов. Различные экземпляры одного и того же класса обычно содержат различные данные, но имеют единообразное представление, то есть значения атрибутов объектов различны, а их перечень и методы для всех объектов одного класса одни и те же.
При использовании объектно-ориентированного подхода не принято использовать прямой доступ к атрибутам какого-либо класса из методов других классов. Взаимодействие между классами осуществляется с помощью отправления сообщений, или вызовов методов объектов. Когда
объект получает сообщение, он может по-разному реагировать на него, в зависимости от своего текущего состояния. Методы и атрибуты класса или члены класса подразделяются на открытые и закрытые. Открытые члены класса образуют его интерфейс, через который объекты данного класса взаимодействуют с другими объектами. Закрытые члены класса не доступны для других объектов.
Сокрытие реализации класса и отделение его внутреннего представления от внешнего получило название инкапсуляция.
Еще одним фундаментальным понятием в объектно-ориентированном программировании, наряду с наследованием и инкапсуляцией, является полиморфизм. Слово полиморфизм греческого происхождения и означает "имеющий много форм". Формально, полиморфизм – это положение теории ООП, согласно которому одинаковые имена методов могут обозначать различное поведение объектов для нескольких классов, имеющих общий суперкласс.
Следовательно, любой объект, обозначаемый полиморфным именем, может по-своему реагировать на некий общий набор операций.
Наследование – важный механизм объектно-ориентированного подхода, позволяющий расширить и/или изменить структуру уже существующего (родительского) класса, путем написания нового класса (потомка), который полностью наследует все свойства и методы и, плюс, добавляет что-то свое. Далее можно начинать создавать и использовать в программе новые объекты с расширенными возможностями.
Во многих ООП-языках сами классы также являются объектами, которые можно создавать, передавать и подвергать интроспекции. Но поскольку объекты, как отмечалось, создаются с использованием классов в качестве шаблонов, то для создания объектов-классов также нужны
шаблоны. Подобные классы для классов получили название метаклассы, которые позволяют динамически генерировать новые классы с различными атрибутами и методами, или, иначе говоря, управлять процессом создания не только объектов, но и классов. Этот аспект особенно важен тогда, когда за ранее невозможно предусмотреть в тексте программы все возможные классы. Примером такой ситуации является анализ текста – концепции формируются по ходу анализа и зависят от содержания нового текста. Наконец, поскольку метакласс сам является
классом, то нет никакого смысла в заведении "мета-мета-классов".
Билет №43.Почему представление знаний на основе продукций получило наибольшее распространение? Как формируется цепочка вывода цели в продукционной системе? Каким образом можно повлиять на ход вывода с помощью метаправил? Приведите пример. На каком формализме основаны логические модели? Почему они не получили большого распространения в коммерческих системах?
Системы представления знаний, использующие выражения вида «ЕСЛИ условие, ТО действие», получили название системы продукций или системы, основанные на правилах. Идея этого метода принадлежит Э. Посту (1943). Правила обеспечивают формальный способ представления
рекомендаций, указаний или стратегий. Они идеально подходят в тех случаях, когда знания предметной области возникают из эмпирических ассоциаций, накопленных за годы работы по решению задач в данной области. Представления знаний в виде продукций наиболее
распространено в экспертных системах, так как запись знаний фактически ведется на подмножестве естественного языка. Следствием этого является то, что правила легко читаются, их просто понять и модифицировать, эксперты без труда могут сформулировать новое правило или указать на ошибочность какого-либо существующего.
Помимо продукционных правил база знаний должна включать и простые факты, поступающие в систему через интерфейс пользователя или выводимые в процессе поиска решения задачи. Факты являются простыми утверждениями типа «клиент работает на одном месте более двух лет». И когда в процессе интерпретации правил машиной вывода какой-либо факт согласуется с частью правила ЕСЛИ, то выполняется действие, определяемое частью ТО этого правила. Новые факты,
добавляемые в базу знаний в результате действий, описанных в правилах, также могут быть использованы для сопоставления с частями ЕСЛИ других правил. Последовательное сопоставление частей правил ЕСЛИ с фактами порождает цепочку вывода.
В процессе вывода решения все правила системы равнозначны и самодостаточны, то есть все необходимое для активизации правила содержится в его условии, и одни правила не могут непосредственно вызывать другие. Но иногда для получения решения требуется вмешательство в стандартный процесс вывода. Для этих целей некоторые продукционные системы позволяют вводить в базу знаний специальные правила для управления процессом вывода – метаправила. Метаправила не принимают непосредственного участия в процессе формирования рассуждений, а определяют приоритет выполнения или исключают из рассмотрения обычные правила и выполняются в первую очередь. Ниже приведен пример метаправила, сокращающего цепочку вывода:
МП 1:
ЕСЛИ кредитный рейтинг клиента высокий
И клиент является клиентом банка,
ТО сначала применить правила для льготных условий
предоставления кредита.
Можно также сформулировать пример метаправила, касающегося общей стратегии вывода и не связанного с какой-либо конкретной предметной областью:
МП 2:
ЕСЛИ существуют правила, в условиях которых не упоминается текущая цель
И существуют правила, в условиях которых упоминается текущая цель,
ТО сначала следует активизировать первые из перечисленных правил.
Последний пример не связан с предметной областью и, поэтому, подобные метаправила можно применять в системах различного назначения. Интерес к такого рода обобщенным формулировкам знаний достаточно высок. Идея использования метаправил является весьма
продуктивной, но, тем не менее, метаправилами следует пользоваться осмотрительно, учитывая возможные исключительные ситуации.
Логические модели представления знаний основаны на стиле программирования, разработанном Ковальским, который использует логику предикатов для управления анализом декларативных предложений.
Каждое предложение записано в следующей форме:
Консеквент → антецедент-1, антецедент-2, … антецедент-n
Данная форма сходна с продукционными правилами. Здесь антецеденты (заключение) являются предикатами, истинность которых можно подтвердить или опровергнуть, а консеквент (условие) – это предикат, который является истинным, если можно доказать истинность всех его антецедентов. Те есть приведенный пример предложения аналогичен продукции «ЕСЛИ условие-1 И условие-2 И … И условие-n, ТО заключение».
Программа, основанная на логике, берёт поставленную цель и сравнивает её с консеквентами всех запомненных предложений. Когда она находит совпадение, она последовательно пытается доказать цель, рассматривая антецеденты совпавшего консеквента в качестве подцелей;
если доказана истинность всех подцелей, тем самым доказана и сама цель.
Этот поиск антецедентов для доказательства консеквента очень похож на построение обратной цепочки рассуждений в схеме управления языков, основанных на правилах.
Логические модели являются наиболее строгим, в математическом смысле, способом представления знаний. Но на практике они не получили большого распространения из-за малой наглядности базы знаний. Основная область применения этих моделей – учебные экспертные
системы.
Билет №44. Какие основные вопросы задачи поиска необходимо рассмотреть для создания эффективной машины вывода? Назовите и опишите работу основных стратегий поиска в пространстве состояний? Приведите пример комбинированного алгоритма поиска. Почему комбинированные алгоритмы являются более предпочтительными при решении реальных задач? Чем отличается прямая цепочка вывода от обратной? В каких случаях следует применять первую, а в каких – вторую?
Предположим, некоторая задача описана, формализована и для нее существует БЗ правил, позволяющих найти решение этой задачи для некоторых начальных фактов. При реализации машины вывода, позволяющей осуществлять поиск решений, необходимо ответить не
следующие вопросы:
• Гарантировано ли нахождение решения в процессе поиска?
• Является ли поиск конечным, или в нем возможны зацикливания?
• Ес