Задание для подготовки к ИГА на 27_09_12
Автоматизированные информационные системы (АИС)
В этот класс систем прикладной информатики входят информационные системы, общая структура которых показана на рисунке.
Основу такой системы составляет банк данных, в котором хранится большая по объему информация о какой-либо области человеческих знаний. Территориально этот банк может быть распределенным. Важно, что для пользователя этот банк представляется как единое хранилище информации, куда он может обратиться с запросом
В неавтоматизированных информационных системах запрос обрабатывается человеком. В АИС запросы обрабатывают с помощью специальных программ, реализуемых на компьютере. Для того чтобы это стало возможным, необходим специальный язык запросов, понимаемый АИС. Для пользователя желательно, чтобы язык запросов был как можно ближе к естественному языку. В этом случае АИС должна обладать системой понимания текстов на естественном языке или языке, близком к нему. В таких АИС используется диалоговая система.
Устройство блока расшифровки запроса зависит от выбранного языка запроса. Оно достаточно просто, если запросы жестко фиксированы. Если же в качестве языка запроса используется подмножество естественного языка, то этот блок может быть достаточно сложным.
После расшифровки запроса по информации, содержащейся в нем, формируется поисковое предписание (или поисковый образ), представляющее задание для процедуры поиска в банке данных. Поиск в банке данных осуществляется блоком поиска. Найденная информация выдается потребителю в удобной для него форме.
Банк данных требует постоянного обновления, пополнения и чистки. Для этого используется специальный входной канал, которым пользуется администратор банка данных.
Частным случаем АИС являются информационно-поисковые системы, предназначенные как для коллективного, так и для индивидуального пользования.
В таких системах хранится информационный массив, из которого по требованиям пользователей выдается нужная информация. Поиск информации по требованию пользователя осуществляется либо автоматически, либо вручную (как в библиотеках, когда с запросом к работнику справочного фонда обращается читатель, а работник пользуется системой каталогов).
Во втором случае используются ЭВМ, снабженные специальными программными средствами, анализирующими процессы запросов, поиска и выдачи нужных документов.
Информационно-поисковые системы делятся на два типа.
21. Документографическая ИПС. В такой ИПС все хранимые документы индексируются некоторым специальным образом. Каждому документу (статье, отчету, протоколу и т.п.) присваивается индивидуальный код, составляющий поисковый образ документа. Поиск идет не по самим документам, а по их поисковым образам, которые содержат информацию (адрес) о местонахождении документа. Именно так ищут книги по заказам читателя в больших библиотеках (в маленьких библиотеках библиотекарь обычно ищет книги сам). По требованию читателя сначала находят карточку в каталоге, а потом по шифру, указанному на ней, отыскивается и сама книга.
Различия документографических ИПС определяются тем, как устроен поисковый образ документа. В простейшем случае это просто его индивидуальное название (например, название, автор, год издания книги). В более сложных случаях нет однозначного соответствия между поисковым образом документа и самим документом. Вполне возможен случай, когда поисковый образ документа соответствует нескольким различным документам и, наоборот, один и тот же документ соответствует не одному, а нескольким поисковым образам.
Такой неоднозначностью обладают, например, поисковые образы документов в дескрипторных системах. Дескриптор - слово или словосочетание, которое тесно связано с содержанием документа. Совокупность дескрипторов определяет группу документов со сходным содержанием. В последнее время журналы, публикующие научные статьи, требуют от своих авторов, чтобы для каждой статьи они указывали список ключевых слов, которые и играют роль дескрипторов.
По набору этих ключевых слов (набору дескрипторов) можно найти статью среди всех статей, введенных в ИПС дескрипторного типа.
Общая блок-схема ИПС дескрипторного типа показана на рисунке.
Эта схема имеет два входа. По одному происходит пополнение хранящегося в системе информационного массива документов, а по второму поступают запросы пользователей.
2. Фактографическая ИПС. В отличие от документографических ИПС в ИПС такого типа хранятся не документы, а факты, относящиеся к какой-либо предметной области. Хранимые факты могут быть извлечены из различных документов. В базе фактов они связываются между собой системой разнообразных отношений. Такая сеть в ИПС носит название тезауруса предметной области. Запросы, поступающие в фактографические ИПС, используют тезаурус для поиска ответов на запросы. Поиск осуществляется методом поиска по образцу, широко применяющемуся в базах знаний систем искусственного интеллекта.
ИПС фактографического типа постепенно приближаются по своей организации и функционированию к развитым базам данных и знаний.
Любая ИС включает в себя четыре компонента: информационные средства, программные средства (обеспечение), технические средства, персонал. Информационное обеспечение реализуется в виде файловой системы или в виде базы данных. База данных (БД) -это совокупность описаний объектов предметной области и связей между ними, актуальных для конкретной предметной области.
Структура данных в ИС обычно сложна (сложность определяется не столько объемом, сколько количеством взаимосвязей), задачи по обработке данных однотипны для разных предметных областей (создание, поиск, ввод и вывод, группировка, сортировка). Поэтому все типовые функции по работе с данными выделены в специальную систему. Система управления базой данных (СУБД - это комплекс программных и языковых средств создания, ведения и манипулирования данными).
Программные средства делят на две части: системное программное обеспечение (СПО) и прикладное программное обеспечение (ППО). В состав СПО входит операционная система ЭВМ (ОС) и СУБД. ОС настолько тесно связана с техническими средствами, что их часто объединяют и называют программно-аппаратной платформой, например, ПЭВМ IBM PC используется платформа WINTEL (Windows + Intel).
Персонал - это специалисты, которые обслуживают и сопровождают ИС, их часто включают в состав системы, поскольку без персонала невозможна работы сложной системы.