Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Обобщенная структура и основные компоненты информационно-поисковых систем для WWW. Понятие индекса. Особенности процедуры индексирования




По пространств. масштабу ИПС:

§ локальные (для быстрого поиска стр. в масштабе отдельного сервера)

§ региональные (описыв. информационные ресурсы опред. региона)

§ глобальные (описыв. ресурсы всего информационного простр-ва сети Инт.)

§ специализированные

Поиск – в собственной базе (индексе) с описан. распределенных источников информации.

Сначала - описать информационные ресурсы и создать индекс. Построение индекса – с определения начального набора URL источника информации. Затем – индексирование.

Индексирование – описание ист. информации и построение спец. базы данных (индекса) для эффектив. поиска. Иногда описание ист. инф. проводится персоналом ИПС, кот. сост. краткую аннотацию на каждый ресурс. Затем - сортировка аннотаций по темам (составление тематич. каталога).

Процедура описания занимает значит. период времени, поэтому индекс имеет ограниченный объем. В ИПС др. типа процедура описания информации ресурсов автоматизир. Для этого - спец. программа - робот, кот. по опред. технологии обходит ресурсы, описыв. их (проводит индексир.) и анализир. ссылки с текущей стр. для расширения области поиска.

Чаще всего просто составляется список слов, кот. встречаются в тексте и др. частях док-та., при этом учитывается частота повторения и местоположения слова т.е. слову приписывается весовой коэффициент в зависимости от его значимости. Затраты времени невелики.

Классификация средств поиска. Приемы работы с тематическими каталогами.

Каталог – поисковая система с классифицируемая по темам списком аннотаций со ссылками на web-ресурсы.

Классификация проводится людьми.

Автоматический индекс (поисков. машина) – поисковая система с формируемой роботом базой данных, содержащая информацию об информационных ресурсах.

Метапоисковая. система – система, не имеющая своего индекса, способная послать запросы пользователю одновременно неск-ким поисковым серверам, затем объединить полученные результаты и представить их пользователю в виде документов со ссылками.

Программа ускорен. поиска – программа с возможностями метапоисковой сис-мы, устанавливаемая на локальном компьютере.

Отличие метапоиск. сис-м и программ ускор. поиска от ИПС - отсутствие собств. индекса. База данных ссылок (индекс) каталога имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.

Результат поиска в каталоге - в виде списка, сост. из краткого описания (аннотации) док-та с гипертекст. ссылкой на первоисточник.

Поисковые машины (автоматические индексы). Простой и сложный режимы поиска. Обобщенные возможности формирования запроса с использованием операторов. Режим сложного (расширенного) поиска. Представление и обработка результатов поиска.

Поисковая машина – поисковая сис-ма с формируемой роботом базой данных, содержащая информацию об информационных ресурсах.

Простой поиск - введение через пробел одного или нескольких слов; поиск слов со всевозможными окончаниями моделируется символом * в конце слова. Словосочет. или фраза - в " ".

Основная проблема – поисковая машина найдет все страницы, на кот. встречаются указанные слова. Многие поиск. сис-мы включают в свой язык составл. запросов спец. операторы, позволяющие проводить поиск в определенных зонах док-та.

Возможность - поиск док-тов в сети, ссылающийся на стр. с указанным адресом (URL). Режим расшир., или детального запроса чаще всего это бланк, в котор. упомянутые операторы и ключевые элементы реализ. простой установкой соответствующих флажков или выбором параметров из списка.

Способы представления результатов поиска: в качестве ф-мы выдачи составляется список документов по 5-10-15 единиц на стр. с возможностями перехода к след. порции внизу стр. Обязательно указывается заголовок и URL (адрес) найденного док-та.

В описании док. чаще всего – несколько первых предлож. или выдержки из текста док-та с выделением ключ. слов, указана дата обновления док-та, его размер в кбайтах.

Если описание док. соответствует требованиям - перейти к первоисточнику по ссылке. Услуга поиска похожих документов.





Поделиться с друзьями:


Дата добавления: 2016-04-03; Мы поможем в написании ваших работ!; просмотров: 523 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Бутерброд по-студенчески - кусок черного хлеба, а на него кусок белого. © Неизвестно
==> читать все изречения...

2464 - | 2390 -


© 2015-2025 lektsii.org - Контакты - Последнее добавление

Ген: 0.011 с.