Информационный поиск как процесс

Рассматривая информационный поиск как процесс можно определить следующие этапы поиска информации:

  • • определение (уточнение) информационной потребности и формулировка информационного запроса;
  • • определение совокупности возможных информационных источников;
  • • извлечение информации из выявленных информационных массивов;
  • • ознакомление с полученной информацией и оценка результатов поиска.

Средства поиска информации. Информационно-поисковые каталоги

Каталог — это система, обеспечивающая классификацию информации.

Отличительной особенностью каталога является наличие иерархии (схемы упорядочения) ресурсов, в которой каждый из них (ресурсов) относится к одному или более разделам. Пример каталога: List.ru (http://list.ru) работает с описаниями ресурсов Интернета. Они наполняются Web- мастерами (людьми, создающими информационные ресурсы) или специальными редакторами, которые просматривают информационные ресурсы Сети.

Каталоги следует использовать, если имеется необходимость нахождения в Интернете группы информационных ресурсов на определенную достаточно узкую тематику, например сайтов, предоставляющих контактную информацию организаций или сайтов электронных СМИ.

Информационно-поисковые системы (ИПС) решают задачи сбора, хранения, обработки и выдачи информации и выполняют следующие операции:

  • • поиск документов;
  • • анализ содержимого документов;
  • • построение поисковых образов документов (извлечение из документов информации, используемой системой как знания о документе);
  • • хранение поисковых образов документов (сведений о документах);
  • • анализ запросов пользователей (потребителей информации);
  • • поиск релевантных (соответствующих) запросу документов;
  • • выдача ссылок на документы потребителям.

Архитектура современных поисковых систем включает

такие элементы как:

  • программы: клиент — программа просмотра конкретного информационного ресурса; пользовательский интерфейс — программа просмотра, способ общения пользователя с поисковым аппаратом: системой формирования запросов и просмотров результатов поиска;
  • поисковая машина служит для трансляции запроса на информационно-поисковом языке, в формальный запрос системы, поиска ссылок на информационные ресурсы Сети и выдачи результатов этого поиска пользователю;
  • индекс базы данных — индекс, который является основным массивом данных ИПС. Он служит для хранения сведений обо всех известных системе Интернет-документах;
  • запросы пользователя сохраняются в его (пользователя) личной базе данных. На отладку каждого запроса уходит достаточно много времени, и поэтому чрезвычайно важно запоминать запросы, на которые система дает хорошие ответы;
  • робот-индексировщик (crawler, spider или паук) служит для сканирования Интернета и поддержания базы данных индекса в актуальном состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов сети;
  • WWW sites — информационные ресурсы, просмотр которых обеспечивается программами просмотра.

В поисковых системах хранятся не сами документы, а только сведения о них, достаточные для их нахождения пользователем и, как следствие этого, поисковая система в результатах поиска может и не выдавать некоторые соответствующие запросу документы. В результате поиска (отклике на запрос) системой сортируются документы по степени соответствия сделанному пользователем запросу с точки зрения алгоритма поисковой системы, а не с точки зрения их фактического соответствия запросу. Поисковые системы следует применять, если требуется найти информацию по специфичным вопросам или для обеспечения полноты охвата ресурсов. К наиболее известным поисковым системам относятся такие службы, как Google (http:// www.google.com) и Яндекс (http://www.yandex.ru).

Метапоисковые системы — это надстройки над поисковыми системами и электронными каталогами, которые не имеют собственной базы данных (индекса).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >