Трюки индексирования и сопоставления - это еще не все

Создание поисковой системы для веб - отнюдь не простая задача. Конечный продукт можно сравнить с невообразимо сложной машиГлава 2. Индексирование в поисковых системах ...

ной, в которой множество разных колесиков, шестеренок и рычагов, и все они должны быть правильно подогнаны, чтобы машина работала. Поэтому важно понимать, что два представленных в этой главе трюка сами по себе не решают задачу построения эффективного поискового индекса. Однако они дают почувствовать, как создаются и используются индексы в реальной поисковой системе.

Трюк с метасловами позволил AltaVista добиться успеха там, где другие потерпели поражение, - эффективно производить поиск во всей сети веб. Мы знаем об этом, потому что этот трюк описан в заявке на патент США 1999 года, поданной компанией AltaVista и названной «Поиск с ограничениями по индексу». Однако замечательного алгоритма сопоставления, придуманного AltaVista, не хватило для удержания на плаву в бурных водах зарождающейся индустрии поиска. Как мы уже знаем, эффективное сопоставление - лишь половина успеха поисковой системы; вторая половина - задача о ранжировании подходящих страниц. И в следующей главе мы увидим, что появления нового типа алгоритмов ранжирования оказалось достаточно, чтобы затмить AltaVista и вывести Google на передний край технологии поиска в веб.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >