Введение в поисковый сервер Apache Soir

Apache Soir (http://lucene.apache.org/solr') - это высокопроизводительный, потокобезопасный поисковый сервер промышленного качества, построенный на базе Apache Lucene. Сервер Soir был создан компанией CNET, которая в начале 2006 года безвозмездно передала его фонду Apache Software Foundation. С тех пор он не переставал развиваться - в него добавлено много новых возможностей, а вокруг сформировалось большое и активное сообщество, члены которого разрабатывают новые функции, исправляют ошибки и повышают производительность. Перечислим некоторые функции, которые ставят Soir на одно из первых мест среди поисковых серверов.

• Простые, основанные на HTTP протоколы индексирования и поиска, а также наличие клиентов, написанных на Java, PHP, Ruby и других языках.

  • • Развитые механизмы кэширования и репликации с целью повышения производительности.
  • • Простота настройки.
  • • Фасетный поиск.
  • • Выделение поисковых термов в найденных результатах.
  • • Средства администрирования, протоколирования и отладки, позволяющие не гадать, что происходит в работающем сервере Soir.
  • • Распределенный поиск.
  • • Проверка орфографии.
  • • Извлечение содержимого с помощью Apache Tika.
  • • Качественная документация.

Одна из лучших черт Soir - использование Apache Lucene. Как и вокруг Soir, вокруг Lucene образовалось активное сообщество, и у нее сложилась репутация надежной, как скала, поисковой библиотеки (Soir, напротив, является поисковым сервером), выдающей высококачественные результаты с великолепной производительностью. Apache Lucene, первоначально написанная Дугом Каттингом (Doug Cutting), превратилась в быструю и мощную библиотеку для полно- текстового поиска. Тем, кто хочет узнать о Lucene побольше, рекомендуем книгу Erik Hatcher, Otis Gospodnetic, Mike McCandless «Lucene In Action» (второе издание). В ней прекрасно описано внутреннее устройство Lucene, и многое применимо также к Soir.

Атеперь, когда вы знаете о том, что Soir может предложить, займемся настройкой и использованием этого сервера. Имейте в виду, что многое из того, что при работе с Lucene приходится программировать вручную, в Soir задается в конфигурационном файле.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >