Arch является открытым расширением источника Apache Nutch (популярный, масштабируемые общего назначения поисковой системы) для поиска в интранете. Не доволен вашей корпоративной поисковой системы? Не удивительно, что очень немногие люди. Насколько нам известно, нет интранете двигателей, которые работают так же как Google глобальный веб-поиска делает. Существует фундаментальная причина этого: алгоритмы, используемые Google по глобальной сети (или аналогичный) не работают почти так же хорошо на внутренних сетях за отсутствия статистических данных. Arch (наконец-то!) Решает эту проблему. Он использует новый метод для доставки высоких результатов поиска точности, что прекрасно работает. Не верьте этому? Слепые инструменты оценки теста включены. Вы можете развернуть Arch и сравнить его производительность с текущей поисковой системы и / или Google (на открытой части вашего сайта), используя слепой методологии испытаний.
В дополнение к отличным качеством поиска, Arch имеет множество функций, имеющие решающее значение для корпоративных сред:
- Безопасность на уровне документа. Пользователи могут найти только те документы, которые они уполномочены видеть.
- Обновления Недорогой индекс. Arch способен поддерживать индексы в актуальном состоянии и избегать регулярного полного сайта повторное сканирование.
- 24/7 проверка наличия. Существует всегда рабочий индекс доступен, даже если ползать терпит неудачу.- Поддержка одновременной индексации и поиска нескольких веб-сайтов, с возможностью поиска и администрировать любой сайт по отдельности, если это необходимо. Динамическое добавление и удаление веб-сайтов легко.
- Автоматически сгенерированное каталог сайтов.
- Низкая стоимость поддержки после развертывания.
- Двойной интерфейс (PHP и Java) для упрощения развертывания и настройки.
- Грановитая поиск "из коробки".
- Обширный и расширяемый набор парсеров для разбора различных форматов: HTML, PHP, PDF, MS Office, Open Office и т.д.
- Модульный плагин на основе архитектуры, которая может быть легко настроен и расширен.
- Исходный код включен в стоимость.
- Высокая производительность и масштабируемость. Arch может работать на вычислительных кластерах для индекса очень больших наборов данных
Что нового в этом выпуске:.
Version 1.9.2: улучшенный синтаксический анализ документа, портирована на Nutch 1.9 .
Что нового в версии 1.7:.
Добавлено сканирование безопасности, портирована на Nutch 1.7
Требования :
Java 1.7, Cygwin
Комментарии не найдены