Детали программы:
Версия: 4.0
Дата загрузки: 3 Jun 15
Тип распространения: Бесплатная
Популярность: 31
Шерлок Холмс является универсальным поисковая система, система для сбора и индексирования текстовых данных (текстовые файлы, веб-страницы, и т.д.), как локально, так и по сети.
Особенности :.
- Собирает файлы с помощью HTTP-либо из локальных файлов
- Анализирует текстовые файлы, HTML, PDF и некоторые другие форматы, используя внешние парсеры (например, MS Word и PostScript).
- Вся система является модульной, поэтому добавляя свои собственные источники данных или анализаторы просто вопрос подключения в правый модуль (хорошо, как правило, также писать это).
- Хорошо работает в смешанной среде кодировки.
- Считает несколько вхождений одного и того же файла (даже с незначительными изменениями) в одном документе с несколькими URL.
- Все настраиваемый. Вы можете написать правила фильтрации на специальном языке, который позволяет настроить переменные конфигурации в зависимости от документа обрабатывается.
- Поиск слов, фраз и логических выражениях. Поиск в именах файлов и ссылок текстов.
- Поиск Близость и близость весовой регулярных поисков.
- Признание языках, легко интегрировать парадигматическим и синонимических словарей.
- Проверка орфографии на основе частот слов, наблюдаемых в индексированных данных, намекая пользователю, что его запрос может быть орфографической ошибкой.
- Результаты поиска включают контекст в каждом документе.
- Весы и десятки миллионов документов на обычной аппаратной ПК.
- Пользовательский интерфейс (передний конец) полностью отделена от остальной части системы, что делает его легко изменить, а также вставлять поисковик в существующих приложениях.
- Загруженные файлы и индексы сжимаются для экономии места.
Комментарии не найдены