cpdetector проект является небольшой, но умный рамки для обнаружения кодировке.
cpdetector является небольшой, но умный рамки для обнаружения кодировке, которая интегрирует различные стратегии. Он может быть использован в качестве библиотеки для стороннего программного обеспечения, которое обращается текстовые данные через сеть.
Это также включает в себя лучшей практикой в виде инструмента командной строки, что позволяет сортировать и преобразования больших коллекций документов, основанных на их кодовой страницы.
Существующие стратегии включают в себя: jchardet (исключение, частотный анализ, и гадать), обнаружение имущества HTML кодировки и обнаружения декларации кодирования в формате XML.
Что такое код страницы?
Во-первых, это текстовый документ, не более, чем последовательность битов. Компьютер должен решить, как он может отображать эти данные в виде символов (которые определены с помощью компьютера в качестве чисел).
Кодовая страница - который также известен как таблицы кодировки - отображает необработанные данные в текстовый документ в символы. Исходный код ASCII страница, например, только использует 7 битов октета (байта) для принятия решения характер, что представлено таким образом, что позволяет только карту 128 различных символов. В прошлом памяти было дорого и компьютеры чаще только был регистров и шины для 8 бит.
Когда мэйнфреймов был задуман он должен был быть решено, какие символы он должен поддерживать. Врачи и математики, например требуется специальных символов для уравнений. В результате, компьютер часто поставляются со специальной кодовой страницы
Что нового В этом выпуске:.
- Это крупное Исправление версия исправляет две проблемы в командной строки пакетного режима.
- Переключатель для пропуска движущихся незамеченными документы в настоящее время работает снова.
- Никакая попытка не будет перекодировать незамеченными документы (последний вызвал исключительный программный поток).
Что нового в версии 1.0.8:
- Этот релиз релиз стабильность и фиксирует байт порядок определения марки и несовместимость с OpenJDK. Это также требует Java 1.5 в настоящее время.
Комментарии не найдены