Jericho HTML Parser

Скриншот программы:
Jericho HTML Parser
Детали программы:
Версия: 3.3
Дата загрузки: 20 Feb 15
Разработчик: Martin Jericho
Тип распространения: Бесплатная
Популярность: 3

Rating: nan/5 (Total Votes: 0)

Jerich HTML анализатор с открытым исходным кодом, проста, но мощная библиотека полностью написан на Java.
Это позволяет программистам управлять и анализировать частей HTML документа.
Jerich HTML Parser также включает высокого уровня функции HTML-форма манипуляции

Что нового В этом выпуске:.

  • Исправления:
  • [3581664] CharacterReference.decode () не декодировать объекты, содержащие цифры - и frac12; & frac14; & frac34; & ПОД1; & Sup2; & sup3; & there4;
  • [3311286] SourceCompactor не уважать TEXTAREA
  • [3519131] Renderer выход неправильно, когда строится с объектом Element.
  • [3538829] Renderer выход украшения шрифта на границах блоков неправильно.
  • Segment.getAllStartTags (имя) и Segment.getFirstElement (имя) не будет работать, если аргумент содержит символы верхнего регистра.
  • Конечный ограничитель общего тега сервера внутри сбежавшего тега сервера ложно признан как конечный разделитель сбежавшего тега.
  • Изменения, которые могут повлиять на ПОВЕДЕНИЕ существующих программ:
  • [3427073] Segment.getStyleURISegments () теперь включает в себя содержание элемента стиля, а также значения атрибутов стиля.
  • [3427927] Segment.getURIAttributes () теперь включает в себя атрибуты Архив объектов и апплетов элементов.
  • Комментарии больше не признанные в течение элементов сценария полного последовательного разбора. Ранее они были признаны на совместимость с основными браузерами, но современный поведение браузера изменилось.
  • Изменен уровень лог всех разбора ошибок с ИНФО ошибки, и уровень журнала в Source.fullSequentialParse () консультативного сообщения от WARN для информации. Предыдущие уровни дал консультативного сообщения высшее тяжести, чем ошибки разбора, предотвращая системы логирования из укрытия консультативную сообщение, показывая ошибки разбора. Кодировка символов предупреждения остаются неизменными на уровне WARN.
  • Изменено поведение метода Renderer.renderHyperlinkURL (StartTag), так что относительные URL-адреса не отображаются.
  • Изменено поведение Renderer, чтобы содержание гиперссылка элемент не отображается, если это то же самое, как гиперссылки, игнорируя HTTP:. // префикс и / или суффикс
  • EndTag.tidy () теперь удаляет пробелы до закрывающей скобки.
  • Добавлена ​​Источник (Файл) Конструктор.
  • Метод Добавлено OutputDocument.getSegment ().
  • Добавлена ​​OutputDocument.remove (INT начала Int конца) метод.
  • Метод Добавлено Renderer.setHRLineLength ().
  • Добавлена ​​RenderToText.jsp WebApp образец.
  • Метод Добавлено Segment.getRowColumnVector ().
  • Кодирование обнаружения теперь игнорирует общие кодировки, указанные в мета-тегов, которые имеют размер код блок несовместимого с предварительного кодирования.
  • Обновление до следующих регистратора API: оно SLF4J-API-1.7.2, 1.2.17 log4j-

Что нового в версии 3.1:

  • исправления:
  • [2793556] Бесконечный цикл на Segment.getAllStartTags ()
  • Бесконечный цикл на Segment.getAllElements ()
  • Segment.getFirst * Методы вернулся сегментов вне ограничивающего сегмента.

  • Методы
  • Segment.getAllElements не вернуть все вложенные элементы в некоторых обстоятельствах.
  • Исправлены ошибки в документации методов Segment.getAllElements.
  • класс Добавлено StreamedSource.
  • Изменения, которые могут повлиять на ПОВЕДЕНИЕ существующих программ:
  • Изменен ParseText из класса в интерфейс.
  • Segment.getNodeIterator () теперь возвращает символьные ссылки как отдельные узлы.
  • Добавлена ​​тегов методы поиска, основанные на значений атрибутов регулярных выражений.
  • Добавлена ​​тегов методы поиска, основанные на атрибут HTML класса.
  • Добавлена ​​статическое свойство Source.LegacyNodeIteratorCompatabilityMode временно восстановить Segment.getNodeIterator () функциональность, что и в предыдущих версиях.
  • Удаленные символьные [] методы, основанные поиска в ParseText.
  • Добавлена ​​CharacterReference.appendCharTo (Appendable) метод.
  • Добавлена ​​OutputDocument (сегмент) Конструктор.
  • Пример программы Добавлено StreamedSourceCopy.

Что нового в версии 3.0:

  • исправления:
  • Ссылки на символы, представляющие дополнительные символы Юникода не декодируется правильно, чтобы в кодировке UTF-16 Код единицы пар.
  • [2188446] Element.getDepth () и Element.getParentElement () возвращается неверные результаты, если называют в разборе на режиме спроса.
  • Комментарии в настоящее время признается в & Lt; Сценарий и GT; элементы.
  • API изменения, которые не имеют обратной совместимости:
  • Изменено наименование пакет net.htmlparser.jericho
  • Значения атрибутов должны быть в настоящее время строки, а не CharSequence.
  • Удалены все устаревшие методы / классы от предыдущих версий.
  • Все найти * методы устаревшие в пользу получить * методов в целях применения последовательного правила именования всех методов поиска тегов.
  • Tag, элемент и HTMLElements классы больше не реализовать интерфейс HTMLElementName. (использовать статический импорт, а)
  • Все коллекции в настоящее время stongly набраны дженерики.
  • Изменен FormControlOutputStyle класс перечисления.
  • Изменен FormControlType класс перечисления.
  • Добавлена ​​CharStreamSource.appendTo (Appendable) метод.
  • Метод Добавлено Source.iterator ().
  • Источник в настоящее время реализует Iterable.
  • внутри использует StringBuilder для лучшей производительности.
  • Добавлена ​​Source.getNextStartTag (StartTagType) метод.
  • Добавлена ​​Source.getNextEndTag (EndTagType) метод.
  • Добавлена ​​Source.getPreviousStartTag (StartTagType) метод.
  • Добавлена ​​Source.getPreviousEndTag (EndTagType) метод.
  • Добавлена ​​Segment.getAllStartTags (StartTagType) метод.
  • Добавлены все Segment.getFirst * методы.
  • Добавлена ​​Renderer.renderHyperlinkURL (StartTag) метод.
  • Пример программы Добавлено HTMLSanitiser.
  • Модернизированный SLF4J-API-1.5.6

Требования

  • Java 2 Standard Edition Runtime Environment

Похожие программы

Sweave2knitr
Sweave2knitr

20 Feb 15

JCAM Engine
JCAM Engine

3 Jun 15

C++ WSDL Parser
C++ WSDL Parser

3 Jun 15

Другие программы разработчика Martin Jericho

Комментарии к Jericho HTML Parser

Комментарии не найдены
добавить комментарий
Включите картинки!