PDFTextStream

Скриншот программы:
PDFTextStream
Детали программы:
Версия: 2.6.0
Дата загрузки: 20 Feb 15
Разработчик: Snowtide Informatics Systems, Inc.
Тип распространения: Условно-бесплатная
Цена: 1900.00 $
Популярность: 2

Rating: nan/5 (Total Votes: 0)

Проект PDFTextStream текстовый PDF и метаданные библиотеки добыча для Java, Python, и .NET.
Он поддерживает все версии спецификации PDF документа (в том числе v1.6, используемые Acrobat 7), добыча текста, закодированного с помощью двухбайтовых наборов символов (включая китайский, японский, корейский и), расшифровки 40-бит и 128- разрядных зашифрованных документов, и добыча всех метаданных документов, предусмотренных PDF документов (в том числе данных форм, закладки и аннотации).
Простая интеграция с Джакарта Lucene входит

Что нового В этом выпуске:.

  • Эта версия включает в себя разнообразные исправления, достигнутый чтобы обеспечить PDFTextStream способен извлекать текст из PDF документов, которые несоответствующих спецификации PDF.
  • Это также включает в себя различные усовершенствования производительности.

Что нового в версии 2.3.0:

  • Добавлена ​​метод к ком .isStruckThrough (). snowtide.pdf.TextUnit, указывающее, имеет ли символ зачеркивания, проведенной через него.
  • Улучшена поддержка PDFTextStream для встраиваемых отображений символов.
  • Расчет пробелов между словами был зафиксирован должным образом зарегистрированы для пробелами, явно, закодированной в документах PDF источником.
  • Улучшена обработка PDFTextStream о композитных кодировок контента, которые ранее могли не приводит в некоторых диапазонах содержания PDF будучи 'игнорируются "во время извлечения.
  • Исправлена ​​ошибка в VisualOutputTarget где текст из одной строки будут разделены на несколько строк
  • Улучшена вертикальное выравнивание текста извлекаются с помощью VisualOutputTarget
  • Улучшена VisualOutputTarget производства экстрактов для устранения паразитных Пробелы между тесно прилегающих слов

Что нового в версии 2.2.5:

  • Этот релиз добавляет поддержку для извлечения XFA формы данные, XML.
  • Это значительно повышает производительность извлечения текста с использованием VisualOutputTarget. Поддержка PDF документов больше, чем 2 Гб.
  • Исправление ошибки, когда кодировки из встроенных шрифтов Type1 ранее не применяются должным образом в некоторых обстоятельствах.
  • Исправление проблемы, где новый контент в обновленных документов PDF иногда игнорируется.
  • Исправление проблемы, где PDFDocEncoding кодировке закладки и метаданных не были декодирования должным образом.
  • а .getDestinationName () в com.snowtide.pdf.Bookmark.

Требования

  • Apache Lucene

Комментарии к PDFTextStream

Комментарии не найдены
добавить комментарий
Включите картинки!