Детали программы:
Версия: 2.6.0
Дата загрузки: 20 Feb 15
Тип распространения: Условно-бесплатная
Цена: 1900.00 $
Популярность: 63
Проект PDFTextStream текстовый PDF и метаданные библиотеки добыча для Java, Python, и .NET.
Он поддерживает все версии спецификации PDF документа (в том числе v1.6, используемые Acrobat 7), добыча текста, закодированного с помощью двухбайтовых наборов символов (включая китайский, японский, корейский и), расшифровки 40-бит и 128- разрядных зашифрованных документов, и добыча всех метаданных документов, предусмотренных PDF документов (в том числе данных форм, закладки и аннотации).
Простая интеграция с Джакарта Lucene входит
Что нового В этом выпуске:.
- Эта версия включает в себя разнообразные исправления, достигнутый чтобы обеспечить PDFTextStream способен извлекать текст из PDF документов, которые несоответствующих спецификации PDF.
- Это также включает в себя различные усовершенствования производительности.
Что нового в версии 2.3.0:
- Добавлена метод к ком .isStruckThrough (). snowtide.pdf.TextUnit, указывающее, имеет ли символ зачеркивания, проведенной через него.
- Улучшена поддержка PDFTextStream для встраиваемых отображений символов.
- Расчет пробелов между словами был зафиксирован должным образом зарегистрированы для пробелами, явно, закодированной в документах PDF источником.
- Улучшена обработка PDFTextStream о композитных кодировок контента, которые ранее могли не приводит в некоторых диапазонах содержания PDF будучи 'игнорируются "во время извлечения.
- Исправлена ошибка в VisualOutputTarget где текст из одной строки будут разделены на несколько строк
- Улучшена вертикальное выравнивание текста извлекаются с помощью VisualOutputTarget
- Улучшена VisualOutputTarget производства экстрактов для устранения паразитных Пробелы между тесно прилегающих слов
Что нового в версии 2.2.5:
- Этот релиз добавляет поддержку для извлечения XFA формы данные, XML.
- Это значительно повышает производительность извлечения текста с использованием VisualOutputTarget. Поддержка PDF документов больше, чем 2 Гб.
- Исправление ошибки, когда кодировки из встроенных шрифтов Type1 ранее не применяются должным образом в некоторых обстоятельствах.
- Исправление проблемы, где новый контент в обновленных документов PDF иногда игнорируется.
- Исправление проблемы, где PDFDocEncoding кодировке закладки и метаданных не были декодирования должным образом.
- а .getDestinationName () в com.snowtide.pdf.Bookmark.
Требования
- Apache Lucene
Комментарии не найдены