PdfMasher является инструментом для преобразования PDF-файлы, содержащие текст, готовых к книгу файлов HTML. Большинство читателей электронных книг поддерживают PDF файлы изначально, но это часто реальная боль, чтобы прочитать эти документы, потому что мы не имеем возможности управления шрифтами размер над документом, как у нас с носителями книг. Во многих случаях, мы должны использовать функцию масштабирования в, и это просто боль. Другим недостатком PDF-файлов на книгу читателям, что аннотации не поддерживается.
Есть уже инструменты для преобразования PDF-файлов в электронные книги, как Calibre, но то, что они делают то, что они пытаются угадать, роль каждой части текста в формате PDF (и это если повезет). Я думаю, что во всем, кроме простейших случаев, это ошибка думать, что что-то не хватает ИИ может сделать такую гадать.
Введите PdfMasher. PdfMasher спрашивает пользователя о роли каждой части текста, и делает это в эффективной манере. Ваш PDF имеет заголовок на каждой странице, и вы не хотите их помета текст? Сортировать текстовые элементы по Y-позиции (таким образом, группируя их всех вместе), сдвиг выбрать элементы и флаг их игнорировать. Они не появятся на вашем окончательном HTML. Ваш PDF имеет сноски на многих страницах? Сортировать ваши элементы по текстовым содержанием (таким образом, группировка все элементы с текстом, начиная с числа вместе) и флаг их как сноски. Они будут перемещены в конец документа, а PdfMasher попытается создать гиперссылки на сноски
Что нового В этом выпуске:.
Убрано окно fairware (Подробнее).
Комментарии не найдены