SILVERCODERS DocToText является открытым исходным кодом, мультиплатформенный, бесплатно и мощная утилита командной строки, что позволяет легко преобразовать один или несколько документов, в различных форматах, в виде обычного текста format.Supports многочисленные файлов опор formatsThe приложений многочисленные форматы файлов, в том числе Microsoft Word (DOC, DOCX), Microsoft Excel (XLS, XLSX, XLSB), Microsoft PowerPoint (PPT, PPTX), Rich Text Format (RTF), OpenDocument, ОАЗИС текстовые документы ODT (), MSOOXML или OpenXML , OpenOffice.org XML (OOXML), OASIS таблицы (ODS), презентации OASIS (ОРС).
Кроме того, в оазисе графика (ODG), форматы iWork (НОМЕРА, СТР, Ключ), OpenDocument форматов Плоские XML (ВССР, FODP, FODT), электронная почта файлы (EML), язык разметки гипертекста (HTML) и формате Portable Document Format (PDF ) также поддерживаются SILVERCODERS DocToText.Command линии optionsAs упомянутых, это утилита командной строки, что означает, что вы можете & Rsquo; т взаимодействовать с ним через довольно графическим пользовательским интерфейсом (GUI), но только с помощью эмулятора терминала X11. Введите & ldquo; ш doctotext.sh & Rdquo; Команда, после & Rsquo; ве извлечены двоичный архив, который соответствует вашему компьютеру и Rsquo, S аппаратную архитектуру, чтобы просмотреть его параметры командной строки.
Оттуда, пользователь может попытаться разобрать файл, который он / она пытается конвертировать в RTF, ODF, OOXML, XLS, XLSB, iWork, PPT, DOC, HTML, PDF, EML или ODFXML документов первых, исправить поврежденные файлы XML, полоса XML теги вместо разбора их, использовать определенную команду, чтобы распаковать файлы из архива, а с помощью встроенного в декомпрессионной утилиты, а также написать журналы в указанных операционных системах file.Supported и platformsSILVERCODERS DocToText был разработан от смещение в кросс-платформенной программного обеспечения, написанного на языке программирования UNIX Shell, которая означает, что он был успешно протестирован с некоторыми из самых популярных дистрибутивов GNU / Linux, а также с операционными системами Microsoft Windows и Mac OS X. Оба 64-битных и 32-битных аппаратных платформ поддерживаются в данный момент
Что нового В этом выпуске:.
- DocToText версия 0.14.0 была выпущена oficially сегодня.
- Язык разметки гипертекста (HTML) Поддержка формата была введена в этой версии.
- Добавлена возможность извлечения метаданных как автора документа, дату последнего изменения или количества страниц.
- Новая важная особенность является извлечение текста из аннотации (комментарии), встроенный в ODT, DOC, DOCX или RTF файлы. Некоторые неисправности были исправлены.
Что нового в версии 0.13.0:
- Это первая версия доступна для Mac OS X а также первая версия доступна как C / C ++ библиотеки в дополнение к консольным приложением. MS PowerPoint двоичный формат был добавлен (PPT) поддержка. Заголовки, колонтитулы и встроенные XLS книги в DOC файлов поддерживаются. Извлечение текста из OpenDocument и OOXML форматов был существенным оптимизированы. Кроме того много ошибок были зафиксированы в этой версии.
Что нового в версии 0.12.0:
- В дополнение к исправлений и оптимизаций, MS Excel двоичный формат (XLS) была добавлена поддержка в этой версии.
Что нового в версии 0.10.0:
- В дополнение к исправлений и оптимизаций, Office Open XML документы (ISO / IEC 29500, также называемый OOXML, OpenXML, или MSOOXML) поддерживаются.
Комментарии не найдены