PDF DocShot конвертировать изображения в PDF, а экспорт OCR привести к XML. Это в том числе сканирование изображения, обработка изображения (выберите, урожай, поворот, яркость, темнота, удалить темный край, отрицательный), установив шаблон OCR, экспорт в...