Как сделать так, чтобы текст, распознанный через tesseract сохранить в pdf с текстовым слоем
Есть файл pdf, содержащий графическое изображение с текстом. Необходимо распознать этот текст и сохранить результат в виде такого-же pdf, но с добавление на него текстового слоя, чтобы можно было осуществлять текстовый поиск по документу.
Кто нибудь решал подобную задачу? Как решали? Понятное дело, что есть ABBYY за деньги, но интересуют open-source инструменты.