Как сделать так, чтобы текст, распознанный через tesseract сохранить в pdf с текстовым слоем

Автор вопроса: Алексей

Есть файл pdf, содержащий графическое изображение с текстом. Необходимо распознать этот текст и сохранить результат в виде такого-же pdf, но с добавление на него текстового слоя, чтобы можно было осуществлять текстовый поиск по документу.

Кто нибудь решал подобную задачу? Как решали? Понятное дело, что есть ABBYY за деньги, но интересуют open-source инструменты.

Источник

БЛОГ НА HUSL

Как сделать так, чтобы текст, распознанный через tesseract сохранить в pdf с текстовым слоем

Ответы (0 шт):