Как достать часть текста с разворота скана паспорта?
Доброго времени суток!
Подскажите пожалуйста, в какую сторону начать думать, что бы достать ФИО со скана или фота паспорта? Я не прошу готовый код, просто не могу понять, с чего лучше начать и где порыться на эту тему. Пробовал сделать с помощью PyTessaract и OpenCV. После решения этой задачи надо будет обучить модель, распознавать нужную часть изображения и доставать эти данные.
И еще хочу спросить для специалиста какого уровня эта задача? Мне это пришло как тестовое на стажера.
P.S.: еще, по условию ТЗ, нельзя пользоваться готовыми библиотеками OCR.