поиск пдф для создания

у меня есть код, который выполняет считывание текста из пдф файлов


Ответы (1 шт):

Автор решения: Сергей Кох
  1. Вам надо составить список из файлов pdf, которые находяться в папке и пройтись по нему в цикле. Аналогия - Парсер всех XML файлов в папке
  2. В каждом цикле создавайте новую папку с именем, используя или имя файла или номера 1, 2,... и сохраняйте результат в ней. os.mkdir(name)
  3. Мне кажется надо разбить ваше сплошное полотно на отдельные функции - выделение картинок, таблиц, текста, так будет потом легче что-то подстраивать или подправлять.
→ Ссылка