Как получить определенные ячейки таблицы PDF в Python?

Хочу создать бота для телеги, который будет парсить с сайта колледжа PDF файлы с расписанием. Возник вопрос как найти нужные мне ячейки (всегда одинаковые, не меняются изо дня в день) с моей группой. Возможно это получится сделать путем конвертации PDF в CSV и там уже по координатам ячейки найти нужные. Но как это реализовать? Через какие библиотеки? Или может возможно делать скрин определенной области PDF файла, в которую будет попадать моя группа?


Ответы (1 шт):

Автор решения: Reims

Попробуйте это, должно помочь. Вам понадобится tabula-py, данный модуль поможет превратить PDF файлы в CSV.

→ Ссылка