Как получить определенные ячейки таблицы PDF в Python?
Хочу создать бота для телеги, который будет парсить с сайта колледжа PDF файлы с расписанием. Возник вопрос как найти нужные мне ячейки (всегда одинаковые, не меняются изо дня в день) с моей группой. Возможно это получится сделать путем конвертации PDF в CSV и там уже по координатам ячейки найти нужные. Но как это реализовать? Через какие библиотеки? Или может возможно делать скрин определенной области PDF файла, в которую будет попадать моя группа?
Ответы (1 шт):
Автор решения: Reims
→ Ссылка
Попробуйте это, должно помочь. Вам понадобится tabula-py, данный модуль поможет превратить PDF файлы в CSV.