Анализ текстовых данных
Есть большой текст (до 500 страниц), описывающий связи между контрагентами (заключённые сделки за несколько лет, суммы и число сделок, имена руководителей, уплаченные налоги и т. п.).
Нужно:
прочитать этот текст языком Python (текст может быть сканирован в PDF),
визуализировать дерево или граф связей между контрагентами, при этом длина / толщина ветви графа отражает число контактов и общую сумму денег (её тоже желательно отразить на рисунке).
С помощью каких библиотек и команд на Python можно выполнить эти задачи? Если можно, то приведите, пожалуйста, ссылки.
Примера самого документа у меня нет, речь идёт о возможной работе в будущем.