Анализ текстовых данных

Есть большой текст (до 500 страниц), описывающий связи между контрагентами (заключённые сделки за несколько лет, суммы и число сделок, имена руководителей, уплаченные налоги и т. п.).

Нужно:

  1. прочитать этот текст языком Python (текст может быть сканирован в PDF),

  2. визуализировать дерево или граф связей между контрагентами, при этом длина / толщина ветви графа отражает число контактов и общую сумму денег (её тоже желательно отразить на рисунке).

С помощью каких библиотек и команд на Python можно выполнить эти задачи? Если можно, то приведите, пожалуйста, ссылки.

Примера самого документа у меня нет, речь идёт о возможной работе в будущем.


Ответы (0 шт):