Взять весь текст с английскими буквами с сайта
На входе я получаю ссылку на сайт, и нужно вывести всю текстовую часть сайта которая написана на английском. Проблема в том, что не зная сайта и структуры можно по общим запросам к тегами с помощью супа взять лишнего. Как лучше всего взять больше текста что бы не фильтровать его потом (цифры, специальные символы и тд удалять)