С помощью beautifulsoup извлечь ИНН и КПП по отдельности

Как с помощью beautifulsoup лучше (правильнее) извлечь ИНН и КПП в данном случае? По отдельности.

Как с помощью beautifulsoup лучше (правильнее) извлечь ИНН и КПП в данном случае? По отдельности.


Ответы (1 шт):

Автор решения: Сергей Ш
from bs4 import BeautifulSoup

txt = '''<p> == $0
<b>инн </b>
5001067335
<b>КПП </b>
500101001
<span class="text--bold">Регион: </span>
<a target="_blank" href="/poisk/region/moskovskaya-oblast/">Московская область</a>
</p>'''
soup = BeautifulSoup(txt, 'lxml')
_, inn, _, kpp = [x for x in soup.stripped_strings][1:-2]
print(inn, kpp)

5001067335 500101001
→ Ссылка