как исправить кодировку в Python?
# pip install beautifulsoup4 lxml
from bs4 import BeautifulSoup
with open("blank/index.html") as file:
src = file.read()
soup = BeautifulSoup(src, "lxml")
title = soup.title
print(title)
print(title)
print(title.string)
Ответы (2 шт):
Автор решения: fancier
→ Ссылка
Для начала, вы пытаете манипулировать открытым файлом вне зоны его видимости.
Лучше открыть файл так:
src = open("blank/index.html", "r")
Далее нужно добавить метод декодирования в объявлении объекта soup
soup = BeautifulSoup(src.read().decode('utf-8'), "lxml")