Не получается определить кодировку ответа сервера
Пытаюсь спарсить данный сайт - https://footballprediction365.com/football-predictions/ Но в ответе он отдает что-то непонятное: �^]�9w��h�D���w�{�H3:mp���
Пытался использовать этот код для определения кодировки
import chardet
import urllib.request
url = 'https://footballprediction365.com/football-predictions/'
data = urllib.request.urlopen(url)
print(chardet.detect(data.read())['encoding'])
Выходит ошибка:
urllib.error.HTTPError: HTTP Error 403: Forbidden
также использовал этот сайт для декодирования - https://2cyr.com/decode/?lang=ru но все равно не получается узнать правильную кодировку
Ответы (2 шт):
Автор решения: Asuranay
→ Ссылка
Все отлично парситься.
from bs4 import BeautifulSoup
import requests
url = 'https://footballprediction365.com/football-predictions/'
page = requests.get(url)
soup = BeautifulSoup(page.text, 'lxml')
print(soup.find('p'))
ответ
<p id="site-description">Football prediction today with 1×2 betting tips, football predictions for BTTS, over/under 2.5 goals and correct score for today’s matches.</p>