Python Парсинг. Проблема в выводе
Недавно начал изучать парсинг сайтов, и возникли некоторое проблемы. Посмотрите, пожалуйста, на скрин и скажите, почему в выводе кода нет текста, например цены, когда на прошлой странице было тоже самое, но работало.
Ответы (1 шт):
Автор решения: Сергей Ш
→ Ссылка
import requests
import json
# скачиваем HTML сайта
res = requests.get('https://scrapingclub.com/exercise/detail_json/')
txt = res.text
# ищем 'var obj = ' и вырезаем до 'var obj = ' включительно
txt = txt[txt.find('var obj = ')+10:]
# ищем '}' и вырезаем лишнее и подгоняем по JSON формат (replace('" + "', ''))
jsn = txt[:txt.find('}')+1].replace('" + "', '')
# Json в словарь
jsn = json.loads(jsn)
print(type(jsn))
print(jsn)
вывод
<class 'dict'>
{'title': 'Short Sweatshirt', 'price': '$24.99', 'description': 'Short sweatshirt with long sleeves and ribbing at neckline, cuffs, and hem
. 57% cotton, 43% polyester. Machine wash cold.', 'img_path': '/static/img/96230-C.jpg'}
