Как сохранить html теги при записи xml
Не получается сохранить html теги из начального xml файла после обработки скриптом Python.
Начальный файл
В конце получаю:
Выяснил, что это из-за проблем с кодировкой. В скрипте все обрабатывается в utf-8. Как мне сохранить кириллицу без потери html тегов?
Код:
import xml.etree.ElementTree as ET
import re
parser = ET.XMLParser(encoding=None)
et = ET.parse('xml.xml', parser = parser)
root = et.getroot()
for a in root.findall('Ad'):
title = a.find('Title').text
description = a.find('Description').text
car = re.search('>(.+?)<', description)#название машины из описания
title2 = title + ' '+ car.group(1) #вставил машину в заголовок
a.find('Title').text = str(title2) #обновил заголовок
et.write('xml1.xml', encoding='utf-8')

