символ u200b, что это такое?
Имеется ексель файлик, с которого дергаю столбец, и заношу в массив, если запринтить массив целиком, появляются символы /u200b, если же выводить каждый элемент отдельно, этого символа нет.
import xlwings as xw
import pandas as pd
import re
wb = xw.Book('new.xlsx')
data_excel = wb.sheets['Details']
# data_pd = data_excel.range("D1").expand().value
data = data_excel.range('D1').expand().options(pd.DataFrame, header = 1, index = False).value #
rewrite = data['Обнаруженный объект'].values
Threats = []
newThreats = []
for i in rewrite:
if i not in Threats:
Threats.append(i)
for k in Threats:
k.replace('u200b','')
print(k)
newThreats.append(k)
print(newThreats)
Ответы (1 шт):
Автор решения: LevAri
→ Ссылка
Похоже на проблемы кодировки в исходном файле. Данный символ в Unicode означает некий хитрый пробел - подробнее тут
Можно попробовать следующее:
- сконвертировать excel в csv и читать csv
- проверить кодировку исходного файла
