символ u200b, что это такое?

Имеется ексель файлик, с которого дергаю столбец, и заношу в массив, если запринтить массив целиком, появляются символы /u200b, если же выводить каждый элемент отдельно, этого символа нет.

import xlwings as xw
import pandas as pd
import re


wb = xw.Book('new.xlsx')
data_excel = wb.sheets['Details']
# data_pd = data_excel.range("D1").expand().value

data = data_excel.range('D1').expand().options(pd.DataFrame, header = 1, index = False).value # 



rewrite = data['Обнаруженный объект'].values


Threats = []
newThreats = []

for i in rewrite: 
    if i not in Threats:
        Threats.append(i)

for k in Threats:
    k.replace('u200b','')
    print(k)
    newThreats.append(k)



print(newThreats)

вывод консоли: введите сюда описание изображения


Ответы (1 шт):

Автор решения: LevAri

Похоже на проблемы кодировки в исходном файле. Данный символ в Unicode означает некий хитрый пробел - подробнее тут

Можно попробовать следующее:

  • сконвертировать excel в csv и читать csv
  • проверить кодировку исходного файла
→ Ссылка