Как убрать транслит при определении русского текста?
Всех приветствую, прошу помощи. Пишу чтение текста с фото при помощи pytesseract. Почему то русский текст выводит транслитом, не могу понять как настроить вывод на русском
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = 'C:\\Tesseract\\tesseract.exe'
img = cv2.imread('p.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
config = r'--oem 3 --psm 6'
text = pytesseract.image_to_string(img, config=config)
with open('text.txt','w') as file:
file.write(text)
Ответы (1 шт):
Автор решения: MrDream
→ Ссылка
Всем спасибо, получилось
import cv2
import pytesseract
import glob #Выбор файлов по маске
pytesseract.pytesseract.tesseract_cmd = 'C:\\Tesseract\\tesseract.exe'
listPic = glob.glob('**.jpg')
listPic.sort()
text = ''
for name in listPic:
img = cv2.imread(name)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
config = r'--oem 3 --psm 6 '
text = text + name + ' \n' + pytesseract.image_to_string(img, lang='rus+eng', config=config) + ' \n'
with open('text.txt','w') as file:
file.write(text)
print('ready')