我想认出这样的图像:
我使用以下配置:
config="--psm 6 --oem 3 -c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ,."
但是,当我试图转换它时,我得到以下信息:
1581 1 W
我认为图像非常清楚地显示了所写的内容,并且认为pytesseract有一个问题。你能帮上忙吗?
发布于 2021-09-20 16:15:15
在执行OCR之前,对图像进行预处理以获得二进制图像似乎是可行的。您还可以尝试调整图像的大小,以便看到更多的细节。
结果
158.1
1
IT
import cv2
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# Grayscale and Otsu's threshold
image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
# Perform text extraction
data = pytesseract.image_to_string(thresh, lang='eng', config='--psm 6')
print(data)
cv2.imshow('thresh', thresh)
cv2.waitKey()
https://stackoverflow.com/questions/69256402
复制相似问题