我得到了this picture (预处理图像),我想要从中提取每一行的数值。我正在使用pytesseract,但它没有显示此图像的任何结果。我已经尝试了其他问题的几个配置选项,比如"--psm 13 --oem 3"
或白名单数字,但都没有结果。因此,我通常只得到一两个字符或~5个点/破折号,但没有任何东西,甚至与我输入的大小相似。
我希望有人能帮我提前为你的时间干杯。
pytesseract版本: 0.3.8 tesseract版本: 5.0.0-alpha.20210506
发布于 2021-11-18 19:35:20
你必须考虑使用--psm 4
,它更适合你的形象。我还建议重新考虑图像预处理。Tesseract并不完美,它需要良好的图像作为输入才能正常工作。
import cv2 as cv
import pytesseract as tsr
img = cv.imread('41DAx.jpg')
img = cv.cvtColor(img, cv.COLOR_BGR2RGB)
config = '--psm 4 -c tessedit_char_whitelist=0123456789,'
text = tsr.image_to_string(img, config=config)
print(text)
上面的代码不能很好地检测图像中的所有数字,但几乎检测到了它们。也许通过一些图像预处理,你可以达到你的目标。
https://stackoverflow.com/questions/69964853
复制相似问题