首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python Tesseract无法识别我图像中的数字

Python Tesseract无法识别我图像中的数字
EN

Stack Overflow用户
提问于 2021-11-14 16:11:47
回答 1查看 49关注 0票数 0

我得到了this picture (预处理图像),我想要从中提取每一行的数值。我正在使用pytesseract,但它没有显示此图像的任何结果。我已经尝试了其他问题的几个配置选项,比如"--psm 13 --oem 3"或白名单数字,但都没有结果。因此,我通常只得到一两个字符或~5个点/破折号,但没有任何东西,甚至与我输入的大小相似。

我希望有人能帮我提前为你的时间干杯。

pytesseract版本: 0.3.8 tesseract版本: 5.0.0-alpha.20210506

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-11-18 19:35:20

你必须考虑使用--psm 4,它更适合你的形象。我还建议重新考虑图像预处理。Tesseract并不完美,它需要良好的图像作为输入才能正常工作。

代码语言:javascript
复制
import cv2 as cv
import pytesseract as tsr

img = cv.imread('41DAx.jpg')
img = cv.cvtColor(img, cv.COLOR_BGR2RGB)


config = '--psm 4 -c tessedit_char_whitelist=0123456789,'
text = tsr.image_to_string(img, config=config)
print(text)

上面的代码不能很好地检测图像中的所有数字,但几乎检测到了它们。也许通过一些图像预处理,你可以达到你的目标。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69964853

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档