首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Tesseract带有文本识别的简单图像,想要转换/转换图像的帮助

Tesseract带有文本识别的简单图像,想要转换/转换图像的帮助
EN

Stack Overflow用户
提问于 2017-07-05 10:43:45
回答 1查看 1.8K关注 0票数 1

你好,我正在尝试使用OCR tesseract来识别图像中的一些字母。

我用imagemagick做了一个转换,图像看起来不错,但还不够

原始图像:

与imagemagick一起使用的命令

代码语言:javascript
运行
复制
convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg

结果图像:

OCR tesseract命令:

代码语言:javascript
运行
复制
$ tesseract output.jpg out -psm 7

输出/结果:

文本: AUGU -> AUOU

Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页

文本: VEGU -> VOR-OU

Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页

文本: EGUV -> E6UV

Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页

文本: USEA -> USSOEA

EN

回答 1

Stack Overflow用户

发布于 2017-07-05 17:33:37

我不确定这是否是纯粹的运气,因为你只提供了一张图片来测试,但我注意到你使用的是嘈杂/模糊的JPEG,而不是漂亮干净的PNG,所以我将你的图片阈值设置为50%,并制作了PNG,它正确地识别了所有四个字母:

代码语言:javascript
运行
复制
convert yourImage.jpeg -threshold 50% clean.png
tesseract -psm 7 clean.png out
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44916266

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档