你好,我正在尝试使用OCR tesseract来识别图像中的一些字母。
我用imagemagick做了一个转换,图像看起来不错,但还不够
原始图像:
与imagemagick一起使用的命令
convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg
结果图像:
OCR tesseract命令:
$ tesseract output.jpg out -psm 7
输出/结果:
文本: AUGU -> AUOU
Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页
文本: VEGU -> VOR-OU
Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页
文本: EGUV -> E6UV
Tesseract开源OCR引擎v4.00.00alpha,含Leptonica第1页
文本: USEA -> USSOEA
发布于 2017-07-05 17:33:37
我不确定这是否是纯粹的运气,因为你只提供了一张图片来测试,但我注意到你使用的是嘈杂/模糊的JPEG,而不是漂亮干净的PNG,所以我将你的图片阈值设置为50%,并制作了PNG,它正确地识别了所有四个字母:
convert yourImage.jpeg -threshold 50% clean.png
tesseract -psm 7 clean.png out
https://stackoverflow.com/questions/44916266
复制相似问题