我正在使用Tesseract (一个光学识别库)构建一个iOS应用程序(拍摄一张照片并在上面运行光学字符识别),它可以很好地处理书写良好的数字和字符(使用常用字体)。
我遇到的问题是,如果我在7段显示器上尝试它,结果会非常非常糟糕。
所以我的问题是:有人知道我如何解决这个问题吗?有没有办法让Tesseract识别这些字符?
发布于 2012-05-12 05:24:23
我也很难让tesseract从LCD显示器的图像中识别数字。
我通过使用ImageMagick对图像进行预处理,将图像的副本覆盖在图像本身上,并进行了轻微的垂直移位,以填充片段之间的间隙,从而取得了一些边际成功:
$ composite -compose Multiply -geometry +0+3 foo.tif foo.tif foo2.png最后,我的得力助手是“七段光学字符识别”二进制文件:http://www.unix-ag.uni-kl.de/~auerswal/ssocr/
非常感谢作者Erik Auerswald的代码!
发布于 2012-02-20 20:49:31
我还没有尝试过OCRing 7-Segment Display,但我怀疑这个问题可能是由于字符不是相连的组件造成的。根据我的经验,Tesseract不能很好地处理断开连接的字体。
简单的侵蚀(图像预处理)可能有助于连接分段,但您必须测试它并调整内核大小,以防止过多的失真。
https://stackoverflow.com/questions/9361213
复制相似问题