我已经读过this问题的答案了。
我有一系列的图像,其中包含一个字之间的3-10个字符.它们是在计算机上生成的图像,因此图像的质量是一致的,图像上没有任何噪音。字体相当大(高度约为30像素)。这应该已经很容易让tesseract准确地读懂了,但是我可以使用哪些技术来提高速度,即使只是提高了几毫秒呢?
字符集仅由大写字母组成。由于OCR任务在本例中是非常具体的,如果我用这种特定的字体和字体大小来训练tesseract引擎会有帮助吗?
编辑以包括样本
除了tesseract之外,我还可以使用C/C++提供更好的性能的其他解决方案吗?可以用OpenCV更快地完成吗?优先考虑与Linux的兼容性。
示例





发布于 2014-01-03 16:20:48
如果所有字母的大小和样式相同,您可以尝试一些非常简单的方法,比如运行blob检测,然后对单个字母进行模板匹配。我不知道它与相比如何,但这是一个非常简单的实验。(此外,降低分辨率会加快速度.)你也可以看看这个问题:Simple Digit Recognition OCR in OpenCV-Python,它可能是相关的
https://stackoverflow.com/questions/20898398
复制相似问题