我最近遇到了Tesseract和OpenCV。看起来Tesseract是一个成熟的光学字符识别引擎,OpenCV可以作为一个框架来创建光学字符识别应用程序/服务。
我试着在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的关于使用OpenCV通过Python执行OCR的tutorial,这给我留下了深刻的印象。在几分钟内,我完成了系统的训练,它的准确性很好。当然,采用这种方法意味着我需要使用大量的训练集来广泛地训练我的系统。
我的具体问题如下:
有什么建议吗?
发布于 2012-07-15 14:12:48
如果你想对光学字符识别有多难有个基本的了解,可以试试OpenCV。Tesseract是用于真正的OCR的。
发布于 2012-07-15 14:21:17
我是你提到的那个数字识别教程的作者,我想说的是,这是无法替代的。
OpenSource是一个非常好的光学字符识别引擎,可能是最好的Tesseract光学字符识别引擎。
你提到的教程只是一个尝试,以了解OCR的最简单的工作原理。
因此,如果你正在寻找光学字符识别应用程序,我建议你使用OpenCV对图像进行预处理,然后应用tesseract引擎。
发布于 2014-11-13 09:50:15
这两者可以是互补的。如果你在OpenCV上阅读了这篇论文:https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
它强调,“由于惠普有独立开发的页面布局分析技术,用于产品中(因此没有开放源代码),Tesseract从来不需要自己的页面布局分析。因此,Tesseract假设它的输入是一个定义了可选多边形文本区域的二进制图像。”
这种类型的任务可以由OpenCV执行,并将生成的图像传递给Tesseract。您可以在Git代码库中找到此类代码的示例:https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples这些示例使用Tesseract API进行图像到文本的转换。
https://stackoverflow.com/questions/11489824
复制相似问题