首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在Tesseract和OpenCV之间进行选择?

如何在Tesseract和OpenCV之间进行选择?
EN

Stack Overflow用户
提问于 2012-07-15 14:07:23
回答 4查看 64.7K关注 0票数 96

我最近遇到了TesseractOpenCV。看起来Tesseract是一个成熟的光学字符识别引擎,OpenCV可以作为一个框架来创建光学字符识别应用程序/服务。

我试着在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的关于使用OpenCV通过Python执行OCR的tutorial,这给我留下了深刻的印象。在几分钟内,我完成了系统的训练,它的准确性很好。当然,采用这种方法意味着我需要使用大量的训练集来广泛地训练我的系统。

我的具体问题如下:

  • 如何在Tesseract和使用OpenCV构建自定义光学字符识别应用程序之间进行选择?
  • 有针对不同语言的Tesseract的训练数据集。OpenCV有没有类似的东西,这样我就不需要从头开始实现光学字符识别了?
  • 对于想要成为商业应用程序的人来说,哪一个更好?

有什么建议吗?

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2012-07-15 14:12:48

  • Tesseract是一种光学字符识别引擎。
  • OpenCV是一个计算机视觉库,它是一个计算机视觉库,可以让你进行一些特征提取和数据分类。您可以创建一个简单的字母分割器和分类器来执行基本的OCR,但它不是一个非常好的OCR引擎(我以前用Python从头做过一个。对于偏离训练数据的输入,这真的是不准确的)。

如果你想对光学字符识别有多难有个基本的了解,可以试试OpenCV。Tesseract是用于真正的OCR的。

票数 81
EN

Stack Overflow用户

发布于 2012-07-15 14:21:17

我是你提到的那个数字识别教程的作者,我想说的是,这是无法替代的。

OpenSource是一个非常好的光学字符识别引擎,可能是最好的Tesseract光学字符识别引擎。

你提到的教程只是一个尝试,以了解OCR的最简单的工作原理。

因此,如果你正在寻找光学字符识别应用程序,我建议你使用OpenCV对图像进行预处理,然后应用tesseract引擎。

票数 66
EN

Stack Overflow用户

发布于 2014-11-13 09:50:15

这两者可以是互补的。如果你在OpenCV上阅读了这篇论文:https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf

它强调,“由于惠普有独立开发的页面布局分析技术,用于产品中(因此没有开放源代码),Tesseract从来不需要自己的页面布局分析。因此,Tesseract假设它的输入是一个定义了可选多边形文本区域的二进制图像。”

这种类型的任务可以由OpenCV执行,并将生成的图像传递给Tesseract。您可以在Git代码库中找到此类代码的示例:https://github.com/Itseez/opencv_contrib/tree/master/modules/text/samples这些示例使用Tesseract API进行图像到文本的转换。

票数 10
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11489824

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档