首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Tesseract-OCR (3.02)识别精度和速度

Tesseract-OCR (3.02)识别精度和速度
EN

Stack Overflow用户
提问于 2016-07-02 05:49:16
回答 1查看 2.4K关注 0票数 6

我有一组非常小的图片(w:70-100;h:12-20),如下所示:

在这些图片中,除了组成员的昵称外,什么都没有。我想从简单的图片中阅读课文,它们都有一个背景,只是昵称不同。所以,我对这张照片所做的是:

我正在使用下面的代码从第二个图像中获取文本:

代码语言:javascript
运行
复制
tesseract::TessBaseAPI ocr;
ocr.Init(NULL, "eng");
PIX* pix = pixRead("D:\\image.png");
ocr.SetImage(pix);
std::string result = ocr.GetUTF8Text();

我有两个问题:

  1. ocr.GetUTF8Text();运行缓慢:650-750毫秒。图像很小,为什么它能工作这么久?
  2. 从上面的图像中,我得到了这样的结果:“我会杀人”,“我会杀死你”等等。这个图像很简单,我相信专家能够百分之百地识别它。

如何处理图像/代码,或者如何阅读(以及在何处)阅读tesseract-ocr (关于文本速度和质量识别的内容)来解决这些问题?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-07-02 06:25:43

这听起来可能很奇怪,但当我增加图像的尺寸时,我总是有最好的运气。这张照片在我看来会“更糟”,但它的速度更快,精确度也更高。

然而,在你开始获得更糟糕的结果之前,你能拍出多大的图像是有限度的:)我记得我以前拍过600 in的照片。不过,你还是得玩了。

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38156961

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档