文章/答案/技术大牛

发布

社区首页 >问答首页 >OCR应用前的图像清理

问OCR应用前的图像清理
EN

Stack Overflow用户

提问于 2013-10-28 16:08:46

回答 3查看 21.1K关注 0票数 15

在过去的几个小时里，我一直在试验PyTesser，这是一个非常好的工具。关于PyTesser的准确性，我注意到了以下几点：

带有图标、图像和文本的文件-- 5-10%的准确性
只有文本的文件(图像和图标被擦除)- 50-60%的准确性
在x轴或y轴上的拉伸文件(这是最好的部分)--在x轴或y轴上拉伸文件的精度提高了10-20%。

因此，显然Pytesser不考虑字体尺寸或图像拉伸。尽管有许多关于图像处理和OCR的理论值得阅读，但是除了擦除图标和图像之外，是否有任何标准的图像清理过程需要在应用PyTesser或其他库之前完成，而不管是哪种语言？

哇，这篇文章现在已经很旧了。这几天我又开始了对OCR的研究。这一次，我抛弃了PyTesser，转而使用了ImageMagik的Tesseract引擎。直截了当地说，这就是我发现的：

1) You can increase the resolution with ImageMagic(There are a bunch of simple shell commands you can use)
2) After increasing the resolution, the accuracy went up by 80-90%.

因此，Tesseract引擎无疑是市场上最好的开源OCR引擎。这里不需要事先进行图像清理。但要注意的是，它不适用于包含大量嵌入图像的文件，而且我也想不出一种方法来训练Tesseract忽略它们。另外，图像中的文本布局和格式也有很大的不同。它能很好的处理图片和文字。希望这能帮上忙。

python

image-processing

ocr

回答 3

Stack Overflow用户

发布于 2014-01-23 18:36:19

事实证明，tesseract维基有一篇文章用我能想象到的最好的方式回答了这个问题：

关于输出“的插图指南。
提高OCR准确性的图像处理问题也可能令人感兴趣。

(初步答案，请记录在案)

我没有使用PyTesser，但是我已经在tesseract (版本：3.02.02)上做了一些实验。

如果在彩色图像上调用tesseract，则首先应用全局Otsu法对其进行二进制化，然后在二进制(黑白)图像上运行实际的字符识别。

图片来源：otsu.html

可以看出，“全球Otsu”可能并不总是产生理想的结果。

要更好地理解tesseract的“看见”是将Otsu的方法应用到您的图像中，然后查看生成的图像。

总结:提高识别率的最简单的方法是自己对图像进行二值化(很可能通过反复试验找到好的阈值)，然后将这些二值化的图像传递给tesseract。

有人很好地发布了http://fossies.org/dox/tesseract-ocr-3.02.02/，所以可以验证以前关于处理管道的声明：http://fossies.org/dox/tesseract-ocr-3.02.02/group__AdvancedAPI.html#ga09be3b61fd89f7803fe37cc420b92b30 -> http://fossies.org/dox/tesseract-ocr-3.02.02/group__AdvancedAPI.html#gaee19c9ea78a647420bbe99a447569995 -> http://fossies.org/dox/tesseract-ocr-3.02.02/classtesseract_1_1ImageThresholder.html#a8240c360cff397784e7e9f635d9ed7a3 -> http://fossies.org/dox/tesseract-ocr-3.02.02/classtesseract_1_1ImageThresholder.html#a9bbeac96aad481ce652816d8780b6e00。

票数 6

Stack Overflow用户

发布于 2014-01-23 17:56:45

不确定您的意图是否用于商业用途，但这是工作的工作，如果您执行OCR在一堆类似的图像。

http://www.fmwconcepts.com/imagemagick/textcleaner/index.php

原创

用给定的参数进行预处理后。

票数 5

Stack Overflow用户

发布于 2014-01-20 20:47:16

我知道这不是一个完美的答案。但我想和大家分享一段我从2013年PyCon上看到的可能适用的视频。它有点缺乏实现细节，但可能会对您如何解决/改进问题提供一些指导/启发。

链接到视频

链接到演示文稿

如果你真的决定使用ImageMagick对你的源图像进行预处理的话。这里是一个问题，它为您提供了很好的python绑定。

旁白。对于Tesseract来说是很重要的事情。你需要训练它，否则它就不会像它所能达到的那样好/准确。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19639703

复制

相似问题

问OCR应用前的图像清理
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问OCR应用前的图像清理EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问OCR应用前的图像清理
EN