问使用Tesseract检测黑色背景上的白色字符
EN

Stack Overflow用户

提问于 2016-08-18 01:32:23

回答 1查看 10.9K关注 0票数 11

我对Tesseract OCR完全陌生。这个问题可能很简单，但我似乎无法用谷歌找到答案。

基本上，我有一个包含两部分的图像:第一部分，在图像的顶部，具有黑色背景，文本为白色；第二部分，位于图像的底部，具有白色背景，文本为黑色。

我在图像上运行了tesseract，它正确地识别了底部的所有字符，但没有识别顶部的字符。我确信顶部的字符非常清晰，应该很容易被Tesseract识别。唯一的区别是它的背景是黑色的。

有没有办法使用Tesseract同时识别黑白背景下的文本？

tesseract

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-09-04 01:48:35

T.Kasar，J.Kumar和A.G.Ramakrishnan的一篇论文描述了这个问题的一种解决方案：“字体和背景颜色无关的文本二值化”。论文可以在here上找到。有一个由Jason Funk实现的算法。他的实现可以在here上找到。我在这个算法上取得了一些成功。我认为这种类型的解决方案就是您正在寻找的。

您可能还会发现，回顾这个最近提出的关于背景删除(OpenCV for OCR: How to compute thresholding levels for gray image OCR)的问题及其答案会很有帮助。您可以通过背景颜色分离感兴趣的区域，然后将每个区域交给tesseract进行处理。或者，在二值化后，您可以反转图像黑色背景部分中的8x8像素区域(如上所述)(或反之)，以创建统一的背景。

最后，通过搜索车牌识别问题(或车牌)的解决方案，您可能会找到一些有用的信息。许多车牌(车牌)都有可能干扰识别的背景图像或照明伪影。更普遍的问题是背景去除。

票数 11

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/39002966

复制

相似问题

问使用Tesseract检测黑色背景上的白色字符
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Tesseract检测黑色背景上的白色字符EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Tesseract检测黑色背景上的白色字符
EN