文章/答案/技术大牛

发布

社区首页 >问答首页 >从图像中提取线条以馈送到OCR - Tesseract

问从图像中提取线条以馈送到OCR - Tesseract
EN

Stack Overflow用户

提问于 2013-03-28 23:42:17

回答 3查看 8.5K关注 0票数 5

我在15:33左右观看了pycon http://youtu.be/B1d9dpqBDVA?t=15m34s的演讲，演讲者谈到了从图像(收据)中提取线条，然后将其提供给OCR引擎，以便以更好的方式提取文本。

我也有类似的需求，我需要将图像传递给OCR引擎。然而，我不太明白他从图像中提取线条是什么意思。我可以使用哪些开源工具从图像中提取线条？

opencv

image-processing

tesseract

回答 3

Stack Overflow用户

发布于 2013-03-29 12:24:08

看看用来对文本进行detect the skew angle的技术。

组是用于隔离图像上的文本的线条(这是有趣的部分)。

根据这个结果，您可以轻松地检测文本的每一行的上限/下限。文本本身将位于它们内部。我以前遇到过类似的问题，the code可能对您有用：

从这里你需要做的就是裁剪每一对线，并将其作为图像提供给Tesseract。

票数 5

Stack Overflow用户

发布于 2013-03-28 23:46:36

我可以告诉你一个简单的技术来将图像输入到OCR。只需要做一些操作，得到你的图像的ROI (感兴趣区域)，并在二值化后定位图像所在的区域。然后，您可以找到轮廓，通过保持阈值，并设置所需的轮廓区域，您可以将生成的图像馈送到OCR :)。(很抱歉解释得不好)

票数 0

Stack Overflow用户

发布于 2013-03-29 16:31:45

直接回答:您可以使用Hough变换从图像中提取线条。您可以找到分析指南here。也可以检测文本行。卡尔菲利普的答案也是基于霍夫变换的。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/15686149

复制

相似问题

问从图像中提取线条以馈送到OCR - Tesseract
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从图像中提取线条以馈送到OCR - TesseractEN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从图像中提取线条以馈送到OCR - Tesseract
EN