文章/答案/技术大牛

发布

社区首页 >问答首页 >使用计算机视觉应用程序按空格将图像中的表拆分为行

问使用计算机视觉应用程序按空格将图像中的表拆分为行
EN

Stack Overflow用户

提问于 2016-05-05 03:18:55

回答 1查看 583关注 0票数 0

我正在努力解决我意识到的一个相当困难的问题，因为我在这个问题上缺乏专业知识。假设我有一个表的图像，其中有3行5列。每一行都包含文本(假设现在只有英文)或数字(普通的印度-阿拉伯数字)。列之间和每行之间只有空格。现在假设所有行和所有列都是对齐的，我的任务将是获得一个算法来识别并从文档中提取出每一行(不知道我是否表达得足够好)。

有没有人能建议一个好的起点(图书馆，类似的例子，处理类似事情的教科书章节)等等。让我开始吧。

我的背景是数据科学，但我从来没有接触过计算机视觉。

任何帮助都将不胜感激。

python

image-processing

graphics

computer-vision

ocr

回答 1

Stack Overflow用户

发布于 2016-05-06 04:10:37

你应该像Racialz建议的那样，从OpenCV开始。此工具包含一个Hough lines/Hough transform方法，它应该是您从表节中查找和裁剪文本的主要且最简单的方法。有许多不同的任务可以用来查找人们使用这种算法(如THIS或THIS)的行，但是使用您的任务会容易得多，因为行应该更清晰和简单，而不是在这些示例中。完成提取后，您将需要扫描您的文本，为此，我建议您使用tesseract ocr引擎。这个引擎是免费的，真的很容易使用，它提供了相当不错的结果，并允许您训练它扫描特定类型的字母。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/37036235

复制

相似问题

问使用计算机视觉应用程序按空格将图像中的表拆分为行
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用计算机视觉应用程序按空格将图像中的表拆分为行EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用计算机视觉应用程序按空格将图像中的表拆分为行
EN