首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >使用计算机视觉应用程序按空格将图像中的表拆分为行

使用计算机视觉应用程序按空格将图像中的表拆分为行
EN

Stack Overflow用户
提问于 2016-05-05 03:18:55
回答 1查看 583关注 0票数 0

我正在努力解决我意识到的一个相当困难的问题,因为我在这个问题上缺乏专业知识。假设我有一个表的图像,其中有3行5列。每一行都包含文本(假设现在只有英文)或数字(普通的印度-阿拉伯数字)。列之间和每行之间只有空格。现在假设所有行和所有列都是对齐的,我的任务将是获得一个算法来识别并从文档中提取出每一行(不知道我是否表达得足够好)。

有没有人能建议一个好的起点(图书馆,类似的例子,处理类似事情的教科书章节)等等。让我开始吧。

我的背景是数据科学,但我从来没有接触过计算机视觉。

任何帮助都将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2016-05-06 04:10:37

你应该像Racialz建议的那样,从OpenCV开始。此工具包含一个Hough lines/Hough transform方法,它应该是您从表节中查找和裁剪文本的主要且最简单的方法。有许多不同的任务可以用来查找人们使用这种算法(如THISTHIS)的行,但是使用您的任务会容易得多,因为行应该更清晰和简单,而不是在这些示例中。完成提取后,您将需要扫描您的文本,为此,我建议您使用tesseract ocr引擎。这个引擎是免费的,真的很容易使用,它提供了相当不错的结果,并允许您训练它扫描特定类型的字母。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37036235

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档