Loading [MathJax]/jax/input/TeX/config.js
社区首页 >问答首页 >使用计算机视觉应用程序按空格将图像中的表拆分为行

使用计算机视觉应用程序按空格将图像中的表拆分为行
EN

Stack Overflow用户
提问于 2016-05-04 19:18:55
回答 1查看 583关注 0票数 0

我正在努力解决我意识到的一个相当困难的问题,因为我在这个问题上缺乏专业知识。假设我有一个表的图像,其中有3行5列。每一行都包含文本(假设现在只有英文)或数字(普通的印度-阿拉伯数字)。列之间和每行之间只有空格。现在假设所有行和所有列都是对齐的,我的任务将是获得一个算法来识别并从文档中提取出每一行(不知道我是否表达得足够好)。

有没有人能建议一个好的起点(图书馆,类似的例子,处理类似事情的教科书章节)等等。让我开始吧。

我的背景是数据科学,但我从来没有接触过计算机视觉。

任何帮助都将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2016-05-05 20:10:37

你应该像Racialz建议的那样,从OpenCV开始。此工具包含一个Hough lines/Hough transform方法,它应该是您从表节中查找和裁剪文本的主要且最简单的方法。有许多不同的任务可以用来查找人们使用这种算法(如THISTHIS)的行,但是使用您的任务会容易得多,因为行应该更清晰和简单,而不是在这些示例中。完成提取后,您将需要扫描您的文本,为此,我建议您使用tesseract ocr引擎。这个引擎是免费的,真的很容易使用,它提供了相当不错的结果,并允许您训练它扫描特定类型的字母。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37036235

复制
相关文章
浅谈计算机视觉中的图像标注
计算机视觉被认为是机器学习和人工智能发展的重要领域之一。简而言之,计算机视觉是人工智能研究领域,致力于赋予计算机看世界和视觉解释世界的能力。
程序你好
2020/12/31
3.5K0
浅谈计算机视觉中的图像标注
计算机视觉|图像中的信息识别
在生活中,很多时候需要识别一些图片中的数字和字母,就像很多网站的验证码识别,对于个人来说,单个的此类事件需要的时间和精力很少,可对于一些机构、企业来说,可能就需要重复很多次(例如某些机构需要向某网站提交多次文档、申请多次访问等操作)。这时,大量的此类工作对于人眼的损耗较大,不但需要损耗人力,同时由于眼花和疲劳等原因可能会导致读取出来的信息出现差错,从而降低效率。所以,就需要使用电脑来执行这一操作。
算法与编程之美
2019/10/31
6770
VBA将一行数据分为多行
有个表格,有许多单元格的数据,制作者为了方便,很多数据是写在一行的,类似下面这种:
xyj
2020/07/28
4.6K2
VBA将一行数据分为多行
将一个工作表拆分为多个工作表
最近已经不止一次被人问到:怎么将一个工作表拆分为多个工作表?一般这样的需求,是因为将1-12月的数据写在了一个工作表上,而现在又想将它拆分为12个单独的工作表,每个工作表单独一个月份.总结了一下,文艺
但老师
2022/03/22
4.4K0
将一个工作表拆分为多个工作表
计算机视觉|图像处理
现在开始小孩更新计算机视觉相关的知识,本来公众号的名字叫电脑小孩,但是好久没更新计算机相关的内容,大家一定不明觉厉。
卷福同学
2023/04/28
2410
计算机视觉|图像处理
计算机视觉101:使用Python处理彩色图像
每个计算机视觉项目(无论是猫/狗分类器还是为旧图像/电影添加颜色)都涉及处理图像。最后,模型只能与基础数据一样好- 垃圾回收。这就是为什么在这篇文章中,着重于解释在Python中使用彩色图像的基本知识,它们的表示方式以及如何将图像从一种颜色表示转换为另一种颜色表示。
代码医生工作室
2020/03/27
2.2K0
计算机视觉︱图像取证技术
上图左为原始图片,比如是小明家后院的军车。现在小明想把图片发到朋友圈稍稍显摆下,但是又不想太暴露,所以他用PhotoShop把图片中一辆车用一大片树叶遮盖住了。本以为这样就可以把敏感内容掩藏,何曾想这样会引入新的痕迹—两片完全相同的叶子(上图右红圈所示)。莱布尼茨他老人家看到“世界上有两片完全相同的树叶”不知会不会醒来。
悟乙己
2019/05/26
1.4K0
使用VPI 1.1加速计算机视觉和图像处理
VPI是VISION PROGRAMING INTERFACE的缩写,即视觉编程接口,是NVIDIA 用于高性能计算机视觉处理的下一代 API
GPUS Lady
2021/09/02
1.3K0
使用VPI 1.1加速计算机视觉和图像处理
使用VPI 1.1加速计算机视觉和图像处理
VPI是VISION PROGRAMING INTERFACE的缩写,即视觉编程接口,是NVIDIA 用于高性能计算机视觉处理的下一代 API
GPUS Lady
2021/09/22
1.1K0
10行Python代码,实现计算机视觉中目标检测
from imageai.Detection import ObjectDetection import os
用户6133654
2019/08/29
5960
计算机视觉|视频图像的预处理
在分析图像问题时,由于环境和拍摄自身因素影响,使得在需要处的图像存在一定的问题,同时由于操作的要求,需要对图像进行一定的转换,所以,在处理图像之前,要对图像做出预处理,方便后期操作。
算法与编程之美
2019/11/07
1.6K0
计算机视觉|视频图像的预处理
计算机视觉任务:图像梯度和图像完成
该笔记是以斯坦福cs231n课程的python编程任务为主线,展开对该课程主要内容的理解和部分数学推导。这篇文章是关于计算机视觉处理的,分为两篇文章撰写完成。此为第二篇:根据上篇文章提到,利用深度学习
用户1332428
2018/03/08
1.8K0
计算机视觉任务:图像梯度和图像完成
【计算机视觉】OpenCV图像处理基础
OpenCV是目前最流行的计算机视觉处理库之一,受到了计算机视觉领域众多研究人员的喜爱。计算机视觉是一门研究如何让机器“看”的科学,即用计算机来模拟人的视觉机理,用摄像头代替人眼对目标进行识别、跟踪和测量等,通过处理视觉信息获得更深层次的信息。例如,通过拍摄环绕建筑物一周的视频,利用三维重建技术重建建筑物三维模型;通过放置在车辆上方的摄像头拍摄前方场景,推断车辆能否顺利通过前方区域等决策信息。对于人类来说,通过视觉获取环境信息是一件非常容易的事情,因此有人会误认为实现计算机视觉是一件非常容易的事情。但事实不是这样的,因为计算机视觉是一个逆问题,通过观测到的信息恢复被观测物体或环境的信息,在这个过程中会缺失部分信息,造成信息不足,增加问题的复杂性。例如,当通过单个摄像头拍摄场景时,因为失去了距离信息,所以常会出现图像中“人比楼房高”的现象。因此,计算机视觉领域的研究还有很长的路要走。
蒙娜丽宁
2023/03/08
2.2K0
【计算机视觉】OpenCV图像处理基础
计算机视觉方向简介 | 图像拼接
作者戴金艳,公众号:计算机视觉life, 编辑部成员.首发原文链接计算机视觉方向简介 | 图像拼接
用户1150922
2019/08/01
1.4K0
计算机视觉中的Transformer
将Transformer应用到CV任务中现在越来越多了,这里整理了一些相关的进展给大家。
小白学视觉
2021/01/20
1.2K0
计算机视觉中的滤波
这两种分类方式并不是割裂的,而是互相交叉的,用于图像处理的滤波器也有线性、非线性、自适应之分。
李拜六不开鑫
2020/02/16
1.1K0
基于计算机视觉的棋盘图像识别
我们利用计算机视觉技术和卷积神经网络(CNN)为这个项目创建分类算法,并确定棋子在棋盘上的位置。最终的应用程序会保存整个图像并可视化的表现出来,同时输出棋盘的2D图像以查看结果。
小白学视觉
2021/01/06
1.2K0
基于计算机视觉的棋盘图像识别
基于计算机视觉的棋盘图像识别
我们利用计算机视觉技术和卷积神经网络(CNN)为这个项目创建分类算法,并确定棋子在棋盘上的位置。最终的应用程序会保存整个图像并可视化的表现出来,同时输出棋盘的2D图像以查看结果。
AI算法与图像处理
2021/01/05
7110
计算机视觉中的Transformer
将Transformer应用到CV任务中现在越来越多了,这里整理了一些相关的进展给大家。
CV君
2021/01/25
8960
计算机视觉中的Transformer
点击加载更多

相似问题

图像拆分为表:删除行之间的空格

00

在python中使用多个空格时拆行

218

计算机视觉将字符与图像分离

11

将行拆分为列表,检测Python中的空格

66

将文件中的行拆分为变量(接受空格)

11
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文