首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >linux从图像中的表中获取文本

linux从图像中的表中获取文本
EN

Stack Overflow用户
提问于 2014-09-12 17:25:35
回答 1查看 640关注 0票数 0

我有几百张图片格式如下。我想从header detector 2结果下面的表格中提取键值文本。即键同位素、值Tc99m、键峰、值140.3 kEV。显然,我更喜欢在bash脚本中执行此操作,而不是手动遍历每个图像。我听说过像imagemagick和ocr这样的工具,它们似乎能做我想做的事情。但是,我对这两个工具都没有经验。我应该如何处理这个问题,并且是可以解决的?

在运行ocr之前,我是否最好裁剪包含表格的大致区域,进行一些对比度调整以清除文本?

EN

回答 1

Stack Overflow用户

发布于 2014-09-12 18:19:41

我也有过非常相似的情况。我必须匹配工资报告中的员工标识号,而不是识别kEV。我的方法如下:用数字将图像裁剪到区域,对裁剪后的图像进行OCR,最后读取文本文件。我使用的工具:用于一般批处理作业和页面迭代的PHP脚本,用于将PDF转换为PNG的imagemagick,用于裁剪图像并将其保存为PNG的PHP GD库(请注意,imagemagick具有支持裁剪的命令行),以及最后用于OCR文本的Tesseract。我发现,如果图像是黑白和计算机生成的,那么Tesseract是相当可靠的,当然,前提是它是高分辨率的。在我的例子中,单个数字大约是11x18像素。

显然,你应该知道如何使用IM (http://www.imagemagick.org/Usage/crop/)裁剪图像,以及如何自动调平它(http://fmwconcepts.com/imagemagick/autolevel/index.php还没有尝试过)。以下是初学者的裁剪示例。然而,我相信你需要更大的分辨率。同时,避免将表格边缘传递给OCR。

代码语言:javascript
运行
复制
convert yrhxY.png -crop 44x12+146+204 -negate output.png

最后回答你的问题:是的-首先裁剪,然后OCR。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25804980

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档