首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用Google Cloud Vision的OCR PDF文件?

使用Google Cloud Vision的OCR PDF文件?
EN

Stack Overflow用户
提问于 2018-09-15 18:40:52
回答 2查看 2.5K关注 0票数 4

目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端?

如果没有,如何使用Google Cloud Vision将PDF转换为OCRed PDF?据我所知,Cloud Vision目前支持PDF文件,但它只能将识别的文本输出为JSON文件。因此,似乎需要在Google Cloud Vision之外的另一个步骤中,将这个转换后的文本放在PDF中的图像顶部。

背景:

我经常需要将扫描的文档转换为包含OCRed文本层的PDF文件。到目前为止,我一直在使用像OCRKit或ABBYY FineReader这样的软件。我测试了这些解决方案的准确性与Google Cloud Vision的文本识别能力,后者遥遥领先。

EN

回答 2

Stack Overflow用户

发布于 2019-12-04 23:19:41

正如其他人所提到的,您需要使用第三方工具来完成此操作。

首先,使用gcv2hocr将google cloud vision response json转换为hocr文件:

代码语言:javascript
复制
gcv2hocr test.jpg.json output.hocr

然后使用hocr-tools将hocr数据缝合到pdf文件中。下面的命令将在'imgdir‘文件夹中查找,并将同名的.hocr和.jpg合并到out.pdf中的页面中。

代码语言:javascript
复制
hocr-pdf --savefile out.pdf <imgdir>
票数 2
EN

Stack Overflow用户

发布于 2018-11-08 01:50:59

正如您很好地提到的,responses retrieved by Vision API仅在PDF格式上可用;因此,为了基于响应的内容创建文件,需要通过使用third-party libraries在您的解决方案中包括额外的步骤。

如果此功能不能满足您当前的需求,您可以使用谷歌发送反馈按钮,位于service public documentation的左下角和右上角,以及看看Issue Tracker工具,以便raise a Vision API feature request和通知这一所需的功能。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52343909

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档