文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Google Cloud Vision的OCR PDF文件？

问使用Google Cloud Vision的OCR PDF文件？
EN

Stack Overflow用户

提问于 2018-09-15 18:40:52

回答 2查看 2.5K关注 0票数 4

目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端？

如果没有，如何使用Google Cloud Vision将PDF转换为OCRed PDF？据我所知，Cloud Vision目前支持PDF文件，但它只能将识别的文本输出为JSON文件。因此，似乎需要在Google Cloud Vision之外的另一个步骤中，将这个转换后的文本放在PDF中的图像顶部。

背景：

我经常需要将扫描的文档转换为包含OCRed文本层的PDF文件。到目前为止，我一直在使用像OCRKit或ABBYY FineReader这样的软件。我测试了这些解决方案的准确性与Google Cloud Vision的文本识别能力，后者遥遥领先。

pdf

pdf-generation

ocr

google-cloud-vision

回答 2

Stack Overflow用户

发布于 2019-12-04 23:19:41

正如其他人所提到的，您需要使用第三方工具来完成此操作。

首先，使用gcv2hocr将google cloud vision response json转换为hocr文件：

gcv2hocr test.jpg.json output.hocr

然后使用hocr-tools将hocr数据缝合到pdf文件中。下面的命令将在'imgdir‘文件夹中查找，并将同名的.hocr和.jpg合并到out.pdf中的页面中。

hocr-pdf --savefile out.pdf <imgdir>

票数 2

Stack Overflow用户

发布于 2018-11-08 01:50:59

正如您很好地提到的，responses retrieved by Vision API仅在PDF格式上可用；因此，为了基于响应的内容创建文件，需要通过使用third-party libraries在您的解决方案中包括额外的步骤。

如果此功能不能满足您当前的需求，您可以使用谷歌发送反馈按钮，位于service public documentation的左下角和右上角，以及看看Issue Tracker工具，以便raise a Vision API feature request和通知这一所需的功能。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52343909

复制

相似问题

问使用Google Cloud Vision的OCR PDF文件？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Google Cloud Vision的OCR PDF文件？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Google Cloud Vision的OCR PDF文件？
EN