目前是否有任何服务或软件工具使用Google Cloud Vision作为OCRing扫描的PDF文件的后端?
如果没有,如何使用Google Cloud Vision将PDF转换为OCRed PDF?据我所知,Cloud Vision目前支持PDF文件,但它只能将识别的文本输出为JSON文件。因此,似乎需要在Google Cloud Vision之外的另一个步骤中,将这个转换后的文本放在PDF中的图像顶部。
背景:
我经常需要将扫描的文档转换为包含OCRed文本层的PDF文件。到目前为止,我一直在使用像OCRKit或ABBYY FineReader这样的软件。我测试了这些解决方案的准确性与Google Cloud Vision的文本识别能力,后者遥遥领先。
发布于 2019-12-04 23:19:41
正如其他人所提到的,您需要使用第三方工具来完成此操作。
首先,使用gcv2hocr将google cloud vision response json转换为hocr文件:
gcv2hocr test.jpg.json output.hocr然后使用hocr-tools将hocr数据缝合到pdf文件中。下面的命令将在'imgdir‘文件夹中查找,并将同名的.hocr和.jpg合并到out.pdf中的页面中。
hocr-pdf --savefile out.pdf <imgdir>发布于 2018-11-08 01:50:59
正如您很好地提到的,responses retrieved by Vision API仅在PDF格式上可用;因此,为了基于响应的内容创建文件,需要通过使用third-party libraries在您的解决方案中包括额外的步骤。
如果此功能不能满足您当前的需求,您可以使用谷歌发送反馈按钮,位于service public documentation的左下角和右上角,以及看看Issue Tracker工具,以便raise a Vision API feature request和通知这一所需的功能。
https://stackoverflow.com/questions/52343909
复制相似问题