首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >检查是否已从Word/Google Docs导出PDF

检查是否已从Word/Google Docs导出PDF
EN

Stack Overflow用户
提问于 2013-06-14 02:50:49
回答 1查看 154关注 0票数 0

我正在做一些OCRing PDF的工作,我很好奇是否有一种方法可以检查一个PDF是否已经从Word (或Google Docs)导出。我可以检查PDF是否已经用Xpdf的pdffonts进行了OCR。我知道Word和Google Docs会自动OCR导出的PDF,所以如果我发现PDF没有OCR,我就知道它没有导出。但是,如果它已经光学字符识别,有没有办法检查的PDF是否从Word/Google Docs导出,而不是简单的OCRd与类似的程序?具体地说,我使用的是JavaScript,但任何信息都是有用的。

EN

回答 1

Stack Overflow用户

发布于 2013-06-20 04:04:02

对于任何正在查找的人来说,我现在所做的是使用带有-meta标志的pdfinfo (来自Xpdf)来检查PDF是否有XMP元数据。从Word和Google Docs导出的PDF没有此元数据,但其他PDF有。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17094800

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档