首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Windows从PDF文件本身的信息自动命名

Windows从PDF文件本身的信息自动命名
EN

Stack Overflow用户
提问于 2020-03-13 12:32:43
回答 1查看 214关注 0票数 0

我试图找出一种方法来获取扫描的pdfs,这些被自动命名为"397009900“之类的东西在PDF本身中有一个特定的字符串。在我的例子中,它是我试图从PDF中提取来重命名文件( "ISO-4024-4301“)的一个绘图名称。

是否有一种方法可以自动重命名一个PDF文件从里面的信息?

非常感谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-13 12:55:11

这可以用python来完成。

代码语言:javascript
运行
复制
import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
    pdfReader = PyPDF2.PdfFileReader(p)
    pageObj = pdfReader.getPage(0)
    info=pageObj.extractText()
    print(info)

您可以指定要提取信息的页号。将要提取的页码从0更改。

代码语言:javascript
运行
复制
pageObj = pdfReader.getPage(0)

提取的文本将存储在变量info中,然后可以执行任何操作来选择要重命名的所需文本。

代码语言:javascript
运行
复制
import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')

使用OS模块,您可以轻松地重命名文件!

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60670537

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档