我试图找出一种方法来获取扫描的pdfs,这些被自动命名为"397009900“之类的东西在PDF本身中有一个特定的字符串。在我的例子中,它是我试图从PDF中提取来重命名文件( "ISO-4024-4301“)的一个绘图名称。
是否有一种方法可以自动重命名一个PDF文件从里面的信息?
非常感谢。
发布于 2020-03-13 12:55:11
这可以用python来完成。
import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
pdfReader = PyPDF2.PdfFileReader(p)
pageObj = pdfReader.getPage(0)
info=pageObj.extractText()
print(info)您可以指定要提取信息的页号。将要提取的页码从0更改。
pageObj = pdfReader.getPage(0)提取的文本将存储在变量info中,然后可以执行任何操作来选择要重命名的所需文本。
import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')使用OS模块,您可以轻松地重命名文件!
https://stackoverflow.com/questions/60670537
复制相似问题