首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在pdfplumber中打开多个文件?

如何在pdfplumber中打开多个文件?
EN

Stack Overflow用户
提问于 2020-07-26 04:26:17
回答 2查看 719关注 0票数 0

我用Access DB forms创建了多个PDF文件。我可以从它们中提取文本的唯一方法是使用pdfplumber。这是我的代码,它只适用于一个文件。

代码语言:javascript
运行
复制
import pdfplumber

with pdfplumber.open('CS_page_1.pdf') as pdf:
    page = pdf.pages[0]
    string = page.extract_text()
    file_name = string[43:48]
    print(file_name)

我需要使用这个提取的字符串来重命名这个文件和文件夹中的100个其他文件。最好的方法是什么?

EN

回答 2

Stack Overflow用户

发布于 2020-07-26 04:38:39

我会首先使用glob (https://docs.python.org/3/library/glob.html)创建一个文件夹中所有pdf的列表。

然后遍历它们中的每一个- pdfplumb它们以获得所需的字符串(您希望将文件重命名为该字符串)-然后分别重命名每个字符串(https://www.tutorialspoint.com/python/os_rename.htm)。如下所示:

代码语言:javascript
运行
复制
import glob
import pdfplumber
import os

arr_of_files = (glob.glob("/path/to/pdfs/*.pdf"))

for file in arr_of_files:
    with pdfplumber.open(file) as pdf:
        page = pdf.pages[0]
        string = page.extract_text()
        file_name = string[43:48]
        os.rename(file, file_name)
票数 1
EN

Stack Overflow用户

发布于 2020-07-26 04:39:51

代码语言:javascript
运行
复制
import pdfplumber
import glob
from tqdm.auto import tqdm
for current_pdf_file in tqdm(glob.glob("<pathname>\.pdf")):
    with pdfplumber.open(current_pdf_file) as my_pdf:
         # do other things here?
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63093234

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档