首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

有没有可能一个接一个地打开PDF文件,它们的名字用Python保存在一个文本文件中?

是的,可以使用Python来实现一个接一个地打开PDF文件,并将它们的名字保存在一个文本文件中。下面是一个示例代码:

代码语言:txt
复制
import os
import PyPDF2

# 定义PDF文件所在的文件夹路径
pdf_folder = '/path/to/pdf/folder/'

# 定义保存PDF文件名的文本文件路径
txt_file = '/path/to/save/names.txt'

# 获取PDF文件夹中的所有文件名
pdf_files = [f for f in os.listdir(pdf_folder) if f.endswith('.pdf')]

# 打开文本文件以写入模式
with open(txt_file, 'w') as f:
    # 遍历PDF文件列表
    for pdf_file in pdf_files:
        # 拼接PDF文件的完整路径
        pdf_path = os.path.join(pdf_folder, pdf_file)
        
        # 打开PDF文件
        with open(pdf_path, 'rb') as pdf:
            # 使用PyPDF2库读取PDF文件
            reader = PyPDF2.PdfReader(pdf)
            
            # 获取PDF文件的名称
            pdf_name = os.path.splitext(pdf_file)[0]
            
            # 写入PDF文件名到文本文件中
            f.write(pdf_name + '\n')
            
            # 在这里可以进行其他操作,如提取文本内容、合并PDF等

这段代码使用了PyPDF2库来处理PDF文件。首先,它获取指定文件夹中的所有PDF文件名,并逐个打开PDF文件。然后,它使用os.path.splitext()函数获取PDF文件的名称(不包括扩展名),并将其写入到指定的文本文件中。

这个功能可以应用于需要批量处理PDF文件的场景,比如提取PDF文件中的文本内容、合并多个PDF文件等。

腾讯云相关产品和产品介绍链接地址:

请注意,以上仅为示例产品,实际使用时需要根据具体需求选择适合的腾讯云产品。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

一文贯通python文件读取

获得数据,就是读取文件操作,文件有各种各样格式即数据组织形式,如何方便快捷获取文件内容呢? 还是那句名言,life is short, just use python。...判断文本文件属于哪个字符集,老码农还在用chardet,不知道现在有没有更先进手段了。...在pythonBS4 来对html 进行操作是非常方便,同样也可以对xml 文件进行类似的操作,尤其是从网络读取html,示例代码如下: import requests from bs4 import...在Python 中一般可以通过pdfminer(http://www.unixuser.org/~euske/python/pdfminer/) 或者pypdf 来读取pdf文件内容, 官网给出示例代码如下...一句话小结 文件数据源读取是数据分析入口,使用Python可以方便快捷读取各种文件格式内容,为进一步数据分析或者数据清洗提供了简洁方式。

1.7K20

Python 自动化指南(繁琐工作自动化)第二版:十五、使用 PDF 和 WORD 文档

除了文本,它们还存储大量字体、颜色和布局信息。如果您想让您程序读写 PDF 或 Word 文档,您需要做不仅仅是简单它们文件名传递给open()。...相反,您必须创建一个 PDF,然后从现有文档复制内容。本节示例将遵循这一通方法: 将一个或多个现有 PDF(源 PDF打开到PdfFileReader对象。...添加完文本后,将文件名字符串传递给save()文档方法,将Document对象保存到文件。 这将在当前工作目录下创建一个名为helloworld.docx文件打开后,看起来像图 15-8 。...您可以通过Paragraph和Run对象操作 Word 文档文本。这些对象也可以被赋予样式,尽管它们必须来自默认样式集或文档已经存在样式。...因为 Python-Docx 只能使用 Word 文档已经存在样式,所以您必须先将这些样式添加到一个空白 Word 文件,然后用 Python-Docx 打开文件

3.6K50
  • python读写、创建文件文件夹等等

    如果size比文件大小还要大,依据系统不同可能是不改变文件,也可能0把文件补到相应大小,也可能是以一些随机内容加上去。...w或a模式打开文件的话,如果文件存在,那么就自动创建。...此外,w模式打开一个已经存在文件时,原有文件内容会被清空,因为一开始文件操作标记是在文件开头,这时候进行写操作,无疑会把原有的内容给抹掉。...由于历史原因,换行符在不同系统中有不同模式,比如在 unix一个\n,而在windows是‘\r\n’,U模式打开文件,就是支持所有的换行模式,也就说‘\r’ ‘\n’ ‘\r\n’都可表示换行...''' 学习遇到问题没人解答?小编创建了一个Python学习交流QQ群:531509025 寻找有志同道合小伙伴,互帮互助,群里还有不错视频学习教程和PDF电子书!

    1.4K20

    如何解压war包_tomcat自动解压war包

    使用WinRAR即可解压,同目录下创建一个.zip文件,右键打开方式->WinRAR压缩文件管理器 “向上”,到文件目录 选择要解压文件,点击“解压到”,解压到你想要目录即可 java war格式压缩包怎么解压...java程序 解压后war包,如何再压缩成war包? 不清楚war包格式。 可以随便找一个war包,然后把压缩工具打开,把里面的内容全部删除,然后把你解压内容全部拖拽进去。...-a 对 文本文件进行必要字符转换。 -b 不 要对文本文件进行字符转换。 -C 压 缩文件文件名称区分大小写。 -j 不 处理压缩文件中原有的目录路径。...-P 使 zip密码选项。 -q 执 行时不显示任何信息。 -s 将 文件空白字符转换为底线字符。 -V 留VMS文件版本信 息。 -X 解 压缩时同时回存文件原来UID/GID。...-y 直 保存符号连接,而非该连接所指向文件,本参数仅在UNIX之 类系统下有效。 -z 替 压缩文件加上注释。 -$ 存第一个被压缩文件所在磁盘卷册名称。

    3.2K10

    如何入门 Bash 编程

    一种方法是在 PDF 编辑器打开 PDF,从数百张图像(页面背景和纹理都算作图像)中选择每张图像,删除它们,然后将其保存到新 PDF。仅仅是一本书,这样就需要半天时间。...通过使用 GhostScript 处理了几天任务,我确认这是解决我问题方法。 编写基本脚本来运行命令,只不过是复制我用来从 PDF 删除图像命令和选项,并将其粘贴到文本文件而已。...实际上,Shell 脚本 存在唯一原因是让你不必亲自参与。这就是为什么命令(以及运行它们 Shell 脚本)会接受参数原因。 在 Shell 脚本,有一些预定义可以反映脚本启动方式变量。...但是通过创建一个接受我输入脚本,我可以一次将几个 PDF 文件全部提交给脚本。该脚本按顺序处理了每个文件,这可能需要半小时或稍长一点时间,但是我可以半小时来完成其他任务。...如下是一个 if/then 语句,如果你以一种基本方式使用 Bash,则你可能不知道 Bash 存在这样语句。

    94130

    流动代码:文件流畅读写艺术(一)

    二进制文件文本文件 二进制文件文本文件是两种基本文件类型,它们主要差别在于存储内容格式和用途: 文本文件 内容:由字符组成,如字母、数字和符号。...举个例子: 读取文件:当你打开一个文本文件,数据(文字)从文件(数据源)流到计算机程序(目的),就像水从水库流向你家水龙头。...mode mode表示文件打开模式,下面有多种类型: r(只读):为了输入数据,打开一个已经存在文本文件,如果指定文件存在,则出错 w(只写):为了输出数据,打开一个文本文件,如果指定文件存在,...则建立一个文件 a(追加):向文本文件尾添加数据,如果指定文件存在,则建立一个文件 rb(只读):为了输入数据,打开一个二进制文件,如果指定文件存在,则出错 wb(只写):为了输出数据,打开一个二进制文件...,如果指定文件存在,则建立一个文件 ab(追加):向一个二进制文件尾添加数据,如果指定文件存在,则建立一个文件 r+(读写):为了读和写,打开一个文本文件,如果指定文件存在,则出错 w+(

    10210

    关于“Python核心知识点整理大全23

    然后,将该文件 存到本章程序所在目录。...这看似微不足道,但未妥善关闭文件可能 会导致数据丢失或受损。如果在程序过早调用close(),你会发现需要使用文件时它已关闭 (无法访问),这会导致更多错误。...根据你组织文件方式,有时可能打开不在程序文件所属目录文件。...例如,你可能将 程序文件存储在了文件python_work,而在文件python_work,有一个名为text_files文 件夹,用于存储程序文件操作文本文件。...调用open()后,将 一个表示文件及其内容对象存储到了变量file_object(见2)。这里也使用了关键字with, 让Python负责妥善打开和关闭文件

    12110

    分享4个实用Python自动化脚本

    大家平时有没有注意到你每天可能会执行许多重复任务,例如阅读 pdf、播放音乐、打开书签、清理文件夹等等。...今天,我将分享4个实用python自动化脚本,无需手动一次又一次完成这些任务,非常方便。...1、将 PDF 转换为音频文件 脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 PyPDF 提取 pdf 文本,然后用 Pyttsx3 将文本转语音。关于文本转移,你还可以看这篇文章。...现在,我把这些网站链接复制粘贴到文本文件,每天早上我都会运行脚本,在我浏览器再次打开所有这些网站。 import webbrowser with open('....一个库,可以自动在默认浏览器打开 URL。

    590120

    在 Linux 上安装 pdftk-java命令方式

    一个 PDF 删除页面 你不能确切一个 PDF 删除一页,但你可以创建一个 PDF,只包含你想保留页面。...$ pdftk book.pdf \ cat 1 3-end \ output shorter-book.pdf 在这个例子,我文件第 1 页,以及从 3 到结尾所有页面,都被保存到一个文件...这将提取表单元素 ID,并将它们放入一个文本文件。...在对生成 PDF 组织工作流程有时令人钦佩和有时尴尬一瞥,你会发现一些表格有明确标签,而其他表格有默认名字,如 “Checkbox_001” 和 “Textfield-021”,所以你可能要把你文本文件和你...PDF 对照一下,但如果你要写一个脚本来自动填写表格,这可能是值得

    1.5K30

    Python高阶项目(转发请告知)

    AudioSegment是Pydub父类。它起着可以加载,操作和保存音频文件容器作用。让我们python创建我们一个音频。...加载和播放 AudioSegment是Pydub父类。它起着可以加载,操作和保存音频文件容器作用。让我们python创建我们一个音频。...Python模拟Monty Hall问题很简单。我们将编写一个函数,该函数使用Pythonrrandom模块来选择隐藏价格那扇门,同时初始选择以及Monty选择打开那扇门。...此打印功能将帮助您查看当前检修出文件: 我们可以使用函数使用Python从所有PDF文件中提取: 在运行该函数之后,如果您要转到目录,您将看到一个名为result1.txt文本文件,其中包含所有从...此文本文件包含电子邮件正文格式: 然后,您应该拥有的下一个文件是CSV文件。我将使用文件包含需要在模板文件占位符细节。它包含应发送给收件人详细信息。它可以是Excel文件或CSV文件

    4.3K10

    Linux系统下各类压缩包解压命令

    -z 仅 显示压缩文件备注文字。 -a 对 文本文件进行必要字符转换。 -b 不 要对文本文件进行字符转换。...-s 将 文件空白字符转换为底线字符。 -V 留VMS文件版本信 息。 -X 解 压缩时同时回存文件原来UID/GID。...-f 此 参数效果和指定"-u"参 数类似,但不仅更新既有文件,如果某些文件原本不存在于压缩文件内,使用 本参数会一并将其加入压缩文件。...-X 不 保存额外文件属性。 -y 直 保存符号连接,而非该连接所指向文件,本参数仅在UNIX之 类系统下有效。 -z 替 压缩文件加上注释。...-$ 存第一个被压缩文件所在磁盘卷册名称。 - 压 缩效率是一个介于1-9 数值。

    2.8K10

    Python 文件操作与路径

    本文内容:Python 文件操作与路径 ---- Python 文件操作与路径 1.文件与路径 2.文本文件与二进制文件 3.操作文件 3.1 打开文件 3.2 关闭文件 3.3 写入文本文件 3.4...在 Python , 可以 os 模块 getcwd() 方法获取当前工作目录: import os os.getcwd() 假如在根目录 Users 文件夹下有一个文件夹 xiaoaoquan...---- 3.操作文件Python ,操作文件包含 3 个步骤: 调用 open() 函数打开物理文件,返回一个文件对象。...\n') file1.close() ---- 3.4 读取文本文件Python , 使用 open() 函数打开文件时,mode 参数默认值是“ rt”, 即以文本文件形式读取文件。...当打开文本文件时,会有一个指针指向文件开头字符。

    1.4K20

    Python文件处理–为初学者学习Python文件处理

    文本文件由一系列行构成。并且,文本文件每一行都包含一个字符序列。文本文件每行终止都以行尾(EOL)表示。有一些特殊字符可以用作EOL,但逗号{,}和换行符是最常见字符。....jpg,.png,.gif等图像文件以及.doc,.xls,.pdf等文档均构成二进制文件。 01. Python open函数语法: file_name是指我们要打开文件。...下面列出了一些最常见访问模式: 模式 描述 [R 打开一个文件仅供读取 rb 打开一个文件仅供读取,但以二进制格式 w 打开仅用于写入文件;如果文件存在,则覆盖文件 b 仅以二进制格式打开文件以供写入...说,这就是我们文本文件“ demofile.txt”样子: 这只是一个文本文件 但这是换行符 现在,这里是一个代码片段,可使用Python文件处理功能打开文件。...f= open(‘demofile.txt’, ‘r’) f.readline() 借助Pythonopen函数读取文本文件,将其保存在文件对象,并借助readlines函数读取行。

    14430

    Python权威指南10个项目(1~5

    项目1:自动添加标签   这个项目主要介绍如何使用Python杰出文本处理功能,包括使用正则表达式将纯文本文件转换为 HTML或XML等语言标记文件。...它使用一个处理程序以及一系列规则和过滤器 将纯文本文件转换为带标记文件(这里是HTML文件)。 其中包括了:完成准 备工作构造函数、添加规则方法、添加过滤器方法以及对文件进行解析方法。...项目2:绘制图表   这个项目主要介绍:Python创建图表。具体说,你将创建一个PDF文件,其中包含图表对 从文本文件读取数据进行了可视化。...另外,它们还设置了变量passthrough (以便将XHTML代码直接写入文件),而且打开和关闭与页面相关文件。 (5) 结果展示 ?...LogoutRoom要简单得多,它唯一职责是将用户名字从服务器删除(服务器包含存储会 话字典users)。如果用户名不存在(因为用户从未登录),将忽略因此而引发KeyError异常。

    81910

    Python 自动化指南(繁琐工作自动化)第二版:九、读取和写入文件

    你可以把一个文件内容想象成一个单独字符串值,大小可能是千兆字节。在本章,您将学习如何使用 Python 来创建、读取和保存硬盘上文件。...检查路径有效性 如果您为许多 Python 函数提供一个存在路径,它们将会崩溃并出现错误。幸运是,Path对象拥有检查给定路径是否存在以及它是文件还是文件方法。...这些可以 Windows 记事本或 MacOS TextEdit 应用打开。您程序可以很容易地读取纯文本文件内容,并将它们视为普通字符串值。...二进制文件是所有其他文件类型,如文字处理文档、PDF、图像、电子表格和可执行程序。如果你在记事本或文本编辑打开一个二进制文件,它会看起来像杂乱无章,就像图 9-6 一样。...open()函数可以打开这些文件,将它们内容作为一个大字符串(read()方法)或字符串列表(readlines()方法)读入。

    3.5K51

    如何用Python批量提取PDF文本内容?

    本文为你展示,如何用Python把许多PDF文件文本内容批量提取出来,并且整理存储到数据框,以便于后续数据分析。 ? (由于微信公众号外部链接限制,文中部分链接可能无法正确打开。...写了几篇关于自然语言处理文章后,一种呼声渐强: 老师,pdf文本内容,有没有什么方便方法提取出来呢? 我能体会到读者心情。 我展示例子,文本数据都是直接可以读入数据框工具做处理。...它们可能来自开放数据集合、网站API,或者爬虫。 但是,有的时候,你会遇到需要处理指定格式数据问题。 例如pdf。 许多学术论文、研究报告,甚至是资料分享,都采用这种格式发布。...另外,演示目录还包括了2个文件夹。 这两个文件夹里面,都是中文pdf文件,用来给你展示pdf内容抽取。它们都是我几年前发表中文核心期刊论文。...from pdf_extractor import extract_pdf_content 这个函数,我们尝试从 pdf 文件列表第一篇里,抽取内容,并且把文本保存在 content 变量里。

    5.7K41

    独家 | 手把手教你如何用PythonPDF文件中导出数据(附链接)

    使用PDFMiner提取文本 最被大家所熟知可能一个叫做PDFMiner包。PDFMiner包大约从Python 2.4版本就存在了。它主要目的是从PDF中提取文本。...你将很大可能需要使用Google和Stack Overflow两个查询工具来弄清楚如何在这篇贴子涵盖内容之外有效使用PDFMiner。 提取所有文本 有时你会想要提取PDF文件所有文本。...此处你可以加入一个特定分析程序,其中你可以将页分成句子或者单词,从而分析出更有趣信息。比如,你可能只想得到有某个特定名字或日期/时间戳句子。...CSV优点就是Microsoft Excel和 LibreOffice都能够自动地以漂亮电子表格方式将它们打开。你也可以在一个文本编辑器打开CSV文件,如果你乐意看到它原始值的话。...从PDF中提取图片 不幸是,并不存在Python包可以真正做到从PDF中提取图片。我找到最接近东西是有一个叫minecart项目宣称可以做到这一点,但是它只在Python 2.7上有效。

    5.4K30
    领券