前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python文件路径操作汇总

Python文件路径操作汇总

作者头像
python数据可视化之路
发布2023-02-23 20:28:24
2K0
发布2023-02-23 20:28:24
举报

在Python编程过程中,我们常常有这样的需求,需要获取某一个文件目录下的所有文件,或获取文件目录下的所有指定后缀名的文件,亦或要求获取该文件所在的文件夹,还有可能需要替换文件名,删除文件夹。针对这些问题,本文系统总结了这些方法,以供大家参考。

本实例的文件夹放置在桌面,路径为:C:\Users\Smile\Desktop\周汇报,该文件夹下有个子文件夹,子文件夹有一个pdf文件。

1

获取文件夹下的所有文件路径

这里推荐使用os模块下的listdir方法,该方法可以获取该文件夹下的所有文件名称(包含子文件夹名称),之后配合os.path.join方法来获取该文件夹下的所有文件路径。

代码语言:javascript
复制
import os
dir_path = r'C:\Users\Smile\Desktop\周汇报'
file_ls = os.listdir(dir_path)  #获取所有文件名称
file_ls

运行结果如下:

我们可以发现,结果不仅包括了文件名,还包括了子文件夹名。

获取完整路径,在上面基础上使用1行代码即可:

代码语言:javascript
复制
file_ls = [os.path.join(dir_path, file) for file in file_ls]
file_ls

如上图可以发现获取了指定文件夹下的所有文件路径,还包括了子文件夹路径。但是如果我们想要连带获取子文件夹下的文件名该如何操作?

解决方案就是通过os.walk方法进行。它返回3个参数——根目录、根目录下的所有文件、根目录下的子文件夹。它的神奇之处在于获取根目录子文件夹后会继续循环,依次取出根目录下子文件夹下的文件。

代码语言:javascript
复制
path = r'C:\Users\Smile\Desktop\周汇报'
for root, dirs, files in os.walk(path):
    print(root)

运行的结果为:

代码语言:javascript
复制
C:\Users\Smile\Desktop\周汇报
C:\Users\Smile\Desktop\周汇报\数据

可以发现在实验中循环了两次,这里指定输出当前循环的根目录,第一次循环遍历了根目录下的文件,由于该根目录下存在子文件夹,所以又循环了一次以获取子文件夹下的文件,所以第二次循环输出的根目录为子文件夹的位置。

对此,我们可以确定,如果在循环外面指定一个空列表。在每一次循环时将文件名与根目录进行拼接并添加到空列表中,就可以得到根目录下所有的文件路径。

代码语言:javascript
复制
path = r'C:\Users\Smile\Desktop\周汇报'
file_ls = []
for root, dirs, files in os.walk(path):
    root_file_ls = [os.path.join(root, file) for file in files]
    file_ls.append(root_file_ls)
file_ls

结果如下:

结果中可以看到,位于子文件夹下的文件也被添加到文件路径列表了。

2

获取后缀名

这里可以使用os.path.splitext方法来分割路径,它将路径分为两个部分,一个是后缀名,另一个是除后缀名之外的部分。

代码语言:javascript
复制
file = r'C:\\Users\\Smile\\Desktop\\周汇报\\第六周总结_20221024_20221030.pptx'
houzhui = os.path.splitext(file)[1]
houzhui

--结果--
'.pptx'

3

获取指定后缀名的文件

路径的本质是字符串,可以使用endswith方法来判断路径是否以某个字符结尾。现在将r'C:\Users\Smile\Desktop\周汇报'直接路径下(不含子文件夹)的所有docx文件输出。

代码语言:javascript
复制
path = r'C:\Users\Smile\Desktop\周汇报'
file_ls = []
for root, dirs, files in os.walk(path):
    root_file_ls = [os.path.join(root, file) for file in files]
    file_ls.append(root_file_ls)
#因为上面循环了两次,第二次是子文件夹的文件,所以取出第1个元素
#使用endswith判断是否以docx结尾
file_ls = [file for file in file_ls[0] if file.endswith('.docx')]
file_ls

结果如下:

可以看出已经将所有的docx文件输出。

4

修改文件名

使用os.rename(old_name, new_name)来进行。

例子我就不举了,太累了~~~

不过要提醒一点,old_name和new_name都是路径。

5

删除/移动文件

删除文件使用os.remove(路径名)

移动文件需要使用shuilt库,语法如下:

代码语言:javascript
复制
import shutil
shutil.move(old_name, new_name)

6

获取文件所在的文件夹

使用os.path.dirname(path)即可获取

代码语言:javascript
复制
path = r'C:\\Users\\Smile\\Desktop\\周汇报\\第001周总结_20220919_20220925.docx'
os.path.dirname(path)

--结果--
'C:\\\\Users\\\\Smile\\\\Desktop\\\\周汇报'

7

移除文件夹

1.如果使用os.remove(path),此时的文件夹必须是空文件夹,否则会报错。

2.如果是非空文件夹,使用shutil.rmtree(path)即可成功删除。

THE END

对于文件路径的操作主要有:文件路径获取、后缀名获取、获取指定后缀名文件、删除/移动文件、替换文件名、获取文件所在的文件夹、移除文件夹。

通过系统性的总结可以帮助我们编写代码节约时间,欢迎您的阅读!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 python数据可视化之美 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档