前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【十】python基础之文件处理

【十】python基础之文件处理

作者头像
菲宇
发布2019-06-13 10:49:51
6640
发布2019-06-13 10:49:51
举报
文章被收录于专栏:菲宇

给要打开的文件对象指定一个名字,这样可在完成操作之后迅速关闭文件,防止一些无用的文件对象占用内存

1 2 3 4 5

file_object = open('thefile.txt') try: all_the_text = file_object.read( ) finally: file_object.close( )

Python读写文件的五大步骤 一、打开文件 Python读写文件在计算机语言中被广泛的应用,如果你想了解其应用的程序,以下的文章会给你详细的介绍相关内容,会你在以后的学习的过程中有所帮助,下面我们就详细介绍其应用程序。 代码如下:

1

f = open("d:\test.txt", "w")

说明: 第一个参数是文件名称,包括路径;第二个参数是打开的模式mode 'r':只读(缺省。如果文件不存在,则抛出错误) 'w':只写(如果文件不存在,则自动创建文件) 'a':附加到文件末尾 'r+':读写 如果需要以二进制方式打开文件,需要在mode后面加上字符"b",比如"rb""wb"等 二、读取内容 f.read(size) 参数size表示读取的数量,可以省略。如果省略size参数,则表示读取文件所有内容。 f.readline() 读取文件一行的内容 f.readlines() 读取所有的行到数组里面[line1,line2,...lineN]。在避免将所有文件内容加载到内存中,这种方法常常使用,便于提高效率。 三、写入文件

f.write(string) 将一个字符串写入文件,如果写入结束,必须在字符串后面加上"\n",然后f.close()关闭文件

四、文件中的内容定位 f.read() 读取之后,文件指针到达文件的末尾,如果再来一次f.read()将会发现读取的是空内容,如果想再次读取全部内容,必须将定位指针移动到文件开始: f.seek(0) 这个函数的格式如下(单位是bytes): f.seek(offset, from_what) from_what表示开始读取的位置,offset表示从from_what再移动一定量的距离,比如f.seek(10, 3)表示定位到第三个字符并再后移10个字符。from_what值为0时表示文件的开始,它也可以省略,缺省是0即文件开头。

1 2 3 4 5 6 7 8

f = open('/tmp/workfile', 'r+') f.write('0123456789abcdef') f.seek(5) # Go to the 6th byte in the file f.read(1) '5' f.seek (-3, 2) # Go to the 3rd byte before the end f.read(1) 'd'

五、关闭文件释放资源 文件操作完毕,一定要记得关闭文件f.close(),可以释放资源供其他程序使用 Python读写文件在计算机语言中被广泛的应用,如果你想了解其应用的程序,以下的文章会给你详细的介绍相关内容,会你在以后的学习的过程中有所帮助,下面我们就详细介绍其应用程序。

Python引入了with语句来自动调用close()方法,这样写起来就方便很多。

读取文件的方法还有很多,除了read( )一次性读取全部内容外,还有:

read(size),每次读取size个字节的内容,适合于未知文件大小的读取; readline( ),每次读取一行内容; readlines( ),一次性读取所有内容,并按行返回list,适用于配置文件的读取。

file-like Object:像open()函数返回的这种有个read()方法的对象,在Python中统称为file-like Object。除了file外,还可以是内存的字节流,网络流,自定义流等等。file-like Object不要求从特定类继承,只要写个read()方法就行。 StringIO就是在内存中创建的file-like Object,常用作临时缓冲。

• 写文件

调用open( )函数时把指示符改为“w”即write,就可以进行写文件。成功打开文件后用write( )方法来进行写入。

>>> f = open('c:\Users\Administrator\test.txt', 'w') >>> f.write('Hello, world!') >>> f.close()

1 2 3

更好的写法:

with open('c:\Users\Administrator\test.txt', 'w') as f: f.write('Hello, world!')

1 2

需要注意的是一定要保证close( )的运行,因为操作系统只有在调用close( )方法时,才能保证把所有内容全部写入磁盘。

如果想要在一个文件后继续添加内容,只要在调用open( )函数时,把指示符改为“a”即append,即可。

一、文件的操作

1、打开一个文件

语法:open(filename,mode)

解释:

filename:代表你要访问的文件名

mode:这里代表你打开文件的模式,有 只读,写入,读写,追加等模式;默认为只读模式。

我们可以看下面的列表:

1、读模式 r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式

例子:

代码语言:javascript
复制
f = open("foo.txt", "r",encoding="UTF-8")  #只读的方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
i=f.read()   # 读取文件,bing 赋值给i
print(i)     #打印i
f.close()    #关闭文件夹
#输出如下:
C:\Python35\python.exe D:/linux/python/all_test/listandtup.py
Python 是一个非常好的语言。
是的,的确非常好!!

2、读写模式 r+ 打开一个文件用于读写。文件指针将会放在文件的开头。

例子:

代码语言:javascript
复制
f = open("foo.txt", "r+",encoding="UTF-8")  #读写的方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
i=f.read()   # 读取文件,bing 赋值给i
print(i)     #打印i
f.write("我要学Python\n")       #写入
# f.flush()
f.close()    #关闭文件夹
输出:
C:\Python35\python.exe D:/linux/python/all_test/listandtup.py
我要学Python
我要学Python

3、写模式 w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件

例子:

代码语言:javascript
复制
f = open("foo.txt", "w",encoding="UTF-8")  #写的方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
f.write("我要学Python\n")       #写入,文件夹存在覆盖,不存在创建
f.close()    #关闭文件夹

4、读写模式 w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件

例子:

代码语言:javascript
复制
f = open("foo.txt", "w+",encoding="UTF-8")  #写的方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
f.write("我要学Python\n")       #写入,文件夹存在覆盖,不存在创建
print("定位之前的光标位置:%s" % (f.tell()))
f.flush()                       #刷新文件使内存的内容刷新至文件夹
f.seek(0)                       #因为W+读取文件之后会定位在文件尾部,所以需要重新定位一下光标位置,要不无法读取
print("定位之后的光标位置:%s" % (f.tell()))
i = f.read()
print(i)
f.close()    #关闭文件夹
输出:
C:\Python35\python.exe D:/linux/python/all_test/listandtup.py
定位之前的光标位置:17
定位之后的光标位置:0
我要学Python

5、追加 a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入

例子:

代码语言:javascript
复制
f = open("foo.txt", "a",encoding="UTF-8")  #追加方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
f.write("我要学Python\n")       #写入,文件夹存在追加,不存在创建
print("定位之前的光标位置:%s" % (f.tell()))
f.seek(0)                       #因为a追加文件之后会定位在文件尾部,所以需要重新定位一下光标位置,要不无法读取
print("定位之后的光标位置:%s" % (f.tell()))
f.close()    #关闭文件夹

6、追加读 a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

例子:

代码语言:javascript
复制
f = open("foo.txt", "a+",encoding="UTF-8")  #追加读方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
f.write("我要学Python\n")       #写入,文件夹存在创建,不存在创建
print("定位之前的光标位置:%s" % (f.tell()))
f.flush()                       #刷新文件使内存的内容刷新至文件夹
f.seek(0)                       #因为W+读取文件之后会定位在文件尾部,所以需要重新定位一下光标位置,要不无法读取
print("定位之后的光标位置:%s" % (f.tell()))
i = f.read()
print(i)
f.close()    #关闭文件夹
输出:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
定位之前的光标位置:136
定位之后的光标位置:0
我要学Python
我要学Python
我要学Python
我要学Python
我要学Python

二、文件的操作方法

文件的常用方法有13种,如下:

file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:

序号

方法及描述

1

file.close() 关闭文件。关闭后文件不能再进行读写操作。

2

file.flush() 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

3

file.fileno() 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。

4

file.isatty() 如果文件连接到一个终端设备返回 True,否则返回 False。

5

file.next() 返回文件下一行。

6

file.read([size]) 从文件读取指定的字节数,如果未给定或为负则读取所有。

7

file.readline([size]) 读取整行,包括 "\n" 字符。

8

file.readlines([sizeint]) 读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

9

file.seek(offset[, whence]) 设置文件当前位置

10

file.tell() 返回文件当前位置。

11

file.truncate([size]) 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

12

file.write(str) 将字符串写入文件,返回的是写入的字符长度。

13

file.writelines(sequence) 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

1、fileno() 方法返回一个整型的文件描述符(file descriptor FD 整型),可用于底层操作系统的 I/O 操作

语法:

fileObject.fileno()

返回值:文件描述符

例子:

代码语言:javascript
复制
f = open("foo.txt", "a+",encoding="UTF-8")  #追加读方式打开的文件,encoding是转码的意思,告诉解释器,是以UTF-8的格式
fid = f.fileno()
print("文件的描述符为:",fid)
f.close()    #关闭文件夹
输出:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
文件的描述符为: 3

2、next() 返回文件的下一行

语法:next(iterator[,default])

代码语言:javascript
复制
# 打开文件
fo = open("foo.txt", "r",encoding="UTF-8")
print ("文件名为: ", fo.name)
for index in range(5):
    line = next(fo)
    print ("第 %d 行 - %s" % (index, line))
# 关闭文件
fo.close()
#输出
# C:\Python35\python.exe D:/linux/python/all_test/总练习.py
# 文件名为:  foo.txt
# 第 0 行 - 我要学Python0
# 第 1 行 - 我要学Python1
# 第 2 行 - 我要学Python2
# 第 3 行 - 我要学Python3
# 第 4 行 - 我要学Python4

3、read方法:用于从文件读取指定的字节数,如果为给定或为负则读取所有

语法:fileObject.read()

代码语言:javascript
复制
fo = open("foo.txt", "r",encoding="UTF-8")
print ("文件名为: ", fo.name)
line = fo.read()       #不指定字符节读取所有
print(line)
fo.close()    # 关闭文件
# 如下:
# C:\Python35\python.exe D:/linux/python/all_test/总练习.py
# 文件名为:  foo.txt
# 我要学Python0
# 我要学Python1
# 我要学Python2
# 我要学Python3
# 我要学Python4
# 我要学Python5

===========================================
fo = open("foo.txt", "r",encoding="UTF-8")
print ("文件名为: ", fo.name)
line = fo.read(16)       #指定读取16字节
print(line)
fo.close()    # 关闭文件
#如下:
# C:\Python35\python.exe D:/linux/python/all_test/总练习.py
# 文件名为:  foo.txt
# 我要学Python0
# 我要学Py

4、readline() 方法用于从文件读取整行,包括 "\n" 字符。如果指定了一个非负数的参数,则返回指定大小的字节数,包括 "\n" 字符。

语法:fileObject.readline()

代码语言:javascript
复制
fo = open("foo.txt", "r",encoding="UTF-8")
print ("文件名为: ", fo.name)
line = fo.readline(3)       #指定读取16字节
print("读取指定的字符串为:%s" % (line))
print("光标现在的位置:%s" %(fo.tell()))
fo.seek(0,0)          #之所以用这个是因为前面已经读了16个字符了所以要把光标调到0 的位置
print("调整后光标的位置:%s" %(fo.tell()))
line = fo.readline()       #读取第一行
print("读取第一行:%s" % (line))
fo.close()    # 关闭文件
#如下:
# C:\Python35\python.exe D:/linux/python/all_test/总练习.py
# 文件名为:  foo.txt
# 读取指定的字符串为:我要学
# 光标现在的位置:9
# 调整后光标的位置:0
# 读取第一行:我要学Python0

5、readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比sizhint较大, 因为需要填充缓冲区。如果碰到结束符 EOF 则返回空字符串。

语法:fileObject.readlines()

代码语言:javascript
复制
fo = open("foo.txt", "r",encoding="UTF-8")
print ("文件名为: ", fo.name)
line = fo.readlines(3)       #指定读取3字节
print("读取指定的字符串为:%s" % (line))
for line in fo.readlines():
    line = line.strip("\n")     #使用strip去掉换行符/n
    print("读取所有行:%s" % (line))
fo.close()    # 关闭文件
输出如下:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
文件名为:  foo.txt
读取指定的字符串为:['我要学Python0\n']
读取所有行:我要学Python1
读取所有行:我要学Python2
读取所有行:我要学Python3
读取所有行:我要学Python4
读取所有行:我要学Python5
读取所有行:我要学Python6
读取所有行:我要学Python7

6、truncate() 方法用于截断文件,如果指定了可选参数 size,则表示截断文件为 size 个字符。 如果没有指定 size,则重置到当前位置。

语法:fileObject.truncate( [ size ])

代码语言:javascript
复制
fo = open("foo.txt", "r+",encoding="UTF-8")
line = fo.readline()
print ("读取行: %s" % (line))

fo.truncate()
line = fo.readlines()
print ("读取行: %s" % (line))
fo.close()    # 关闭文件

输出:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
读取行: 我要学Python1

读取行: ['我要学Python2\n', '我要学Python3\n', '我要学Python4']

==========================================
fo = open("foo.txt", "r+",encoding="UTF-8")
fo.truncate(10)            #截取10个字符,其余的清空
line = fo.read()
print ("读取的数据: %s" % (line))
fo.close()    # 关闭文件

输出如下:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
读取的数据: 我要学P

7、writelines() 方法用于向文件中写入一序列的字符串,这一序列字符串可以是由迭代对象产生的,如一个字符串列表,换行需要制定换行符 \n。

语法:fileObject.writelines( [ str ])

代码语言:javascript
复制
fo = open("foo.txt", "a+",encoding="UTF-8")
seq = ["我要学Python 1\n", "我要学Python 2"]
fo.writelines( seq )
fo.flush()
fo.seek(0,0)                                            #跳到行首
line = fo.readlines()                                 #读取所有行
print ("读取的数据: %s" % (line))
fo.close()    # 关闭文件

输出:
C:\Python35\python.exe D:/linux/python/all_test/总练习.py
读取的数据: ['我要学Python 1\n', '我要学Python 2']

文件的读写操作

文件的各种系统操作

存储对象

遍历文件

代码语言:javascript
复制
import os
import os.path
rootdir = "d:/code/su/data"                                   # 指明被遍历的文件夹

for parent,dirnames,filenames in os.walk(rootdir):    #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字
    for dirname in  dirnames:                       #输出文件夹信息
        print "parent is:" + parent
        print  "dirname is" + dirname
    
    for filename in filenames:                        #输出文件信息
        print "parent is:" + parent
        print "filename is:" + filename
        print "the full name of the file is:" + os.path.join(parent,filename) #输出文件路径信息

一、python中对文件、文件夹操作时经常用到的os模块和shutil模块常用方法。

1.得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 2.返回指定目录下的所有文件和目录名:os.listdir() 3.函数用来删除一个文件:os.remove() 4.删除多个目录:os.removedirs(r"c:\python") 5.检验给出的路径是否是一个文件:os.path.isfile() 6.检验给出的路径是否是一个目录:os.path.isdir() 7.判断是否是绝对路径:os.path.isabs() 8.检验给出的路径是否真地存:os.path.exists() 9.返回一个路径的目录名和文件名:os.path.split() 例子: 代码如下: os.path.split('/home/swaroop/byte/code/poem.txt') 结果:('/home/swaroop/byte/code', 'poem.txt')

10.分离扩展名:os.path.splitext() 11.获取路径名:os.path.dirname() 12.获取文件名:os.path.basename() 13.运行shell命令: os.system() 14.读取和设置环境变量:os.getenv() 与os.putenv() 15.给出当前平台使用的行终止符:os.linesep Windows使用'\r\n',Linux使用'\n'而Mac使用'\r' 16.指示你正在使用的平台:os.name 对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix' 17.重命名:os.rename(old, new) 18.创建多级目录:os.makedirs(r"c:\python\test") 19.创建单个目录:os.mkdir("test") 20.获取文件属性:os.stat(file) 21.修改文件权限与时间戳:os.chmod(file) 22.终止当前进程:os.exit() 23.获取文件大小:os.path.getsize(filename) 二、文件操作方法大全 1.os.mknod("test.txt") 创建空文件 2.fp = open("test.txt",w) 直接打开一个文件,如果文件不存在则创建文件 3.关于open 模式:

代码如下:

r:以读方式打开文件,可读取文件信息。 w:以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容 a:以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建 b:以二进制模式打开文件,而不是以文本模式。该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。 r+:以读写模式打开 w+:以读写模式打开 (参见 w ) a+:以读写模式打开 (参见 a ) rb:以二进制读模式打开 wb:以二进制写模式打开 (参见 w ) ab:以二进制追加模式打开 (参见 a ) rb+:以二进制读写模式打开 (参见 r+ ) wb+:以二进制读写模式打开 (参见 w+ ) ab+:以二进制读写模式打开 (参见 a+ )

文件对象方法 f.close():关闭文件,记住用open()打开文件后一定要记得关闭它,否则会占用系统的可打开文件句柄数。 f.fileno():获得文件描述符,是一个数字 f.flush():刷新输出缓存 f.isatty():如果文件是一个交互终端,则返回True,否则返回False。 f.read([count]):读出文件,如果有count,则读出count个字节。 f.readline():读出一行信息。 f.readlines(): 读出所有行,也就是读出整个文件的信息。 f.seek(offset[,where]):把文件指针移动到相对于where的offset位置。where为0表示文件开始处,这是默认值 ;1表示当前位置;2表示文件结尾。 f.tell():获得文件指针位置。 f.truncate([size]):截取文件,使文件的大小为size。 f.write(string):把string字符串写入文件。 f.writelines(list):把list中的字符串一行一行地写入文件,是连续写入文件,没有换行。

fp.read([size]) #size为读取的长度,以byte为单位 fp.readline([size]) #读一行,如果定义了size,有可能返回的只是一行的一部分 fp.readlines([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。 fp.write(str) #把str写到文件中,write()并不会在str后加上一个换行符 fp.writelines(seq) #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。 fp.close() #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError fp.flush() #把缓冲区的内容写入硬盘 fp.fileno() #返回一个长整型的"文件标签" fp.isatty() #文件是否是一个终端设备文件(unix系统中的) fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点 fp.next() #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。 fp.seek(offset[,whence]) #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。 fp.truncate([size]) #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

三、目录操作方法大全

1.创建目录

os.mkdir("file") 2.复制文件: shutil.copyfile("oldfile","newfile") #oldfile和newfile都只能是文件 shutil.copy("oldfile","newfile") #oldfile只能是文件夹,newfile可以是文件,也可以是目标目录 3.复制文件夹: 4.shutil.copytree("olddir","newdir") #olddir和newdir都只能是目录,且newdir必须不存在 5.重命名文件(目录) os.rename("oldname","newname") #文件或目录都是使用这条命令 6.移动文件(目录) shutil.move("oldpos","newpos") 7.删除文件 os.remove("file") 8.删除目录 os.rmdir("dir") #只能删除空目录 shutil.rmtree("dir") #空目录、有内容的目录都可以删 9.转换目录 os.chdir("path") #换路径

目录操作: os.mkdir("file") 创建目录 复制文件: shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是文件 shutil.copy("oldfile","newfile") oldfile只能是文件夹,newfile可以是文件,也可以是目标目录 复制文件夹: shutil.copytree("olddir","newdir") olddir和newdir都只能是目录,且newdir必须不存在 重命名文件(目录) os.rename("oldname","newname") 文件或目录都是使用这条命令 移动文件(目录) shutil.move("oldpos","newpos") 删除文件 os.remove("file") 删除目录 os.rmdir("dir")只能删除空目录 shutil.rmtree("dir") 空目录、有内容的目录都可以删 转换目录 os.chdir("path") 换路径

编程实例:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94

# -*- coding: utf-8 -*- import os import shutil # 一. 路径操作:判断、获取和删除 #1. 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() #print: currentpath: f:\LearnPython currentpath = os.getcwd() print "currentpath: ",currentpath #2. 返回指定目录下的所有文件和目录名:os.listdir() #print:os.listdir(): ['test.txt', 'testRW.py', 'test1.txt', 'cmd.py', 'rwfile.py', 'downloadfile.py', 'date.py', 'time.py', 'datetime.py', 'file.py'] print "os.listdir(): ",os.listdir('f:\LearnPython') path = "F:\mmmmmmmmm\debug_taobao_200003@taobao_android1.6_3.2.1.apk" #3. 判断给出的路径是否真地存:os.path.exists() if os.path.exists(path): #删除一个文件:os.remove() os.remove(path) else: print path,"not exist" #4. 删除多个目录:os.removedirs(“c:\python”) #它只能删除空目录,如果目录里面有内容将不会被删除 if os.path.exists("d:/woqu"): os.removedirs("d:/woqu") else: os.mkdir("d:/woqu") os.removedirs("d:/woqu") #5. 判断给出的路径是否是一个文件:os.path.isfile() #print: True print os.path.isfile("D:\hello\json.txt") #6. 判断给出的路径是否是一个目录:os.path.isdir() #print: True print os.path.isdir("D:\hello") #7. 判断是否是绝对路径:os.path.isabs() #print: True print os.path.isabs("D:\hello") # 判断是否是链接 print os.path.islink('http://www.baidu.com') #8. 返回一个路径的目录名和文件名:os.path.split() #eg os.path.split('/home/swaroop/byte/code/poem.txt') 结果:('/home/swaroop/byte/code', 'poem.txt') #print: ('D:\\hello', 'json.txt') print os.path.split("D:\hello\json.txt") #9. 分离扩展名:os.path.splitext() #print:('D:\\hello\\json', '.txt') print os.path.splitext("D:\hello\json.txt") #10. 获取路径名:os.path.dirname() #print: 'D:\\hello' print os.path.dirname("D:\hello\json.txt") #11. 获取文件名:os.path.basename() #print: 'json.txt' print os.path.basename("D:\hello\json.txt") #13. 指示你正在使用的平台:os.name 对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix' print "os.name: ",os.name #14. linex 下的命令 if os.name == 'posix': #读取和设置环境变量:os.getenv() 与os.putenv() home_path = os.environ['HOME'] home_path = os.getenv('HOME') #读取环境变量  elif os.name == 'nt': home_path = 'd:' print 'home_path: ',home_path #15. 给出当前平台使用的行终止符:os.linesep Windows使用'\r\n',Linux使用'\n'而Mac使用'\r' print(os.linesep) #16. 应为windows和linux的路径有点点不一样,windows是用 \\ 来分割的,linux是用 / 来分隔, #而用os.sep 会自动根据系统选择用哪个分隔符。 print(os.sep) #17. 重命名:os.rename(old, new) #先进入目录 os.chdir("d:\\hello") print os.getcwd() #18. 再重命名 os.rename("1.txt", "11.txt") #19. 创建多级目录:os.makedirs(“c:\python\test”) os.makedirs('d:\h\e\l\l\o') #20. 创建单个目录:os.mkdir(“test”) os.mkdir('d:\f') #21. 获取文件属性:os.stat(file) #print: nt.stat_result(st_mode=33206, st_ino=0L, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=497L, st_atime=1346688000L, st_mtime=1346748054L, st_ctime=1346748052L) print os.stat('d:\hello\json.txt') #22. 修改文件权限与时间戳:os.chmod(path,mode) #这里有介绍:http://blog.csdn.net/wirelessqa/article/details/7974477 #23. 终止当前进程:os.exit() #24. 获取文件大小:os.path.getsize(filename) print os.path.getsize('d:/hello/json.txt')

如果只需要获得单个目录节点的子节点:

os.listdir(rootdir)

基于字符read & write

最基本的文件操作当然就是在文件中读写数据。这也是很容易掌握的。现在打开一个文件以进行写操作:

1. fileHandle = open ( 'test.txt', 'w' )

fileHandle = open ( 'test.txt', 'w' )

‘w'是指文件将被写入数据,语句的其它部分很好理解。下一步就是将数据写入文件:

1. fileHandle.write ( 'This is a test.\nReally, it is.' )

fileHandle.write ( 'This is a test.\nReally, it is.' )

这个语句将“This is a test.”写入文件的第一行,“Really, it is.”写入文件的第二行。最后,我们需要做清理工作,并且关闭文件:

1. fileHandle.close()

fileHandle.close()

正如你所见,在Python的面向对象机制下,这确实非常简单。需要注意的是,当你再次使用“w”方式在文件中写数据,所有原来的内容都会被删除。如果想保留原来的内容,可以使用“a”方式在文件中结尾附加数据:

1. fileHandle = open ( 'test.txt', 'a' ) 2. fileHandle.write ( '\n\nBottom line.' ) 3. fileHandle.close()

fileHandle = open ( 'test.txt', 'a' ) fileHandle.write ( '\n\nBottom line.' ) fileHandle.close()

然后,我们读取test.txt,并将内容显示出来:

1. fileHandle = open ( 'test.txt' ) 2. print fileHandle.read() 3. fileHandle.close()

fileHandle = open ( 'test.txt' ) print fileHandle.read() fileHandle.close()

以上语句将读取整个文件并显示其中的数据。

基于行的读写 line

1. fileHandle = open ( 'test.txt' ) 2. print fileHandle.readline() # "This is a test." 3. fileHandle.close() fileHandle = open ( 'test.txt' ) print fileHandle.readline() # "This is a test." fileHandle.close() 同时,也可以将文件内容保存到一个list中: 1. fileHandle = open ( 'test.txt' ) 2. fileList = fileHandle.readlines() 3. for fileLine in fileList: 4. print '>>', fileLine 5. fileHandle.close() fileHandle = open ( 'test.txt' ) fileList = fileHandle.readlines() for fileLine in fileList: print '>>', fileLine fileHandle.close()

或者在文件中一次读取几个字节的内容:

1. fileHandle = open ( 'test.txt' ) 2. print fileHandle.read ( 1 ) # "T" 3. fileHandle.seek ( 4 ) 4. print FileHandle.read ( 1 ) # " "(原文有错)

fileHandle = open ( 'test.txt' ) print fileHandle.read ( 1 ) # "T" fileHandle.seek ( 4 ) print FileHandle.read ( 1 ) # " "(原文有错)

随机访问文件中的位置 seek

Python在读取一个文件时,会记住其在文件中的位置,如下所示:

1. fileHandle = open ( 'test.txt' ) 2. garbage = fileHandle.readline() 3. fileHandle.readline() # "Really, it is."fileHandle.close()

fileHandle = open ( 'test.txt' ) garbage = fileHandle.readline() fileHandle.readline() # "Really, it is."fileHandle.close()

可以看到,只有第二行显示出来。然而,我们可以让Python从头开始读来解决这个问题:

1. fileHandle = open ( 'test.txt' ) 2. garbage = fileHandle.readline() 3. fileHandle.seek ( 0 ) 4. print fileHandle.readline() # "This is a test." 5. fileHandle.close()

fileHandle = open ( 'test.txt' ) garbage = fileHandle.readline() fileHandle.seek ( 0 ) print fileHandle.readline() # "This is a test." fileHandle.close()

在上面这个例子中,我们让Python从文件第一个字节开始读取数据。所以,第一行文字显示了出来。当然,我们也可以获取Python在文件中的位置:

1. fileHandle = open ( 'test.txt' ) 2. print fileHandle.readline() # "This is a test." 3. print fileHandle.tell() # "17" 4. print fileHandle.readline() # "Really, it is."

fileHandle = open ( 'test.txt' ) print fileHandle.readline() # "This is a test." print fileHandle.tell() # "17" print fileHandle.readline() # "Really, it is."

二进制方式读写

在Windows和Macintosh环境下,有时可能需要以二进制方式读写文件,比如图片和可执行文件。此时,只要在打开文件的方式参数中增加一个“b”即可:

1. fileHandle = open ( 'testBinary.txt', 'wb' ) 2. fileHandle.write ( 'There is no spoon.' ) 3. fileHandle.close()

fileHandle = open ( 'testBinary.txt', 'wb' ) fileHandle.write ( 'There is no spoon.' ) fileHandle.close()

1. fileHandle = open ( 'testBinary.txt', 'rb' ) 2. print fileHandle.read() 3. fileHandle.close()

fileHandle = open ( 'testBinary.txt', 'rb' ) print fileHandle.read() fileHandle.close()

python本身并没有对二进制进行支持,不过提供了一个模块来弥补,就是struct模块。

python没有二进制类型,但可以存储二进制类型的数据,就是用string字符串类型来存储二进制数据,这也没关系,因为string是以1个字节为单位的。

import struct

a=12.34

#将a变为二进制

bytes=struct.pack('i',a)

此时bytes就是一个string字符串,字符串按字节同a的二进制存储内容相同。

再进行反操作

现有二进制数据bytes,(其实就是字符串),将它反过来转换成python的数据类型:

a,=struct.unpack('i',bytes)

注意,unpack返回的是tuple

所以如果只有一个变量的话:

bytes=struct.pack('i',a)

那么,解码的时候需要这样

a,=struct.unpack('i',bytes) 或者 (a,)=struct.unpack('i',bytes)

如果直接用a=struct.unpack('i',bytes),那么 a=(12.34,) ,是一个tuple而不是原来的浮点数了。

如果是由多个数据构成的,可以这样:

a='hello'

b='world!'

c=2

d=45.123

bytes=struct.pack('5s6sif',a,b,c,d)

此时的bytes就是二进制形式的数据了,可以直接写入文件比如 binfile.write(bytes)

然后,当我们需要时可以再读出来,bytes=binfile.read()

再通过struct.unpack()解码成python变量 a,b,c,d=struct.unpack('5s6sif',bytes)

'5s6sif'这个叫做fmt,就是格式化字符串,由数字加字符构成,5s表示占5个字符的字符串,2i,表示2个整数等等,下面是可用的字符及类型,ctype表示可以与python中的类型一一对应。

===============================================================================================

各种系统操作

python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。

得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()

返回指定目录下的所有文件和目录名:os.listdir()

函数用来删除一个文件:os.remove()

删除多个目录:os.removedirs(r“c:\python”)

检验给出的路径是否是一个文件:os.path.isfile()

检验给出的路径是否是一个目录:os.path.isdir()

判断是否是绝对路径:os.path.isabs()

检查是否快捷方式os.path.islink ( filename )

检验给出的路径是否真地存:os.path.exists()

返回一个路径的目录名和文件名:os.path.split() eg os.path.split('/home/swaroop/byte/code/poem.txt') 结果:('/home/swaroop/byte/code', 'poem.txt')

分离扩展名:os.path.splitext()

获取路径名:os.path.dirname()

获取文件名:os.path.basename()

运行shell命令: os.system()

读取和设置环境变量:os.getenv() 与os.putenv()

给出当前平台使用的行终止符:os.linesep Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

指示你正在使用的平台:os.name 对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'

重命名:os.rename(old, new)

创建多级目录:os.makedirs(r“c:\python\test”)

创建单个目录:os.mkdir(“test”)

获取文件属性:os.stat(file)

修改文件权限与时间戳:os.chmod(file)

终止当前进程:os.exit()

获取文件大小:os.path.getsize(filename) 文件操作: os.mknod("test.txt") 创建空文件 fp = open("test.txt",w) 直接打开一个文件,如果文件不存在则创建文件

目录操作:os.mkdir("file") 创建目录 复制文件: shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是文件 shutil.copy("oldfile","newfile") oldfile只能是文件夹,newfile可以是文件,也可以是目标目录 复制文件夹: shutil.copytree("olddir","newdir") olddir和newdir都只能是目录,且newdir必须不存在 重命名文件(目录) os.rename("oldname","newname") 文件或目录都是使用这条命令 移动文件(目录) shutil.move("oldpos","newpos") 删除文件 os.remove("file") 删除目录 os.rmdir("dir")只能删除空目录 shutil.rmtree("dir") 空目录、有内容的目录都可以删 转换目录 os.chdir("path") 换路径

ps: 文件操作时,常常配合正则表达式:

img_dir = img_dir.replace('\\','/')

关于open 模式:

w 以写方式打开, a 以追加模式打开 (从 EOF 开始, 必要时创建新文件) r+ 以读写模式打开 w+ 以读写模式打开 (参见 w ) a+ 以读写模式打开 (参见 a ) rb 以二进制读模式打开 wb 以二进制写模式打开 (参见 w ) ab 以二进制追加模式打开 (参见 a ) rb+ 以二进制读写模式打开 (参见 r+ ) wb+ 以二进制读写模式打开 (参见 w+ ) ab+ 以二进制读写模式打开 (参见 a+ )

fp.read([size]) #size为读取的长度,以byte为单位

fp.readline([size]) #读一行,如果定义了size,有可能返回的只是一行的一部分

fp.readlines([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

fp.write(str) #把str写到文件中,write()并不会在str后加上一个换行符

fp.writelines(seq) #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。

fp.close() #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError

fp.flush() #把缓冲区的内容写入硬盘

fp.fileno() #返回一个长整型的”文件标签“

fp.isatty() #文件是否是一个终端设备文件(unix系统中的)

fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点

fp.next() #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。

fp.seek(offset[,whence]) #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。

fp.truncate([size]) #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

===============================================================================================

存储对象

使用前一节中介绍的模块,可以实现在文件中对字符串的读写。 然而,有的时候,你可能需要传递其它类型的数据,如list、tuple、dictionary和其它对象。在Python中,你可以使用Pickling来完成。你可以使用Python标准库中的“pickle”模块完成数据编组。 下面,我们来编组一个包含字符串和数字的list:

1. import pickle 2. 3. fileHandle = open ( 'pickleFile.txt', 'w' ) 4. testList = [ 'This', 2, 'is', 1, 'a', 0, 'test.' ] 5. pickle.dump ( testList, fileHandle ) 6. fileHandle.close()

import pickle

fileHandle = open ( 'pickleFile.txt', 'w' ) testList = [ 'This', 2, 'is', 1, 'a', 0, 'test.' ] pickle.dump ( testList, fileHandle ) fileHandle.close()

拆分编组同样不难:

1. import pickle 2. 3. fileHandle = open ( 'pickleFile.txt' ) 4. testList = pickle.load ( fileHandle ) 5. fileHandle.close()

import pickle

fileHandle = open ( 'pickleFile.txt' ) testList = pickle.load ( fileHandle ) fileHandle.close()

现在试试存储更加复杂的数据:

1. import pickle 2. 3. fileHandle = open ( 'pickleFile.txt', 'w' ) 4. testList = [ 123, { 'Calories' : 190 }, 'Mr. Anderson', [ 1, 2, 7 ] ] 5. pickle.dump ( testList, fileHandle ) 6. fileHandle.close()

import pickle

fileHandle = open ( 'pickleFile.txt', 'w' ) testList = [ 123, { 'Calories' : 190 }, 'Mr. Anderson', [ 1, 2, 7 ] ] pickle.dump ( testList, fileHandle ) fileHandle.close()

1. import pickle 2. 3. fileHandle = open ( 'pickleFile.txt' ) 4. testList = pickle.load ( fileHandle ) 5. fileHandle.close()

import pickle

fileHandle = open ( 'pickleFile.txt' ) testList = pickle.load ( fileHandle ) fileHandle.close()

如上所述,使用Python的“pickle”模块编组确实很简单。众多对象可以通过它来存储到文件中。如果可以的话,“cPickle”同样胜任这个工作。它和“pickle”模块一样,但是速度更快:

1. import cPickle 2. 3. fileHandle = open ( 'pickleFile.txt', 'w' ) 4. cPickle.dump ( 1776, fileHandle ) 5. fileHandle.close()

import cPickle

fileHandle = open ( 'pickleFile.txt', 'w' ) cPickle.dump ( 1776, fileHandle ) fileHandle.close()

字符串匹配

对于简单的数据,使用流文本文件而不是数据库更简单明了,也就少不了文件操作和字符串匹配的需求。

re模块的search和match方法是匹配到就返回,而不是去匹配所有,而findall()则匹配所有返回数组。  >>> m=re.findall("^a\w+","abcdfa\na1b2c3",re.MULTILINE)  >>> m  ['abcdfa', 'a1b2c3']

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年12月22日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、文件的操作
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档