IO编程
一、文件读写
1、读文件
要以读文件的模式打开一个文件对象,使用Python内置的open()
函数,传入文件名和标示符:
f=open('C:\Python27/README.txt','r')
标示符'r'表示读,这样,我们就成功地打开了一个文件。
如果文件不存在,open()
函数就会抛出一个IOError
的错误:
f=open('C:\Python27/donotREADME.txt','r')
Traceback (most recent call last):
File "C:/…/lx.py", line 1, in <module>
f=open('C:\Python27/donotREADME.txt','r')
IOError: [Errno 2] No such file ordirectory: 'C:\\Python27/donotREADME.txt'
如果文件打开成功,接下来,调用read()
方法可以一次读取文件的全部内容:
f=open('C:\Python27/README.txt','r')
print f.read()
'This is Python version2.7.9\n============================\n\nCopyright…
f.read()#调用close()方法关闭文件
为了保证无论是否出错都能正确地关闭文件,我们可以使用try ...finally
来实现:
try:
f=open('/path/to/file','r')
print f.read()
finally:
if f:
f.close()
每次都这么写实在太繁琐,所以,Python引入了with
语句来自动帮我们调用close()
方法:
with open('C:\Python27/README.txt','r') as f:
print f.read()
调用read()
会一次性读取文件的全部内容,如果文件较大,要保险起见,可以反复调用read(size)
方法,每次最多读取size个字节的内容。另外,调用readline()
可以每次读取一行内容,调用readlines()
一次读取所有内容并按行返回list
。
2、二进制文件
要读取二进制文件,比如图片、视频等等,用'rb'
模式打开文件即可:
f=open('C:\Python27/test.jpg','rb')
f.read()
3、字符编码
要读取非ASCII编码的文本文件,就必须以二进制模式打开,再解码。比如GBK编码的文件:
f = open('C:\Python27/NEWS.txt', 'rb')
u = f.read().decode('gbk')
print u
Python还提供了一个codecs
模块帮我们在读文件时自动转换编码,直接读出unicode:
import codecs
with codecs.open('C:\Python27/NEWS.txt','r','gbk')as f:
f.read()
4、写文件
写文件和读文件是一样的,唯一区别是调用open()
函数时,传入标识符'w'
或者'wb'
表示写文本文件或写二进制文件
二、操作文件和目录
1、环境变量
>>> os.environ
{'TMP': 'C:\\DOCUME~1\\ADMINI~1\\LOCALS~1\\Temp', 'PYTHONIOENCODING': 'UTF-8', 'COMPUTERNAME': 'SG8HYXREBVSOT6Q', …}
要获取某个环境变量的值,可以调用os.getenv()
函数
2、操作文件和目录
# 查看当前目录的绝对路径:
>>> os.path.abspath('.') '/Users/michael' # 在某个目录下创建一个新目录, # 首先把新目录的完整路径表示出来: >>> os.path.join('/Users/michael','testdir') '/Users/michael/testdir' # 然后创建一个目录: >>> os.mkdir('/Users/michael/testdir') # 删掉一个目录: >>> os.rmdir('/Users/michael/testdir')
把两个路径合成一个时,不要直接拼字符串,而要通过os.path.join()函数
要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数
三、序列化
Python提供两个模块来实现序列化:cPickle和pickle。这两个模块功能是一样的
先尝试导入cPickle,如果失败,再导入pickle:
try: importcPickle as pickle except ImportError: importpickle
把一个对象序列化并写入文件:
>>> d = dict(name='Bob', age=20,score=88) >>> pickle.dumps(d) "(dp0\nS'age'\np1\nI20\nsS'score'\np2\nI88\nsS'name'\np3\nS'Bob'\np4\ns."
pickle.dumps()方法把任意对象序列化成一个str,然后,就可以把这个str写入文件。或者用另一个方法pickle.dump()
直接把对象序列化后写入一个file-like Object:
>>> f = open('dump.txt', 'wb') >>> pickle.dump(d, f) >>> f.close()
这个教程看的非常艰难和痛苦,需要找一本正经的教材来学习,也在看视频教程,相对思路就很清晰,好懂。
这是最后一篇笔记,做的不是和认真,学了十几天了才开始接触pycharm,相见恨晚。求扩散一下: