专栏首页机器学习与统计学Python学习 Day 13 IO编程 (最后一篇 明天换教材)

Python学习 Day 13 IO编程 (最后一篇 明天换教材)

IO编程

一、文件读写

1、读文件

要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符:

f=open('C:\Python27/README.txt','r')

标示符'r'表示读,这样,我们就成功地打开了一个文件。

如果文件不存在,open()函数就会抛出一个IOError的错误:

f=open('C:\Python27/donotREADME.txt','r')

Traceback (most recent call last):

File "C:/…/lx.py", line 1, in <module>

f=open('C:\Python27/donotREADME.txt','r')

IOError: [Errno 2] No such file ordirectory: 'C:\\Python27/donotREADME.txt'

如果文件打开成功,接下来,调用read()方法可以一次读取文件的全部内容:

f=open('C:\Python27/README.txt','r')
print f.read()

'This is Python version2.7.9\n============================\n\nCopyright…

f.read()#调用close()方法关闭文件

为了保证无论是否出错都能正确地关闭文件,我们可以使用try ...finally来实现:

try:
    f=open('/path/to/file','r')
    print f.read()
finally:
    if f:
        f.close()

每次都这么写实在太繁琐,所以,Python引入了with语句来自动帮我们调用close()方法:

with open('C:\Python27/README.txt','r') as f:
    print f.read()

调用read()会一次性读取文件的全部内容,如果文件较大,要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。另外,调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list

2、二进制文件

要读取二进制文件,比如图片、视频等等,用'rb'模式打开文件即可:

f=open('C:\Python27/test.jpg','rb')
f.read()

3、字符编码

要读取非ASCII编码的文本文件,就必须以二进制模式打开,再解码。比如GBK编码的文件:

f = open('C:\Python27/NEWS.txt', 'rb')
u = f.read().decode('gbk')
print u

Python还提供了一个codecs模块帮我们在读文件时自动转换编码,直接读出unicode:

import  codecs
with codecs.open('C:\Python27/NEWS.txt','r','gbk')as f:
    f.read()

4、写文件

写文件和读文件是一样的,唯一区别是调用open()函数时,传入标识符'w'或者'wb'表示写文本文件或写二进制文件

二、操作文件和目录

1、环境变量

>>> os.environ
{'TMP': 'C:\\DOCUME~1\\ADMINI~1\\LOCALS~1\\Temp', 'PYTHONIOENCODING': 'UTF-8', 'COMPUTERNAME': 'SG8HYXREBVSOT6Q', …}

要获取某个环境变量的值,可以调用os.getenv()函数

2、操作文件和目录

# 查看当前目录的绝对路径:

>>> os.path.abspath('.') '/Users/michael' # 在某个目录下创建一个新目录, # 首先把新目录的完整路径表示出来: >>> os.path.join('/Users/michael','testdir') '/Users/michael/testdir' # 然后创建一个目录: >>> os.mkdir('/Users/michael/testdir') # 删掉一个目录: >>> os.rmdir('/Users/michael/testdir')

把两个路径合成一个时,不要直接拼字符串,而要通过os.path.join()函数

要拆分路径时,也不要直接去拆字符串,而要通过os.path.split()函数

三、序列化

Python提供两个模块来实现序列化:cPickle和pickle。这两个模块功能是一样的

先尝试导入cPickle,如果失败,再导入pickle:

try: importcPickle as pickle except ImportError: importpickle

把一个对象序列化并写入文件:

>>> d = dict(name='Bob', age=20,score=88) >>> pickle.dumps(d) "(dp0\nS'age'\np1\nI20\nsS'score'\np2\nI88\nsS'name'\np3\nS'Bob'\np4\ns."

pickle.dumps()方法把任意对象序列化成一个str,然后,就可以把这个str写入文件。或者用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object:

>>> f = open('dump.txt', 'wb') >>> pickle.dump(d, f) >>> f.close()

这个教程看的非常艰难和痛苦,需要找一本正经的教材来学习,也在看视频教程,相对思路就很清晰,好懂。

这是最后一篇笔记,做的不是和认真,学了十几天了才开始接触pycharm,相见恨晚。求扩散一下:

本文分享自微信公众号 - 机器学习与统计学(tjxj666)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-05-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【笨办法学Python】习题15读取文件

    我们要做的是把该文件用我们的脚本“打开(open)”,然后打印出来。然而把文件名ex15_sample.txt 写死(hardcode)在代码中不是一个好意,这...

    统计学家
  • 机 器 学 习 中 的 数 学 意 义

    机器学习中的用于声称性能的指标标准很少被讨论。由于在这个问题上似乎没有一个明确的、广泛的共识,因此我认为提供我一直在倡导并尽可能遵循的标准可能会很有趣。它源于这...

    统计学家
  • 深度学习优化背后的数学基础

    一般而言,神经网络的整体性能取决于几个因素。通常最受关注的是网络架构,但这只是众多重要元素之一。还有一个常常被忽略的元素,就是用来拟合模型的优化器。

    统计学家
  • Python文件处理入门篇

    昨天分享了一个关于文件搜索的小实战项目,其实文件处理是Python里面非常重要的一块内容,知识点很多,Python对本地文件的处理,主要是通过文件的读和写来完成...

    stormwen
  • 在Linux最大打开文件数限制下 MySQL 对参数的调整

    非root用户运行MySQL,当MySQL配置比较高时,MySQL运行中生效的参数值与配置的值不一样。 这篇文章的目的是为了说明在系统资源不够的情况下,MySQ...

    二狗不要跑
  • HDFS元数据管理:fsimage&edits

    介绍HDFS的元数据管理机制,说明fsimage文件和edits的作用,给出解析fsimage文件和edits文件的demo

    Eights
  • 逆向课程第五讲逆向中的优化方式,除法原理,以及除法优化下

            逆向课程第五讲逆向中的优化方式,除法原理,以及除法优化下 一丶除法的优化 1.有符号被除数 / 无符号除数的情况下 高级代码为: ? 汇编中优化...

    IBinary
  • Linux进价命令

    sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲...

    呼延十
  • 使用 Moq 测试.NET Core 应用 -- Mock 属性

    第一篇文章, 关于Mock的概念介绍: https://www.cnblogs.com/cgzl/p/9294431.html

    solenovex
  • overlayfs存储驱动的使用以及技术探究

    overlayfs存储驱动的使用以及技术探究 1.overlayfs 基本概念 一种联合文件系统,设计简单,速度更快。overlayfs在linux主机上只有两...

    BGBiao

扫码关注云+社区

领取腾讯云代金券