Python进阶三部曲之IO操作

写在前面:前几天准备做数据分析,发现没有数据来源,于是我不得不准备爬虫方面的教程了。

IO操作,多线程进程分布式,网络编程等三部曲爬虫做一些准备。

IO编程

文件读写

打开文件

open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)具体需要查看API,这里只介绍几个常用的方法。

open函数的文件名是必传参数,返回一个文件对象

#打开一个文件。
f = open('read.txt', 'r')

open函数的mode参数:

功能描述

'r'

读模式

'w'

写模式

'a'

追加模式

'b'

二进制模式

'+'

读/写模式

b参数一盘处理文本文件时是用不到b参数,便但处理其它类型的文件(二进制文件,)比如mp3或者图像,那么应该在模式参数中添加b

buffering,文件缓冲区:

缓冲区,默认是无缓冲区,

  1. 如果参数是0,IO操作就是无缓冲,直接将数据写在硬盘上,
  2. 如果参数是1,IO操作就是有缓冲,数据先写到内存里,只有使用,flush函数,或者close函数,才会将数据更新到硬盘中,
  3. 如果参数大于天,则表示缓冲区的大小(单位是字节),-1(或者是任何负数)代表使用默认缓冲区的大小,

文件读取,

  1. 文件读取主要分为按字节读取和按行进行读取,常用的方法有read(),readlines(),close()
  2. 如果成功打开文本文件,接下来调用read()方法则可以一次性将文件内容,全部写入到内存中,最后返回的是str类型的对象: f.read()
  3. 调用close()可以关闭对文件的引用,文件使用完后必须关闭,因为文件对象会占用系统资源,影响系统IO操作。

由于文件操作可能会出现IO异常,一旦出现IO异常,后面的close()方法就不会调用。所以为了保证程序的健壮性,我们需要使用try...finally来实现。

try:
    f = open('read.txt', 'r')
    print(f.read())
finally:
    if f:
        f.close()

python提供了一种简单的写法,使用with语句来替代try...finally代码块和close()方法。

with open('read.txt', 'r') as fileReader:
    print(fileReader.read())

由于可能会出现文件过大,将会出现内存不足,python提供更加合理的做法,调用readline()来每次读一行内容。

  • 小文件可以直接采取read()方法读取到内存中,
  • 大文件更加安全的方式是连续使用read(size)
  • 对于配置文件等文本文件,使用readline()更加合理。
with open('read.txt', 'r') as fileReader:
    for line in fileReader.readlines():
        print(line.strip())
        
得到结果:
1
2
3
4
5
6
7
8
9        

文件写入

推荐写法:

with open('read.txt', 'w') as fileWriter:
    for num in range(1, 100):
        fileWriter.write(str(num)+'\n')        

原文发布于微信公众号 - Python绿色通道(Future_coder)

原文发表时间:2017-10-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏coding

Linux笔记4.重定向及管道

1825
来自专栏Debian社区

Linux 系统 vim 编辑器使用简明教程

vi(vim)是上Linux非常常用的代码编辑器,很多Linux发行版都默认安装了vi(vim)。vi(vim)命令繁多但是如果使用灵活之后将会大大提高效率。v...

1377
来自专栏Python小屋

详解Python项目开发时自定义模块中对象的导入和使用

背景:1)任何一个Python程序文件既可以直接执行,也可以作为模块导入再使用其中的对象;2)对于大型系统开发,一般不会把所有代码放到单个文件中,而是根据功能将...

3895
来自专栏IT派

Python 的异步 IO:Asyncio 简介

所谓「异步 IO」,就是你发起一个 IO 操作,却不用等它结束,你可以继续做其他事情,当它结束时,你会得到通知。

1153
来自专栏大内老A

[WCF 4.0新特性] 标准终结点与无(.SVC)文件服务激活

今天介绍WCF 4.0的另外两个新特性:标准终结点(Standard Endpoint)和无(.SVC)文件服务激活(File-Less Activation)...

24310
来自专栏python学习之旅

Python笔记(十三):urllib模块

(一)      URL地址 URL地址组件 URL组件 说明 scheme 网络协议或下载方案 net_loc ...

2986
来自专栏coding

python的多进程与多fork

1543
来自专栏Charlie's Road

<Solidity学习系列二>深入理解Solidity之二---Solidity源代码文件结构

版本Pragma 源文件可以(也应该)用所谓的版本注释来注释,以拒绝被编译为未来可能引入不兼容更改的编译器版本。 我们试图将这种变化保持在绝对最低限度,特别是引...

821
来自专栏高性能服务器开发

(一)Redis结构解析

从今天起,本人将会展开对Redis源码的学习,Redis的代码规模比较小,非常适合学习,是一份非常不错的学习资料,数了一下大概100个文件左右的样子,用的是C...

2934
来自专栏小白课代表

文件搜索利器——Everything

2742

扫码关注云+社区

领取腾讯云代金券