首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python基础教程11.1 打开文件

到目前为止, 我们使用的主要是解释器自带的数据结构,程序与外部的交互很少,且都是通过input和print进行的。本章将更进一步,让程序能够与更大的外部世界交互:文件和流。本章介绍的函数和对象让你能够永久存储数据以及处理来自其他程序的数据。

11.1 打开文件

要打开文件,可使用函数open,它位于自动导入的模块io中。函数open将文件名作为唯一必不可少的参数,并返回一个文件对象。如果当前目录中有一个名为somefile.txt的文本文件(可能是使用文本编辑器创建的),则可像下面这样打开它:

>>> f = open('somefile.txt')

如果文件位于其他地方,可指定完整的路径。如果指定的文件不存在,将看到类似于下面的异常:

Traceback (most recent call last):

File "", line 1, in

FileNotFoundError: [Errno 2] No such file or directory: 'somefile.txt'

如果要通过写入文本来创建文件,这种调用函数open的方式并不能满足需求。为解决这种问题,可使用函数open的第二个参数。

文件模式

调用函数open时,如果只指定文件名,将获得一个可读取的文件对象。如果要写入文件,必须通过指定模式来显式地指出这一点。函数open的参数mode的可能取值有多个,表11-1对此进行了总结。

表11-1 函数open的参数mode的最常见取值

值 描 述

'r' 读取模式(默认值)

'w' 写入模式

'x' 独占写入模式

'a' 附加模式

'b' 二进制模式(与其他模式结合使用)

't' 文本模式(默认值,与其他模式结合使用)

'+' 读写模式(与其他模式结合使用)

显式地指定读取模式的效果与根本不指定模式相同。写入模式让你能够写入文件,并在文件不存在时创建它。独占写入模式更进一步,在文件已存在时引发FileExistsError异常。在写入模式下打开文件时,既有内容将被删除(截断),并从文件开头处开始写入;如果要在既有文件末尾继续写入,可使用附加模式。

'+'可与其他任何模式结合起来使用,表示既可读取也可写入。例如,要打开一个文本文件进行读写,可使用'r+'。(你可能还想结合使用seek,详情请参阅本章后面的旁注“随机存取”。)请注意, 'r+'和'w+'之间有个重要差别:后者截断文件,而前者不会这样做。

默认模式为'rt',这意味着将把文件视为经过编码的Unicode文本,因此将自动执行解码和编码,且默认使用UTF-8编码。要指定其他编码和Unicode错误处理策略,可使用关键字参数encoding和errors。(有关Unicode的详细信息,请参阅第1章。)这还将自动转换换行字符。默认情况下,行以'\n'结尾。读取时将自动替换其他行尾字符('\r'或'\r\n');写入时将'\n'替换为系统的默认行尾字符(os.linesep)。

通常, Python使用通用换行模式。在这种模式下,后面将讨论的readlines等方法能够识别所有合法的换行符('\n'、 '\r'和'\r\n')。如果要使用这种模式,同时禁止自动转换,可将关键字参数newline设置为空字符串,如open(name, newline='')。如果要指定只将'\r'或'\r\n'视为合法的行尾字符,可将参数newline设置为相应的行尾字符。这样,读取时不会对行尾字符进行转换,但写入时将把'\n'替换为指定的行尾字符。

如果文件包含非文本的二进制数据,如声音剪辑片段或图像,你肯定不希望执行上述自动转换。为此,只需使用二进制模式(如'rb')来禁用与文本相关的功能。

还有几个更为高级的可选参数,用于控制缓冲以及更直接地处理文件描述符。要获取有关这些参数的详细信息,请参阅Python文档或在交互式解释器中运行help(open)。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190126G05PIT00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券