前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python12 文件操作

Python12 文件操作

作者头像
py3study
发布2020-01-09 11:33:09
5670
发布2020-01-09 11:33:09
举报
文章被收录于专栏:python3python3

文件操作

image_1c0ag46vu1lqg1ievebs1kmh4gc9.png-5.4kB
image_1c0ag46vu1lqg1ievebs1kmh4gc9.png-5.4kB

Pycharm使用UTF-8格式,而Windows默认是GBK格式,所以默认pycharm是处理不了BGK格式的,所以要要定义使用UTF-8格式打开Windows文件的内容。

.read():读取文件所有内容。

image_1c0ag5e9f13v91nofo3mek0fcam.png-18.3kB
image_1c0ag5e9f13v91nofo3mek0fcam.png-18.3kB
image_1c0ag8ico1udedpat5t1pj2c5713.png-8.6kB
image_1c0ag8ico1udedpat5t1pj2c5713.png-8.6kB

同样是读取文件内容,但是print(data2)时没有任何数据显示,这是因为data1读取完成的时候,光标位置处于test.txt文档中的最下面,所以当data2再去读取时,下面已经没有数据了。

1.读写

image_1c0agba2m1cnahau1uga11efnds1g.png-9.2kB
image_1c0agba2m1cnahau1uga11efnds1g.png-9.2kB
image_1c0agbg9h1682lti114j11to1hc81t.png-12kB
image_1c0agbg9h1682lti114j11to1hc81t.png-12kB

报错没有写入的权限。

image_1c0agbrqf1vt01r70158013cp1llr2a.png-9.5kB
image_1c0agbrqf1vt01r70158013cp1llr2a.png-9.5kB

使用’r’赋予只读权限,不写的话默认就是只读。

image_1c0agcehl1d7819dtnb91ln1il2n.png-11.9kB
image_1c0agcehl1d7819dtnb91ln1il2n.png-11.9kB

因为是只读所以不能写入

image_1c0agcrk71rvdg7626moee18qv34.png-9.3kB
image_1c0agcrk71rvdg7626moee18qv34.png-9.3kB

将其赋予写入权限

image_1c0agdm0lqhf142ghg4lbbjtb3h.png-11.2kB
image_1c0agdm0lqhf142ghg4lbbjtb3h.png-11.2kB

可以看到只能写入,却不能读取(代码中有读取的动作)。

image_1c0age4vt1194t851im61atj1s5j3u.png-9.3kB
image_1c0age4vt1194t851im61atj1s5j3u.png-9.3kB
image_1c0agec7o1klj1vp2r81oku1u2e4b.png-4.4kB
image_1c0agec7o1klj1vp2r81oku1u2e4b.png-4.4kB

可以看到test文档已经被写入内容了,但是内容却都写在了同一行。

image_1c0agg7uu18dbhfpkro1g6f1k2l6o.png-10kB
image_1c0agg7uu18dbhfpkro1g6f1k2l6o.png-10kB

\n表示换行符 f.close(),写入内容后需要关闭文档,关闭后自动保存。

image_1c0aghb6urm4ju41v5g3vv1nom75.png-4.6kB
image_1c0aghb6urm4ju41v5g3vv1nom75.png-4.6kB

注意’w’权限会覆盖之前有的内容。

image_1c0aghok91qpa23h1hq1phv19ig7i.png-6.9kB
image_1c0aghok91qpa23h1hq1phv19ig7i.png-6.9kB
image_1c0aghv4prj5i8229rbbga5a7v.png-2.7kB
image_1c0aghv4prj5i8229rbbga5a7v.png-2.7kB

可以看到文档中直接了内容,并不会覆盖。

image_1c0agkg6q1bdf1kldikb12gt18b58c.png-9.1kB
image_1c0agkg6q1bdf1kldikb12gt18b58c.png-9.1kB

每一行定义一个数字

image_1c0agkskufhb1un3doi1mm16k18p.png-15.7kB
image_1c0agkskufhb1un3doi1mm16k18p.png-15.7kB
image_1c0agl2f46fo9i5lma1lu014md96.png-1.5kB
image_1c0agl2f46fo9i5lma1lu014md96.png-1.5kB

读取了多行的内容,但是这样写的代码太多,可以使用循环替代重复代码

image_1c0agllfk12r1tf76n217621d9e9j.png-8.5kB
image_1c0agllfk12r1tf76n217621d9e9j.png-8.5kB

2.readlines

image_1c0agmpr2ubn1n6rbvilvta2a0.png-6.3kB
image_1c0agmpr2ubn1n6rbvilvta2a0.png-6.3kB
image_1c0agmun11mffn91134g9fdg41ad.png-3kB
image_1c0agmun11mffn91134g9fdg41ad.png-3kB

可以看到以列表的形式,将每一行的列表元素在同一行打印出来。

image_1c0agnb3s8l1adj1pjg1tg516foaq.png-7.7kB
image_1c0agnb3s8l1adj1pjg1tg516foaq.png-7.7kB
image_1c0agnh3o1vd21ijga2l1ihnfp8b7.png-1.6kB
image_1c0agnh3o1vd21ijga2l1ihnfp8b7.png-1.6kB

将列表的每一个元素分行打印出来,但是可以看到打印的时候将\n也打印出来了,所以显示的时候会有空行。

image_1c0agnucbhgs1m4mrhal0g179fbk.png-8.7kB
image_1c0agnucbhgs1m4mrhal0g179fbk.png-8.7kB
image_1c0ago5f01s26154rvlj1khpku7c1.png-2.2kB
image_1c0ago5f01s26154rvlj1khpku7c1.png-2.2kB

可以看到,通过strip分隔了空行(也就是删除,因为括号中是空格所以删除所有空格,如果是其他字符就删除对应的所有字符),显示就正常了。

image_1c0agp77r1k0gjgkfelarf55kdr.png-25kB
image_1c0agp77r1k0gjgkfelarf55kdr.png-25kB
image_1c0agone810fh1qaa1ovoipc14t0cu.png-4.2kB
image_1c0agone810fh1qaa1ovoipc14t0cu.png-4.2kB
  • readlines的缺点 Readlines会读取文件的所有内容,并将读取的内容放入到内存中,读取的文件小的话内存是可以接受的,但是如果读取的文件过大,超过了内存的大小就不可以了(比如内存8G,你的文件有20G)。
image_1c0agqv9dru13v7p3e11gh18qse8.png-9.9kB
image_1c0agqv9dru13v7p3e11gh18qse8.png-9.9kB

解决方法就是直接使用for循环就可以了

这种方式就是读取一行后,打印一行,在打印下一行前会把之前打印的内容在内存中删除,这样内存中就始终保存一行的内容,不会占据过大内存。

内存只保存一行是因为f打开的文件编程了一个叫迭代器的东西,迭代器后面会讲。

不使用readlines读取,显示的内容就不在会是列表了,也就无法将文档中的下标读取出来了,就没办法在通过匹配下标的方式去针对达到指定行进行操作了。 可以通过使用计数器来判断读取文档到多少行了。

image_1c0ags7ed1mfr1a0e133avu81fkhel.png-17.5kB
image_1c0ags7ed1mfr1a0e133avu81fkhel.png-17.5kB
image_1c0agspoq1rn8irme6r1aqaauuf2.png-4.2kB
image_1c0agspoq1rn8irme6r1aqaauuf2.png-4.2kB

### 3.文件修改

image_1c0agtjoe1k941vtr112hhp91rg4ff.png-22kB
image_1c0agtjoe1k941vtr112hhp91rg4ff.png-22kB

F_1是旧文件 F_2是新文件 要求:通过读取旧文件的指定内容,将其修改并写入新的文件中;如果没有读取到指定内容,也将新内容写入到新文件中。 代码含义:如果发现小明要去玩内容在文件中,就通过replace替换关键字;如果没有发现指定内容,根据else代码直接写入新文件中。 但是此代码中可以看到,出现了重复代码f_2.write(line)

image_1c0agu43ad1a6srj7j1k3fhabfs.png-18.5kB
image_1c0agu43ad1a6srj7j1k3fhabfs.png-18.5kB

只需要将缩进等级调整一下,如果发现指定内容就进行替换,之后会将替换内容写入到新文件。 即使没有发现指定内容,那么就不需要他换,直接将循环到旧文件的内容写入到新文件。

image_1c0aguh9a1m4a4rhv11oc71t17g9.png-25kB
image_1c0aguh9a1m4a4rhv11oc71t17g9.png-25kB

也可以将要查找和替换的信息赋值变量,然后用变量名称来代替。

4.with语句

image_1c0ah05i51lsgo4h19gabms1fl3gm.png-8.4kB
image_1c0ah05i51lsgo4h19gabms1fl3gm.png-8.4kB

使用with语句可以在该语句模块最后不适用close来关闭文件,因为with语句最后会自动关闭; 这里的as f,相当于f = open…….

image_1c0ah0hqtgu1r411u0h18cks24h3.png-0.8kB
image_1c0ah0hqtgu1r411u0h18cks24h3.png-0.8kB
image_1c0ah0p31fgkn1ohsi1hgq15aahg.png-12.5kB
image_1c0ah0p31fgkn1ohsi1hgq15aahg.png-12.5kB

可以通过with同时打开多个文件; 从代码中可以看出是分了多行来打开多个文件,其实也可以在同一行来打开,只不过python官网的开发规范说明了一行的开发代码不应该超过80个字符,当同时打开多个文件时,可能就超过了限制的80个字符,所以这里我们没打开一个文件就换一行来写代码。

总结

r只读

w只写(覆盖)

a追加(最后一行)

r+读写(读后可以写,如果是写就是追加到最后一行)

w+写读(覆盖后可以读)

a+追加写读

rb使用二进制模式打开(打开的数据都是bytes格式)

wb通过bytes的格式写入,如果使用过wb必须制定字符集(如:encoding='utf-8'),当夸系统平台时会用到二进制数据。

ab用二进制追加

seek:重置读取的下标位置到最顶

tell:查看当前下标的位置

truncate():截断剩下的字符串(剩下也就是还没读取的),默认截断后面所有,括号中指定数字就是指定多少个字符。

flush():一般文件需要关闭后才换刷新缓冲区将内容写入文件,但是用flush后不需要等文件关闭,直接指定缓冲,将内容写入文件

文件还有很多其他方法:

image_1c0ah39qc13q24r2hs6p789ebht.png-75.5kB
image_1c0ah39qc13q24r2hs6p789ebht.png-75.5kB
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-08-24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文件操作
  • 1.读写
  • 2.readlines
  • 4.with语句
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档