前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python爬虫基础讲解(八):数据持久化——文件操作

Python爬虫基础讲解(八):数据持久化——文件操作

作者头像
松鼠爱吃饼干
发布2021-09-24 10:41:40
4090
发布2021-09-24 10:41:40
举报
文章被收录于专栏:Python分享Python分享

计算机的文件,就是存储在某种长期储存设备上的一段数据长期存储设备包括:硬盘、U盘、移动硬盘、光盘...

文本文件和二进制文件

文本文件:

  • 可以使用文本编辑软件查看o本质上还是二进制文件
  • 例如: python的源程序

二进制文件:

  • 保存的内容不是给人直接阅读的,而是提供给其他软件使用的。
  • 例如:图片文件、音频文件、视频文件等等
  • 二进制文件不能使用文本编辑软件查看

1. 文件的基本操作

操作文件的函数/方法

在Python中要操作文件需要记住1个函数和3个方法

  • open函数负责打开文件,并且返回文件对象
  • read / write/ close三个方法都需要通过文件对象来调用

1. 1读取文件

代码语言:javascript
复制
open

函数的第一个参数是要打开的文件名(文件名区分大小写)

  • 如果文件存在,返回文件操作对象
  • 如果文件不存在,会抛出异常
  • read方法可以一次性读入并返回文件的所有内容
  • close方法负责关闭文件 如果忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问
  • 注意:read方法执行后,会把文件指针移动到文件的末尾
代码语言:javascript
复制
# 1.打开-文件名需要注意大小写
file = open("README")

#2.读取
text = file.read()
print(text)

#3.关闭
file.close()

1.2 打开文件的方式

open函数默认以只读方式打开文件,并且返回文件对象 语法如下:

代码语言:javascript
复制
f = open("文件名","访问方式")

提示

  • 频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以只读、只写的方式来操作文件

写入文件示例

代码语言:javascript
复制
#打开文件
f = open ("README","w")

f.write( "he17o python! \n")
f.write("今天天气真好")

#关闭文件
f.close()

1.3按行读取文件内容

  • read()方法 默认会把文件的所有内容一次性读取到内存。如果文件太大,对内存的占用会非常严重。
  • readline方法 readline方法可以一次读取一行内容。方法执行后,会把文件指针移动到下一行,准备再次读取。 这是读取大文件的正确姿势。

2. 目录操作

  • 在终端/文件浏览器、中可以执行常规的文件/目录管理操作,例如: 创建、重命名、删除、改变路径、查看目录内容、…….
  • 在Python中,如果希望通过程序实现上述功能,需要导入os模块

2.1 文件操作

2.2 目录操作

提示:文件或者目录操作都支持相对路径和绝对路径

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-09-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 松鼠爱吃饼干 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文本文件和二进制文件
  • 1. 文件的基本操作
    • 1. 1读取文件
      • 1.2 打开文件的方式
        • 1.3按行读取文件内容
        • 2. 目录操作
          • 2.1 文件操作
            • 2.2 目录操作
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档