前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python基础语法——文件与库

python基础语法——文件与库

作者头像
鲜于言悠
发布2024-03-20 16:26:56
570
发布2024-03-20 16:26:56
举报
文章被收录于专栏:c/c++的学习笔记c/c++的学习笔记
基础语法

前言

本文基于pycharm编译器,也可以使用Anaconda 里的编译器,将讲解一些python的一些基础语法知识,是对上篇文章的补充.


文件

文件是什么

文件是计算机中存储数据的一种方式,指计算机中用来存储数据、程序、图像、音频、视频等的一种信息存储单位。

文件可以包含多种格式的数据和不同类型的内容,如文本、图像、音频、视频等,其文件格式也是多种多样的,例如TXT、PDF、JPG、MP3、MP4等。 文件通常存储在计算机硬盘、U盘、移动硬盘等存储设备中,用户可以通过文件管理器或专业软件等方式进行管理和使用。

内存和硬盘都是计算机存储数据的设备。内存是临时存储设备,也被称为随机访问存储器(RAM),其作用是存储系统正在运行的程序和处理数据所需的临时数据。当程序被关闭或计算机被关闭时,内存中的数据就会被清除。硬盘是永久性存储设备,也被称为持久性存储器。它存储着计算机的操作系统、程序文件、文档、图片、音乐等文件,不会因为计算机关闭而丢失。内存和硬盘之间的关系是:计算机在运行程序时,会将程序及其需要处理的数据从硬盘中加载到内存中,然后在内存中进行处理和运行。当程序运行完毕后,计算机将数据再次写回硬盘,以便后续使用。因此,内存和硬盘在计算机运作过程中密不可分,两者的协调使用可以提高计算机的运行速度和效率。

  1. 内存的空间更小,硬盘空间更大
  2. 内存访问更快,硬盘访问更慢
  3. 内存成本更贵,硬盘成本更便宜
  4. 内存的数据易失,硬盘的数据持久化存储.

数据都是保存在硬盘上的

文件路径

一个机器上, 会存在很多文件,为了让这些文件更方面的被组织,往往会使用很多的"文件夹"(也叫做目录)来整理文件. 实际一个文件往往是放在一系列的目录结构之中的.

为了方便确定一个文件所在的位置使用文件路径来进行描述

例如,QQ.exe这个文件,描述这个文件的位置,就可以使用路径"D:\QQ\Bin\QQ.exe"来表示. D: 表示 盘符. 不区分大小写.

每一个\ 表示一级目录. 当前 QQ.exe 就是放在"D 盘下的QQ目录下的 Bin 目录中".

目录之间的分隔符,可以使用\ 也可以使用 /.一般在编写代码的时候使用 / 更方便.

上述以 盘符 开头的路径, 我们也称为 绝对路径.除了绝对路径之外,还有一种常见的表示方式是 相对路径,相对路径需要先指定一个基准目录,然后以基准目录为参照点,间接的找到目标文件.

描述一个文件的位置, 使用 绝对路径 和 相对路径 都是可以的. 对于新手来说,使用 绝对路径更简单更好理解,也不容易出错.

文件操作

要使用文件, 主要是通过文件来保存数据,并且在后续把保存的数据读取出来.

但是要想读写文件,需要先 “打开文件”,读写完毕之后还要 “关闭文件”.

在计算机,把远程操纵的“遥控器”称为句柄

1.打开文件

使用内建函数 open 打开一个文件.

代码语言:javascript
复制
f = open('d:/test.txt', 'r')

第一个参数是一个字符串,表示要打开的文件路径

第二个参数是一个字符串,表示打开方式. 其中 r 表示按照读方式打开.w 表示按照写方式打开. a 表示追加写方式打开.

如果打开文件成功,返回一个文件对象. 后续的读写文件操作都是围绕这个文件对象展开. 如果打开文件失败(比如路径指定的文件不存在),就会抛出异常.

  • 'r':只读模式,在该模式下打开的文件只能读取,不能修改和写入。
  • 'w':写入模式,在该模式下打开的文件可供写入,如果该文件已经存在,则会清空原有内容,如果不存在,则会创建新文件。
  • 'a':追加模式,在该模式下打开的文件可以在文件末尾进行写入。

以下是打开文件并读取其内容的代码示例:

代码语言:javascript
复制
# 打开文件
file = open("example.txt", "r")

# 读取文件内容
content = file.read()

# 输出内容
print(content)

# 关闭文件
file.close()

在读取完文件后,一定要记得关闭文件,避免造成资源浪费和文件损坏。

2. 关闭文件
  • 使用 close 方法关闭已经打开的文件.
代码语言:javascript
复制
f.close()

使用完毕的文件要记得及时关闭!

  • 一个程序能同时打开的文件个数, 是存在上限的.
代码语言:javascript
复制
# 打开文件个数的上限
flist = []
count = Θ
while True:
	f = open('d:/Python环境/test.txt', 'r')
	flist.append(f)
	count += 1
print(f'打开文件的个数: {count}')

在系统中可以通过设置,来改变打开文件的上限

  • 在Python中关闭文件的语法是:file_object.close()。

例如,在打开一个名为"example.txt"的文件并读取文件中的内容后,需要关闭文件,可以使用以下代码:

代码语言:javascript
复制
file = open("example.txt", "r")
content = file.read()
print(content)
file.close()   # 关闭文件

在关闭文件之前,建议始终使用file.closed方法先检查文件是否已经关闭,以避免出现错误。

3.写文件

文件打开之后, 就可以写文件了. 写文件, 要使用写方式打开,open 第二个参数设为

  • 使用 write 方法写入文件.
代码语言:javascript
复制
f = open('d:/test.txt', 'w')
f.write('hello')
f.close()

用记事本打开文件, 即可看到文件修改后的内容.

  • 如果是使用 ‘r’ 方式打开文件,则写入时会抛出异常.
代码语言:javascript
复制
f = open('d:/test.txt', 'r')
f.write('hello')
f.close()

使用’w’一旦打开文件成功,就会清空文件原有的数据.

  • 使用 ‘a’ 实现"追加写",此时原有内容不变,写入的内容会存在于之前文件内容的末尾.
代码语言:javascript
复制
f = open('d:/test.txt', 'w')
f.write('hello')
f.close()
f = open('d:/test.txt', 'a')
f.write('world')
f.close()
4. 读文件

读文件内容需要使用 ‘r’ 的方式打开文件

  • 使用 read 方法完成读操作. 参数表示"读取几个字符"
代码语言:javascript
复制
f = open('d:/test.txt', 'r')
result = f.read(2)
print (result)
f.close()

如果文件是多行文本, 可以使用 for 循环一次读取一行.

代码语言:javascript
复制
# 更常见的需求,是按行来读取
#最简单的办法,直接 for 循环.
f = open('d:/Python环境/test.txt', 'r', encoding='utf8')
for line in f:
print(f'line = {line}', end='')#末尾为空
f.close()

先构造一个多行文件.

代码语言:javascript
复制
f = open('d:/test.txt', 'r')
for line in f:
print(f'line = {line}')
f.close()

Python读取文件的方法:

  1. 使用open函数打开文件,指定文件名和读取模式(‘r’)。
  2. 使用read方法读取整个文件内容,或者使用readline方法读取一行内容,或者使用readlines方法读取所有行并返回一个列表。
  3. 关闭文件,使用close方法进行关闭,释放文件资源。
代码语言:javascript
复制
# 使用 readlines 方法直接把整个文件所有内容都读出来,按照行组织到一个列表里.
f = open('d:/Python环境/test.txt', 'r', encoding='utf8')
print(lines)
lines = f.readlines()
f.close()

代码示例:

代码语言:javascript
复制
# 打开文件
f = open('example.txt', 'r')

# 读取文件内容
content = f.read()

# 输出文件内容
print(content)

# 关闭文件
f.close()

注意:

  • 在使用open函数打开文件后,如果不进行关闭,会占用系统资源,因此必须使用close方法进行关闭。
  • 在程序结束时,Python会自动关闭所有未关闭的文件,但最好习惯性地使用close方法手动关闭文件。

在Python中读取文件时,可以使用open函数打开文件并指定文件的编码方式。例如:

代码语言:javascript
复制
with open('filename.txt', 'r', encoding='utf-8') as f:
    content = f.read()

其中,'utf-8’代表文件的编码方式。如果不指定编码方式,则默认使用系统默认编码方式进行读取。如果文件的编码方式与指定的不一致,则可能会导致乱码或错误的解析。

5.上下文管理器

Python的上下文管理器是一种用于管理资源的特殊对象,它支持用"with"语句来简化资源管理的代码。上下文管理器可以确保资源(例如文件或网络连接等)在使用之后正确地释放。

在Python中,上下文管理器通过实现 “enter” 和 “exit” 这两个特殊方法来实现。当使用 “with” 语句打开一个上下文管理器时,会先调用 “enter” 方法,接着执行语句块,最后调用 “exit” 方法释放资源。

例如,以下是一个用于打开文件的上下文管理器的示例:

代码语言:javascript
复制
class MyFile:
    def __init__(self, filename):
        self.filename = filename

    def __enter__(self):
        self.file = open(self.filename, 'r')
        return self.file

    def __exit__(self, exc_type, exc_value, traceback):
        self.file.close()

with MyFile('example.txt') as file:
    for line in file:
        print(line)

with MyFile('example.txt') as file 的意思是,给file赋值为MyFile('example.txt')

在上述示例中,类MyFile实现了 enterexit 方法,这使得该类的实例可以作为上下文管理器使用。在使用 “with” 语句时,将会调用 enter 方法来打开文件,并返回文件对象,接着就可以在语句块中使用该文件对象。在语句块执行完毕后,将会调用 exit 方法来关闭文件。

这个可以和c++的智能指针关联

使用库

库 就是是别人已经写好了的代码, 可以让我们直接拿来用. 一个编程语言能不能流行起来,一方面取决于语法是否简单方便容易学习, 一方面取决于生态是否完备. 所谓的"生态"指的就是语言是否有足够丰富的库,来应对各种各样的场景. 实际开发中,也并非所有的代码都自己手写,而是要充分利用现成的库, 简化开发过程. 按照库的来源,可以大致分成两大类

  • 标准库: Python 自带的库. 只要安装了 Python 就可以直接使用.
  • 第三方库: 其他人实现的库. 要想使用, 需要额外安装.

咱们自己也可以实现 “第三方库” 发布出去, 交给别人来使用.

标准库

认识标准库 Python 自身内置了非常丰富的库. 在 Python 官方文档上可以看到这些库的内容. Python标准库是Python内置的一组模块,包含了大量的常用函数和工具,如文件I/O、网络通信、字符串操作、数据结构、日期和时间处理、正则表达式、多线程等。Python标准库是Python开发者非常常用的一组工具,使用Python标准库可以大大提高开发效率。

Python标准库包含以下模块:

  • 日期和时间(datetime)
  • 数学函数(math)
  • 正则表达式(re)
  • 文件操作(os、io)
  • 网络编程(socket、http)
  • 数据库操作(sqlite3)
  • 多线程编程(threading、queue)
  • 进程管理(subprocess)
  • 图形界面开发(tkinter)
  • XML处理(xml、xml.dom、xml.sax)
  • 邮件处理(smtplib、email)

除了标准库,Python还有大量的第三方库和框架,如NumPy、Pandas、Matplotlib、Django等,这些库和框架大大扩展了Python的功能和应用领域。

第三方库

Python第三方库是指由Python社区中的开发者所开发的,可供其他Python程序员使用的外部库,可以提供各种功能,如图形界面、数据分析、网络编程、爬虫、机器学习等等。

以下是一些常见的Python第三方库:

  • NumPy:用于处理科学计算、数学计算和数值分析的库。
  • Pandas:用于数据处理和数据分析的库,可以用来读写各种格式的数据文件。
  • Matplotlib:用于绘制二维图表和三维图表的库,可生成多种类型的图形。
  • Scikit-learn:用于机器学习和数据挖掘的库,包括常用的机器学习算法。
  • Requests:用于发送HTTP请求和处理HTTP响应的库,可以用于爬虫和网页自动化测试等等。
  • Django:用于Web应用程序开发的框架,提供了完整的MVC架构、自带ORM、模版引擎、路由分发和中间件等功能。
  • Flask:轻量级的Web应用程序框架,提供了路由分发、模版引擎、中间件等功能,适合用于小型Web应用程序的开发。
  • Pygame:用于开发游戏的库,提供了图形界面和音频播放等功能。
  • TensorFlow:用于机器学习和深度学习的库,支持GPU加速和分布式计算,可用于实现各种机器学习和深度学习模型。

例如,举一个时间序列的例子

代码语言:javascript
复制
#import datetime
#from datetime import datetime
import datetime as dt
# 先构造 datetime 变量
date1 = dt.datetime(year=2012, month=2, day=14)
date2 = dt.datetime(year=2016, month=2, day=3)
print(date2 - date1)
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2023-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基础语法
  • 前言
  • 文件
    • 文件是什么
      • 文件路径
        • 文件操作
          • 1.打开文件
          • 2. 关闭文件
          • 3.写文件
          • 4. 读文件
          • 5.上下文管理器
        • 使用库
          • 标准库
          • 第三方库
      相关产品与服务
      消息队列 TDMQ
      消息队列 TDMQ (Tencent Distributed Message Queue)是腾讯基于 Apache Pulsar 自研的一个云原生消息中间件系列,其中包含兼容Pulsar、RabbitMQ、RocketMQ 等协议的消息队列子产品,得益于其底层计算与存储分离的架构,TDMQ 具备良好的弹性伸缩以及故障恢复能力。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档