前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python为什么需要函数、类这些概念

python为什么需要函数、类这些概念

作者头像
咋咋
发布2023-02-10 12:03:01
6060
发布2023-02-10 12:03:01
举报
文章被收录于专栏:数据大宇宙数据大宇宙

前言

许多小伙伴已经可以使用 python 解决小问题。定义几个变量,洋洋洒洒写几段 if 和 for 都不喘气。

但是,面对一个稍微复杂的问题,总感觉哪里不对劲,好像代码怎么样都写不出来规整的样子。

是不是没有"面向对象"?

是不是要定义一些类,搞一些模块?

今天,我们就来探讨一下,为什么需要定义类。

它到底解决了什么问题,与函数有什么不一样。


函数就是编写行动计划

我们用一个文件数据拆分小需求作为例子。

需求很简单,把一个数据表,按指定字段把数据拆分到不同的表,过程中需要去掉一些无用的列和行。

如下代码:

写出这段代码的你很开心,运行后也能出来正确结果。

后来,又需要完成一样的需求,但是文件不一样,字段也不一样。

你发现这份代码的小问题。于是,你把经常需要变化的变量,写到最上方,以便每次可以更容易找到并修改它们。

这时候的你不知不觉学会了定义函数。稍微改造一下:

函数就像在写明天的工作计划,编写的时候是不执行。

此时的参数叫做形参,因为这时候它们没有具体的值 。当执行函数的时候,需要指定一个确定值给这些参数,所以这时候参数叫实参。

这些知识很简单,但是此时你必须要注意到,我们的代码组织上,有了巨大的变化—— 数据以及处理这些数据的相关逻辑,被封装到一个范围内。

接下来,需求要升级一下


类,另一种组织方式

因为执行过程中去掉了一些行,有时候你希望能够把这些记录单独输出文件,方便查看。

那不就又要多一个参数,用来指定输出文件名字或路径吗?

你开始意识到这个函数的参数有点多。 因为它负责的事情太多了!

于是,你按流程顺序,拆分成不同的小函数。

现在执行的代码成这样子:

  • 每个函数的输入,来自于上一个函数的输出

如何进行划分,是面向过程和面向对象的重要区别。这里为了便于理解,简单按流程划分。

现在加入需求"把过程中删除掉的行单独输出"的函数:

这实现方式你很满意,因为它负责的事情只有一件,所以实现代码足够简单

但你却发现了问题,因为加入到执行代码的时候:

新函数的第一个参数的实际值(实参),不知道在哪里。因为,它需要上一个函数"配合",返回去掉的数据。

于是,第二个函数要修改它的返回值才能满足:

重点:

这种使用函数,面向流程的组织方式就有这种缺点。因为 每个小函数之间通过返回值强关联,同时需求变化很容易导致返回值变化,甚至是执行顺序的变化。

怎么解决?

为了让大家更容易理解,我一步步来推演。

首先,想办法干掉每个小函数之间的数据依赖。既然每个小函数都可能返回不同的东西,我们直接用一个容器去存放它们。

  • 在执行流程开始之前,定义一个空字典
  • 每执行一个小函数,必须传入这个字典
  • 小函数不需要返回结果数据,有需要保留数据,就直接写入到这个字典中

此时,每个小函数的第一个参数都是字典:

现在函数之间数据的依赖关系,由原来的

变成

现在我们已经很接近定义类!

但是,现在数据字典是一个外部的变量,如果需要同时处理多个操作,数据很容易乱套。

而且,每个小函数的第一个参数都是这个数据字典,不太好看。

下面我用一种 python 中很不常见的写法解决:

为了方便查看,省略了2个函数。

重点:

  • 行3:定义一个函数 new
  • 行4:数据字典
  • 行6-11:原来的小函数搬到这里而已。但是要注意,它们第一个参数不需要设置 data_dict
  • 行7:利用闭包,这些小函数可以直接访问行4定义的字典
  • 行13-16:以字典方式,把这些函数返回出去

执行的代码现在成这样子:

可以在 new 函数中设定参数,用于保存过程中需要的数据

当然,这种方式有一些缺点,比如执行的时候无法得到智能提示,因为现在函数需要从字典中取出。但是它解决了之前说的流程数据依赖问题。

这种方式可以让你理解带数据状态的执行流程: 每次要执行,都需要调用函数 new 。这个函数做了什么?就是创建了一个数据字典和一系列操作这个数据字典的相关函数

如果你看到这里,那么恭喜你,你已经学会了 python 中定义类。

我们用定义类的代码如下:

  • 行4:语法规则而已,相当于定义了函数 new 的名字
  • 行5-6:这叫初始化函数,相当于函数 new 的执行过程。注意第一个参数 self,其实它就是相当于之前说的数据字典
  • 行8:定义函数,注意它现在第一个参数是数据字典。只不过在执行的时候,python 会自动为我们传递数据字典
  • 行9:self.data ,类似之前数据字典用法:data_dict['data'] =xxx
  • 行14:同样道理,self.data 可以访问数据字典 data 的对应值

python 还会把我们定义的函数,加入到数据字典中。也就是说,每个小函数都可以通过 self.函数名() ,调用彼此

执行时候的代码:

  • 第一句,我们称为实例化对象。本质就是构造了一个全新的数据字典,通过这个字典,我们可以访问相关的逻辑处理函数

是不是与之前我们用数据字典很类似。因为它们的内在本质是一样。

类有继承等特性。不过我们同样可以通过构造数据字典的方式做到。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据大宇宙 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 函数就是编写行动计划
  • 类,另一种组织方式
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档