Python 拓展之详解深拷贝和浅拷贝

写在之前

在昨天的文章里 (零基础学习 Python 之字典),写字典的方法的时候留了一个小尾巴,那就是 copy() 方法还没讲。一是因为 copy 这个方法比较特殊,不单单是它表面的意思;二是以为昨天的文章写得比较长,可能你看到那的时候就没啥耐心去仔细思考了,但是这个知识点又比较重要,也是面试过程中会被长问起的题,我之前在面试的时候(干货满满--亲身经历的 Python 面试题)就被问起过。所以我把 copy 单独摘出来今天单讲。

正式开始

首先我在这介绍两个新的小知识,要在下面用到。一个是函数 id() ,另一个是运算符 is。id() 函数就是返回对象的内存地址;is 是比较两个变量的对象引用是否指向同一个对象,在这里请不要和 == 混了,== 是比较两个变量的值是否相等。

>>> a = [1,2,3]
>>> b = [1,2,3]
>>> id(a)
38884552L
>>> a is b
False
>>> a == b
True

copy 这个词有两种叫法,一种是根据它的发音音译过来的,叫拷贝;另一种就是标准的翻译,叫复制。

其实单从表面意思来说,copy 就是将某件东西再复制一份,但是在很多编程语言中,比如 Python,C++中,它就不是那么的简单了。

>>> a = 1
>>> b = a
>>> b
1

看到上面的例子,从表面上看我们似乎是得到了两个 1,但是如果你看过我之前写的文章,你应该对一句话有印象,那就是 “变量无类型”, Python 中变量就是一个标签,这里我们有请 id() 闪亮登场,看看它们在内存中的位置。

>>> a = 1
>>> b = a
>>> b
1
>>> id(a)
31096808L
>>> id(b)
31096808L

看出来了吗,id(a) 和 id(b) 相等,所以并没有两个 1,只是一个 1 而已,只不过是在 1 上贴了两张标签,名字是 a 和 b 罢了,这种现象普遍存在于 Python 之中,这种赋值的方式实现了 “假装” 拷贝,真实的情况还是两个变量和同一个对象之间的引用关系。

我们再来看 copy() 方法:

>>> a = {'name':'rocky','like':'python'}
>>> b = a.copy()
>>> b
{'name': 'rocky', 'like': 'python'}
>>> id(a)
31036280L
>>> id(b)
38786728L

咦,果然这次得到的 b 和原来的 a 不同,它是在内存中又开辟了一个空间。那么我们这个时候就来推理了,虽然它们两个是一样的,但是它们在两个不同的内存空间里,那么肯定彼此互不干扰,如果我们去把 b 改了,那么 a 肯定不变。

>>> b['name'] = 'leey'
>>> b
{'name': 'leey', 'like': 'python'}
>>> a
{'name': 'rocky', 'like': 'python'}

结果和我们上面推理的一模一样,所以理解了对象有类型,变量无类型,变量是对象的标签,就能正确推断出 Python 提供的结果。

我们接下来在看一个例子,请你在往下看的时候保证上面的你已经懂了,不然容易晕车。

>>> a = {'name':'rocky','like':'python'}
>>> b = a
>>> b
{'name': 'rocky', 'like': 'python'}
>>> b['name'] = 'leey'
>>> b
{'name': 'leey', 'like': 'python'}
>>> a
{'name': 'leey', 'like': 'python'}

上面的例子看出什么来了吗?修改了 b 对应的字典类型的对象,a 的对象也变了。也就是说, b = a 得到的结果是两个变量引用了同一个对象,但是事情真的这么简单吗?请睁大你的眼睛往下看,重点来了。

>>> first = {'name':'rocky','lanaguage':['python','c++','java']}
>>> second = first.copy()
>>> second
{'name': 'rocky', 'lanaguage': ['python', 'c++', 'java']}
>>> id(first)
31036280L
>>> id(second)
38786728L

在这里的话没有问题,和我们之前说的一样,second 是从 first 拷贝过来的,它们分别引用的是两个对象。

>>> second['lanaguage'].remove('java')
>>> second
{'name': 'rocky', 'lanaguage': ['python', 'c++']}
>>> first
{'name': 'rocky', 'lanaguage': ['python', 'c++']}

发现什么了吗?按理说上述例子中 second 的 lanaguage 对应的是一个列表,我删除这个列表里的值,也只应该改变的是 second 啊,为什么连 first 的也会改,不是应该互不干扰吗?是不是很意外?是我们之前说的不对吗?那我们再试试另一个键:

>>> second['name'] = 'leey'
>>> second
{'name': 'leey', 'lanaguage': ['python', 'c++']}
>>> first
{'name': 'rocky', 'lanaguage': ['python', 'c++']}

前面说的原理是有效的,那这到底是为什么啊,来来来,有请我们的 id() 再次闪亮登场。

>>> id(first['name'])
38829152L
>>> id(second['name'])
38817544L
>>> id(first['lanaguage'])
38754120L
>>> id(second['lanaguage'])
38754120L

其实这里深层次的原因是和 Python 的存储数据的方式有关,这里不做过多的说明(其实是我也不懂。。 在这里,我们只需要知道的是,当 copy() 的时候,列表这类由字符串,数字等复合而成的对象仍然是复制了引用,也就是贴标签,并没有建立一个新的对象,我们把这种拷贝方式叫做浅拷贝(唉呀妈呀,终于把这个概念引出来了。。,言外之意就是并没有解决深层次的问题,再言外之意就是还有能够解决深层次问题的方法。

确实,在 Python 中还有一个深拷贝(deep copy),在使用它之前要引入一个 copy 模块,我们来试一下。

>>> import copy
>>> first = {'name':'rocky','lanaguage':['python','c++','java']}
>>> second = copy.deepcopy(first)
>>> second
{'name': 'rocky', 'lanaguage': ['python', 'c++', 'java']}
>>> second['lanaguage'].remove('java')
>>> second
{'name': 'rocky', 'lanaguage': ['python', 'c++']}
>>> first
{'name': 'rocky', 'lanaguage': ['python', 'c++', 'java']}

用了深拷贝以后,果然就不是引用了。

写在最后

深拷贝和浅拷贝到这里就讲完了,花了一番功夫总算写的还令自己满意,不知道朋友们看到这里的时候是否是觉得对这一部分豁然开朗,我尽力了。这个拓展也可能是成为一个系列,补充一些我觉得理解起来比较困难或者平时面试求职或者工作中常见的知识点,希望您多捧场。

最后感谢你能看到这里,希望我写的东西能够让你有到收获,但是我还是希望我在文章里插入的代码,你们能自己动手试一下,都很简单。原创不易,每一个字,每一个标点都是自己手敲的,所以希望大家能多给点支持,该关注关注,该点赞点赞,该转发转发,有什么问题欢迎在后台联系我,也可以在公众号找到我的微信加我。

本文分享自微信公众号 - Python空间(Devtogether)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-07-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习与python集中营

奔走相告,Python 3.8.0 正式发布!

那么,这次新发布的 Python 3.8.0 有哪些重要的改进呢?以下是是 Python 3.8 相比 3.7 的新增特性。

5330
来自专栏菲宇

python的super()的作用和原理

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

7120
来自专栏数据派THU

史上最全 | 数据分析技能详细拆解,一张图覆盖全流程知识细节和资源推荐(附下载)

而基于这些数据的分析,可以挖掘到非常多有价值的信息,这些信息正在成为大多数企业业务增长、迭代更新的关键。

13130
来自专栏测试技术圈

Jenkins+Ansible+GitLab持续交付平台搭建-第3篇

遇到错误:configure: error: no acceptable C compiler found in $PATH

12030
来自专栏菲宇

Python操作MongoDB

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

6530
来自专栏Small Code

BERT 是如何分词的

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

23830
来自专栏菲宇

Python Django使用HttpResponse返回图片并显示

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

14740
来自专栏菲宇

jieba分词器详解及python实战

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

13420
来自专栏浊酒清味

Python进阶之Matplotlib入门(二)

Matplotlib是Python的画图领域使用最广泛的绘图库,它能让使用者很轻松地将数据图形化以及利用它可以画出许多高质量的图像,是用Python画图的必备技...

9230
来自专栏浊酒清味

Python进阶之Matplotlib入门(三)

Matplotlib是Python的画图领域使用最广泛的绘图库,它能让使用者很轻松地将数据图形化以及利用它可以画出许多高质量的图像,是用Python画图的必备技...

8820

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励