id，hash 和 hashlib

不可言诉的深渊

发布于 2019-07-27 19:52:47

1.2K0

发布于 2019-07-27 19:52:47

看了标题，大家应该知道今天我要讲的内容了，其中 id 和 hash 是内置的两个函数，hashlib 是一个模块，它们的共同点就是给每一个对象一个特定的标志，当然它们也有不同之处。

id 函数有一个参数，参数类型没有限制，可以是任意类型（实际上是 object 类型），返回一个对象的身份。这个函数确保参数在同时存在的对象中独一无二，如果是 CPython（底层语言是 C），该函数返回该对象的内存地址。其实 Python 有很多，远远不止一个 CPython，还有 Jython（底层语言是 Java）和IronPython（底层语言是 C#）等。如果不是 CPython 这个 id 的返回值有什么规律我就不做演示了，大家可以自己尝试，下面我就来演示一下在 CPython 中为什么返回的是内存地址。

首先定义一个列表 a，然后把 a 赋值给 b，此时 b 和 a 应该值相等，如果地址相等的话，那么我修改 b 时，a 也会跟着变化，通过下面的操作，我们可以发现地址是相等的，id(a) 和 id(b) 相等，而且值是一个整数，接下来我们只要做一件事就可以确定这是通过一个算法生成的特定值还是内存中的地址（会变化），其实很简单，我们重新打开一个解释器继续创建同样的对象并且用 id 得到值，如图所示。

很明显，不同的解释器值不一样，所以它返回的是内存地址，而不是由一种算法产生的一个特定的值。

hash

hash 函数有一个参数，参数类型有一点限制，必须是可哈希的类型，返回传入对象的哈希值，两个相等的对象也必然有相等的哈希值。

可哈希类型主要是不可变类型，当然自己定义的类默认也是可哈希的，怎么样自己可以定义不可哈希的类型呢？其实很简单，继承不可哈希的类就完事了。如果我不继承，就想自己手写一个不可哈希的类该怎么办？其实很简单，重写 __eq__ 魔法方法的同时，不去重写 __hash__ 方法，那么这个类就不可哈希。下面我就不做验证了，直接演示一下为什么两个相等对象有着相等的 hash 值。