python---pickle

雷子

发布于 2023-12-13 12:54:57

8510

Python 中有个序列化过程叫作 pickle，它能够实现任意对象与文本之间的相互转化，也可以实现任意对象与二进制之间的相互转化。也就是说，pickle 可以实现 Python 对象的存储及恢复。

pickle 模块提供了以下 4 个函数供我们使用：

- dumps()：将 Python 中的对象序列化成二进制对象，并返回；
- loads()：读取给定的二进制对象数据，并将其转换为 Python 对象；
- dump()：将 Python 中的对象序列化成二进制对象，并写入文件；
- load()：读取指定的序列化数据文件，并返回对象

以上这 4 个函数可以分成两类，其中 dumps 和 loads 实现基于内存的 Python 对象与二进制互转；dump 和 load 实现基于文件的 Python 对象与二进制互转。

pickle.dumps()函数

此函数用于将 Python 对象转为二进制对象，其语法格式如下：

dumps(obj, protocol=None, *, fix_imports=True)

此格式中各个参数的含义为：

此格式中各个参数的含义为：
- obj：要转换的 Python 对象；
- protocol：pickle 的转码协议，取值为 0、1、2、3、4，
  其中 0、1、2 对应 Python 早期的版本，3 和 4 则对应 
Python 3.x 版本及之后的版本。未指定情况下，默认为 3。

import pickle
tup1 = ('雷子说测试开发', {1,2,3,6}, None)
#使用 dumps() 函数将 tup1 转成 p1
p1 = pickle.dumps(tup1)
print(p1)

结果：

b'\x80\x04\x95(\x00\x00\x00\x00\x00\x00\x00\x8c\x15\xe9\x9b\xb7\xe5\xad\x90\xe8\xaf\xb4\xe6\xb5\x8b\xe8\xaf\x95\xe5\xbc\x80\xe5\x8f\x91\x94\x8f\x94(K\x01K\x02K\x03K\x06\x90N\x87\x94.

pickle.loads()函数

此函数用于将二进制对象转换成 Python 对象，其基本格式如下：

loads(data, *, fix_imports=True, encoding='ASCII', errors='strict')

将 p1 对象反序列化为 Python 对象。

import pickle
tup1 = ('雷子说测试开发', {1,2,3,6}, None)
#使用 dumps() 函数将 tup1 转成 p1
p1 = pickle.dumps(tup1)
print(pickle.loads(p1))
print(type(pickle.loads(p1)))

结果：

('雷子说测试开发', {1, 2, 3, 6}, None) 
<class 'tuple'>

在使用 loads() 函数将二进制对象反序列化成 Python 对象时，会自动识别转码协议，所以不需要将转码协议当作参数传入。并且，当待转换的二进制对象的字节数超过 pickle 的 Python 对象时，多余的字节将被忽略。

pickle.dump()函数

此函数用于将 Python 对象转换成二进制文件，其基本语法格式为：

dump (obj, file,protocol=None, *, fix mports=True)

其中各个参数的具体含义如下：

- obj：要转换的 Python 对象。
- file：转换到指定的二进制文件中，要求该文件必须是以"wb"的打开方式进行操作。
- protocol：和 dumps() 函数中 protocol 参数的含义完全相同，
因此这里不再重复描述。

将 tup1 元组转换成二进制对象文件

import pickle
tup1 = ('雷子说测试开发', {1,2,3,6}, None)
#使用 dumps() 函数将 tup1 转成 p1
p1 = pickle.dumps(tup1)
#使用 dumps() 函数将 tup1 转成 p1
with open ("a.txt", 'wb') as f: #打开文件
    pickle.dump(tup1, f) #用 dump 函数将 Python 对象转成二进制对象文件

结果：

文件展示：

pickle.load()函数

此函数和 dump() 函数相对应，用于将二进制对象文件转换成 Python 对象。该函数的基本语法格式为

load(file, *, fix_imports=True, encoding='ASCII', errors='strict')

file 参数表示要转换的二进制对象文件（必须以 "rb" 的打开方式操作文件）

import pickle
with open ("a.txt", 'rb') as f: #打开文件
    t3 = pickle.load(f) #将二进制文件对象转换成 Python 对象
    print(t3)

结果：

pickle模块在以下情况下非常有用：
数据持久化：你可以使用pickle将Python对象保存到文件中，以便稍后读取。这对于保存模型、配置文件、数据缓存等非常有用。
数据传输：你可以使用pickle将Python对象序列化并通过网络传输，以便不同的Python程序之间共享数据。
对象复制：你可以使用pickle将Python对象进行深拷贝，以便创建对象的独立副本，而不是引用原始对象。
测试和调试：pickle也用于创建模拟数据，以便进行测试和调试。

但在使用它时需要注意一些事项：

化数据时要小心，因为pickle可以执行任意代码。不要从不受信任的来源加载pickle数据，以免遭受安全风险。
版本兼容性：在不同版本的Python之间，pickle数据的兼容性可能会有问题。因此，确保在不同版本之间测试并验证pickle数据的兼容性。
自定义对象：一些自定义对象的序列化和反序列化可能会受到限制，因此需要额外的配置。你可能需要实现特定的__reduce__方法来控制对象的序列化行为。

后记

发现问题，解决问题。遇到问题，慢慢解决问题即可。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2023-12-11，如有侵权请联系 cloudcommunity@tencent.com 删除

python