最近研究了一下python 解析MySQL binlog 文件的内容,binlog是二进制存储,python如何解析成我们能读懂的语言呢?答案就是 struct 模块用于 Python 值和用 Python 字节对象表示的 C 结构体之间的转换,可以处理存储在文件,网络或者其他数据源的二进制数据。
其实struct核心函数有三个
struct.pack(fmt, v1, v2, …)
按照给定的格式(fmt),把数据封装成字符串(实际上是类似于c结构体的字节流)
struct.unpack(fmt, string)
按照给定的格式(fmt)解析字节流string,返回解析出来的tuple
struct.calcsize(fmt)
计算给定的格式(fmt)占用多少字节的内存
其中fmt 格式如下两个表格所示:
本机字节顺序是 big-endian 或 little-endian,具体取决于主机系统:
Intel x86 和 AMD64(x86-64)是 little-endian;
摩托罗拉 68000 和 PowerPC G5 都是大端的;
ARM 和 Intel Itanium 具有可切换的字节序(双端)
format 格式所代表的含义 C 和Python 沟通的协议。
我们根据实际内容写出fmt串,读取或写入文件进行(十六进制)字节流和文本格式的转换。