首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

由 Python2和Python3中socket.inet

这几天在做一个功能实现的时候,需要把别人用 Python2.6 写好的脚步转成 Python3.4 实现,大部分地方转化都没啥问题,但是在 socket.inet_aton() 转化的过程中出了点问题,花费我不少的精力去解决,先做个记录备忘,同时给后续需要的人做个提醒。

首先说一下,我在解决这个问题前期的思路有点问题,所以请关注最后的总结。

需求目的:把一个 ip 地址使用 socket.inet_aton() 转化后和一个字符串组合,然后算出 MD5。

下面是 Python2.6 的实现代码:

运行后的输出结果为:

fc138bb4748a18f885cc321c2c6396e2

如果原封不动的使用 Python3.4 运行后,报错如下:

提示说的是,socket.inet_aton(ip) 的返回值是 bytes 类型,所以不能和 str 类型的 base_str 直接进行连接操作。

也就是说 Python2.6 和 python3.4 中对于 socket.inet_aton(ip) 的实现是有差异的,查官方文档吧。

python2.6文档说明:

socket.inet_aton(ip_string)

Convert an IPv4 address from dotted-quad string format (for example, ‘123.45.67.89’) to 32-bit packed binary format, as abytesobject four characters in length.

python3.4 文档说明:

socket.inet_aton(ip_string)

Convert an IPv4 address from dotted-quad string format (for example, ‘123.45.67.89’) to 32-bit packed binary format, as astringfour characters in length.

好吧,返回值类型不同,为了保证和原脚本逻辑一致,我就做个转化,把 bytes 主动转换为 str 类型再连接,修改后的代码如下:

代码通过 decode 把 bytes 使用 gbk 的方式解码成 str,至于为什么用 gbk,是因为我对比了下,只有 gbk 编码方式解码后的输出才和 python2.6 中的 str 返回值结果一致。

行,赶紧运行一把试试看。。。还是报错了,这次的报错内容变了:

看起来 hashlib.md5() 在 Python2.6 和 Python3.4 中的实现也有差异,继续看文档。

python2.6文档说明:

You can now feed this object witharbitrary stringsusing the update() method.

python3.4 文档说明:

You can now feed this object withbytes-like objects (normally bytes)using the update() method.

依然是编码格式的问题,Python2.6 中参数传入的是 str,但是 Python3.4 中参数需要传入 bytes,那就继续转码吧。

再次转码后的代码如下:

运行后再次报错:

好吧,继续看文档。

python2.6文档说明:

hash.digest()

Return the digest of the strings passed to the update() method so far. This is astringof digest_size bytes which may contain non-ASCII characters, including null bytes.

python3.4 文档说明:

hash.digest()

Return the digest of the data passed to the update() method so far. This is abytesobject of size digest_size which may contain bytes in the whole range from 0 to 255.

这次更严重,encode() 直接用不了,换方法吧,更新后的代码如下:

运行后的输出结果:

fc138bb4748a18f885cc321c2c6396e2

终于得到了最终结果,激动,不过再回头一看,如果知道这几个函数的使用方式的话,就不需要 decode() 然后又 encode(),比如稍微优化后的代码如下:

总结:

Python3 新增了 bytes 类型,对于 bytes 的转换逻辑要特别清楚,这地方涉及了编码类型,要特别关注;

在使用一些函数前,一定要搞清楚这个函数的具体实现,必须清楚的知道使用了这个函数是什么效果,而不仅仅是看到暂时的效果,或者经验主义的去调用(上面例子的最后一步,其实我一开始不是用的 binascii,而是用的现成的 md5 转换函数,导致 encode() 成了 utf-8 格式,而浪费了不少时间去定位);

解决问题过程中,思路一定要清晰,不能靠猜,越猜越错;

先弄明白问题的根本原因,直接从根源上去解决,比一步步的就错解错,效果更好。

以上,如果觉得有用,请帮忙转发分享,不甚感激。

关注公众号,支持作者:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180711G0A4AI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券