几个 Python 编程小技巧

Photo from Unsplash

1 编码问题

我们在爬取网站是,会经常抓取网页文本,但是打印文本会出现是一堆乱码。这是为什么呢?原因是 Python 中字符对象分为两种,一种是 Unicode 对象,另一种是 str 对象。字符在 Python 中又以 Unicode 对象为基础,所以我们定义的字符串在内存中以 Unicode 编码的形式存储。另外,str 对象又可以有多种编码形式,如 UTF-8、GBK-2312 等。虽然不同编码的 str 对象能被解码成 unicode 对象,但是不同编码的 str 对象直接不能直接转换。因此,如果字符串编码是 GB2312,将其存储到 list 中,再打印出来看到乱码是 Unicode 编码。

解决这个问题其实很简单,把 Unicode 作为中间编码。我们只要将一种字符编码(如 GB2312)的字符串解码为 Unicode 编码,再编码为另外一种字符编码(如 UTF-8)。

2 值交换

在 C 或者 Java 中,要将两个变量的值进行交换。我们需要一个临时变量来存储其中一个值。

但是在 Python中,有个简单的办法能直接一步到位。

3 单例模式

Python 不仅是面向过程的编程语言,而且是面向对象的编程语言。在 Python 中,一个类被初始化,那么 `__new__()` 函数一定会先被调用,然后再调用`__init__()`。我们可以采用 hasattr() 函数来判断对象是否包含对应的属性,也就是判断类是否被初始化。

END

作者:猴哥

公众号:极客猴

爱好读书,喜欢钻研技术,梦想成为文艺青年的 boy。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180123G10DWS00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券