首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【Python专题(二)】Python二三事

不知道大家有没有注意到,两三年前用python的时候python2和python3简直是势不两立,python3调python2的package很难不报错。但是近两年python3调python2的package几乎不会报错。原因有两个,第一就是早期的很多package本身就是纯python2写的,完全没有做python3的兼容,但是后来的很多package在写的时候就考虑了python2和python3的兼容问题,会分别写一个python2的版本和一个python3的版本。第二个原因就是随着python2和python3兼容性问题日益凸显,很多专门解决兼容性问题的package,诸如future,past,six等,也日渐成熟,这极大的简化了两个版本互相兼容的工作,有时甚至只需要加一行代码就可以让python3支持python2的项目。

01

Python - 了解bytes、str

Python3有两种表示字符序列的类型:bytes和str。前者的实例包含原始的8位值,后者的实例包含Unicode字符。     Python2也有两种表示字符序列的类型,分别叫做str和Unicode。与Python3不同的是,str实例包含原始的8位值;而unicode的实例,则包含Unicode字符。     把Unicode字符表示为二进制数据(也就是原始8位值)有许多种办法。最常见的编码方式就是UTF-8。但是,Python3的str实例和Python2的unicode实例都没有和特定的二进制编码形式相关联。要想把Unicode字符转换成二进制数据,就必须使用encode方法。要想把二进制数据转换成Unicode字符,则必须使用decode方法。     编写Python程序的时候,一定要把编码和解码操作放在界面最外围来做。程序的核心部分应该使用Unicode字符类型(也就是Python3中的str、Python2中的unicode),而且不要对字符编码做任何假设。这种办法既可以令程序接受多种类型的文本编码(如Latin-1、Shift JIS和Big5),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8)。     由于字符类型有别,所以Python代码中经常会出现两种常见的使用情境: 开发者需要原始8位值,这些8位值表示以UTF-8格式(或其他编码形式)来编码的字符。 开发者需要操作没有特定编码形式的Unicode字符。     所以,我们需要编写两个辅助(helper)函数,以便在这两种情况之间转换,使得转换后的输入数据能够符合开发者的预期。

01
领券