首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python - 了解bytes、str

Python3有两种表示字符序列的类型:bytes和str。前者的实例包含原始的8位值,后者的实例包含Unicode字符。     Python2也有两种表示字符序列的类型,分别叫做str和Unicode。与Python3不同的是,str实例包含原始的8位值;而unicode的实例,则包含Unicode字符。     把Unicode字符表示为二进制数据(也就是原始8位值)有许多种办法。最常见的编码方式就是UTF-8。但是,Python3的str实例和Python2的unicode实例都没有和特定的二进制编码形式相关联。要想把Unicode字符转换成二进制数据,就必须使用encode方法。要想把二进制数据转换成Unicode字符,则必须使用decode方法。     编写Python程序的时候,一定要把编码和解码操作放在界面最外围来做。程序的核心部分应该使用Unicode字符类型(也就是Python3中的str、Python2中的unicode),而且不要对字符编码做任何假设。这种办法既可以令程序接受多种类型的文本编码(如Latin-1、Shift JIS和Big5),又可以保证输出的文本信息只采用一种编码形式(最好是UTF-8)。     由于字符类型有别,所以Python代码中经常会出现两种常见的使用情境: 开发者需要原始8位值,这些8位值表示以UTF-8格式(或其他编码形式)来编码的字符。 开发者需要操作没有特定编码形式的Unicode字符。     所以,我们需要编写两个辅助(helper)函数,以便在这两种情况之间转换,使得转换后的输入数据能够符合开发者的预期。

01

LeetCode-算法-位运算-第14天

思路:for i in range(0,32)表示循环次数32次。(n&1)之前了解过,只保留当前n最右侧一位,(n&1)<<(31-i),的意思是将最右侧一位左移(31-i)。此时rev按位|与,从而使最高位获取到n最右侧一位。同理,第二次循环则是左侧第二位获取n的右侧第二位。 这里以8位的二进制,则相对应的为(n&1)<<(7-i)来举个例子: 第一次循环n=181二进制1011 0101,n&1=0000 0001,通过左移位7位,可以看出变为1000 0000,此处的1是1011 0101的最后一位的1。最后rev 0000 0000 与1000 0000按位与,则rev=1000 0000。之后n=n>>1=0101 1010。 第二次循环n&1=0000 0000通过左移7-i=6位,则变为0000 0000,最后与rev 1000 0000按位与则rev=1000 0000,n=n>>1=0010 1101。最终通过循环结束得到rev为1010 1101。

01

Python二进制串转换为通用字符串

此时的lineVec的元素类型为string,但输出是仍然是 “b’heros\xff…..” ,仍然无法摆脱二进制标志的影响。然而,尴尬的是,在后边对以lineVec元素作为键的字典进行索引时,只能获得通用字符串的键。所以,每次索引都以KeyError退出。         在多次尝试之后,我发现:二进制串在经过str()函数转化之后,已经将所有的内容都转化成了一个通用的字符串。也就是说,“b’heros\xff……”中的所有字符都是可以用python的字符串处理手段处理的。         给定一个 word=”b’heros”,如果希望得到通用字符串形式的单词”heros”,那么我们可以直接取字符串word的第3至最后一个字母,或将“b’”直接替换掉:

02
领券