前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >gbk,utf-8,unicode编码转换

gbk,utf-8,unicode编码转换

作者头像
用户1733462
发布2018-06-01 15:21:40
4.8K0
发布2018-06-01 15:21:40
举报
文章被收录于专栏:数据处理

1、将字符串'024f'转化为unicode字符,先将字符转化为16进制整数

代码语言:javascript
复制
code = int('024f',base=16)
print '%x'%code,'%04x'%code

输出结果:24f 024f,一般选择后者处理凑足偶数字节 转化unicode编码

代码语言:javascript
复制
unichr(code)

运行得到unicode编码

代码语言:javascript
复制
u'\u024f'
代码语言:javascript
复制
uc = unichr(code)
print uc, type(uc)

输出字符,类型,特别注意unicode类型,处理起来有点不同,两个字节算一个字符

代码语言:javascript
复制
ɏ,unicode

转gb18030编码

代码语言:javascript
复制
uc.encode('gb18030')
代码语言:javascript
复制
'\x810\xab6'
代码语言:javascript
复制
gbk = uc.encode('gb18030')
print  type(gbk)

类型是str

代码语言:javascript
复制
<type 'str'>
代码语言:javascript
复制
gbk = uc.encode('gb18030')
gbkcode = str()
for el in gbk:
    gbkcode += '%02x'%ord(el)
print gbkcode
代码语言:javascript
复制
  8130ab36
代码语言:javascript
复制
  uc.encode('utf-8')

输出

代码语言:javascript
复制
    '\xc9\x8f'

解码

代码语言:javascript
复制
utf8 = uc.encode('utf-8')
utf8.decode('utf-8')

输出

代码语言:javascript
复制
u'\u024f'
代码语言:javascript
复制
gbk.decode('gb18030')

输出

代码语言:javascript
复制
u'\u024f'
代码语言:javascript
复制
代码语言:javascript
复制
def writeTxt(fdir, info):
    print '%s\\f0.txt'%fdir
    f=open('%s\\f0.txt'%fdir,'a')
    f.write(info)
    f.write('\n')
    f.close()
def getcosins(wordcode, gbkflag=0):
    if gbkflag == 2:
        wordcodelen = 2
    else:
        wordcodelen = len(wordcode)
    cosins = '20ff%02x00%02x'%(gbkflag, wordcodelen)
    if gbkflag == 2:
        cosins += '%04x'%ord(wordcode)
    else:
        for i in range(len(wordcode)):
            cosins += '%02x'%ord(wordcode[i])
    writeTxt('F:\zpcs', cosins)
    return cosins
def writegbkucode(uccode):
    code = int(uccode,base=16)
    print code
    uc = unichr(code)
    print uc
    getcosins(uc, 2)
    ucgbk = uc.encode('gb18030')
    getcosins(ucgbk)
writegbkucode('024f')
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017.08.01 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档