文章/答案/技术大牛

发布

问在python中解码utf8字符串
EN

Stack Overflow用户

提问于 2022-06-09 16:29:10

回答 1查看 768关注 0票数 0

关于Python中的编码和解码，我有一个问题。我想用我的算法用越南文编码纯文本，但是这个算法不能对越南明文进行编码，所以我通过plaintext.encode('utf-8')将它转换为UTF-8，然后将它从字节转换为字符串(因为我的算法只编码一个字符串)。但是我的问题是解码部分，然后我用我的算法解码，我得到一个UTF-8字符串，所以我想将UTF-8字符串解码成越南文本(mojibake)，但是我不能使用receiveString.decode('utf-8')，因为“string没有属性' decode '”。我知道字符串不能使用这种方法，但是如何处理呢？

这是我收到的字符串：

b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'

那是一个UTF-8字符串，我想解码它，但是

'str' object has no attribute 'decode'

python

utf-8

decode

mojibake

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-06-18 18:36:53

很不清楚的问题。但是，下面的代码片段可能会有所帮助(内联注释显示部分进度报告)：

receive_string = "b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'"
vietnamese_txt = (receive_string
  .encode()                      # b"b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'"
  .decode('unicode_escape')      #  "b'vÃ´ Ä\x91á»\x8bch thiÃªn háº¡'"
  .encode('latin1').decode()     #  "b'vô địch thiên hạ'" 
  .lstrip('b').strip("'"))       #    'vô địch thiên hạ'

print(vietnamese_txt)            #     vô địch thiên hạ

vđịch thiên hạ

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72563734

复制

相似问题

问在python中解码utf8字符串
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中解码utf8字符串EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在python中解码utf8字符串
EN