关于Python中的编码和解码,我有一个问题。我想用我的算法用越南文编码纯文本,但是这个算法不能对越南明文进行编码,所以我通过plaintext.encode('utf-8')
将它转换为UTF-8,然后将它从字节转换为字符串(因为我的算法只编码一个字符串)。但是我的问题是解码部分,然后我用我的算法解码,我得到一个UTF-8字符串,所以我想将UTF-8字符串解码成越南文本(mojibake),但是我不能使用receiveString.decode('utf-8')
,因为“string没有属性' decode '”。我知道字符串不能使用这种方法,但是如何处理呢?
这是我收到的字符串:
b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'
那是一个UTF-8字符串,我想解码它,但是
'str' object has no attribute 'decode'
发布于 2022-06-18 18:36:53
很不清楚的问题。但是,下面的代码片段可能会有所帮助(内联注释显示部分进度报告):
receive_string = "b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'"
vietnamese_txt = (receive_string
.encode() # b"b'v\\xc3\\xb4 \\xc4\\x91\\xe1\\xbb\\x8bch thi\\xc3\\xaan h\\xe1\\xba\\xa1'"
.decode('unicode_escape') # "b'vô Ä\x91á»\x8bch thiên hạ'"
.encode('latin1').decode() # "b'vô địch thiên hạ'"
.lstrip('b').strip("'")) # 'vô địch thiên hạ'
print(vietnamese_txt) # vô địch thiên hạ
vđịch thiên hạ
https://stackoverflow.com/questions/72563734
复制相似问题