大家好,又见面了,我是你们的朋友全栈
with open(self.path, 'r') as test:
for line in test:
pass
代码如上,出现错误:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position …
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 9: ...
或者是
UnicodeDecodeError: 'gbk' codec can't decode byte 0xb3 in position 9: illegal multibyte sequence
主要原因是因为编码的问题,可能是因为0x80这个字节在gbk编码中没有这个字符,可能原字符是两个字节,在gbk里被解析成了一个字节,导致字符不存在。解决方法有两个,一个是二进制读取,一个是改编编码方式:
with open(self.path, 'rb') as test:
for line in test:
pass
但是这样在读取的是中文文本的时候还可能会产生其他的错误:
TypeError: a bytes-like object is required, not 'str'
with open(self.path, 'r', encoding='utf-8') as test:
for line in test:
pass
或者
with open(self.path, 'r', encoding='utf-8-sig') as test:
for line in test:
pass
这个utf-8-sig亲测好用,屡试不爽,非常nice
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/194235.html原文链接:https://javaforall.cn
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有