我是Python的新手,我正在尝试使用下面的脚本读取csv文件。
Past=pd.read_csv("C:/Users/Admin/Desktop/Python/Past.csv",encoding='utf-8')
但是,得到错误"UnicodeDecodeError:'utf-8‘编解码器无法解码字节0x96在位置35:无效的开始字节“,请帮助我了解这里的问题,我在脚本中使用编码,认为它可以解决错误。
发布于 2017-08-06 17:00:24
这是因为您选择了错误的编码。
由于您使用的是Windows计算机,因此只需替换
Past=pd.read_csv("C:/Users/.../Past.csv",encoding='utf-8')
使用
Past=pd.read_csv("C:/Users/.../Past.csv",encoding='cp1252')
应该可以解决这个问题。
发布于 2018-02-01 15:27:26
使用此解决方案,它将剥离(忽略)字符并返回不带字符的字符串。只有当你需要剥离它们而不是转换它们时才使用它。
with open(path, encoding="utf8", errors='ignore') as f:
使用errors='ignore'
只会丢失一些字符。但是,如果你不关心他们,因为他们似乎是额外的字符起源于一个错误的格式和编程的客户端连接到我的套接字服务器。然后这是一个简单直接的解决方案。reference
发布于 2018-03-07 09:59:46
尝试使用:
pd.read_csv("Your filename", encoding="ISO-8859-1")
我从一些网站解析的代码被转换成这种编码,而不是标准的默认UTF-8编码。
https://stackoverflow.com/questions/45529507
复制相似问题