前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas文件读取错误及解决办法

pandas文件读取错误及解决办法

作者头像
诡途
发布2022-05-09 18:55:49
1.1K0
发布2022-05-09 18:55:49
举报
文章被收录于专栏:诡途的python路诡途的python路

错误一:‘gbk’ codec can’t decode byte 0x98 in position 2: illegal multibyte sequence

报错代码:

代码语言:javascript
复制
data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误解读: Unicode的解码Decode错误(Error),以gbk编码的方式去解码(该字符串变成Unicode),但是此处通过gbk的方式,却无法解码(can’t decode )。“illegal multibyte sequence”意思是非法的多字节序列,即没法(解码)了。 此种错误,可能是要处理的字符串本身不是gbk编码,但是却以gbk编码去解码 。比如,字符串本身是utf-8的,但是却用gbk去解码utf-8的字符串,所以结果不用说,则必然出错。

.解决办法:rb读取

代码语言:javascript
复制
data_path=r"G:\test.csv"
f = open(data_path,'rb')
res = pd.read_csv(f)
f.close()

错误二:Initializing from file failed

报错代码:pd.read_csv(r"G:\文件名.csv")

错误解读:文件初始化失败;即:文件路径或者文件名中存在中文,pd.read_csv()需要通过open的方式打开再进行读取

代码语言:javascript
复制
data_path=r"G:\test.csv"
f = open(data_path)
res = pd.read_csv(f)
f.close()

错误三:UnicodeDecodeError:

‘gbk’ codec can’t decode byte 0xd7 in position 99413: illegal multibyte sequence

问题解读:gbk”编解码器无法解码位置99413中的字节0xd7:非法的多字节序列,通常是比较大的文件会出现一些无关紧要的字码解码不出来

解决办法:

代码语言:javascript
复制
data_path=dir_path_order+'\\'+wj_name  #获取数据路径
f=open(data_path,encoding='gbk',errors='ignore')#部分文件有字节编码错误,errors 忽略
data=pd.read_csv(f)
f.close

错误四:部分带公式的Excel读不出来

解决办法:请移步之前文章,链接如下:

1、https://blog.csdn.net/qq_35866846/article/details/102672342 2、https://blog.csdn.net/qq_35866846/article/details/102775288

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-12-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档