前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python | pandas 读csv数据报错: 0x8b 解决方案

python | pandas 读csv数据报错: 0x8b 解决方案

作者头像
努力在北京混出人样
发布2019-02-18 16:33:59
9380
发布2019-02-18 16:33:59
举报

用pandas 读取csv数据报错了,报错内容如下:

读取的代码:

import pandas as pd
#载入数据:
train = pd.read_csv('Train.csv')

主要错误是:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x8b in position 2: invalid start byte

全部显示信息

pandas\parser.pyx in pandas.parser.TextReader.read (pandas\parser.c:10415)()

pandas\parser.pyx in pandas.parser.TextReader._read_low_memory (pandas\parser.c:10691)()

pandas\parser.pyx in pandas.parser.TextReader._read_rows (pandas\parser.c:11728)()

pandas\parser.pyx in pandas.parser.TextReader._convert_column_data (pandas\parser.c:13162)()

pandas\parser.pyx in pandas.parser.TextReader._convert_tokens (pandas\parser.c:14116)()

pandas\parser.pyx in pandas.parser.TextReader._convert_with_dtype (pandas\parser.c:16172)()

pandas\parser.pyx in pandas.parser.TextReader._string_convert (pandas\parser.c:16400)()

pandas\parser.pyx in pandas.parser._string_box_utf8 (pandas\parser.c:22072)()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8b in position 2: invalid start byte

采用了utf-8的编码形式也出错,最后找到方案,用ISO-8859-1来编码

#载入数据:
test = pd.read_csv('Test.csv',encoding = "ISO-8859-1")

数据如下,出现类似错误的同学可以尝试下。 链接:http://pan.baidu.com/s/1eRO4wGq 密码:do08

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017年02月06日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档