文章/答案/技术大牛

发布

社区首页 >问答首页 >熊猫读csv，剪掉最后两个字

问熊猫读csv，剪掉最后两个字
EN

Stack Overflow用户

提问于 2018-05-17 19:14:52

回答 2查看 400关注 0票数 4

csv文件如下所示：

a,b,c
1,2,3, 
4,5,6, 
a,b,c,

当我尝试用熊猫read_csv读取这个文件时，数据框架如下所示：

   |---------------|
   |   | a | b | c |
   |---------------|
   | 1 | 2 | 3 |   |
   | 4 | 5 | 6 |   |
   | a | b | c |   |
   |---------------|

我认为数据中的问题是:它看起来像是1,2,3，空格\n和熊猫认为有4列，第一列没有名字。我有没有办法把这个改为：

   |-----------|
   | a | b | c |
   |-----------|
   | 1 | 2 | 3 |
   | 4 | 5 | 6 |
   | a | b | c |
   |-----------|

这些文件大约有5000万行，有许多文件。有没有办法用最少的运行时间做这件事？

回答已采纳

发布于 2018-05-17 19:22:03

考虑下面的代码，其中index_col=False。当您不知道csv文件中需要多少列时，可以使用此解决方案。如果不同的文件有不同的列数，则更好。有关更多信息，请参考文档。

from io import StringIO
csvtext = StringIO("""a,b,c
1,2,3, 
4,5,6, 
a,b,c, """)

df = pd.read_csv(csvtext, index_col=False)
df

输出：

    a   b   c
0   1   2   3
1   4   5   6
2   a   b   c

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50398988

复制

相似问题

问熊猫读csv，剪掉最后两个字EN