csv文件如下所示:
a,b,c
1,2,3,
4,5,6,
a,b,c, 当我尝试用熊猫read_csv读取这个文件时,数据框架如下所示:
|---------------|
| | a | b | c |
|---------------|
| 1 | 2 | 3 | |
| 4 | 5 | 6 | |
| a | b | c | |
|---------------|我认为数据中的问题是:它看起来像是1,2,3,空格\n和熊猫认为有4列,第一列没有名字。我有没有办法把这个改为:
|-----------|
| a | b | c |
|-----------|
| 1 | 2 | 3 |
| 4 | 5 | 6 |
| a | b | c |
|-----------|这些文件大约有5000万行,有许多文件。有没有办法用最少的运行时间做这件事?
发布于 2018-05-17 19:22:03
考虑下面的代码,其中index_col=False。当您不知道csv文件中需要多少列时,可以使用此解决方案。如果不同的文件有不同的列数,则更好。有关更多信息,请参考文档。
from io import StringIO
csvtext = StringIO("""a,b,c
1,2,3,
4,5,6,
a,b,c, """)
df = pd.read_csv(csvtext, index_col=False)
df输出:
a b c
0 1 2 3
1 4 5 6
2 a b chttps://stackoverflow.com/questions/50398988
复制相似问题