所以我有一个大约有20k列的原始文件,类似于:
number|colour|(a|1)|animal
1|green|x|dog
2|blue|y|cat
3|red|z|owl
当我使用read_csv('raw.csv',sep='|')时,这会创建一个带有额外列的数据帧,因为(a|1)列被拆分了。
我尝试使用quotechar参数,但它只能接受一个值。任何帮助都将不胜感激
发布于 2017-02-22 23:39:28
对于您给出的示例数据,额外的分隔符仅出现在标题行中。因此,您可以使用names
关键字提供您自己的列名,然后告诉Pandas跳过标题行,如下所示:
import pandas as pd
df = pd.read_csv('raw.csv', sep='|', skiprows=1, names=["number", "colour", "(a|1)", "animal"])
print df
这将为您提供:
number colour (a|1) animal
0 1 green x dog
1 2 blue y cat
2 3 red z owl
https://stackoverflow.com/questions/42395480
复制相似问题