我有一个简单的csv,它有2列和大约50行。
第一列是ip,其他是cik,我想知道不同的cik有多少个ip。这是我的代码,它工作得很好:
代码:
import pandas as pd
csv = pd.read_csv('test.csv')
df = pd.DataFrame(csv)
df = df.groupby('cik').count()
df = pd.DataFrame(df).to_csv('output.csv', index=False)
但csv输出如下所示:
ip
49
我希望它类似于在groupby和count之后打印df值时的样子,如下所示:
因此,我在第一列中有cik,在其他列中有具有该cik的ip的数量。
发布于 2019-05-10 03:45:00
您的选项index=False
使方法省略行名,在本例中为1515671
,使用simple保存它:
df.to_csv('output.csv')
发布于 2019-05-10 03:43:14
尝试在输出to_csv之前添加reset_index。
import pandas as pd
csv = pd.read_csv('test.csv')
df = pd.DataFrame(csv)
df = df.groupby('cik').count().reset_index() #reset_index creates 0...n index and avoids cik as index
df.to_csv('output.csv', index=False)
或者在输出to_csv时设置index=True
df.to_csv('output.csv', index=True)
https://stackoverflow.com/questions/56066451
复制相似问题