我想要计算具有单个值的多个行的平均值,并将其存储在另一个csv文件中。给定的数据为:
ID salary days_of_work ...
1 2000 3 ...
1 1890 2 ...
1 2109 4 ...
2 .
2 .
2 .
2
3
3
...
然后在另一个文件中获取每个ID的单行,该行包含其他列的数据的平均值,如下所示:
ID salary days_of_work ...
1 1999.6667 3 ...
2 ...
3 ...
.
.
.
更新:
我尝试过这样做,但是对于一个使用utc_time而不是ID的文件
import pandas as pd
keep_col = ['utc_time','temperature','pressure','humidity','wind_direction','wind_speed/kph']
pd.read_csv('Gridpoints.csv', names=keep_col).to_csv("GridPoints/test.csv", index=False)
f=pd.read_csv("Gridpoints"+".csv")
df = f[keep_col]
df.groupby(['utc_time']).mean()
df.to_csv("GridPoints/test.csv", index=False)
首先,我删除了一个列,然后在获得的数据帧上,我想对utc_time列执行此操作,但它什么也不做
发布于 2018-06-04 03:30:09
首先,您需要按ID分组,然后计算平均值。
import pandas as pd
df = pd.read_csv('Book1.csv')
df1 = df.groupby(['ID'], as_index= False)[['Salary', 'days']].mean()
print(df1)
ID Salary days
1 1999.666667 3.0
https://stackoverflow.com/questions/50669877
复制相似问题