我正在使用德国的covid19数据集。按月计算德国的cases、deaths和recovery的数量给出了相同的数值。有什么不对的?检查dataframe显示它们是不一样的。
covid19_data.set_index("date").resample("M").agg({"deaths": "count",
"cases": "count",
"recovered": "count"})
deaths cases recovered
date
2020-01-31 7 7 7
2020-02-29 76 76 76
2020-03-31 28489 28489 28489
2020-04-30 38567 38567 38567
2020-05-31 13116 13116 13116
2020-06-30 7740 7740 7740
2020-07-31 810 810 810发布于 2020-07-06 12:38:31
如果您正在聚合,则应该对值进行求和。
covid19_data.set_index("Date").resample("M").agg({"deaths": "sum",
"cases": "sum",
"recovered": "sum"})或
df = df.groupby(by=pd.Grouper(key='date', freq='M')).sum()
deaths cases recovered
Date
2020-01-31 67 744 15
2020-02-29 68 777 17https://stackoverflow.com/questions/62756064
复制相似问题