我有COVID印度数据集,每天都有病例。我想要聚合每日案例,以获得特定州的累积日期结果。
印度的Covid数据集,所有邦的每日确诊病例、每日死亡病例和每日恢复病例:
后来,我对数据帧执行了'groupby‘
statewise_daily.groupby(['State','Date'])['dailyconfirmed','dailydeaths','dailyrecovered'].sum().sort_values(['State','Date']).reset_index()
在此之后,应如何获得累积确认、死亡和康复病例?
有没有人可以告诉我。
发布于 2020-09-05 00:33:54
以下是一个潜在的解决方案:
首先,将Date
格式转换为datetime
格式,并将其转换为数据帧的index
。这可以通过read_csv
方法直接实现:
statewise_daily=pd.read_csv('india-covid.csv', parse_dates=['Date'], index_col=['Date'])
接下来,您可以将您的pandas
代码与resample
方法一起使用,只需稍作更改:
statewise_daily.groupby(['State'])['dailyconfirmed','dailydeaths','dailyrecovered'].resample('1D').sum().sort_values(['State']).reset_index()
https://stackoverflow.com/questions/63742715
复制相似问题