我在pandas中有一个数据帧,如下所示:Snapshot of my pandas dataframe
现在我希望转换数据帧,如下所示,根据排序的日期值(%m/%d/%Y),使用分隔符为每个customerid连接属性'category‘。日期较早的订单具有对应的客户id,其类别列在第一位。
发布于 2019-02-24 15:21:06
首先使用to_datetime转换列,然后使用sort_values转换列,最后使用join转换groupby
df['Date'] = pd.to_datetime(df['Date'], format='%m/%d/%Y')
df = (df.sort_values(['customerid','Age','Date'])
.groupby(['customerid','Age'])['category']
.agg(', '.join)
.reset_index())
print (df)
customerid Age category
0 1 10 Electronics, Clothing
1 2 25 Grocery, Clothinghttps://stackoverflow.com/questions/54849640
复制相似问题