我正在对以下Pandas数据帧进行预处理。 ? 对于相同的assetid,我希望找到第一个和最后一个AccountingDate,并基于下面的isSold逻辑创建另一个列AccountingDate。of all deals for same assetid is Null:else:
isSold = True 同时,我想找出每个assetid的第一个和最后一个一般来说,Pandas中的group
在groupby之后,如何在数据帧上使用collect_set或collect_list。例如:df.groupby('key').collect_set('values')。我得到一个错误:AttributeError: 'GroupedData' object has no attribute 'collect_set'
我希望在给定特定条件的情况下,将Pandas的DataFrame中的列聚合为1。这个想法是为了节省DF中的空间,并将一些列聚合成一个列,前提是它们满足特定的条件。举个例子可能会让它更容易解释:import seaborn as sns # for sample data set
# load some sample例如)聚合到一个名为'20+‘的列