我有一个有11'000'000行和3列的大型.csv文件: id、magh、mixid2。我要做的是选择具有相同id的行,然后检查这些行是否具有相同的mixid2;如果为True,则删除这些行;如果为False,则使用所选行的信息初始化一个类。这是我的代码: obs=obs.set_index('id')#dropping elements with only one mixid2 an
我需要按日期对Pandas数据帧进行分组,然后取给定值的加权平均值。下面是当前是如何使用边距值作为示例的(在有NaN值之前,它可以很好地工作):# Create new columns as required 'margin_WA': group_wa(), # agg_func includes WAs for other elements
result = df.<e