我们现在想知道每家餐厅在城市中所占的销售百分比是多少。 预期输出为:
传统方法是:先groupby分组,结合apply计算分组求和,再用merge合并原表,然后再apply计算百分比。...但其实用transform可以直接代替前面两个步骤(分组求和、合并),简单明了。
首先,用transform结合groupby按城市分组计算销售总和。...四、结合分组处理缺失值
df = pd.DataFrame({
'name': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
'value': [...1, np.nan, np.nan, 2, 8, 2, np.nan, 3]
})
在上面的示例中,数据可以按name分为三组A、B、C,每组都有缺失值。...我们知道替换缺失值的常见的方法是用mean替换NaN。下面是每个组中的平均值。