pandas
是一个强大的数据处理和分析库,广泛用于数据科学和机器学习领域。groupby
是 pandas
中的一个方法,用于根据一个或多个列的值将数据分组。分组后,可以对每个组应用聚合函数(如 sum
、mean
、count
等),以计算每组的统计信息。
pandas
的 groupby
操作经过优化,能够高效处理大规模数据集。groupby
操作主要分为两类:
pandas groupby
没有任何函数,每个唯一值只显示一次。
这通常是因为在使用 groupby
后没有应用任何聚合函数。groupby
本身只是将数据分组,并不会自动计算任何统计信息。
groupby
后应用聚合函数,如 sum
、mean
、count
等。import pandas as pd
# 示例数据
data = {
'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': [1, 2, 3, 4, 5, 6, 7, 8],
'C': [10, 20, 30, 40, 50, 60, 70, 80]
}
df = pd.DataFrame(data)
# 应用聚合函数
result = df.groupby('A').sum()
print(result)
def custom_agg(x):
return x.max() - x.min()
result = df.groupby('A')['B'].agg(custom_agg)
print(result)
通过上述方法,可以解决 pandas groupby
没有任何函数,每个唯一值只显示一次的问题。
领取专属 10元无门槛券
手把手带您无忧上云