前言
在使用 Pandas 进行数据分析时,我们需要经常进行查询和统计分析。...进行聚合操作:
# 聚合函数:求和、均值、中位数、最大值、最小值
df.aggregate([sum, 'mean', 'median', max, min])
对某列数据进行聚合操作:
# 统计年龄平均值...:
# 将缺失值使用 0 填充
df.fillna(0)
数据去重
对 DataFrame 去重:
# 根据所有列值的重复性进行去重
df.drop_duplicates()
# 根据指定列值的重复性进行去重...)
数据合并
横向(按列)合并 DataFrame:
# 创建一个新的 DataFrame
other_data = {'name': ['Tom', 'Jerry', 'Lucy', 'Amy'],...([df, other_df], axis=1)
纵向(按行)合并 DataFrame:
# 创建一个新的 DataFrame
other_data = {'name': ['Kate', 'Jack'