Pandas 是一个强大的 Python 数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。Pandas DataFrame 是一个二维的表格型数据结构,类似于 Excel 表格或 SQL 表。
在 Pandas 中,过滤器通常是通过布尔索引(Boolean Indexing)来实现的。根据过滤条件的不同,可以分为以下几种类型:
Pandas 过滤器广泛应用于数据清洗、数据分析、数据可视化等领域。例如:
假设我们有一个包含学生信息的 DataFrame,如下所示:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [20, 22, 21, 23],
'Gender': ['F', 'M', 'M', 'M'],
'Score': [85, 90, 78, 88]
}
df = pd.DataFrame(data)
# 过滤出年龄大于 21 的学生
filtered_df = df[df['Age'] > 21]
print(filtered_df)
# 过滤出年龄大于 21 且性别为男的学生
filtered_df = df[(df['Age'] > 21) & (df['Gender'] == 'M')]
print(filtered_df)
# 过滤出成绩在 80 到 90 之间的学生
filtered_df = df[(df['Score'] >= 80) & (df['Score'] <= 90)]
print(filtered_df)
原因:
解决方法:
# 示例:检查数据类型
print(df.dtypes)
原因:
解决方法:
# 示例:使用索引提高查询效率
df.set_index('Name', inplace=True)
filtered_df = df.loc[df['Age'] > 21]
print(filtered_df)
领取专属 10元无门槛券
手把手带您无忧上云