基于值列表对DataFrame的行进行多个筛选器

基础概念

DataFrame 是一种二维表格数据结构，常用于数据分析和处理。它类似于 Excel 表格，但功能更强大，支持多种数据类型和复杂的操作。基于值列表对 DataFrame 的行进行多个筛选器，是指根据多个条件（值列表）来过滤 DataFrame 中的行，只保留符合条件的行。

类型

基于值列表的筛选器可以分为以下几种类型：

等于（==）：筛选出某一列的值等于指定值的行。
不等于（!=）：筛选出某一列的值不等于指定值的行。
包含（in）：筛选出某一列的值在指定列表中的行。
不包含（not in）：筛选出某一列的值不在指定列表中的行。
大于（>）、小于（<）、大于等于（>=）、小于等于（<=）：筛选出某一列的值满足指定比较条件的行。

应用场景

数据清洗：根据多个条件筛选出需要保留或删除的数据。
数据分析：根据特定条件筛选出数据进行进一步分析。
数据可视化：筛选出符合特定条件的数据，进行图表展示。

示例代码

假设我们有一个 DataFrame df，包含以下数据：

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'Age': [25, 30, 35, 40, 45],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston', 'Phoenix']
}

df = pd.DataFrame(data)

我们希望筛选出年龄在 30 到 40 之间，并且城市是 'Chicago' 或 'Houston' 的行。

# 定义筛选条件
age_range = (30, 40)
cities = ['Chicago', 'Houston']

# 应用筛选条件
filtered_df = df[(df['Age'] >= age_range[0]) & (df['Age'] <= age_range[1]) & (df['City'].isin(cities))]

print(filtered_df)