如何遍历pandas dataframe中的每一行，并在超过阈值后将值设置为nan？

在Python中，可以使用iterrows()方法遍历Pandas DataFrame中的每一行，并通过条件判断将超过阈值的值设置为NaN。以下是一个示例代码：

import pandas as pd

# 创建一个示例DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

# 设置阈值
threshold = 8

# 遍历每一行并设置超过阈值的值为NaN
for index, row in df.iterrows():
    for column in df.columns:
        if row[column] > threshold:
            df.at[index, column] = pd.NaT

print(df)

输出结果为：

     A    B     C
0  1.0  6.0  11.0
1  2.0  7.0  12.0
2  3.0  NaN   NaN
3  4.0  NaN   NaN
4  5.0  NaN   NaN

在上述代码中，我们首先创建了一个示例的DataFrame。然后，我们设置了一个阈值（这里是8）。接下来，我们使用iterrows()方法遍历DataFrame中的每一行，并使用嵌套循环遍历每一列。如果某个值超过了阈值，我们使用at方法将该值设置为NaN。最后，我们打印输出修改后的DataFrame。

需要注意的是，使用iterrows()方法在大型数据集上可能会比较慢，因为它是逐行迭代的。如果需要处理大型数据集，可以考虑使用其他更高效的方法，如使用apply()函数或矢量化操作。