]])
# 将数据加载为数据帧
df = pd.DataFrame(X, columns=['feature_1', 'feature_2'])
# 移除带缺失值的观测
df.dropna()...3 Medium 2
4 High 3
使用下采样处理不平衡类
在下采样中,我们从多数类(即具有更多观测值的类)中不放回随机抽样,来创建与少数类相等的新观测子集。...0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
使用上采样处理不平衡类别
在上采样中,对于多数类中的每个观测,我们从少数类中带放回随机选择观测。...均值插补用该特征/变量的平均值替换缺失值。...例如,单个特征Fruit将被转换为三个特征,Apples,Oranges和Bananas,类别特征中的每个类别一个。