三、数据预处理
作者:Chris Albon
译者:飞龙
协议:CC BY-NC-SA 4.0
为 Scikit-Learn 转换 Pandas 类别数据
# 导入所需的库
from sklearn...0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
使用上采样处理不平衡类别
在上采样中,对于多数类中的每个观测,我们从少数类中带放回随机选择观测。...最终结果是来自少数类和多数类的观测数量相同。...有一些常用的方法可以预处理分类特征:使用 pandas 或 scikit-learn。...方法的输出会生成相同的输出矩阵。