([2, 2, 1]))
# ['weak', 'weak', 'strong']
删除带缺失值的观测
# 加载库
import numpy as np
import pandas as pd
#...]])
# 将数据加载为数据帧
df = pd.DataFrame(X, columns=['feature_1', 'feature_2'])
# 移除带缺失值的观测
df.dropna()...0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
使用上采样处理不平衡类别
在上采样中,对于多数类中的每个观测,我们从少数类中带放回随机选择观测。...,我们从类 0 中带放回随机选择观测。...有一些常用的方法可以预处理分类特征:使用 pandas 或 scikit-learn。