([2, 2, 1]))
# ['weak', 'weak', 'strong']
删除带缺失值的观测
# 加载库
import numpy as np
import pandas as pd
#...]])
# 将数据加载为数据帧
df = pd.DataFrame(X, columns=['feature_1', 'feature_2'])
# 移除带缺失值的观测
df.dropna()...3 Medium 2
4 High 3
使用下采样处理不平衡类
在下采样中,我们从多数类(即具有更多观测值的类)中不放回随机抽样,来创建与少数类相等的新观测子集。...0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])
使用上采样处理不平衡类别
在上采样中,对于多数类中的每个观测,我们从少数类中带放回随机选择观测。...,我们从类 0 中带放回随机选择观测。