特征工程:
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性
特征抽取
特征预处理
特征降维
1.特征抽取
1.1 字典特征抽取: 万能的0和1之字典特征抽取...())
# 将数据以类one_hot编码方式展示
print(data.toarray())
2.特征预处理
通过特定的统计方法(数学方法)将数据转换成算法要求的数据
2.1 归一化
将某一列类型的数据...,缩放到特定的范围(一般为缩放到0至1之间),相当于把满分为100分转换成满分为1分,原来百分制能考95分,现在只能算作0.95分
原始数据 归一化后
[0, 0, 10] [0, 0, 0]
[3,...0, 10], [3, 3, 13], [5, 5, 15], [8, 8, 18], [10, 20, 20]]
# 填充并转换数据
data = std.fit_transform(lee)
#...var():
"""
数据降维
"""
var_thr = VarianceThreshold()
# 第一列和第四列数据方差均为0, 会被消除