基本概念:
人工智能 > 机器学习 > 深度学习
机器学习:
机器学习是从数据中自动分析获得规律(模型), 并利用规律对未知数据进行预测....特征值(已知的): 身高, 体重, 头发长度, 体征(很多)
目标值(未知的): 男, 女
样本
如果对全班学生成绩进行分析,一个学生就是一个样本
----
特征工程:
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程...,从而提高了对未知数据的预测准确性
特征抽取
特征预处理
特征降维
1.特征抽取
1.1 字典特征抽取: 万能的0和1之字典特征抽取 (one-hot编码)
1.2 文本特征抽取: 对自然语言进行情感分析...1之间),相当于把满分为100分转换成满分为1分,原来百分制能考95分,现在只能算作0.95分
原始数据 归一化后
[0, 0, 10] [0, 0, 0]
[3, 3, 13] [0.3, 0.15,...var():
"""
数据降维
"""
var_thr = VarianceThreshold()
# 第一列和第四列数据方差均为0, 会被消除