预测模型 :
① 模型形式 : 使用已知的变量 ( 属性值 / 特征值 ) 表达 未知变量的函数 ;
② 已知变量 : 当前数据集中的样本 , 已知的属性的属性值 ;
③ 未知变量 : 将要预测的属性值...值 ;
③ 模型
f
确定 : 确定 需要确定模型
f
结构 , 即函数的格式 , 线性模型 , 还是二次函数 ,
n
次函数 等其它形式 ; 先找到使用的模型 ;
④ 参数
\theta...确定 : 这是数据挖掘算法的核心部分 ;
⑤ 评分函数 : 评分函数值达到最大 ( 最小 ) 确定参数
\theta
值 ; 如 似然函数 ( 评分函数值越大越好 ) , 误差平方和 ( 评分函数值越小越好...X
向量维数为 1 时 :
① 数据集样本 : 数据集中的样本已知属性是 2 个 , 一个是已知的输入向量
X
, 一个是未知的 , 需要预测的响应变量
Y
;
② 判别模型 : 此时模型是二维坐标系中的...X
向量维数为 2 时 :
① 数据集样本 : 数据集中的样本已知属性是 3 个 , 一个是已知的输入向量
X
( 有两个属性值 ) , 一个是未知的 , 需要预测的响应变量
Y
;
② 判别模型