, 是人来完成 , 优化评分函数的过程是计算机完成 ;
参考博客 :
【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )...) : 如果
\rm T
中 样本类别相同 , 决策树只有一个叶子结点 ;
② 属性用尽 ( 递归停止条件 ) : 如果
\rm T
没有用于继续分裂的变量 , 则将
\rm T
中出现频率最高的类别作为当前节点的类别...;
③ 样本用尽 ( 递归停止条件 ) : 如果
\rm T
中的样本都分配完毕 , 现在为空 , 则停止递归 ;
④ 分支 ( 递归操作 ) : 如果
\rm T
包含的样本属于不同类别 ,...根据变量选择策略 , 选择最佳的 变量 和 划分方式 , 将
\rm T
分为多个子集 , 每个子集构成一个内部结点 ;
针对上述每个内部结点 , 都进行上述 ① ② ③ ④ 递归操作 , 直到满足决策树的终止条件为止...分为多个子集 ;
⑤ 标识根节点 : 使用
\rm X
标识当前结点 ;
⑥ 递归操作 : 对 ④ 中分割的多个子集执行 Generate_Decision_Tree 递归操作 ,
\rm X