用第5列属性进行划分,属性0对应着分类0,属性1对应着分类0,属性2对应着分类0和1,此时树的结构是这样的:
?
7.png
第二个属性如何计算呢?
找出第5列属性的值为2所对应的类别。...再找出这些类别对应的各列属性值(不包含第5列属性),得
2,2,2,2,1,0
2,2,2,2,2,0
2,2,2,4,0,1
2,2,2,4,1,1
这里前五列表示属性0,1,2,3,4;最后一列表示分类...第3个属性取值为2时,分类为0;取值为4时,分类为1。
此时的决策树为
?...,最后一列是实际结果,用来和预测结果做比较。...,用于决策树的构建
# pre_pruning: 表示是否进行预剪枝
# check_attr: 在预剪枝时,用作测试数据的属性集合
# check_label: 在预剪枝时,用作测试数据的验证标签