计算香农熵;
划分数据集合;
选择最好的数据集划分方式;
构建决策树;
基本节点绘制函数;
构造注解树、使用决策树执行分类;
(本文内容参考于《机器学习实战》)
图片发自简书App
(1)计算准备好的数据集的香农熵;
(2)新增一个键值(maybe),计算香农熵,观察其变化(熵越高,则混合的数据也越多);
图片发自简书App
图片发自简书App
接着,定义函数,按照给定特征划分数据集:
图片发自简书App
测试:
图片发自简书App
图片发自简书App
代码:
测试:
代码运行结果告诉我们,第0个特征是最好的用于划分数据集的特征
图片发自简书App
图片发自简书App