“
本公众号不定期分享大数据相关干货文章及学习资料,欢迎志同道合的朋友一起来交流学习!
”
本文接着上一篇【学习笔记】C4.5算法(上)文章,上篇文章没看的朋友可以先看一下。
信息:
属性集有四种:天气,温度,适度,风速
类标签集合两种:进行取消
步骤:
1.计算信息熵
2.分别计算按不同属性的划分信息熵
3.计算出信息增益
4.计算增益信息
5.计算信息增益率
6.重复1-5计算出不同属性划分的信息增益率
代码
程序引入
节点数据结构
主要流程
(可左右滑动)
参考
《数据挖掘与机器学习WEKA应用技术与实践》
https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval
领取专属 10元无门槛券
私享最新 技术干货