C4.5算法(下)

本公众号不定期分享大数据相关干货文章及学习资料,欢迎志同道合的朋友一起来交流学习!

本文接着上一篇【学习笔记】C4.5算法(上)文章,上篇文章没看的朋友可以先看一下。

信息:

属性集有四种:天气,温度,适度,风速

类标签集合两种:进行取消

步骤:

1.计算信息熵

2.分别计算按不同属性的划分信息熵

3.计算出信息增益

4.计算增益信息

5.计算信息增益率

6.重复1-5计算出不同属性划分的信息增益率

代码

程序引入

节点数据结构

主要流程

(可左右滑动)

参考

《数据挖掘与机器学习WEKA应用技术与实践》

https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180123G0NKUK00?refer=cp_1026

扫码关注云+社区