首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

C4.5算法(下)

本公众号不定期分享大数据相关干货文章及学习资料,欢迎志同道合的朋友一起来交流学习!

本文接着上一篇【学习笔记】C4.5算法(上)文章,上篇文章没看的朋友可以先看一下。

信息:

属性集有四种:天气,温度,适度,风速

类标签集合两种:进行取消

步骤:

1.计算信息熵

2.分别计算按不同属性的划分信息熵

3.计算出信息增益

4.计算增益信息

5.计算信息增益率

6.重复1-5计算出不同属性划分的信息增益率

代码

程序引入

节点数据结构

主要流程

(可左右滑动)

参考

《数据挖掘与机器学习WEKA应用技术与实践》

https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180123G0NKUK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券