前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >第14周Python机器学习周记

第14周Python机器学习周记

作者头像
凌川江雪
发布2018-09-13 13:02:27
4410
发布2018-09-13 13:02:27
举报
文章被收录于专栏:李蔚蓬的专栏李蔚蓬的专栏
时间:第14周
&关于计划:
决策树的学习--使用ID3算法:

(1)数据处理部分:

计算香农熵;

划分数据集合;

选择最好的数据集划分方式;

构建决策树;

(2)Matplotlib绘图部分:

基本节点绘制函数;

构造注解树、使用决策树执行分类;

(本文内容参考于《机器学习实战》)

&内容摘要:
1.计算香农熵以及准备数据集:

图片发自简书App

测试代码:

(1)计算准备好的数据集的香农熵;

(2)新增一个键值(maybe),计算香农熵,观察其变化(熵越高,则混合的数据也越多);

图片发自简书App

2.首先,关于append函数跟extend函数的区别:

图片发自简书App

接着,定义函数,按照给定特征划分数据集:

图片发自简书App

测试:

图片发自简书App

图片发自简书App

3.选择最好的数据集划分方式:

代码:

测试:

代码运行结果告诉我们,第0个特征是最好的用于划分数据集的特征

4.绘制树节点的函数设计:

图片发自简书App

图片发自简书App

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.12.18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 时间:第14周
  • &关于计划:
  • 决策树的学习--使用ID3算法:
  • (1)数据处理部分:
  • (2)Matplotlib绘图部分:
  • &内容摘要:
  • 1.计算香农熵以及准备数据集:
  • 测试代码:
  • 2.首先,关于append函数跟extend函数的区别:
  • 3.选择最好的数据集划分方式:
  • 4.绘制树节点的函数设计:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档