文章/答案/技术大牛

发布

分类算法之决策树

文章来源：企鹅号 - Python那些事

来源：hongweipeng链接：

https://www.hongweipeng.com/index.php/archives/1384/

起步

在《分类算法之决策树（理论篇）》我们介绍了决策树的构建和一些关于熵的计算方法，这篇文章将根据一个例子，用代码上来实现决策树。

实验环境

操作系统： win10 64

编程语言： Python3.6

用到的第三方模块有：

数据源

为了方便理解和架设，我们用理论篇中买电脑的例子：

将这些记录保存成文件：

这些数据就是这次应用的数据源。

数据整理

可以利用python标准库中来对这个数据源进行读取，要对原始数据集进行整理，随机变量放在一个数组，分类结果放在另一个数组，形如:

按照这个思路我们构造一下:

随机变量向量化

在提供的库中，对输入的特征有一定的要求，所有特征和分类都要是数值型的值，不能是例子中的类别的值。

怎么转化呢？比方说这个特征，它有三个值: , , 。有一条记录的针对这个特征我们就变成：

那么第一条记录转化为：

特征向量化

分类结果向量化

构造决策树

在中提供了多种决策树构建方法，这边需要向其表明，是依据的方式来构造决策树的，因此需要传入一个参数 :

保存模型

将训练好的模型保存到文件里去：

测试数据

接下来就是给它随机变量，让决策树来进行分类。我们修改第一条记录来进行测试:

模型可视化

转化文件至可视化决策树的命令:

得到一个pdf文件，打开可以看到决策树:

附录

本次应用的全部代码:

看完本文有收获？请转发分享给更多人

关注「Python那些事」，做全栈开发工程师

发表于: 2017-12-132017-12-13 08:15:51
原文链接：http://kuaibao.qq.com/s/20171213B03TO000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

分类算法之决策树

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐