通俗理解决策树中的熵&条件熵&信息增益

marsggbo

发布于 2018-01-23 18:21:20

1.2K0

发布于 2018-01-23 18:21:20

文章被收录于专栏：AutoML(自动机器学习)

参考通俗理解决策树算法中的信息增益

说到决策树就要知道如下概念：

假如双十一我要剁手买一件衣服，但是我一直犹豫着要不要买，我决定买这件事的不确定性（熵）为2.6。

我在看了这件衣服的评价后，我决定买衣服这件事的不确定性是1.2。我在线下实体店试穿衣服后，我决定买衣服这件事的不确定性是0.9。

上面条件熵给出了两个：一个是看了网上的评价，此时的信息增益是\(Gain_1 =2.6-1.2=1.4\)。另一个是线下试穿了衣服，此时的信息增益 \(Gain_2=2.6-0.9=1.7\)。

很显然我在线下试穿衣服之后对于决定买这件衣服的不确定度下降更多，更通俗的说就是我试穿衣服之后买这件衣服的可能性更大了。所以如果有看买家评价和线下试穿两个属性，首先应该选择线下试穿来构建内部节点。

信息熵计算公式

符号\(x_i\)所具备的信息为: \[I(x_i) = -log_2p(x_i)\]
所有类别所具有的信息熵（information entropy）：\[H(X) = -\sum_{i=1}^{n}p(x_i)log_2p(x_i)\]

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2017-09-02 ，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度