前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >决策树可视化,被惊艳到了!

决策树可视化,被惊艳到了!

作者头像
统计学家
发布2021-12-04 14:21:26
1.3K0
发布2021-12-04 14:21:26
举报

目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!),而GBDT的基分类器最常用的就是CART决策树!掌握决策树,对理解之后的GBDT、LightGBM都有大有裨益。

可视化的方式理解决策树,对深刻理解这个模型很有帮助。大家最熟知的决策树可视化实现方式是下面这种:

代码语言:javascript
复制
dot_data = export_graphviz(
    clf,
    out_file=None,
    feature_names=df.columns[:-1],
    class_names=["good", "bad"],
    filled=True,
    rounded=True,
    special_characters=True,
)
graph2 = pydotplus.graph_from_dot_data(dot_data)
graph2.write_png("./pics/tree.png")

这种方法很好地展示了树的结构,但并不完美: 1、基尼系数会占用图中的空间,并且不利于解释 2、每个节点中各目标类别的样本数不够直观

今天向大家介绍一个更为惊艳的决策树可视化库——dtreeviz ,我们直接看几张效果图

dtreeviz有以下特色:

  • 利用有颜色的目标类别图例
  • 叶子大小与该叶子中的样本数成正比
  • 将≥和<用作边缘标签,看起来更清晰
  • 决策节点利用堆叠直方图展示特征分布,每个目标类别都会用不同的颜色显示
  • 在每个节点中各目标类别的样本数都用直方图的形式,这样可以提供更多信息

dtreeviz同样依赖GraphViz,其安装配置方法可以参考我之前的文章(点击直达:决策树的可视化

GraphViz 搞定后,安装dtreeviz即可

代码语言:javascript
复制
pip install dtreeviz             # install dtreeviz for sklearn
pip install dtreeviz[xgboost]    # install XGBoost related dependency
pip install dtreeviz[pyspark]    # install pyspark related dependency
pip install dtreeviz[lightgbm]   # install LightGBM related dependency

使用也很简单

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-12-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档