首页
学习
活动
专区
工具
TVP
发布

木东居士的专栏

专栏作者
222
文章
404564
阅读量
178
订阅数
决策树5:剪枝与sklearn中的决策树
当训练数据量大、特征数量较多时构建的决策树可能很庞大,这样的决策树用来分类是否好?答案是否定的。
木东居士
2019-12-23
3.8K0
决策树4:构建算法之ID3、C4.5
ID3算法是一种分类预测算法,算法以信息论中的“信息增益”为基础。核心是通过计算每个特征的信息增益,每次划分选取信息增益最高的属性为划分标准,递归地构建决策树。
木东居士
2019-12-23
7240
决策树3: 特征选择之寻找最优划分
决策树算法的三个步骤:特征选择、决策树生成、决策树剪枝。其中特征选择要解决的核心问题就是:
木东居士
2019-12-23
1.2K0
决策树2: 特征选择中的相关概念
熵是热力学中的概念,表示混乱程度。熵越大,热力系统中粒子无规则的运动越剧烈;熵越小,粒子越趋近于静止的状态。
木东居士
2019-12-23
1.6K0
决策树1:初识决策树
决策树是一个非常有意思的模型,它的建模思路是尽可能模拟人做决策的过程。因此决策树几乎没有任何抽象,完全通过生成决策规则来解决分类和回归问题。因为它的运行机制能很直接地被翻译成人类语言,即使对建模领域完全不了解的非技术人员也能很好地理解它。因此在学术上被归为白盒模型(white box model)。
木东居士
2019-12-23
1.1K0
数据人必读的一篇数据可视化文章【值得珍藏】
数据可视化,对于很多人来说,并不是高不可攀和陌生的东西,无论是否是数据行业从业者,在日常的工作和汇报当中,都不免会使用到各种图表来直观的呈现数据。
木东居士
2019-11-09
9100
​特征工程系列:聚合特征构造以及转换特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
木东居士
2019-10-12
2.3K0
数据挖掘面试题之:梯度提升树
GBDT是机器学习面试中的常客,但是,要准确地说出它的原理却并不容易,除了掌握DT基本知识外,还要掌握加法模型、前向分步算法、梯度提升思想,本文是对这些知识点的一个简单总结,请各路大神指正。
木东居士
2019-08-06
4510
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档