首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
877605
阅读量
105
订阅数
CART决策树暴力生成风控规则
上一篇我们介绍了决策树节点信息更新的方法风控规则的决策树可视化(升级版),以辅助我们制定风控规则,可视化的方法比较直观,适合做报告展示,但分析的时候效果没那么高。
Python数据科学
2024-03-18
710
风控策略:客户分群策略详解
客户分群策略主要应用在贷前场景中。简单来说就是根据客户的不同维度将客户划分到不同的群体或组中,划分后的群组之间有一定的风险差异性或者业务含义。
Python数据科学
2023-12-12
3470
厉害了!Scikit-Learn 新版再次重磅升级
本次scikit-learn 1.3更新增加了许多错误修复和改进,并引入了一些重要的新功能(增功能:标签编码、决策树缺失值处理 等众多新特性)。要查看所有更改的详尽列表,请参阅发布说明。
Python数据科学
2023-08-29
3240
机器学习建模中的 Bagging 思想
我们在生活中做出的许多决定都是基于其他人的意见,而通常情况下由一群人做出的决策比由该群体中的任何一个成员做出的决策会产生更好的结果,这被称为群体的智慧。集成学习(Ensemble Learning)类似于这种思想,集成学习结合了来自多个模型的预测,旨在比集成该学习器的任何成员表现得更好,从而提升预测性能(模型的准确率),预测性能也是许多分类和回归问题的最重要的关注点。
Python数据科学
2021-08-10
7440
强悍!TensorFlow 开源 TF-DF 决策森林库
在人工智能发展史上,各类算法可谓层出不穷。近十几年来,深层神经网络的发展在机器学习领域取得了显著进展。通过构建分层或「深层」结构,模型能够在有监督或无监督的环境下从原始数据中学习良好的表征,这被认为是其成功的关键因素。
Python数据科学
2021-06-10
6710
决策树算法的原理(接地气版)
决策树算法不像前面介绍的SVM那样,散发着浓厚的数学气味。这个算法还是比较接地气的。
Python数据科学
2020-08-19
4720
机器学习读书笔记系列之决策树
决策树是当下使用的最流行的非线性框架之一。目前为止,我们学过的支持向量机和广义线性都是线性模型的例子,内核化则是通过映射特征ϕ得出非线性假设函数。决策树因其对噪声的鲁棒性和学习析取表达式的能力而闻名。实际上,决策树已被广泛运用于贷款申请人的信用风险测评中。
Python数据科学
2019-11-26
7590
终于有人把XGBoost 和 LightGBM 讲明白了,项目中最主流的集成算法!
本文主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。
Python数据科学
2019-11-21
7650
​特征工程系列:聚合特征构造以及转换特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
Python数据科学
2019-10-14
9610
决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结
决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行输的分割,直到达到结束条件或叶子节点纯度达到阈值。下图是决策树的一个示例图:
Python数据科学
2019-10-10
7510
开源 sk-dist,超参数调优仅需 3.4 秒,sk-learn 训练速度提升 100 倍!
这篇文章为大家介绍了一个开源项目——sk-dist。在一台没有并行化的单机上进行超参数调优,需要 7.2 分钟,而在一百多个核心的 Spark 群集上用它进行超参数调优,只需要 3.4 秒,把训练 sk-learn 的速度提升了 100 倍。
Python数据科学
2019-09-16
7380
决策树,逻辑回归,PCA-算法面经
决策树是一种自上而下,对样本数据进行树形分类的过程,由节点和有向边组成。节点分为内部节点和叶节点,其中每个内部节点表示一个特征或属性,叶节点表示类别。从顶部节点开始,所有样本聚在一起,经过根节点的划分,样本被分到不同的子节点中,再根据子节点的特征进一步划分,直至所有样本都被归到某个类别。
Python数据科学
2019-08-23
5470
决策树学习笔记(三):CART算法,决策树总结
推荐导读:本篇为树模型系列第三篇,旨在从最简单的决策树开始学习,循序渐进,最后理解并掌握复杂模型GBDT,Xgboost,为要想要深入了解机器学习算法和参加数据挖掘竞赛的朋友提供帮助。
Python数据科学
2019-07-22
3.3K0
决策树学习笔记(二):剪枝,ID3,C4.5
本篇将详细介绍决策树常用的三种算法,剪枝处理,缺失值,决策树优缺点,以及常见的应用场景。
Python数据科学
2019-07-22
2.3K0
决战紫禁之巅 | sklearn参数介绍及使用
本篇将介绍决策树sklearn的使用,超参数的定义和用法,以一个简单的实战内容实现决策树的分类和回归实现。
Python数据科学
2019-07-19
1.6K0
决策树学习笔记(一):特征选择
相信很多朋友已经对决策树很熟悉了,决策树是机器学习中的一种基本的可用于分类与回归的方法,它是一些集成学习如GBDT,XGboost等复杂模型的基础。这些高级模型比如XGboost可以非常好地拟合数据,在数据挖掘比赛以及工业界中都有着非常出色的表现,受到了无数爱好者的追捧。
Python数据科学
2019-07-19
3.4K0
机器学习经典算法优缺点对比及选择建议
机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。
Python数据科学
2019-07-19
1.6K0
回归建模的时代已结束,算法XGBoost统治机器学习世界
Vishal Morde讲了这样一个故事:十五年前我刚完成研究生课程,并以分析师的身份加入了一家全球投资银行。在我工作的第一天,我试着回忆我学过的一切。与此同时,在内心深处,我想知道我是否能够胜任这份工作。我的老板感觉到我的焦虑,他说:
Python数据科学
2019-05-07
9140
精选 | 机器学习与深度学习常见面试题
随机森林的预测输出值是多课决策树的均值,如果有n个独立同分布的随机变量xi,它们的方差都为σ2,则它们的均值的方差为:
Python数据科学
2019-04-09
9370
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档