首页
学习
活动
专区
工具
TVP
发布

SAMshare

专栏作者
271
文章
286392
阅读量
38
订阅数
风控ML[18] | 风控建模中GBDT和XGBoost怎么调优
01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 04 GBDT的评估与调参思路 05 XGBoost的评估与调参思路 06 总结一下
Sam Gor
2022-11-14
1.2K0
Python手写了 35 种可解释的特征工程方法
特征的挖掘,是一个 算法工程师 or 数据挖掘工程师,最最最基本的能力。实际业务中,许多数时候数据源和建模目标都是确定的,这时候特征工程几乎就决定了最终模型的业务效果。即使是表示学习横行的当下,在风控和推荐系统中依然大量的使用着手工的特征进行建模。本文将介绍机器学习中的2大类特征深入挖掘方法(特征聚合&特征交叉),以及其中35种特征衍生方案。希望能为对此处经验较少的读者提供一些帮助。
Sam Gor
2020-09-14
1.2K0
学习周报20200621 | 风控、模型、回顾
这周因为一些原因需要整理一些风控建模的知识点,顺便在这里整理一下,一起来回顾回顾。
Sam Gor
2020-06-24
1.6K0
MLK | 一文理清集成学习知识点(Boosting&Bagging)
相信这个环节的内容大家都会比较熟悉的,因为我们经常用到的XGBoost、GBDT就是集成模型,今天这里就给大家系统地梳理一下知识点和原理,做到了然于胸。
Sam Gor
2019-12-06
5630
终于有人把XGBoost 和 LightGBM 讲明白了,项目中最主流的集成算法!
本文是主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。
Sam Gor
2019-11-22
2.8K0
推荐收藏 | 决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结
决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行分割,直到达到结束条件或叶子节点纯度达到阈值。下图是决策树的一个示例图:
Sam Gor
2019-10-12
6450
推荐收藏 | 统计学 常用的数据分析方法大总结!
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
Sam Gor
2019-09-09
1.2K0
Machine Learning-算法汇总介绍
之前一个一个讲还是有些零散而且更新的速度也慢,所以我还是打算先整理一波全部的算法,再逐一展开介绍比较好,原文来自Jason Brownlee 的文章《A Tour of Machine Learning Algorithms》。
Sam Gor
2019-08-22
7200
Machine Learning-经典模型之DT Learning
Decision tree learning uses a decision tree (as a predictive model) to go from observations about an item (represented in the branches) to conclusions about the item's target value (represented in the leaves).
Sam Gor
2019-08-22
7200
Machine Learning-教你用Scikit-Learn来做分类器(完整版)
选自 Python-Machine-Learning-Book On GitHub
Sam Gor
2019-08-22
1.3K0
Machine Learning-常见算法优缺点汇总
机器学习算法我们了解了很多,但是放在一起来比较优缺点是缺少的,本篇文章就一些常见的算法来进行一次优缺点梳理。
Sam Gor
2019-08-22
8600
Machine Learning-教你用Scikit-Learn来做分类器(下)
选自 Python-Machine-Learning-Book On GitHub
Sam Gor
2019-08-22
4140
MLK | 机器学习常见算法优缺点了解一下
2、使用基于决策树的combination算法,如bagging算法,randomforest算法,可以解决过拟合的问题。
Sam Gor
2019-08-13
6020
【推荐收藏】一文入门Scikit-Learn分类器
选自 Python-Machine-Learning-Book On GitHub
Sam Gor
2019-07-08
2K0
MLK | 那些常见的特征工程
为了消除不同数据特征之间的量纲影响,我们需要对数据特征进行归一化处理,使得不同指标之间有一定的可比性。常用的归一化方法有:
Sam Gor
2019-07-08
6040
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档