首页
学习
活动
专区
工具
TVP
发布

SAMshare

专栏作者
271
文章
292661
阅读量
38
订阅数
风控ML[18] | 风控建模中GBDT和XGBoost怎么调优
01 GBDT和XGBoost的原理介绍 02 GBDT和XGBoost的异同点分析 03 什么风控建模场景下常用这两个明星算法? 04 GBDT的评估与调参思路 05 XGBoost的评估与调参思路 06 总结一下
Sam Gor
2022-11-14
1.2K0
关于机器学习模型可解释性算法的汇总
目前很多机器学习模型可以做出非常好的预测,但是它们并不能很好地解释他们是如何进行预测的,很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的,因为如果我们无法知道某个算法是如何进行预测,那么我们将很难将其前一道其它的问题中,很难进行算法的debug。
Sam Gor
2022-04-12
9960
风控建模中的自动分箱的方法有哪些
之前有位读者朋友说有空介绍一下自动分箱的方法,这个确实在我们实际建模过程前是需要解决的一个问题,简单来说就是把连续变量通过分箱的方式转换为类别变量。关于这个话题,我也借着这个主题来系统的梳理总结一下几点:为什么要分箱?不分箱可以入模型吗?自动分箱的常用方法有哪些?评估分箱效果好坏的方法有哪些? 如果篇幅允许,就顺便把实现的Python代码也分享下,如果太长了就另外起一篇文章来讲。因此,本篇文章主要从下面几个模块来展开说说。
Sam Gor
2022-02-25
2.4K0
风控ML[2] | 机器学习模型如何做业务解释?
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!
Sam Gor
2021-11-30
7460
风控ML[1] | 风控建模老司机的几点思考与总结
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!
Sam Gor
2021-11-30
1.3K0
[006] 模型在生产上无法发挥功效,该何去何从?
The reasons for this are often down to three major factors:
Sam Gor
2020-11-19
2710
[003] 这5类机器学习算法你需要知道!
One of the most well-known and essential sub-fields of data science is machine learning. The term machine learning was first used in 1959 by IBM researcher Arthur Samuel. From there, the field of machine learning gained much interest from others, especially for its use in classifications.
Sam Gor
2020-11-19
3660
用简单术语让你看到贝叶斯优化之美
假设有一个函数 f(x)。其计算成本很高,它不一定是分析表达式,而且你不知道它的导数。
Sam Gor
2020-10-23
5140
这5件事情我希望自己能在刚开始学习数据科学的时候就知道
这是作者在她自己的数据科学学习经历中的总结的一些见解,还是有很有道理的,确实是经验之谈,初学者可以参考。
Sam Gor
2020-09-30
4480
特征锦囊:今天一起搞懂机器学习里的L1与L2正则化
特征锦囊:今天一起搞懂机器学习里的L1与L2正则化 今天我们来讲讲一个理论知识,也是老生常谈的内容,在模型开发相关岗位中出场率较高的,那就是L1与L2正则化了,这个看似简单却十分重要的概念,还是需要深
Sam Gor
2020-09-30
1.3K0
机器学习在金融风控的经验总结!
由于金融风控场景的特殊性,很多算法同学在刚进入这个领域容易“水土不服”,为了使机器学习项目(也包括图算法相关的应用)落地更加顺利,本文介绍下实践过程的一些经验和踩过的坑。
Sam Gor
2020-09-22
1.6K0
吴恩达给我们的ML生涯规划,赞!
作为曾在多个著名企业和学术机构担任实验室负责人的“老司机”,吴恩达可谓经验丰富,他就以上问题给出了出色的建议,带你稳步上车。
Sam Gor
2020-09-22
6000
Python手写了 35 种可解释的特征工程方法
特征的挖掘,是一个 算法工程师 or 数据挖掘工程师,最最最基本的能力。实际业务中,许多数时候数据源和建模目标都是确定的,这时候特征工程几乎就决定了最终模型的业务效果。即使是表示学习横行的当下,在风控和推荐系统中依然大量的使用着手工的特征进行建模。本文将介绍机器学习中的2大类特征深入挖掘方法(特征聚合&特征交叉),以及其中35种特征衍生方案。希望能为对此处经验较少的读者提供一些帮助。
Sam Gor
2020-09-14
1.3K0
学习周报20200621 | 风控、模型、回顾
这周因为一些原因需要整理一些风控建模的知识点,顺便在这里整理一下,一起来回顾回顾。
Sam Gor
2020-06-24
1.7K0
黑盒模型实际上比逻辑回归更具可解释性
如何让复杂的模型具备可解释性,SHAP值是一个很好的工具,但是SHAP值不是很好理解,如果能将SHAP值转化为对概率的影响,看起来就很舒服了。先前阿Sam也写过一篇类似的文章,关于SHAP值的解释的,感兴趣的也可以一并阅读一下。MLK | 如何解决机器学习树集成模型的解释性问题
Sam Gor
2020-05-13
1.3K0
10万+字的机器学习理论笔记&特征工程tips分享,附PDF下载
随着我们在机器学习、数据建模、数据挖掘分析这条发展路上越走越远,其实越会感觉到机器学习理论知识和特征工程的重要性,这里有两本一位好友整理的学习资料,都是满满干货!分别是《machine learning knowledge》和 《Tips of feature engineering》,全文加起来超过10万字!
Sam Gor
2020-04-11
8430
2020年图机器学习的最新趋势
2020年才刚刚开始,但我们已经在最新的研究论文中看到了图机器学习(GML)的趋势。以下是我对2020年GML的重要内容的看法以及对这些论文的讨论。
Sam Gor
2020-02-19
5600
近6万字的机器学习理论笔记分享,附PDF下载
近期在对历史的机器学习文章进行了整理与归集,方便自己也方便他人学习知识,今天分享给大家的是一个近8万字的机器学习理论知识点文章汇集,主题为《machine learning knowledge》,这个系列的文章可以满足你对machine learning理论知识的学习~
Sam Gor
2020-02-17
8780
特征锦囊:如何把分布修正为类正态分布?
今天我们用的是一个新的数据集,也是在kaggle上的一个比赛,大家可以先去下载一下:
Sam Gor
2020-02-17
9740
强烈推荐!分享一个持续连载的《特征工程小锦囊》项目,代码已开源!
随着我们在机器学习、数据建模、数据挖掘分析这条发展路上越走越远,其实越会感觉到特征工程的重要性,平时我们在很多地方都会看到一些很好的特征工程技巧,但是都会是一个完整项目去阅读,虽然说这样子也可以学习挖掘思路,但有的时候浓缩的技巧总结也是十分重要!
Sam Gor
2020-02-16
5020
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档