首页
学习
活动
专区
工具
TVP
发布

SAMshare

专栏作者
271
文章
292675
阅读量
38
订阅数
关于机器学习模型可解释性算法的汇总
目前很多机器学习模型可以做出非常好的预测,但是它们并不能很好地解释他们是如何进行预测的,很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的,因为如果我们无法知道某个算法是如何进行预测,那么我们将很难将其前一道其它的问题中,很难进行算法的debug。
Sam Gor
2022-04-12
9960
风控建模中的自动分箱的方法有哪些
之前有位读者朋友说有空介绍一下自动分箱的方法,这个确实在我们实际建模过程前是需要解决的一个问题,简单来说就是把连续变量通过分箱的方式转换为类别变量。关于这个话题,我也借着这个主题来系统的梳理总结一下几点:为什么要分箱?不分箱可以入模型吗?自动分箱的常用方法有哪些?评估分箱效果好坏的方法有哪些? 如果篇幅允许,就顺便把实现的Python代码也分享下,如果太长了就另外起一篇文章来讲。因此,本篇文章主要从下面几个模块来展开说说。
Sam Gor
2022-02-25
2.4K0
风控ML[2] | 机器学习模型如何做业务解释?
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!
Sam Gor
2021-11-30
7460
风控ML[1] | 风控建模老司机的几点思考与总结
「风控ML」系列文章,主要是分享一下自己多年以来做金融风控的一些事一些情,当然也包括风控建模、机器学习、大数据风控等相关技术分享,欢迎同行交流与新同学的加入,共同学习,进步!
Sam Gor
2021-11-30
1.3K0
[006] 模型在生产上无法发挥功效,该何去何从?
The reasons for this are often down to three major factors:
Sam Gor
2020-11-19
2710
[003] 这5类机器学习算法你需要知道!
One of the most well-known and essential sub-fields of data science is machine learning. The term machine learning was first used in 1959 by IBM researcher Arthur Samuel. From there, the field of machine learning gained much interest from others, especially for its use in classifications.
Sam Gor
2020-11-19
3660
用简单术语让你看到贝叶斯优化之美
假设有一个函数 f(x)。其计算成本很高,它不一定是分析表达式,而且你不知道它的导数。
Sam Gor
2020-10-23
5140
这5件事情我希望自己能在刚开始学习数据科学的时候就知道
这是作者在她自己的数据科学学习经历中的总结的一些见解,还是有很有道理的,确实是经验之谈,初学者可以参考。
Sam Gor
2020-09-30
4480
特征锦囊:今天一起搞懂机器学习里的L1与L2正则化
特征锦囊:今天一起搞懂机器学习里的L1与L2正则化 今天我们来讲讲一个理论知识,也是老生常谈的内容,在模型开发相关岗位中出场率较高的,那就是L1与L2正则化了,这个看似简单却十分重要的概念,还是需要深
Sam Gor
2020-09-30
1.3K0
机器学习在金融风控的经验总结!
由于金融风控场景的特殊性,很多算法同学在刚进入这个领域容易“水土不服”,为了使机器学习项目(也包括图算法相关的应用)落地更加顺利,本文介绍下实践过程的一些经验和踩过的坑。
Sam Gor
2020-09-22
1.6K0
吴恩达给我们的ML生涯规划,赞!
作为曾在多个著名企业和学术机构担任实验室负责人的“老司机”,吴恩达可谓经验丰富,他就以上问题给出了出色的建议,带你稳步上车。
Sam Gor
2020-09-22
6000
Python手写了 35 种可解释的特征工程方法
特征的挖掘,是一个 算法工程师 or 数据挖掘工程师,最最最基本的能力。实际业务中,许多数时候数据源和建模目标都是确定的,这时候特征工程几乎就决定了最终模型的业务效果。即使是表示学习横行的当下,在风控和推荐系统中依然大量的使用着手工的特征进行建模。本文将介绍机器学习中的2大类特征深入挖掘方法(特征聚合&特征交叉),以及其中35种特征衍生方案。希望能为对此处经验较少的读者提供一些帮助。
Sam Gor
2020-09-14
1.3K0
黑盒模型实际上比逻辑回归更具可解释性
如何让复杂的模型具备可解释性,SHAP值是一个很好的工具,但是SHAP值不是很好理解,如果能将SHAP值转化为对概率的影响,看起来就很舒服了。先前阿Sam也写过一篇类似的文章,关于SHAP值的解释的,感兴趣的也可以一并阅读一下。MLK | 如何解决机器学习树集成模型的解释性问题
Sam Gor
2020-05-13
1.3K0
10万+字的机器学习理论笔记&特征工程tips分享,附PDF下载
随着我们在机器学习、数据建模、数据挖掘分析这条发展路上越走越远,其实越会感觉到机器学习理论知识和特征工程的重要性,这里有两本一位好友整理的学习资料,都是满满干货!分别是《machine learning knowledge》和 《Tips of feature engineering》,全文加起来超过10万字!
Sam Gor
2020-04-11
8430
2020年图机器学习的最新趋势
2020年才刚刚开始,但我们已经在最新的研究论文中看到了图机器学习(GML)的趋势。以下是我对2020年GML的重要内容的看法以及对这些论文的讨论。
Sam Gor
2020-02-19
5600
机器学习面试的12个基础问题,强烈推荐!
这些问题是我在面试 AI 工程师岗位时常问到的问题。事实上,并非所有面试都需要用到所有这些问题,因为这取决于面试者的经验以及之前做过的项目。经过很多面试(尤其是与学生的面试)之后,我收集了 12 个深度学习领域的面试问题。我将在本文中将其分享给你。
Sam Gor
2020-02-16
1K0
算法在岗一年的经验总结
这是大家没有看过的船新栏目!ML表示机器学习,DEV表示开发,本专栏旨在为大家分享作为算法工程师的工作,机器学习生态下的有关模型方法和技术,从数据生产到模型部署维护监控全流程,预备知识、理论、技术、经验等都会涉及,近期内容以入门线路为主,敬请期待!
Sam Gor
2020-01-15
3390
周志华团队:深度森林挑战多标签学习,9大数据集超越传统方法
2017年,南京大学机器学习与数据挖掘研究所(简称LAMDA 团队)的周志华教授与他的团队,提出了“深度森林”(Deep forest):一种基于树的方法,拓展了深度学习的体系。
Sam Gor
2019-12-09
6180
MLK | 一文理清集成学习知识点(Boosting&Bagging)
相信这个环节的内容大家都会比较熟悉的,因为我们经常用到的XGBoost、GBDT就是集成模型,今天这里就给大家系统地梳理一下知识点和原理,做到了然于胸。
Sam Gor
2019-12-06
5720
特征工程系列:时间特征构造以及时间序列特征构造
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
Sam Gor
2019-12-04
1.1K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档