SAMshare-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

SAMshare

专栏成员

272

文章

312005

阅读量

39

订阅数

关于机器学习模型可解释性算法的汇总

机器学习神经网络深度学习人工智能

目前很多机器学习模型可以做出非常好的预测，但是它们并不能很好地解释他们是如何进行预测的，很多数据科学家都很难知晓为什么该算法会得到这样的预测结果。这是非常致命的，因为如果我们无法知道某个算法是如何进行预测，那么我们将很难将其前一道其它的问题中，很难进行算法的debug。

2022-04-12

1.1K0

风控建模中的自动分箱的方法有哪些

https 网络安全神经网络机器学习

之前有位读者朋友说有空介绍一下自动分箱的方法，这个确实在我们实际建模过程前是需要解决的一个问题，简单来说就是把连续变量通过分箱的方式转换为类别变量。关于这个话题，我也借着这个主题来系统的梳理总结一下几点：为什么要分箱？不分箱可以入模型吗？自动分箱的常用方法有哪些？评估分箱效果好坏的方法有哪些？如果篇幅允许，就顺便把实现的Python代码也分享下，如果太长了就另外起一篇文章来讲。因此，本篇文章主要从下面几个模块来展开说说。

2022-02-25

2.7K0

风控ML[2] | 机器学习模型如何做业务解释？

机器学习神经网络深度学习人工智能 https

「风控ML」系列文章，主要是分享一下自己多年以来做金融风控的一些事一些情，当然也包括风控建模、机器学习、大数据风控等相关技术分享，欢迎同行交流与新同学的加入，共同学习，进步！

2021-11-30

8130

风控ML[1] | 风控建模老司机的几点思考与总结

编程算法机器学习深度学习神经网络人工智能

「风控ML」系列文章，主要是分享一下自己多年以来做金融风控的一些事一些情，当然也包括风控建模、机器学习、大数据风控等相关技术分享，欢迎同行交流与新同学的加入，共同学习，进步！

2021-11-30

1.4K0

[006] 模型在生产上无法发挥功效，该何去何从？

linux 机器学习神经网络深度学习人工智能

The reasons for this are often down to three major factors:

2020-11-19

2810

[003] 这5类机器学习算法你需要知道！

linux 机器学习神经网络深度学习人工智能

One of the most well-known and essential sub-fields of data science is machine learning. The term machine learning was first used in 1959 by IBM researcher Arthur Samuel. From there, the field of machine learning gained much interest from others, especially for its use in classifications.

2020-11-19

3940

用简单术语让你看到贝叶斯优化之美

机器学习神经网络深度学习人工智能

假设有一个函数 f(x)。其计算成本很高，它不一定是分析表达式，而且你不知道它的导数。

2020-10-23

5330

这5件事情我希望自己能在刚开始学习数据科学的时候就知道

机器学习神经网络深度学习人工智能

这是作者在她自己的数据科学学习经历中的总结的一些见解，还是有很有道理的，确实是经验之谈，初学者可以参考。

2020-09-30

4680

特征锦囊：今天一起搞懂机器学习里的L1与L2正则化

正则表达式编程算法机器学习神经网络深度学习

特征锦囊：今天一起搞懂机器学习里的L1与L2正则化今天我们来讲讲一个理论知识，也是老生常谈的内容，在模型开发相关岗位中出场率较高的，那就是L1与L2正则化了，这个看似简单却十分重要的概念，还是需要深

2020-09-30

1.5K0

机器学习在金融风控的经验总结！

特征工程机器学习神经网络深度学习人工智能

由于金融风控场景的特殊性，很多算法同学在刚进入这个领域容易“水土不服”，为了使机器学习项目（也包括图算法相关的应用）落地更加顺利，本文介绍下实践过程的一些经验和踩过的坑。

2020-09-22

1.7K0

吴恩达给我们的ML生涯规划，赞！

图像处理机器学习人工智能深度学习神经网络

作为曾在多个著名企业和学术机构担任实验室负责人的“老司机”，吴恩达可谓经验丰富，他就以上问题给出了出色的建议，带你稳步上车。

2020-09-22

6320

Python手写了 35 种可解释的特征工程方法

编程算法决策树机器学习神经网络深度学习

特征的挖掘，是一个算法工程师 or 数据挖掘工程师，最最最基本的能力。实际业务中，许多数时候数据源和建模目标都是确定的，这时候特征工程几乎就决定了最终模型的业务效果。即使是表示学习横行的当下，在风控和推荐系统中依然大量的使用着手工的特征进行建模。本文将介绍机器学习中的2大类特征深入挖掘方法（特征聚合&特征交叉），以及其中35种特征衍生方案。希望能为对此处经验较少的读者提供一些帮助。

2020-09-14

1.4K0

黑盒模型实际上比逻辑回归更具可解释性

机器学习神经网络深度学习人工智能编程算法

如何让复杂的模型具备可解释性，SHAP值是一个很好的工具，但是SHAP值不是很好理解，如果能将SHAP值转化为对概率的影响，看起来就很舒服了。先前阿Sam也写过一篇类似的文章，关于SHAP值的解释的，感兴趣的也可以一并阅读一下。MLK | 如何解决机器学习树集成模型的解释性问题

2020-05-13

1.4K0

10万+字的机器学习理论笔记&特征工程tips分享，附PDF下载

机器学习深度学习神经网络人工智能

随着我们在机器学习、数据建模、数据挖掘分析这条发展路上越走越远，其实越会感觉到机器学习理论知识和特征工程的重要性，这里有两本一位好友整理的学习资料，都是满满干货！分别是《machine learning knowledge》和《Tips of feature engineering》，全文加起来超过10万字！

2020-04-11

9020

2020年图机器学习的最新趋势

数据结构知识图谱机器学习神经网络深度学习

2020年才刚刚开始，但我们已经在最新的研究论文中看到了图机器学习(GML)的趋势。以下是我对2020年GML的重要内容的看法以及对这些论文的讨论。

2020-02-19

5780

机器学习面试的12个基础问题，强烈推荐！

神经网络机器学习人工智能深度学习批量计算

这些问题是我在面试 AI 工程师岗位时常问到的问题。事实上，并非所有面试都需要用到所有这些问题，因为这取决于面试者的经验以及之前做过的项目。经过很多面试（尤其是与学生的面试）之后，我收集了 12 个深度学习领域的面试问题。我将在本文中将其分享给你。

2020-02-16

1.1K0

算法在岗一年的经验总结

编程算法机器学习神经网络深度学习人工智能

这是大家没有看过的船新栏目！ML表示机器学习，DEV表示开发，本专栏旨在为大家分享作为算法工程师的工作，机器学习生态下的有关模型方法和技术，从数据生产到模型部署维护监控全流程，预备知识、理论、技术、经验等都会涉及，近期内容以入门线路为主，敬请期待！

2020-01-15

3550

周志华团队：深度森林挑战多标签学习，9大数据集超越传统方法

深度学习神经网络编程算法

2017年，南京大学机器学习与数据挖掘研究所（简称LAMDA 团队）的周志华教授与他的团队，提出了“深度森林”(Deep forest)：一种基于树的方法，拓展了深度学习的体系。

2019-12-09

7190

MLK | 一文理清集成学习知识点(Boosting&Bagging)

决策树编程算法机器学习神经网络人工智能

相信这个环节的内容大家都会比较熟悉的，因为我们经常用到的XGBoost、GBDT就是集成模型，今天这里就给大家系统地梳理一下知识点和原理，做到了然于胸。

2019-12-06

5890

特征工程系列：时间特征构造以及时间序列特征构造

https 网络安全机器学习神经网络深度学习

数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程在机器学习中占有相当重要的地位。在实际应用当中，可以说特征工程是机器学习成功的关键。

2019-12-04

1.2K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态