近期在对历史的机器学习文章进行了整理与归集,方便自己也方便他人学习知识,今天分享给大家的是一个近8万字的机器学习理论知识点文章汇集,主题为《machine learning knowledge》,这个系列的文章可以满足你对machine learning理论知识的学习~
该系列的文章主要来自于作者对于《百面机器学习》以及其他网路上的一些学习资料的笔记总结? ,分享给更多的同行同学一起学习复习~ 文章内容已经贴到GitHub上啦,大家可以去star一波~
? GitHub传送门:
https://github.com/Pysamlam/Machine-Learning-Knowledge
目前作者更新的系列文章有12篇,每一篇都相对比较干货的,目录如下:
MLK01 | 机器学习论文搜索利器推荐
MLK02 | 如何解决机器学习树集成模型的解释性问题
MLK03 | 那些常见的特征工程
MLK04 | 机器学习的降维”打击“
MLK05 | 机器学习采样方法大全
MLK06 | 非监督学习最强攻略
MLK07 | 机器学习常见算法优缺点了解一下
MLK08 | 模型评估的一些事
MLK09 | 一文理清深度学习前馈神经网络
MLK10 | 一文理清深度学习循环神经网络
MLK11 | 一文理清集成学习知识点(Boosting&Bagging)
MLK12 | Keras 基础模型调参指南
我们看看当中的一些文章片段:
目前TREE SHAP可以支持的树集成模型有XGBoost, LightGBM, CatBoost, and scikit-learn tree models,可以看看下面的demo:
import xgboost
import shap
# load JS visualization code to notebook
shap.initjs()
"""训练 XGBoost 模型,SHAP里提供了相关数据集"""
X,y = shap.datasets.boston()
model = xgboost.train({"learning_rate": 0.01}, xgboost.DMatrix(X, label=y), 100)
"""
通过SHAP值来解释预测值
(同样的方法也适用于 LightGBM, CatBoost, and scikit-learn models)
"""
explainer = shap.TreeExplainer(model)
shap_values = explainer.shap_values(X)
# 可视化解释性 (use matplotlib=True to avoid Javascript)
shap.force_plot(explainer.expected_value, shap_values[0,:], X.iloc[0,:])
# visualize the training set predictions
shap.force_plot(explainer.expected_value, shap_values, X)
更多详细的文章内容,可以移步GitHub哈,会持续更新内容!
https://github.com/Pysamlam/Machine-Learning-Knowledge
Or 直接下载当前版本的PDF文件:在后台回复“MLK”获取!?