这篇文章我从面试找工作的角度,给大家介绍一下掌握机器学习算法的三重门,希望能够帮助到大家。
一、完整口述机器学习模型原理
这算是基本操作了,考验逻辑思维和表达能力。之前介绍过一篇文章,如何口述机器学习模型原理,可以做个参考,里面讲的比较简单,大家可以在此基础上去扩充,也可以写个文档,有空就练习着讲一遍。
之前推过的一文看完《统计学习方法》所有知识点,也可以做个参考,或者自己做一个类似的知识点直接or思维导图。
二、手推机器学习算法原理
图片来自:lawlite19@github
大家在学习《统计学习方法》或《机器学习》的时候,学完一章,要做到合上书,给你一张白纸,可以把本章算法每一步写的清清楚楚。这里顺便推荐一个我觉得非常不错的机器学习视频教程:shuhuai007大佬的《机器学习-白板推导系列》,大佬用21节课,在白板上一步一步推导算法,讲的非常详细,通俗易懂。
课程地址:
https://space.bilibili.com/97068901/channel/detail?cid=54167
有好心的同学将板书做了整理,非常美观,已更新到第19章:
https://github.com/ws13685555932/machine_learning_derivation
三、机器学习算法Python实现
这就比较考验代码能力了,虽然现在sklearn有现成的包可以调,还是建议大家将常见算法如LR、感知机、k近邻、贝叶斯、SVM、EM、Adaboost、决策树、随机森林、GBDT、XGBoost、聚类等等都试着用Python实现一下。这里推荐两个不错的资源:
https://github.com/lawlite19/MachineLearning_Python
作者用python实现了线性回归、逻辑回归、BP神经网络,SVM、K-Mean、PCA、异常检测等算法。
https://github.com/WenDesi/lihang_book_algorithm
作者将统计学习方法第一版每一章的算法用自己的方式实现一遍,这可是被李航老师点赞的项目!