收藏 | 27个机器学习小抄(附学习资源)

来源:机器学习算法与自然语言处理

本文多资源,建议收藏。 本文针对机器学习基本概念及编程和数学基础,为你列出相应的学习资源。

机器学习(Machine Learning)有很多方面,当我开始研究学习它时,我发现了各种各样的“小抄”,它们简明地列出了给定主题的关键知识点。最终,我汇集了超过 20 篇的机器学习相关的小抄,其中一些我经常会翻阅,而另一些我也获益匪浅。这篇文章里面包含了我在网上找到的 27 个小抄,如果你发现我有所遗漏的话,请告诉我。

机器学习领域的变化是日新月异的,我想这些可能很快就会过时,但是至少在目前,它们还是很潮的。

机器学习

这里有一些有用的流程图和机器学习算法表,我只包括了我所发现的最全面的几个。

1. 神经网络架构

http://www.asimovinstitute.org/neural-network-zoo/

2. 神经网络公园

微软 Azure 算法流程图

https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet

用于微软 Azure 机器学习工作室的机器学习算法

3. SAS 算法流程图

SAS:我应该使用哪个机器学习算法?

http://blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/

4. 算法总结

http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/

5. 机器学习算法指引

已知的机器学习算法哪个最好?

http://thinkbigdata.in/best-known-machine-learning-algorithms-infographic/

6. 算法优劣

https://blog.dataiku.com/machine-learning-explained-algorithms-are-your-friend

Python

自然而然,也有许多在线资源是针对 Python 的,这一节中,我仅包括了我所见过的最好的那些小抄。

1. 算法

https://www.analyticsvidhya.com/blog/2015/09/full-cheatsheet-machine-learning-algorithms/

2. Python 基础

资源 1:http://datasciencefree.com/python.pdf

资源 2:https://www.datacamp.com /community/tutorials/python-data-science-cheat-sheet-basics#gs.0x1rxEA

3. Numpy

资源1:https://www.dataquest.io/blog/numpy-cheat-sheet/

资源 2:http://datasciencefree.com/numpy.pdf

资源 3:https://www.datacamp.com /community/blog/python-numpy-cheat-sheet#gs.Nw3V6CE

资源 4:https://github.com/donnemartin/data-science-ipython-notebooks/blob/master /numpy /numpy.ipynb

4. Pandas

资源1:http://datasciencefree.com/pandas.pdf

资源 2:https://www.datacamp.com /community/blog/python-pandas-cheat-sheet#gs.S4P4T=U

资源 3:https://github.com/donnemartin/data-science-ipython-notebooks/blob/master /pandas/pandas.ipynb

5. Matplotlib

资源 1:https://www.datacamp.com/ community/blog/python-matplotlib-cheat-sheet

资源 2:https://github.com/donnemartin/data-science-ipython-notebooks/blob/master /matplotlib/matplotlib.ipynb

6. Scikit Learn

资源 1:https://www.datacamp.com /community/blog/scikit-learn-cheat-sheet#gs.fZ2A1Jk

资源 2:http://peekaboo-vision.blogspot.de/2013 /01/machine-learning-cheat-sheet-for-scikit.html

资源 3:https://github.com/rcompton /ml_cheat_sheet/blob/master/supervised_learning.ipynb

7. Tensorflow

https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks /1_Introduction/basic_operations.ipynb

8. Pytorch

https://github.com/bfortuner/pytorch-cheatsheet

数学

如果你希望了解机器学习,那你就需要彻底地理解统计学(特别是概率)、线性代数和一些微积分。我在本科时辅修了数学,但是我确实需要复习一下了。这些小抄提供了机器学习算法背后你所需要了解的大部分数学知识。

1. 概率

http://www.wzchen.com/s/probability_cheatsheet.pdf

2. 线性代数

四页内解释线性代数

https://minireference.com/static/tutorials/linear_algebra_in_4_pages.pdf

3. 统计学

http://web.mit.edu/~csvoss/Public/usabo/stats_handout.pdf

4. 微积分

http://tutorial.math.lamar.edu/getfile.aspx?file=B,41,N

原文发布于微信公众号 - 数据派THU(DatapiTHU)

原文发表时间:2018-05-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器人网

机器学习项目的常见误区

在最近的一次报告中,Ben Hamner向我们介绍了他和他的同事在Kaggle比赛中看到的一些机器学习项目的常见误区。

1033
来自专栏ATYUN订阅号

惊喜!神经元比我们想象的复杂的多

? 深度学习或人工神经网络(ANN)能够模拟生物神经元的观点,是个很大的误解。ANN充其量能模仿一个1957年的单个神经元模型的卡通版本。任何声称深度学习的人...

3394

关于情绪分析项目的10个提议

在我的统计学硕士学位论文项目过程中,我专注于情感分析的问题。情感分析是自然语言处理的一个应用,目的是识别情感(积极的vs消极的vs中性的),主观性(客观的vs主...

2346
来自专栏AI研习社

MIT 6.S094· 深度增强学习 | 学霸的课程笔记,我们都替你整理好了

2.传感器:采集物理世界的信息并将其转换成机器可以处理的原始数据。是机器人在物理世界工作的输入端。

833
来自专栏数据科学与人工智能

【Python环境】机器学习反欺诈实践:Python+scikit-learn+随机森林

作者:Jun He 出处:CSDN 将机器学习算法用于金融领域的一个很好的突破口是反欺诈,在这篇博文中,WePay介绍了支付行业构建机器学习模型应对很难发现...

2839
来自专栏人工智能头条

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

1314
来自专栏PPV课数据科学社区

数据科学教材没有教给你的三件事

有问题直接微信我吧! 大家好,PPV课大数据微信开通了人工客服,大家有问题可以在工作时间:9:00-18:00直接通过微信与客服联系! ? 如果你还没有听说的话...

2864
来自专栏大数据挖掘DT机器学习

飞林沙:商品推荐算法&推荐解释

这是今天看到的一篇蛮有新意的讲稿,由于不是一篇完整的论文,所以理解起来稍微有些困难,就顺着写个笔记,仅供参考。 ? 在这篇文章中,我分成两部分,我们先顺着作者的...

4709
来自专栏大数据文摘

DeepMind:深度学习原理初探

1434
来自专栏大数据文摘

从基线模型开始:别担心,模型最开始都让人不忍直视

1155

扫码关注云+社区