重磅干货,第一时间送达
来源 | 量子位
最近,有一份很全面的算法资源在GitHub上火了,不仅有相应的原理介绍和实现代码,还提供了Demo,目前GitHub上标星已经突破 8500 星。
这份资源中,一共有5个算法,分别是:
线性回归
逻辑回归
K 均值算法
异常检测
神经网络
每一个算法,都会有数学原理解释、Python 实现的示例和交互式的 Jupyter Notebook Demo。大多数情况下,这些算法的解释,都是基于吴恩达的机器学习课程。
基于这些资源,你可以进行相应的数据训练、算法配置,并立即在浏览器中查看结果、图表和预测。
整个机器学习算法地图:
资源里有什么?
5 个算法, 一共分为了监督学习、无监督学习和神经网络3个类别。每个大的类别,都有相应的介绍,并给出了相应的应用范围。然后就是相应算法的资源。
1. 线性回归
2. 逻辑回归
3. K 均值算法
4. 异常检测算法
5. 神经网络:多层感知机(MLP)
每个算法都包含了三类资源:
第一个资源是文档,介绍算法原理与实现逻辑,并提供了相应的参考资料,可以进一步学习。
第二个资源是代码,呈现了如何用 Python 实现算法。基本上每一块代码前,都有相应的注释,标明了代码的功能和注意事项。
第三个资源是基于 Jupyter Notebook 的 Demo,用算法和数据集训练模型,来进一步的熟悉算法的运用。
需要什么先决条件?
资源的上手门槛不高,最基本的要求就是安装 Python。因为项目中的所有 Demo 都可以在浏览器中运行,所以不需要在本地安装 Jupyter。
所有用于Jupyter Notebook的数据集都可以在data文件夹中找到。
谁干的好事?
制作这份资源的,是一位名叫 Oleksii Trekhleb 的乌克兰工程师,目前正在一家软件技术咨询公司 EPAM Systems 担任首席软件工程师。
他说,建立这个存储库的目的,不是通过使用第三方库的“一行程序”来实现机器学习算法,而是从头开始实践这些算法,从而让大家能够更好地理解每个算法背后的原理。
传送门
https://github.com/trekhleb/homemade-machine-learning
领取专属 10元无门槛券
私享最新 技术干货