每个机器学习工程师都应该知道的基本算法

机器学习作为一门多领域交叉学科,已经存在很长时间了,但近些年才开始火热起来。本文中列出了你需要知道的机器学习领域的算法,了解这些你就可以解决在机器学习中所遇到的任何问题。但这只是个覆盖大部分基础算法的清单,并不是全部。

回归算法

回归算法对变量之间的关系建模。最初是一种统计技术,它现在已经成为每个机器学习工程师必须掌握的重要工具。

常见的回归算法:

  • 最小二乘回归(Least Squares Regression)
  • 线性回归(Linear Regression)
  • Logistic回归(Logistic Regression)
  • 回归介绍视频:https://www.coursera.org/learn/regression-models/lecture/Kz1eV/ introduction-to-regression

聚类算法

聚类算法可以将数据点分到具有相似属性的组中。他们通过查找数据中的固有结构来将数据划分到不同的组中。一个组中的事物属性的关联比其他组中的关联的更密切。

聚类算法有硬聚类和软聚类两种类型。硬聚类是指数据点明确的完全属于一个组或完全不属于一个组。软聚类是指一个数据点可以不同程度地属于许多不同的组。

常见的聚类算法:

  • K均值(K-means)
  • 层次聚类(Hierarchical Clustering)
  • 聚类介绍视频:https://www.youtube.com/watch?v=ZueoXMgCd1c

降维算法

当特征的数量与数据点的数量要大很多时。降维算法可以帮你将特征的数量减少到目前问题所需要的数量。他们可以删除多余的特征,帮助你获得更好的结果。

降维算法有两种工作方法。第一种方法是通过特征选择,算法选取可用特征的子集。第二种方法是特征提取,将高维空间中的数据压到低维度。

常见的降维算法:

  • 主成分分析(PCA)
  • 低方差滤波(Low Variance Filter)
  • 高相关滤波(High Correlation Filter)
  • 随机森林(Random Forests)
  • 反向特征消除/前向特征构造(Backward Feature Elimination / Forward Feature construction)
  • 更多的内容可以查看:https://www.kdnuggets.com/2015/05/7-methods-data-dimensionality-reduction.html

决策树算法

决策树创建一个根据数据做出决策的模型。在树状结构中制作一个分叉,直到每个数据点都有对应的预测。与其他深度学习的算法不同,它们的结果很容易理解,并且它们很容易在许多不同的数据类型中使用。

常见的决策树算法:

  • 分类和回归树(classification and regression tree)
  • C4.5和C5.0
  • 随机森林(Random Forests)
  • 卡方自动交互检测(CHAID)
  • 推荐教程:https://www.analyticsvidhya.com/blog/2016/04/complete-tutorial-tree-based-modeling-scratch-in-python/

深度学习

机器学习和人工智能的概念是深度学习炒火的。他们是人造神经网络的现代版本,利用廉价的计算来训练更大的神经网络。它们证明了它们具有解决一些最难问题的能力。如AlphaGo。

常见深度学习:

  • 栈式自编码器(Stacked Auto-encoders)
  • 卷积神经网络(CNN)
  • 递归神经网络(RNN)
  • 胶囊网络(Capsule Networks,https://hackernoon.com/what-is-a-capsnet-or-capsule-network-2bfbe48769cc)
  • 推荐教程:https://www.safaribooksonline.com/library/view/deep-learning/97814919 24570/ch04.html

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2017-11-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

特征学习

Contents 1 关键词 2 为什么需要进行特征学习 3 无监督学习解决的问题 4 功能强大的特征学习 1. 关键词 自我学习/自学习 self-t...

28310
来自专栏视觉求索无尽也

图像卷积与滤波参考资料:

首先,我们有一个二维的滤波器矩阵(有个高大上的名字叫卷积核)和一个要处理的二维图像。然后,对于图像的每一个像素点,计算它的邻域像素和滤波器矩阵的对应元素的乘积,...

912
来自专栏企鹅号快讯

DL笔记:Neural Networks 神经网络

回顾 -DL笔记:机器学习和深度学习的区别 :听说深度学习的思想受到神经网络的启发,那是什么玩意儿? :神经网络包括生物神经网络和人工神经网络。在生物神经网络中...

1916
来自专栏SeanCheney的专栏

《Scikit-Learn与TensorFlow机器学习实用指南》 第5章 支持向量机

支持向量机(SVM)是个非常强大并且有多种功能的机器学习模型,能够做线性或者非线性的分类,回归,甚至异常值检测。机器学习领域中最为流行的模型之一,是任何学习机器...

2412
来自专栏大数据挖掘DT机器学习

判别模型 和 生成模型

【摘要】 - 生成模型:无穷样本==》概率密度模型 = 产生模型==》预测 - 判别模型:有限样本==》判别函数 = 预测模型==》预测 【...

2776
来自专栏SIGAI学习与实践平台

深入浅出聚类算法

聚类问题是机器学习中无监督学习的典型代表,在数据分析、模式识别的很多实际问题 中得到了应用。在本文中,SIGAI 将为大家深入浅出的介绍聚类问题的定义以及各种典...

1051
来自专栏null的专栏

机器学习中的特征——特征选择的方法以及注意点

关于机器学习中的特征我有话要说     在这次校园招聘的过程中,我学到了很多的东西,也纠正了我之前的算法至上的思想,尤其是面试百度的过程中,让我渐渐意识到机器学...

2889
来自专栏机器学习算法与Python学习

机器学习(18)之支持向量机原理(三)线性不可分支持向量机与核函数

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 前言 在(机器学习(15)之支持向量...

3817
来自专栏机器之心

学界 | 将未来信息作为正则项,Twin Networks加强RNN对长期依赖的建模能力

2978
来自专栏量子位

卷积神经网络在图像分割中的进化史:从R-CNN到Mask R-CNN

王小新 编译自 Medium 量子位 出品 | 公众号 QbitAI 卷积神经网络(CNN)不仅能用来对图像进行分类,还在图像分割任务重有着广泛的应用。 Dh...

3865

扫码关注云+社区