什么是机器学习
维基百科上是这样说的:
机器学习是人工智能的一个分支。
人工智能的研究是从以“推理”为重点到以“知识”为重点,再到以“学习”为重点,一条自然、清晰的脉络。
显然,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。
机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。
机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。
机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。
算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。
其实要想真正的去理解机器学习,我们可能需要分不同的方法去研究它
机器学习
我们把机器学习分为三种不同的类型机器学习方法:
1、监督学习
2、无监督学习
3、强化学习
这三种不同的方法直接也存在着本质的区别,我们将来稍作分析
监督学习
我们通过监督学习可以实现对未来可能发生的事件进行预测
分类
利用分类对类标的训练数据进行建模,对列表数据进行预测。
分类属于监督学习的一个子类,目的就基于对过往类标一直示例的观察学习,实现对新样本类标的预测。
通过监督学习算法构造的预测模型可以将训练样本中出现的任何类标赋给一个尚未被标记的新样本。
回归
针对连续型输出变量进行预测,也就是我们现在要说的回归分析。
在回归分析中,数据结果中会给出大量的自变量【解释变量】和相应的连续因变量【输出结果】,通过尝试寻找这两种变量之间的关系,就能够预测输出的变量。
无监督学习
我们通过无监督学习可以实现在无已知变量和反馈的情况下提取有效信息
聚类
聚类属于一种探索性数据分析技术,可以实现在没有任何相关先验的信息情况下,帮助我们将数据划分为有意义的即簇【类别】。对数据进行分析时,生成的每个组中其内部成员之间具有一定的相似度,而与其他簇中的成员则具有较大的不同,这也是为什么聚类有时被称为“无监督分类”的原因
数据降维
数据降维属于无监督学习的另外一个领域,我们每一次采样都会获得大量的样本值,这也会增加学习算法性能的难度,无监督降维就起到了降低某些算法准确性的作用,提高数据处理信息中对数据特征进行预处理的作用。并在数据可视化放面通过技术可以实现映射到一维、二维或者三维的属性空间,并可通过散点图和直方图对二维、三维数据进行可视化输出。
强化学习
我们通过强化学习可以达到系统性能的最大化利用
强化学习
强化学习的目标是为了构建一个系统,在与环境交互的过程中提高系统的性能。
比如象棋对决中,系统可以根据当前棋盘上的棋子状态决定下一步棋落子的位置,而在游戏结束给予用户胜负的判定就可以作为一个激励信号。
在通过与环境的交互,系统可以通过强化学习来得到一系列的行为,再通过探索性的试错或者借助精心设计的激励系统使用正向反馈发挥到最大化。
小结
通过本文简单的介绍,我相信小伙伴们应该对机器学习有个初步的认识。我们可以了解到监督学习由两个重要的子领域组成:分类和回归。其中,我们可以通过分类技术将对象划分到不同的类别中,而回归则能够对输出为连续型的目标变量进行预测。无监督学习不仅能从众多的无类标数据中发现其整体结构,同时在特征预处理阶段的数据压缩中也发挥了重要作用。
☂
来者是萍水相逢,去者是江湖相忘。
领取专属 10元无门槛券
私享最新 技术干货