首页
学习
活动
专区
工具
TVP
发布

机器学习专题导言

预计阅读时间:15min

自从zhang88a开了一个机器学习的专题,我就感觉自己得写点什么。没错就是这个导言!在我的视角很多人对机器学习有一些误解,最常见的就是认为机器学习等于人工智能约等于神经网络等于机器人毁灭世界。所以我觉得在正式开始这个全新的专题时应该先写一些与算法原理无关的东西。

机器学习&神经网络&人工智能

人工智能严格的说不能指代算法,我们所说的AI并不全指利用了机器学习算法的一类工程,事实上有很多AI还在用专家系统,而且效果还很不错,比如我们可以接触到的象棋软件的bot,或者同类的一些bot都没有引进机器学习算法。神经网络有些小伙伴比较了解,它其实是机器学习的一个分支,把两者等同起来是很片面的。神经网络的雏形在上世纪就出现了,但是当时的运算器并没有能力进行这种大规模的运算,当时的储存器也没有能力为算法准备海量的训练数据,依赖于硬件技术的发展以及大数据的发展神经网络之前的一些弊端显得无足轻重了。

所以我们可以这样简单的区分这三者,神经网络是一类机器学习算法,他们两个都是算法的类别,人工智能经常用到前两者的相关算法,但是人工智能没有很严格的定义。

机器学习离我们很远吗

其实我们高中时期就已经学过第一个机器学习算法了,那就是线性回归模型,后来高数用一个名为最小二乘的方法包装了一下,后来我们又学会了一个看起来更加高端的词叫拟合。我们用很多的采样点把原先的曲线拟合出来,这听起来没什么,不过在机器学习里面这个过程又有了一个新的名字叫学习。对于一个算法来说,如果它的运行过程伴随着类似于这样的学习过程,都可以广义的称之为机器学习算法。不过狭义上的机器学习算法已经只能指一部分固定的算法了,我觉得这种观念严重限制了人们的思维。

我们可以这样认识机器学习:即是它可以根据输入数据动态的调整自己的模型,如果输入的数据来自于一个相对稳定的或者慢变系统,那这个被调整过的模型参数就可以用来描述这个系统,当然数据越多,这个模型会描述的越准确。从这个视角看,我们的数理统计书里面简直全部都是机器学习算。例如点估计,用很多采样数据来估计数据服从分布的均值和方差,模型参数就是均值和方差,它被采样(训练)数据不断的调整,最后我们用均值和方差来描述发生这组采样数据的发生器。机器学习的这一特性比较符合数据融合的特点。

机器学习的学习跟我们的学习不是一个概念,它只是一个算法过程的形象化描述。我相信认识到这一点对于理性的看待这一技术是很有帮助的。

两种不同的思路

机器学习算法用来解决什么问题呢?其实所有的问题都可以笼统的概括为一类问题,即是通过学习数据隐式的或者显式的归纳出其中的规律,并且用来指导人们对测试数据的认识。最常见的分类和预测问题其实都属于这个范畴。当我们用支持向量机(svm)来分类的时候,分类的方案是显式的,我们只需要训练出一个合适的分类界面就行,但是如果用更为复杂的神经网络来分类,分类的方案就是隐式的了,这就意味着我们没法向给出线性回归时的截距和斜率一样把学习的结果很直观的呈现出来,我们只能认为这个复杂的网络里面所有的神经元的参数就指示了我的分类方案。

细心的小伙伴应该发现了神经网络和其他机器学习算法走了一条完全不同的道路,即是去模型化。它不再使用固定的理论模型来描述系统,而是用一个难以用形象的概念表达的网络来描述系统。这其中的好处是这玩意能描述的范围极其的广泛,我们不需要针对不同的问题来想一个相应的模型来,坏处是它消耗很大的算力,而且在有些较为简单的问题上表现相比较传统方法并没有优势。因此我觉得遇到任何问题都套用神经网络是一种很不智而且偷懒的行为。

神经网络=简单的大脑?

尽管有一些研究人员引用神经科学作为灵感的来源,而且神经网络给自己取来一个极其具有噱头的名字,但是不应该认为神经网络是在模拟大脑,深度学习的算法和人类大脑之间还存在着硬件和原理上的鸿沟,浅显的认为大脑就是个十分复杂的神经网络模型也是很粗陋的。在我们还没有搞清楚大脑的机制的现在,想要仿照一个简单的大脑是不可能的。

不过我们可以把这玩意看作仿生学在算法领域的一次里程碑式的胜利,诸如蚁群算法,遗传算法,粒子群,模拟退火等等算法都是来自于生物行为或者自然规律,这让算法从死板的数学推导中跳脱出来,上述的几个算法的原理描述大多只有寥寥几个简单的公式。

结束语

关注这个公众号的很多小伙伴都是在教研室沉沦的研究生,开设这个专题是希望在介绍了一些机器学习算法之后能给大家带来一些有益的启发,有些算法也许艰涩难懂,但是其实重要的不是算法的原理,重要的是思维方法,要知道灵感是不会无缘无故的降临的。接下来这个专题会根据作者的研究不同,或多或少的介绍一些东西,大家可以把这些内容当做我们一干人的学习笔记来看。

欢迎各位开放脑洞,放飞自我。同好者也可以与我们联系投稿(来稿不拒),稿酬没有。

◆◆◆◆◆

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190124G13QLH00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券