学习机器学习需要理解的五个基本概念

文章来源：企鹅号 - 上海数据分析

译者：么凹

来源：网络大数据

这篇文章主要讲述了机器学习的相关内容，阐述了机器学习的主要意义和形成过程。区别了机器学习与 AI、深度学习、神经网络等专业词汇。

大多数人可能对机器学习有点恐惧或困惑。脑子中会有它到底是什么,它有什么发展方向,我现在可以通过它挣钱吗等等这样的问题。

这些问题的提出都是有依据的。事实上，你可能没有意识到自己其实多年来一直在训练机器学习模型。你看过苹果手机或者是 Facebook 上的照片吧？你知道它如何向你展示一组面孔并要求你识别它们吗？

其实，通过标记这些照片，你正在训练面部识别模型去识别新面孔。恭喜你，现在可以说你有训练机器学习模型的经验了！但在此之前，请阅读这些机器学习基础知识，以便你可以准确回答任何后续问题。

1、机器学习可以预测

如果你只是在图片中标记朋友的面孔，那就不是在用机器学习模型。如果你上传了一张新照片系统马上告诉你每个人是谁，那你就是应用了机器学习模型。机器学习的主要意义在于根据图案模型和经过训练的其他因素来预测事物。它可以预测任何事物，如要基于地理位置和卧室数量预测房价，基于一年中的时间和天气的变化预测航班是否会延误，依据图片中的人物特点进行人像识别等等。

2、机器学习需要训练

你必须告诉机器学习模型它试图预测的是什么。想想一个孩子是如何学习的，他们第一次看到香蕉，他们不知道它是什么。然后你告诉他们这是一个香蕉。下次他们看到另一个，他们会把它识别为香蕉，机器学习就是以类似的方式工作。你可以尽可能多地展示香蕉的照片，告诉它这是香蕉，然后用未经训练的香蕉图片进行测试。但这是一个过度的简化的方法，因为整个过程遗漏了告诉它什么不是香蕉的部分，除此之外还要给它展示不同种类不同颜色、不同角度的香蕉图片等等。

3、达到 80% 的准确度就可以认为是成功的

我们还没有达到通过机器学习平台识别图片中的香蕉达到 100% 的准确率技术的地步，但也没关系，事实证明，人类去识别也不是 100% 准确。业界的潜规则是达到 80% 准确度的模型就是成功的。大家可以思考一下，在你收藏的图片中正确识别 800,000 张是非常有用的，虽然可能还有错误的 200,000 张，但这已经节省了 80% 的时间。

毋庸置疑，这是非常有价值的。假如我可以用它使你的生产力提高如此之多，你肯定会付我很多钱。而事实证明我可以用机器学习提高你的生产力。(2018 年更新：80% 规则改为 90% 规则。)

4、机器学习不同于AI，深度学习或神经网络

人们经常随意抛出以上这些术语，听起来像专家，但其中有很大差异。

AI-人工智能是指在完成特定任务时与人类一样好（或优于人类）的计算机。它也可以指一个可以根据大量输入做出决策的机器人，与终结者或 C3PO 不同。它是一个非常广泛的术语，不是很有特指性。

ML-机器学习是实现AI的一种方法。就是通过解析数据集对某事做出预测。ML 平台可以通过许多不同的方式运行训练集来预测事物。

NL-神经网络是实现机器学习模型预测事物的方式之一。神经网络的工作有点像人的大脑，通过大量的训练来调整自己，以了解香蕉应该是什么样子。这个过程创建了非常深的节点层。

5、在 AI 变得有自我意识之前，我们还有很长的路要走

我并不担心机器学习接管地球。主要是因为如果你曾构建过一个机器学习模型，就会明白它需要依赖你来告诉它究竟该做什么。即使你给出明确的指示，它通常也会出错。你必须对这些体系非常清晰明确，让它突然变化的可能性降到最低。即使是一个显示带有单词的框的简单网页，也需要你准确地告诉它该框出现的位置，形状，颜色，如何在不同的浏览器上工作，如何在不同的设备上正确显示等等。

———— / END / ————

上海交通大学教你“玩”转AI

发表于: 2018-11-302018-11-30 16:30:04
原文链接：https://kuaibao.qq.com/s/20181130B1243N00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

学习机器学习需要理解的五个基本概念

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐