原创译文 | 数据科学家告诉你:深度学习和机器学习不同

导读:上一期介绍了无人驾驶的发展现状,今天我们来了解一下深度学习和机器学习的不同实践和运用(文末更多往期译文推荐)

GoodData数据科学和机器学习高级总监Arvin Hsu 认为,尽管深度学习和机器学习两个术语可互换使用,但深度学习和机器学习在解决的业务问题和它们的结果方面有很大的不同。Arvin在数据科学和数据建模方面拥有超过15年的经验,其中包括6年的开发机器学习的数据产品,包括像迪士尼和初创公司这样的企业公司。他热衷于在大数据、机器学习和企业数据交叉点进行创新,还着迷于新技术与传统的智慧融合,用技术改变人们的工作方式。

随着人工智能进入主流技术运用当中,很多人都在讨论怎样才能最有效的利用该技术。在观察一些数据科学家的对话时,我注意到一些人经常互换使用术语机器学习(ML)和深度学习(DL)。其实两者在解决业务问题及其所需的资源方面实际上是不同的概念,混淆它们可能会导致不必要且成本高昂的结果。让我们花一点时间来具体了解一下。

我们最近总能看到一些关于的人工智能头条新闻,比如关于苹果使用面部识别,iPhone安全或制作相关资讯,模仿奥巴马总统的演讲模式的视频,这些应用使用的程序通常属于深度学习的类别。深度学习实际上已经存在了数十年,但是在过去几年中,必须在足够大的数据范围内,它才能在计算上变得可行,从而使其成为有效的选择。

深度学习被认为是机器学习整体的一个子集,这是人工智能的一种方法,使应用程序能够更准确地预测结果,而而且无需特别编程。电子邮件垃圾邮件过滤器是一个很好的例子,过滤器后面是一个算法,可以不断地“学习”关于红旗邮件的信息,指示可能的垃圾邮件或网络钓鱼邮件。因此,大多数应用程序都能够将垃圾邮件减少到收到的所有电子邮件的1-3%。大约15年前,垃圾邮件过滤器开始从基于规则的系统转移到基于机器学习的过滤器。然而一个简单的贝叶斯机器学习算法可以从一个大型的“垃圾邮件”培训里集中学习,其中单词,标题和IP地址最有可能表明电子邮件是垃圾邮件。

为了区分深度学习和机器学习之间不同的使用目的,我把在过去15到20年里,在商业上可行的简单的机器学习算法作为“经典机器学习”。这些算法包括数据科学家可以在一个小数据集上运行的一套机器学习算法,这些算法能够相对容易地创建预测和预测,集群,检测异常值等。

深度学习发挥作用,实现期望的目标,需要分析大量相互关联的复杂网络的因素。要了解两者的不同之处,请思考,一辆驶近交叉路口的汽车,使用经典的机器学习算法,即使在不同的天气条件下也可以确定交通信号是红色、黄色还是绿色。但是,正如每一个司机所知道的,在交叉路口做出决定需要理解的不仅仅是光是红色还是绿色,我们还必须考虑行人,其他汽车,我们所在的车道等,以及所有这些因素之间的关系。吸收和处理所有这些数据进行优化决策是深度学习的一个工作,这就是为什么它被用于无人驾驶当中的原因。

虽然深度学习已经进入主流商业领域,但事实上实现起来既不便宜也不简单。在人事方面,你将需要一支经过专门培训的数据科学家和工程师团队,具备深度学习技术的高级专业知识。目前这类专家人数并不是很多。在硬件方面,你将需要一台具有高端图形处理单元(GPU)的计算机,这将大大的提高成本。

幸运的是,对于大多数商业公司来说,经典机器学习将为企业提供了完美的服务 我喜欢将经典机器学习视为“80/20”解决方案,即通过20%的成本,你可以实现80%的深度学习能力。

让我们回到垃圾邮件过滤器的电子邮件的案例当中,正如我前面提到的,大多数经典机器学习功能的过滤器都能够将垃圾邮件发送率降低至1-3%。最近Google的领导层提出,这个速度很低,对Gmail用户来说是不能接受的。他们发起了一个将深度学习方法整合到Gmail过滤器中的举措,Gmail过滤器的垃圾邮件发送率为0.1%。这个结果是否值得大量投入人力,资源和资金呢?Google认为是完全值得的。

所以在你决定使用深度学习是否是明智方向之举前,花一些时间和精力来思考你最终想要实现什么。时代和技术给与我们很好的机会,经典的机器学习将让你到达你想去的地方。如果不能,深度学习的门总是开放的。

文章编辑:秦革

原文发布于微信公众号 - 灯塔大数据(DTbigdata)

原文发表时间:2017-11-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

大咖 | 《深度学习革命》作者:人们对AI概念的理解存在偏差

对基本概念的误解必然导致对人工智能的错误解读。因此“杀手AI”、“机器人使我们过时”等话题便应运而生。

10320
来自专栏镁客网

Facebook推出人工智能引擎DeepText,让机器更好的理解语言和内容

19940
来自专栏人工智能头条

推荐算法不够精准?让知识图谱来解决

50120
来自专栏about云

数据挖掘快速入门

问题导读 1.什么是数据挖掘? 2.机器学习 与 数据挖掘在什么地方? 3.数据挖掘能解决什么问题? 1 数据挖掘 数据挖掘(Data Mining,简...

37880
来自专栏AI科技大本营的专栏

你天天叫的外卖,你知道这里面深度学习的水有多深吗

很多人以为外卖不过是下单、送餐,不需要什么技术含量。这种理解其实很片面,外卖业务不仅需要技术,它高度个性化、精细化的需求,是要用深度学习技术来解决的。 本文以...

33540
来自专栏MixLab科技+设计实验室

AI与设计:技术思维与设计思维的mix

最近在思考一些机器学习给设计带来的思维转变,还有对交互设计的影响,本文把一些读书笔记,及感想总结而成,主要是涉及AI技术、技术思维、设计思维、设计工具、用户体验...

15330
来自专栏腾讯云技术沙龙

郭律: 论机器学习平台与人工智能的关系

众所周知,现阶段的人工智能特别热门,研究人员也都想进入到这一领域,人工智能究竟是什么?我们有一个形象的比喻来说明什么叫做人工智能。

42140
来自专栏新智元

IEEE特稿:神经形态芯片注定为深度学习而生,否则就是自取灭亡

【新智元导读】研究者声称神经形态芯片相比传统的CPU,耗能更小。但现在的问题是,研究者需要证明,神经形态芯片能够从研究实验室转移到商业应用中吗。用航空业打比方的...

42170
来自专栏新智元

DeepMind提出想象智能体,更鲁棒AlphaGo逼近真实世界

【新智元导读】DeepMind 最新发布的两篇论文提出了有想象力和计划能力的智能体。这些智能体能够想象行动结果、制定计划,为最高效地完成任务提供了新方法。智能体...

38570
来自专栏智能算法

“忘掉大数据”之“建模术”:数据挖掘还原用户的生活场景

建模无疑是大数据里面最艺术的部分,也是最令大数据从业者痴迷、得意的领域,一个好的模型就是一篇作品,是一首诗,令人心旷神怡。建模、模型并不是什么新鲜事...

35560

扫码关注云+社区

领取腾讯云代金券