前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >深度学习的昨天,今天和明天

深度学习的昨天,今天和明天

作者头像
大数据文摘
发布2018-05-21 16:09:27
8820
发布2018-05-21 16:09:27
举报
文章被收录于专栏:大数据文摘大数据文摘

机器学习是人工智能领域的一个重要学科.自从20世纪80年代以来机器学习在算法理论和应用等方面都获得巨大成功.2006年以来机器学习领域中一个叫深度学习的课题开始受到学术界广泛关注到今天已经成为互联网大数据和人工智能的一个热潮.深度学习通过建立类似于人脑的分层模型结构对输入数据逐级提取从底层到高层的特征从而能很好地建立从底层信号到高层语义的映射关系.近年来谷歌微软IBM百度等拥有大数据的高科技公司相继投入大量资源进行深度学习技术研发,在语音图像自然语言在线广告等领域取得显著进展.从对实际应用的贡献来说深度学习可能是机器学习领域最近这十年来最成功的研究方向。

2012年6月,纽约时报披露了谷歌的google brain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学的机器学习教授Ng和在大规模计算机系统方面的世界顶尖专家Dean共同主导的用16000个CPU Core的并行计算平台训练一种称为深度神经网络 (Deep Neural Networks,DNN)的机器学习模型,该模型在语音识别和图像识别等领域获得了巨大的成功。

2012年11月,微软在中国天津的一次活动上公开演示了一个全自动的同声传译系统,讲演者用英文演讲,后台的计算机一气呵成自动完成语音识别英中机器翻译和中文语音合成,效果非常流畅。据报道后面支撑的关键技术也是DNN,【或者深度学习(deep learning,DL)】

2013年的1月在中国最大的互联网搜索引擎公司百度的年会上,创始人兼CEO李彦宏高调宣布要成立百度研究院,其中第一个重点方向的就是深度学习,并为此而成立Institute Of Deep Learning(IDL).这是百度成立10多年以来第一次成立研究院。2013年4月,麻省理工学院技术评论 MIT Technology Review杂志将深度学习列为2013年十大突破性技术“Break Through Technology”之首。

为什么深度学习受到学术届和工业界如此广泛的重视?深度学习技术研发面临什么样的科学和工程问题?深度学习带来的科技进步将怎样改变人们的生活?本文将简要回顾机器学习在过去20多年的发展介绍深度学习的昨天,今天和明天。

机器学习的两次浪潮:从浅层学习到深度学习

在解释深度学习之前我们需要了解什么是机器学习。机器学习是人工智能的一个分支,而在很多时候几乎成为人工智能的代名词。简单来说机器学习就是通过算法使得机器能从大量历史数据中学习规律从而对新的样本做智能识别或对未来做预测。从20世纪80年代末期以来机器学习的发展大致经历了两次浪潮浅层学习Shallow Learning和深度学习Deep Learning.需要指出是机器学习历史阶段的划分是一个仁者见仁智者见智的事情,从不同的维度来看会得到不同的结论。这里我们是从机器学习模型的层次结构来看的。

第一次浪潮:浅层学习

20世纪20年代末期用于人工神经网络的反向传播算法,也叫Back Propagation算法或者BP算法,的发明给机器学习带来了希望,掀起了基于统计模型的机器学习热潮.这个热潮一直持续到今天.人们发现利用BP算法可以让一个人工神经网络模型从大量训练样本中学习出统计规律从而对未知事件做预测。这种基于统计的机器学习方法比起过去基于人工规则的系统在很多方面显示出优越性。

这个时候的人工神经网络虽然也被称作多层感知机multi-layer Perceptron。由于多层网络训练的困难,实际使用的多数是只含有一层隐层节点的浅层模型。

20世纪90年代,各种各样的浅层机器学习模型相继被提出。比如支撑向量机Support Vector Machine,Boosting,最大熵方法,比如logistic regression,LR等.这些模型的结构基本上可以看成带有一层隐层节点如SVM,Boosting,或没有隐层节点如LR。这些模型在无论是理论分析还是应用都获得了巨大的成功。相比较之下,由于理论分析的难度而且训练方法需要很多经验和技巧,这个时期多层人工神经网络反而相对较为沉寂。

2000年以来互联网的高速发展,对大数据的智能化分析和预测提出了巨大需求。浅层学习模型在互联网应用上获得了巨大的成功。最成功的应用包括搜索广告系统,比如谷歌的Adwords,百度的凤巢系统的广告点击率CTR预估,网页搜索排序,比如雅虎和微软的搜索引擎,垃圾邮件过滤系统,基于内容的推荐系统等等。

第二次浪潮:深度学习

2006年加拿大多伦多大学教授机器学习领域的泰斗Hinton和他的学生Salakhutdinov在顶尖学术刊物《科学》上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。这篇文章有两个主要的讯息:

  1. 1. 很多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻划,从而有利于可视化或分类。
  2. 2. 深度神经网络在训练上的难度可以通过“逐层初始化Layer-wise-pre-training”来有效克服。在这篇文章中逐层初始化是通过无监督学习实现的。

自2006年以来深度学习在学术界持续升温。斯坦福大学纽约大学加拿大蒙特利尔大学等成为研究深度学习的重镇。2010年美国国防部DARPA计划首次资助深度学习项目,参与方有斯坦福大学、纽约大学和NEC美国研究院。支持深度学习的一个重要依据就是脑神经系统的确具有丰富的层次结构。一个最著名的例子就是Huble-Wiesel模型.由于揭示了视觉神经的机理而曾获得诺贝尔医学与生理学奖。

除了仿生学的角度,目前深度学习的理论研究还基本处于起步阶段。但在应用领域已经显现巨大能量。2011年以来微软研究院和谷歌的语音识别研究人员先后采用DNN技术降低语音识别错误率20%-30%,是语音识别领域10多年来最大的突破性进展。2012年DNN技术在图像识别领域取得惊人的效果在ImageNet评测上将错误率从26%降低到15%.在这一年DNN还被应用于制药公司的DrugeActivity预测问题并获得世界最好成绩,这一重要成果被纽约时报报道。

正如文章开头所描述的,今天谷歌微软百度等知名的拥有大数据的高科技公司争相投入资源占领深度学习的技术制高点,正是因为他们都看到了,在大数据时代更加复杂且更加强大的深度模型,能够深刻揭示海量数据里所承载的负责而丰富的信息,并对未来或未知事件做更精准的预测。

大数据与深度学习

在工业界一直有一个很流行的观点,在大数据条件下简单的机器学习模型会比复杂模型更加有效。比如说,在很多的大数据应用中最简单的线性模型得到大量使用。而最近深度学习的惊人进展促使我们也许到了要重新思考这个观点的时候。简而言之,在大数据情况下也许只有比较复杂的模型或者说表达能力强的模型才能够充分发掘海量数据中蕴藏的丰富信息。现在我们到了需要重新思考“大数据+简单模型”的时候。运用更强大的深度模型也许我们能从大数据中发掘出更多的有价值的信息和知识。

为了理解为什么大数据需要深度模型,先举一个例子。语音识别已经是一个大数据的机器学习问题。在其声学建模部分通常面临的是十亿到千亿级别的训练样本。

在谷歌的一个语音识别实验中发现,训练后的DNN对训练样本和测试样本的预测误差基本相当.这是非常违反常识的。因为通常模型在训练样本上的预测误差会显著小于测试样本.只有一个解释就是由于大数据里含有丰富的信息维度,使得即便是DNN这样的高容量复杂模型也是处于欠拟合的状态,更不必说传统的GMM声学模型了.所以在这个例子里我们看出,大数据更加需要深度学习。

浅层模型有一个重要特点,就是假设靠人工经验来抽取样本的特征,而强调模型主要是负责分类或预测。在模型的运用不出差错的前提下,比如假设互联网公司聘请的是机器学习的专家,特征的好坏就成为整个系统性能的瓶颈。因此通常一个开发团队中更多的人力是投入到发掘更好的特征上的。发现一个好的特征,要求开发人员对待解决的问题要有很深入的理解。而达到这个程度往往需要反复的摸索甚至是数年磨一剑。因此人工设计样本特征不是一个可扩展的途径。

深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据来学习更有用的特征,从而最终提升分类或预测的准确性。所以,深度模型是手段,特征学习是目的。区别于传统的浅层学习,深度学习的不同在于:

1 强调了模型结构的深度,通常有5层6层甚至10多层的隐层节点;

2 明确突出了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示,变换到一个新特征空间。从而使分类或预测更加容易。

与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻划数据更丰富内在信息。所以在未来的几年里我们将看到越来越多的,深度模型+大数据的应用,而不是浅层的线性模型。

作者:余凯、贾磊、陈雨强、徐伟

余凯,百度深度学习研究院(IDL)常务副院长,第九批"千人计划“国家特聘专家,知名机器学习专家。斯坦福大学计算机系Adjunct Faculty (2011), 南京大学兼职教授 (2013-),北京邮电大学兼职教授 (2013-),和中科院计算所客座研究员 (2013-)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2014-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档