正当你认为弄明白了机器学习…..bang!又一个科技新词出现了。
深度学习
虽然它看起来可能只像另一个所有新的创业公司都在用的硅谷流行词语,深度学习实际上已经取得了一些令人惊讶的进步。我们将在这讨论一些介于科幻与现实之间的东西。
我们找到了深度学习专家吴恩达,并让他来解释什么是深度学习和我们应该期望它如何在2016年改变世界。
什么是深度学习?
深度学习是机器学习的一个子领域,本质上是指尝试去比对神经网络(同样让你大脑工作的机制)。通过比对这些神经网络,我们可以重新创造出人脑工作时一些相同的过程。
其目标是要创造出能够处理一些没有结构的数据(如图像、音频波或者文本块等传统方式上对于计算机来说很难处理的数据)的算法,并预测这些输入的特质。经典的例子是让电脑识别图像中的猫。
如果你不是一个计算机科学天才的话,这可能听起来并不令人心动,但实际上,处理实际生活中的问题——如识别图片中的猫——需要一些非常复杂的函数。并且一旦我们找到如何运行这些复杂的函数,我们可以开始做一些令人印象深刻的事情。
为什么现在深度学习很重要?
神经网络并不是很新的事物。自从1890年代,我们就已经开始尝试比对大脑中的神经元,并于60年代末在计算机科学中使用这些原理。
吴恩达说,改变的是我们做这些事情的规模。日渐增长的计算能力让我们比对并处理比以往更大的神经网络。我们也有了更多的数据来训练这些网络。
不管你信不信,训练电脑来识别一只猫就是通过给它展示成千上万张猫的图片。
深度学习能做的令人惊讶的事情
那么这些新增加的数据、计算能力和神经元的理解到底意味着什么?这些在现实生活中是怎样应用的?
电脑起标题
有了这些神经网络的应用,电脑不仅可以识别图片中的猫,它们还可以描述那些猫在做的事情。想一想简单地说“是的,这里有只猫”或者“不,这里没有猫”需要消耗多少脑力。很多!
将这种脑力提高一个层次,你甚至可以问关于展示给它的图片的问题。它会告诉你公交车是红色的或者猫在地板上。
为盲人提供视力
如果电脑不仅能识别图片还能像我们的大脑一样理解并解释图片,那么我们能够高效地为盲人模拟视力。
在百度的人创造了DuLight,一个穿戴式装置能够识别拍下图片中的事物并将描述词反馈给穿戴者。它也可以通过识别关于存折的照片来告诉盲人们他们还有多少钱,或者一张冰箱里面的照片告诉人们冰箱中还剩下什么等等。
提高了的语音识别
神经网络并不限于视觉输入。科学家和研究人员也可以使用神经网络来改善语音识别。在百度深度学习吴恩达小组的努力下,他们成功的将语音识别的准确率从89%提高到了99%。
这可能听起来不多,但当你这样想:95%的准确率意味着,20个词中有95%的可能性会错一个词,那么99%可以改变大局。考虑到中国很多文盲的情况,这尤其重要。没有好的语音识别,很多人都不能使用互联网。
吴恩达看到的不仅仅是手机上的语音识别技术。不久的将来,他说,你将会和你的车、家用电器和穿戴式设备交流。
预测用户行为
有了越来越多的数据提供给算法,百度小组开始使用深度学习来预测用户和机器的行为。他们知道哪种广告你最有可能点击,哪个服务器最可能需要修复和安全隐患最有可能来自哪里。所有的这些进步对将来的收益都有直接的影响。
你口袋中的深度学习
这些例子令人印象很深刻,但是很多人对它都没有直接体验。如果你想要体验一下深度学习,你可以下载Faceyou(在苹果App store中)。它是一个手机app,可以实时侦测你的脸,并用另一个图片为其增加特效。
这个技术能够实现就是因为深度学习,它可以比对你的脸部特征并精确的将特效添加到上面,并实时跟随你的动作而移动。现在这只是一个用于娱乐的app,但是想象一下如果你能够在线尝试新款服装或者发型而不需要到实际场所体验,这对于零售行业来说多么重要。
给电脑超人力量
正如吴恩达解释的那样,深度学习是一个电脑版本的“蜘蛛侠”。如果电脑可以像人一样看、听和理解,那么与电脑互动将会变得很容易。
深度学习的进展是突飞猛进的。2016年对于深度学习领域来说肯定会是令人兴奋的一年。