黑科技之火到爆的深度学习

图片源于网络

【文章导语】

内容主题取自《黑科技》,书由硅谷15位技术咖编写。本文主要概述人工智能领域火到爆的深度学习,旨在抛开繁杂云雾,让读者真切的了解当前科技的真正技术实力。

本文涵盖深度学习的简单介绍、基本原理说明、热点算法以及市场应用状况。

本文定位为扫盲文,由于去年的项目用到了部分这个,对这个有过一段时间的学习,也了解一些,希望自己能把基本的东西说明白,我会尽可能的简单来。有疑问的可以撩我。

网络

一、【基本概念】

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

以上来自百科,下面开始说人话,一些很简单的概念,有些人为了显示自己高强的文学功底非要整些大众难以看懂的,如果那些所谓的大咖可以放下身段,亲民一些,让新手更快入门的话,相信中国科技的发展会更好的。好了,不抱怨,多干事。

网络

深度学习其实就是神经网络层数的加深。

下面我通过老家给唠唠介绍的几个妹子来简单说下神经网络这个看似高端的词汇:

自制

本项目为通过汇总对比权衡三位美女的各项指标,然后来挑选出最符合唠唠心意的美娘子。

先来下三个妹子身高、体重、月薪三个方面的简单介绍:

大美:172cm 50Kg 4K

小美:156cm 45Kg 8K

小钱:165cm 60Kg 1000K

三位的身高体重月薪这三个数据为输入层,三个指标在心里占的比重为权重,让唠唠知道这三个数据的行为为激励函数。

这样来唠的话,还有哪不清楚的吗?难选吗?我肯定选小钱同学啊,哈哈哈谁让我穷呢?

深度学习之所以优于早期的神经网络,主要是他可以从大规模数据中有效的训练出更多隐含层。现在公开的深度学习模型最多可以有150层网络,但无论结构多么复杂,只要知道了输入和网络的结构和参数,很容易根据之前的公式计算出最后的输出了。

网络

二、【热点算法】

后向传播算法:解决的是多层神经网络的优化问题。神经网络的优化是基于一组训练数据的参数调整过程。

下面来举个栗子:

上学的时候,不会做题了咋办?我是好孩子可从来不咋抄哟,哈哈哈,我想要的答案是看答案!依稀记得高中的美女老师总是气呼呼的说我不反对你们看答案,但是你们看了得弄懂!注意弄懂这个过程,其实就是反向传播算法:根据答案来捋清思路。

所以当时记得我总是做一题,不会,看答案;做一题,不会,继续看答案;就通过这样的学习方式,考了个全校第一的名次。

网络

再比如,识别汽车图片的例子,汽车的图片就是题目,汽车的类型就是答案,大量的图片和对应的汽车类型就构成了训练数据。优化过程完成后,解题的方法就蕴含在神经网络的各个隐含层中。

困了,讲个别人挣钱的小故事提提神:(呜呜)

后向传播算法的发明人Hinton教授可能会这样和大家来个自我介绍:

同事甲:经常看您若有所思,忧郁满怀的装B写程序,您是从事 什么工作的呢?

Hinton:你是用安卓手机吧?

同事甲:是啊,有意见?

Hinton:里面的语音识别好用吗?

同事甲:还不错,语音搜索还比较准确。

Hinton:嗯,这就是我做的。

Hinton

其实Hinton教授没有说的是他的公司才被谷歌买了,据说谷歌花了上亿美元,而公司的核心人员就只有Hinton教授和他的两个学生。公司的核心技术就是深度学习的高校优化算法及其计算机视觉、语音识别、自然语言理解中的应用。

说的有点多了,也有点困了,下面的其他算法也不是本文的重点,有点过于专业了,本文的定位是扫盲的,不盲的可以自己走了哈哈。

下面我来概述下还有哪些东西没有说,有兴趣的可以私撩我,或者留言,如果人多的话我再更一篇专门的算法的。

通过基本概念我们也可以知道,深度学习的要素主要有三个方面:一个为数据,一个为软件,还有一个为硬件支撑。相信大数据现在大家都听过很多次了,随着国内互联网的高速发展,我国在全球的大数据信息肯定属于榜首的地位。但是数据和财富一样,属于少部分人的,数据大部分也就掌握在BAT手中。

网络

深度学习的软件我们可以从两个方面来说一个是模型一个是算法,模型即对整体架构的调整,算法大部分的功能也是为了对模型进行压缩。所以我统归为了软件。软件运行的基础条件是硬件,而且深度学习的数据量之大,要求速度之快,这样就对硬件(GPU)的要求也要比较严苛了。

三、【市场应用】

下面我深度学习的三大分类来说明下市场应用场景及美好未来。声明下那三大分类可不是我胡诌的,那是Hinton,Bengio及Lecun三位大神在Nature上发表的Deep Learning综述最后总结的:

1. 无监督学习。无监督学习在深度学习刚火的那几年有很重要的作用,比如用无监督方式训练深度信念网络还有稀疏自编码器等,使用无监督学习主要是为了预训练,以得到一个较好的初始值,随后再使用有监督训练进行微调。

但是随着计算能力的发展,人们发现只要在数据集足够大的情况下使用纯有监督学习也能得到较好性能,所以近几年无监督学习发展不是很大,Hinton他们希望在未来无监督学习能有更大发展,因为人类和动物的学习在很大程度上都是无监督的:我们通过观察这个世界来学习,而不是有个老师在教我们这个世界的原理。

网络

2. 深度强化学习。深度强化学习的主要思想简而言之就是将深度学习与强化学习相结合,是一种从感知到动作的端到端学习。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有人工特征的工作。深度增强学习具备使机器人实现真正完全自主的学习一种甚至多种技能的潜力。

深度强化学习最突出的代表就是DeepMind公司了,该公司在NIPS 2013上发表的Playing Atari with Deep Reinforcement Learning一文,在该文中第一次提出深度强化学习这个名称,之后在Nature上发表了改进版的文章Human-level control through deep reinforcement learning,引起了广泛的关注,深度强化学习从此成为深度学习领域的前沿研究方向。最近的李世石大战阿法狗中,阿法狗背后的技术也是深度强化学习,DeepMind将阿法狗背后用到的技术发表在了2016年的Nature上Mastering the game of Go with deep neural networks and tree search。

3. 自然语言理解。自然语言理解也是深度学习在未来几年能大有作为的领域。使用深度学习技术的各种应用比如神经机器翻译,问答系统,文摘生成等都取得了不错的效果,效果的提升主要归功于注意力机制和循环神经网络相结合的强大能力。相信未来几年内还会有大量相关工作出现。

自制

深度学习的端到端架构,需要人工干预的比较小,降低了企业引入深度学习的成本。

虽然目前国际上最领先的人工智能技术掌握在谷歌、微软、IBM等公司,但我国的人工智能技术与国际领先水平相差不大。毕竟我国人口的大基数带来的大数据为我们提供了有利的基础。

国家方面,国务院在2015年便论述了“互联网+”大战略下人工智能的发展规划,而且最近国家对大数据、云计算等新技术也高度重视。相信在政府和企业的共同努力下,我国在深度学习技术方面肯定会取得不菲的成就。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180109G0204Z00?refer=cp_1026

相关快讯

扫码关注云+社区