360 副总裁颜水成教授: 深度学习的研发目标及 1×1 卷积的功能 | CCF-GAIR 2017

7 月 7 日,雷锋网承办的第二届 CCF-GAIR 全球人工智能与机器人峰会在深圳如期开幕。奇虎 360 副总裁、首席科学家、IEEE Fellow、IAPR Fellow 颜水成教授带来了主题为《深度学习:精度极限 VS 用户体验》的演讲。这是今天最后一场演讲。

深度学习研发的两种不同目标:

  • 追求极限精度 针对一个具体的问题,去探索算法能达到的边界和极限。比如说我们可以设计更好的模型结构,可以用更大、更快的模型,也可以用大量的模型去做融合,另外一方面我们也会思考用更好的训练平台和更多的资源实现多机多卡分布式训练。在训练的时候可以利用海量的无标注数据,比如说利用预测学习的方式实现预训练,当训练好模型之后,又可以利用 Baby-learning 和增强学习的方式来增强模型的性能。
  • 追求产品的体验 人工智能本身不是一个产品,必须跟具体的场景相结合才有它的价值,核心算法只是这里面的一个部分而已,最好的办法是算法和场景数据形成一个闭环,先训练出初始的模型,然后在具体的场景里得到模型失效的数据,用这些数据再来提升模型的精度,再把模型用到场景中,进行不断地迭代,最终在场景中达到它最好的体验。只有算法科学家和产品工程师结合,可能让不完美的算法产生完美的用户体验。有一个很明显的例子就是当前很多 AR 相机采用的萌颜效果。

总的来说第一个目标的特点是必须” 用脑”,而第二个目标更多的是” 用心”。

两种目标相互促进的实例:

在 2016 年,大家都觉得分类和检测已经可以在工业界中很好地使用,但是从来没有人觉得物体分割已经到了可以使用的阶段。我的研究组就做了很多人体分割的工作,给出一个图象,输出每个像素具体是什么东西,我们花了两年的时间把它的性能从 44% 提升到了 86%。同时领域内有很多分割算法取得了很好的成果,去年年底工业界开始思考,确实有很多的应用场景可以受益于这种分割的技术,于是很多人开始思考怎么样去对模型进行加速,保证在一些限定的场景的性能能满足产品化的需求。

从今年开始,比如说美图秀秀和 Snapchat 可以把人的头发和脸分割出来,可以产生很好的头发美化的效果,360 和其他一些公司则提供人体分割的技术,可以把人实时从自拍的视频里面分割出来,叠加到动态的场景,产生很多好玩、好看的效果。这是一个典型的因为追求精度极限达到一定程度时,就激发了新的产品形态的创新。

1×1 卷积概念

纯粹的内积不能很好地模拟人的神经元的复杂工作方式,卷积可以用更复杂的网络结构来替代,当这种复杂的结构是多层感知机的时候,对应的后面操作就是 1×1 卷积,这个 1×1 卷积跟前面的 3×3、5×5 卷积叠加在一起,就会产生更复杂的抽象过程。基于 1×1 卷积的模型的参数可以降到很低,这样就为我们把深度学习往端上迁移提供了一个可能性。

1×1 卷积功能

基于 1x1 卷积的张量逼近分析可以很好地解释当前各种流行网络,GoogleNet、ResNet, ResNext 里面微观结构的理论依据。

基于 1x1 卷积的分析可以将 ResNet 解释成 Deeply Connected Network 的一个特列,同时启发了我们提出的一个新网络,Dual-path Network。这个网络在 ImageNet 取得了单模型的最好性能。

通过对每一个卷积操作附加一个 1x1 卷积操作然后再点乘,虽然模型变复杂了,但可以大幅减少前向传播的计算量。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-07-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界 | 顶会见闻系列:ICML 2018(上),表示学习、网络及关系学习

AI 科技评论按:本篇属于「顶会见闻系列」。每年这么多精彩的人工智能/机器学习会议,没去现场的自然可惜,在现场的也容易看花眼。那么事后看看别的研究员的见闻总结,...

795
来自专栏灯塔大数据

观点|12位专家展望未来5年深度学习发展趋势

? 2015年已然过去,2016刚刚开始,回头将目光集中于去年的成就上,以及对将来科学趋势的预测。去年最令人瞩目的一个领域就是深度学习,它是机器学习中越来越流...

34014
来自专栏AI科技评论

回顾 | Yoshua Bengio暑期课程《Deep Learning for AI》核心要点总结(附PPT下载)

AI 科技评论按:在刚刚结束的巴黎综合理工学院举行的 Data Science 暑期学校中,Yoshua Bengio 以《Deep Learning for ...

3325
来自专栏计算机视觉战队

视频中的深度学习

视频分级介绍 视频分析是计算机视觉领域中的一项重要研究内容。它借助计算机和视频采集设备,在无人监督的情况下,自动完成人类视觉的部分功能。对人类视觉皮层机理的研...

3726
来自专栏人工智能头条

深度学习 vs 机器学习 vs 模式识别

1133
来自专栏CSDN技术头条

整理:深度学习 vs 机器学习 vs 模式识别

本文来自CMU的博士,MIT的博士后,vision.ai的联合创始人Tomasz Malisiewicz的个人博客文章,阅读本文,你可以更好的理解计算机视觉是怎...

17810
来自专栏专知

【下载】深度学习与围棋实战书籍《Deep Learning and the Game of Go》

【导读】深度学习平台aetros.com的联合创始人Max Pumperla博士撰写的深度学习与围棋实战《Deep Learning and the Game ...

3958
来自专栏技术翻译

深度学习到瓶颈期了吗?

深度学习和机器学习的进步都起到了最近AI成就了的核心作用,让计算机进行练习,通过消化和分析大量的数据,而不用明确地编程,就可以达到目的。在过去的两年里,谷歌以深...

1293
来自专栏新智元

【干货】机器学习概览+模型可视化呈现

2016年10月18日, 世界人工智能大会技术论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容:...

3846
来自专栏机器人网

三个相关概念:深度学习Vs机器学习Vs模式识别

本文我们来关注下三个非常相关的概念(深度学习、机器学习和模式识别),最热门的科技主题(机器人和人工智能)的联系。

732

扫码关注云+社区