何恺明!再斩ICCV 2017最佳论文

夏乙 若朴 发自 凹非寺 量子位 出品 | 公众号 QbitAI

何恺明第三次斩获顶会最佳论文!

昨天下午,ICCV 2017最佳论文公布。

何恺明为一作的Mask R-CNN论文,不负众望获得最佳论文(Marr Prize)。

另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。

作为计算机视觉领域的顶级会议,ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比例29%),其中56篇亮点报告(Spotlight),45篇口头报告(Oral)。

本次ICCV 2017大会,参会人数再创新高,达到3107名。在30年ICCV大会历史上,堪称火爆出奇的一届。

从参会人数上来看,来自美国的最多,达到749人;来自中国的次之,达到362人。排进前五的还包括:德国(274人)、韩国(229人)、英国(218人)。

Mask R-CNN简史

还是得详细说一说Mask R-CNN

这篇论文主要解决的是“实例级的”对象分割,也就是把照片中的人、动物等对象,一个一个地从图像中检测出来,并同时为每个对象实例生成一个高质量分割遮罩。

根据Mask R-CNN论文中所写的,这个算法在COCO数据集的三类任务上,Mask R-CNN都取得了顶尖的成绩,包括实例分割、边界框对象检测、以及人体关键点检测。不用任何trick,Mask R-CNN在所有任务上的性能都超越了全部现有单一模型算法,包括COCO 2016的获胜者。

获得Best Paper的消息传出之后,知乎就热闹了起来,不少同行都到Faster R-CNN相关问题下表示盼望开源代码已经判了半年。

所以,量子位就不多介绍论文内容了,认真好学但是还没读过这篇论文的朋友看这里:https://arxiv.org/abs/1703.06870

论文Preprint版今年3月在arXiv上公开后,得到了同行们的广泛认可。

比如说上学期斯坦福大学李飞飞的计算机视觉课CS231n,就在今年5月份的图像检测和分割一节里,介绍了Mask R-CNN。

再比如MIT在7月份CVPR 2017上主办的“将深度学习用于对象和场景”Tutorial,还邀请论文作者之一Ross Girshick到现场做了演讲。Girshick讲的主要内容,就是Mask R-CNN。何恺明也去了,他分享了图像识别相关的内容,涉及经典的ResNet以及CVPR 2017上发表的ResNeXt。

Mask R-CNN摘取胜利的果实时,并不是站在地上,而是站在巨人的肩膀上,而这个“巨人”,叫做Faster R-CNN,作者也包括何恺明自己,和我们前边提到的Ross Girshick。

Ross Girshik也是Facebook的研究员,江湖人称RBG大神。他和何恺明第一次合作写论文的时候,何恺明还是微软亚洲研究院员工,而RBG也还在Redmond微软研究院工作。他们,以及任少卿、孙剑的合作成果,就是Faster R-CNN。

在这之前,RBG已经长期在探索用CNN做对象检测,并发表了两篇论文,提出了R-CNN和Fast R-CNN算法。这个系列虽然历史不长,却已经成了谈CNN图像分割绕不开的经典,量子位之前也发布过相关文章

对于与何恺明的合作,RBG大神表示非常满意,至少对美国和北京之间的时差很满意。( ̄▽ ̄)”他说俩人加一起,每天可以高效工作24小时。

论文还没写完,RBG就跳槽到了Facebook AI研究院。而何恺明,在微软亚洲研究院和老朋友张翔宇、任少卿、孙剑一起,完成了后来甚至被称为图像识别算法顶峰的ResNet。

第二年,何恺明也加入了Facebook,搬到了太平洋对岸的加州门罗帕克。

何恺明和RBG大神之间的时差,顿时从12小时缩短到了几乎没有,不过好在,他们之间依然合作愉快,也就有了今年的Mask R-CNN。

传奇何恺明

ICCV 2017绝不是何恺明唯一的高光时刻。

或者说,他一路以来都似乎在以“开挂”的模式前进。

2003年,何恺明以高考满分的成绩,摘得广东高考状元。不过在高考之前,何恺明已经被保送清华。

在当年的报道中,何恺明谈到学习秘诀时说:“不知道啊,很多人都问过这个问题,但(自己)一直都不太清楚,可能是(自己)悟性好”。谈到高考后的计划,何恺明说:去桂林旅游。

直到现在,何恺明的微博上还有不少他在各地的留影,俨然一副旅游博主的感觉。

插播一句,当年与何恺明同为广东高考满分状元的还有王俊煜等人。当年王俊煜在接受采访时,谈到了自己对杂志的喜好。

2007年,尚未本科毕业的何恺明以实习生身份,进入微软亚洲研究院(MSRA)。在孙剑的指导下开始研究工作。

尝试很多方向未果之后,有天何恺明打游戏时,受到雾气场景启发,认为存在一种方法可以去除图像中的雾气。

运气和实力再次眷顾了何恺明,他很快找到简单高效的处理办法。但孙剑要求何恺明继续研究,找到成功背后的本质原因。最后何恺明写出了论文Single Image Haze Removal Using Dark Channel Prior。

最终,何恺明的这篇论文被评为CVPR 2009最佳论文。这也是中国人首次获得这一奖项。这篇论文的另外两名作者是:孙剑、汤晓鸥。

本科毕业后,何恺明进入香港中文大学读研。期间继续在微软亚洲研究院参与研究。2015年,何恺明所在的团队凭借图像识别深度残差学习(Deep Residual Learning for Image Recognition)在ImageNet上傲视群雄。

随后这篇论文被CVPR 2016评为最佳论文。这篇论文的作者还包括:张祥雨、任少卿、孙剑。

随后残差网络(ResNets)也在AI领域得到了广泛的应用,包括机器翻译、语音合成、语音识别,以及最新的AlphaGo Zero(相关报道)。

如上所述,去年8月何恺明加入Facebook人工智能研究院(FARI)。

获奖论文详情

最后,再小结下ICCV 2017的奖项。

最佳论文

  • Mask R-CNN 作者:何恺明、Georgia Gkioxari、Piotr Dollár、Ross Girshick 地址:https://arxiv.org/abs/1703.06870

最佳学生论文

  • Focal Loss for Dense Object Detection 作者:Tsung-Yi Lin、Priya Goyal、Ross Girshick、何恺明、Piotr Dollár 地址:https://arxiv.org/abs/1708.02002

提名奖(Honorable mentions)

  • First Person Activity Forecasting with Online Inverse Reinforcement Learning 作者:Nicholas Rhinehart、Kris M. Kitani 地址:https://www.cs.cmu.edu/~nrhineha/darko.html
  • Open Set Domain Adaptation 作者:Pau Panareda Busto、Juergen Gall 地址:http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_opensetdomain_iccv17.pdf
  • Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence 作者:Dylan Campbell、Lars Petersson、Laurent Kneip、Hongdong Li 地址:https://arxiv.org/abs/1709.09384

OMT

这次ICCV 2017也有一众中国企业赞助。

白金赞助商包括:百度、滴滴、美图、商汤、腾讯优图。白银赞助商包括:360、中科视拓、北京文安。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-10-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

褚达晨:深度学习青衫磊落险峰行,人工智能漫谈之一

【新智元导读】作者褚达晨认为,科技发展让人类借助计算机的能力,在一个超高维弯曲空间中,搜寻自然世界奥秘。而深度学习则是利用最近年发展起来的大算力,让计算机代替人...

29580
来自专栏深度学习与数据挖掘实战

前沿|概率图模型

在过去10年里,特别是在深度学习(Deep Learning)红得发紫之前,概率图模型(Probabilistic Graphical Model)曾经是当仁不...

13710
来自专栏AI2ML人工智能to机器学习

哈密尔顿,不变的爱

前面我们提到两大变( “变分の美” 和 “Legendre变变变” ), 那么一直在变的话,什么时候不再变呢? 这就是我们今天想概述的。 所谓物极必反, 又所...

18820
来自专栏SIGAI学习与实践平台

理解计算-从根号2到AlphaGo 第4季 凛冬将至

在新中国诞生的那一年,加拿大生理学家唐纳德﹒赫布(Donald O. Hebb)出版了《行为的组织》 (《The Organization of Behavio...

9820
来自专栏新智元

【最全干货】机器视觉的资料整理

机器视觉和图像处理的研究工作,有两个好方法: 1、把握国际最前沿的内容,解决方法是找到这个方向公认成就最高的几个超级专家 2、所做的工作具备很高的实用性,解决方...

45250
来自专栏AI科技评论

学界 | 用充满爱与和平的GUNs挑战GANs?我可能看了篇假论文

上个世界七八十年代,邓小平爷爷曾郑重其事地提出:和平与发展是当代世界的两大主题。如今,这一伟大宏愿实现的如何? 据联合国今年1月份发布的公报显示:去年一年仅在伊...

413100
来自专栏CSDN技术头条

大数据专家教你用数据模型来找女朋友

男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了...

26990
来自专栏数说工作室

【温故】P值之死

100年前的今天(1918年7月8日),有位叫 Ronald Fisher 的人向外界宣读了一篇论文《Thecorrelation between relati...

9520
来自专栏华章科技

数学,原来可以这么美!

导读:法国著名艺术家罗丹曾说:世界中从不缺少美,而是缺少发现美的眼睛。对于我们的眼睛,不是缺少美,而是缺少发现。如果我们能够用数学的眼光来观察世界,又将会是怎样...

15620
来自专栏数据科学与人工智能

【数据科学】数据科学家教你用数据模型来恋爱。

男生和女生分别是来自不同星球的科学事实已经众所周知的了.男生们总是认为,女生们都是迷一样的生物,他们的情感状态浮动似乎是以秒单位在变化的,难以理解,更勿论预测了...

21670

扫码关注云+社区

领取腾讯云代金券