何恺明！再斩ICCV 2017最佳论文

量子位

发布于 2018-03-26 15:03:59

1.4K0

发布于 2018-03-26 15:03:59

文章被收录于专栏：量子位

夏乙若朴发自凹非寺量子位出品 | 公众号 QbitAI

何恺明第三次斩获顶会最佳论文！

昨天下午，ICCV 2017最佳论文公布。

何恺明为一作的Mask R-CNN论文，不负众望获得最佳论文（Marr Prize）。

另外，何恺明参与的另一篇论文：Focal Loss for Dense Object Detection，也被大会评为最佳学生论文。

作为计算机视觉领域的顶级会议，ICCV 2017共收到2143篇论文投稿，其中621篇被选为大会论文（入围比例29%），其中56篇亮点报告（Spotlight），45篇口头报告（Oral）。

本次ICCV 2017大会，参会人数再创新高，达到3107名。在30年ICCV大会历史上，堪称火爆出奇的一届。

从参会人数上来看，来自美国的最多，达到749人；来自中国的次之，达到362人。排进前五的还包括：德国（274人）、韩国（229人）、英国（218人）。

Mask R-CNN简史

还是得详细说一说Mask R-CNN。

这篇论文主要解决的是“实例级的”对象分割，也就是把照片中的人、动物等对象，一个一个地从图像中检测出来，并同时为每个对象实例生成一个高质量分割遮罩。

根据Mask R-CNN论文中所写的，这个算法在COCO数据集的三类任务上，Mask R-CNN都取得了顶尖的成绩，包括实例分割、边界框对象检测、以及人体关键点检测。不用任何trick，Mask R-CNN在所有任务上的性能都超越了全部现有单一模型算法，包括COCO 2016的获胜者。

获得Best Paper的消息传出之后，知乎就热闹了起来，不少同行都到Faster R-CNN相关问题下表示盼望开源代码已经判了半年。

所以，量子位就不多介绍论文内容了，认真好学但是还没读过这篇论文的朋友看这里：https://arxiv.org/abs/1703.06870

论文Preprint版今年3月在arXiv上公开后，得到了同行们的广泛认可。

比如说上学期斯坦福大学李飞飞的计算机视觉课CS231n，就在今年5月份的图像检测和分割一节里，介绍了Mask R-CNN。

再比如MIT在7月份CVPR 2017上主办的“将深度学习用于对象和场景”Tutorial，还邀请论文作者之一Ross Girshick到现场做了演讲。Girshick讲的主要内容，就是Mask R-CNN。何恺明也去了，他分享了图像识别相关的内容，涉及经典的ResNet以及CVPR 2017上发表的ResNeXt。

Mask R-CNN摘取胜利的果实时，并不是站在地上，而是站在巨人的肩膀上，而这个“巨人”，叫做Faster R-CNN，作者也包括何恺明自己，和我们前边提到的Ross Girshick。

Ross Girshik也是Facebook的研究员，江湖人称RBG大神。他和何恺明第一次合作写论文的时候，何恺明还是微软亚洲研究院员工，而RBG也还在Redmond微软研究院工作。他们，以及任少卿、孙剑的合作成果，就是Faster R-CNN。

在这之前，RBG已经长期在探索用CNN做对象检测，并发表了两篇论文，提出了R-CNN和Fast R-CNN算法。这个系列虽然历史不长，却已经成了谈CNN图像分割绕不开的经典，量子位之前也发布过相关文章。

对于与何恺明的合作，RBG大神表示非常满意，至少对美国和北京之间的时差很满意。(￣▽￣)”他说俩人加一起，每天可以高效工作24小时。

论文还没写完，RBG就跳槽到了Facebook AI研究院。而何恺明，在微软亚洲研究院和老朋友张翔宇、任少卿、孙剑一起，完成了后来甚至被称为图像识别算法顶峰的ResNet。

第二年，何恺明也加入了Facebook，搬到了太平洋对岸的加州门罗帕克。

何恺明和RBG大神之间的时差，顿时从12小时缩短到了几乎没有，不过好在，他们之间依然合作愉快，也就有了今年的Mask R-CNN。

传奇何恺明

ICCV 2017绝不是何恺明唯一的高光时刻。

或者说，他一路以来都似乎在以“开挂”的模式前进。

2003年，何恺明以高考满分的成绩，摘得广东高考状元。不过在高考之前，何恺明已经被保送清华。

在当年的报道中，何恺明谈到学习秘诀时说：“不知道啊，很多人都问过这个问题，但（自己）一直都不太清楚，可能是（自己）悟性好”。谈到高考后的计划，何恺明说：去桂林旅游。

直到现在，何恺明的微博上还有不少他在各地的留影，俨然一副旅游博主的感觉。

插播一句，当年与何恺明同为广东高考满分状元的还有王俊煜等人。当年王俊煜在接受采访时，谈到了自己对杂志的喜好。

2007年，尚未本科毕业的何恺明以实习生身份，进入微软亚洲研究院（MSRA）。在孙剑的指导下开始研究工作。

尝试很多方向未果之后，有天何恺明打游戏时，受到雾气场景启发，认为存在一种方法可以去除图像中的雾气。

运气和实力再次眷顾了何恺明，他很快找到简单高效的处理办法。但孙剑要求何恺明继续研究，找到成功背后的本质原因。最后何恺明写出了论文Single Image Haze Removal Using Dark Channel Prior。

最终，何恺明的这篇论文被评为CVPR 2009最佳论文。这也是中国人首次获得这一奖项。这篇论文的另外两名作者是：孙剑、汤晓鸥。

本科毕业后，何恺明进入中国香港中文大学读研。期间继续在微软亚洲研究院参与研究。2015年，何恺明所在的团队凭借图像识别深度残差学习（Deep Residual Learning for Image Recognition）在ImageNet上傲视群雄。

随后这篇论文被CVPR 2016评为最佳论文。这篇论文的作者还包括：张祥雨、任少卿、孙剑。

随后残差网络（ResNets）也在AI领域得到了广泛的应用，包括机器翻译、语音合成、语音识别，以及最新的AlphaGo Zero（相关报道）。

如上所述，去年8月何恺明加入Facebook人工智能研究院（FARI）。

获奖论文详情

最后，再小结下ICCV 2017的奖项。

最佳论文

Mask R-CNN 作者：何恺明、Georgia Gkioxari、Piotr Dollár、Ross Girshick 地址：https://arxiv.org/abs/1703.06870

最佳学生论文

Focal Loss for Dense Object Detection 作者：Tsung-Yi Lin、Priya Goyal、Ross Girshick、何恺明、Piotr Dollár 地址：https://arxiv.org/abs/1708.02002

提名奖（Honorable mentions）

First Person Activity Forecasting with Online Inverse Reinforcement Learning 作者：Nicholas Rhinehart、Kris M. Kitani 地址：https://www.cs.cmu.edu/~nrhineha/darko.html
Open Set Domain Adaptation 作者：Pau Panareda Busto、Juergen Gall 地址：http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_opensetdomain_iccv17.pdf
Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence 作者：Dylan Campbell、Lars Petersson、Laurent Kneip、Hongdong Li 地址：https://arxiv.org/abs/1709.09384

OMT

这次ICCV 2017也有一众中国企业赞助。

白金赞助商包括：百度、滴滴、美图、商汤、腾讯优图。白银赞助商包括：360、中科视拓、北京文安。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-10-25，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能

本文分享自量子位微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

人工智能

登录后参与评论

0 条评论

热度