前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >何恺明!再斩ICCV 2017最佳论文

何恺明!再斩ICCV 2017最佳论文

作者头像
量子位
发布2018-03-26 15:03:59
1.3K0
发布2018-03-26 15:03:59
举报
文章被收录于专栏:量子位量子位
夏乙 若朴 发自 凹非寺 量子位 出品 | 公众号 QbitAI

何恺明第三次斩获顶会最佳论文!

昨天下午,ICCV 2017最佳论文公布。

何恺明为一作的Mask R-CNN论文,不负众望获得最佳论文(Marr Prize)。

另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。

作为计算机视觉领域的顶级会议,ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比例29%),其中56篇亮点报告(Spotlight),45篇口头报告(Oral)。

本次ICCV 2017大会,参会人数再创新高,达到3107名。在30年ICCV大会历史上,堪称火爆出奇的一届。

从参会人数上来看,来自美国的最多,达到749人;来自中国的次之,达到362人。排进前五的还包括:德国(274人)、韩国(229人)、英国(218人)。

Mask R-CNN简史

还是得详细说一说Mask R-CNN

这篇论文主要解决的是“实例级的”对象分割,也就是把照片中的人、动物等对象,一个一个地从图像中检测出来,并同时为每个对象实例生成一个高质量分割遮罩。

根据Mask R-CNN论文中所写的,这个算法在COCO数据集的三类任务上,Mask R-CNN都取得了顶尖的成绩,包括实例分割、边界框对象检测、以及人体关键点检测。不用任何trick,Mask R-CNN在所有任务上的性能都超越了全部现有单一模型算法,包括COCO 2016的获胜者。

获得Best Paper的消息传出之后,知乎就热闹了起来,不少同行都到Faster R-CNN相关问题下表示盼望开源代码已经判了半年。

所以,量子位就不多介绍论文内容了,认真好学但是还没读过这篇论文的朋友看这里:https://arxiv.org/abs/1703.06870

论文Preprint版今年3月在arXiv上公开后,得到了同行们的广泛认可。

比如说上学期斯坦福大学李飞飞的计算机视觉课CS231n,就在今年5月份的图像检测和分割一节里,介绍了Mask R-CNN。

再比如MIT在7月份CVPR 2017上主办的“将深度学习用于对象和场景”Tutorial,还邀请论文作者之一Ross Girshick到现场做了演讲。Girshick讲的主要内容,就是Mask R-CNN。何恺明也去了,他分享了图像识别相关的内容,涉及经典的ResNet以及CVPR 2017上发表的ResNeXt。

Mask R-CNN摘取胜利的果实时,并不是站在地上,而是站在巨人的肩膀上,而这个“巨人”,叫做Faster R-CNN,作者也包括何恺明自己,和我们前边提到的Ross Girshick。

Ross Girshik也是Facebook的研究员,江湖人称RBG大神。他和何恺明第一次合作写论文的时候,何恺明还是微软亚洲研究院员工,而RBG也还在Redmond微软研究院工作。他们,以及任少卿、孙剑的合作成果,就是Faster R-CNN。

在这之前,RBG已经长期在探索用CNN做对象检测,并发表了两篇论文,提出了R-CNN和Fast R-CNN算法。这个系列虽然历史不长,却已经成了谈CNN图像分割绕不开的经典,量子位之前也发布过相关文章

对于与何恺明的合作,RBG大神表示非常满意,至少对美国和北京之间的时差很满意。( ̄▽ ̄)”他说俩人加一起,每天可以高效工作24小时。

论文还没写完,RBG就跳槽到了Facebook AI研究院。而何恺明,在微软亚洲研究院和老朋友张翔宇、任少卿、孙剑一起,完成了后来甚至被称为图像识别算法顶峰的ResNet。

第二年,何恺明也加入了Facebook,搬到了太平洋对岸的加州门罗帕克。

何恺明和RBG大神之间的时差,顿时从12小时缩短到了几乎没有,不过好在,他们之间依然合作愉快,也就有了今年的Mask R-CNN。

传奇何恺明

ICCV 2017绝不是何恺明唯一的高光时刻。

或者说,他一路以来都似乎在以“开挂”的模式前进。

2003年,何恺明以高考满分的成绩,摘得广东高考状元。不过在高考之前,何恺明已经被保送清华。

在当年的报道中,何恺明谈到学习秘诀时说:“不知道啊,很多人都问过这个问题,但(自己)一直都不太清楚,可能是(自己)悟性好”。谈到高考后的计划,何恺明说:去桂林旅游。

直到现在,何恺明的微博上还有不少他在各地的留影,俨然一副旅游博主的感觉。

插播一句,当年与何恺明同为广东高考满分状元的还有王俊煜等人。当年王俊煜在接受采访时,谈到了自己对杂志的喜好。

2007年,尚未本科毕业的何恺明以实习生身份,进入微软亚洲研究院(MSRA)。在孙剑的指导下开始研究工作。

尝试很多方向未果之后,有天何恺明打游戏时,受到雾气场景启发,认为存在一种方法可以去除图像中的雾气。

运气和实力再次眷顾了何恺明,他很快找到简单高效的处理办法。但孙剑要求何恺明继续研究,找到成功背后的本质原因。最后何恺明写出了论文Single Image Haze Removal Using Dark Channel Prior。

最终,何恺明的这篇论文被评为CVPR 2009最佳论文。这也是中国人首次获得这一奖项。这篇论文的另外两名作者是:孙剑、汤晓鸥。

本科毕业后,何恺明进入中国香港中文大学读研。期间继续在微软亚洲研究院参与研究。2015年,何恺明所在的团队凭借图像识别深度残差学习(Deep Residual Learning for Image Recognition)在ImageNet上傲视群雄。

随后这篇论文被CVPR 2016评为最佳论文。这篇论文的作者还包括:张祥雨、任少卿、孙剑。

随后残差网络(ResNets)也在AI领域得到了广泛的应用,包括机器翻译、语音合成、语音识别,以及最新的AlphaGo Zero(相关报道)。

如上所述,去年8月何恺明加入Facebook人工智能研究院(FARI)。

获奖论文详情

最后,再小结下ICCV 2017的奖项。

最佳论文

  • Mask R-CNN 作者:何恺明、Georgia Gkioxari、Piotr Dollár、Ross Girshick 地址:https://arxiv.org/abs/1703.06870

最佳学生论文

  • Focal Loss for Dense Object Detection 作者:Tsung-Yi Lin、Priya Goyal、Ross Girshick、何恺明、Piotr Dollár 地址:https://arxiv.org/abs/1708.02002

提名奖(Honorable mentions)

  • First Person Activity Forecasting with Online Inverse Reinforcement Learning 作者:Nicholas Rhinehart、Kris M. Kitani 地址:https://www.cs.cmu.edu/~nrhineha/darko.html
  • Open Set Domain Adaptation 作者:Pau Panareda Busto、Juergen Gall 地址:http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_opensetdomain_iccv17.pdf
  • Globally-Optimal Inlier Set Maximisation for Simultaneous Camera Pose and Feature Correspondence 作者:Dylan Campbell、Lars Petersson、Laurent Kneip、Hongdong Li 地址:https://arxiv.org/abs/1709.09384

OMT

这次ICCV 2017也有一众中国企业赞助。

白金赞助商包括:百度、滴滴、美图、商汤、腾讯优图。白银赞助商包括:360、中科视拓、北京文安。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-10-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Mask R-CNN简史
  • 传奇何恺明
  • 获奖论文详情
  • OMT
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档