华人包揽CVPR 2019两篇最佳论文,李飞飞ImageNet十年后获奖

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

乾明 边策 发自 凹非寺 本文转载自:量子位(QbitAI)

现在,是时候称CVPR为CCVPR了。

这已经不再是“戏言”,而是实力见证。

大洋彼岸,计算机视觉领域顶级学术会议在加州长滩召开,各项奖项一一揭开。

有两篇论文,在CVPR 2019评审过程中,从5160篇投稿论文中杀出重围,分别获得最佳论文和最佳学生论文,而且这两篇论文的第一作者,都是华人。

华人包揽最佳论文,李飞飞成经典

其中,最佳论文花落CMU、多伦多大学、伦敦大学学院。

题为一个用于非视线内物体形状重建的费马路径理论

论文委员会表示,这一研究成果,在解决“非视线内的物体形状重建”方面向前跨越了一大步。

这篇论文的第一作者为Shumian Xin,中文名为辛书冕,本科毕业于西安交通大学,现在是CMU博士二年级学生。

华人,拿下“First Blood”。

然后是最佳学生论文,花落加州大学圣巴巴拉分校、微软雷蒙德研究院和杜克大学。

题为用于视觉—语言导航的强化跨模态匹配和自我监督模仿学习

论文委员会在授奖时表示,在计算机视觉非常重要的视觉导航领域,这一研究通过视觉语言相结合,展现了令人激动的成果。

这篇论文的第一作者王鑫,2015年本科毕业于浙江大学,正在UCSB攻读博士学位,研究方向为自然语言处理、计算机视觉和机器学习。

华人,拿下“Double Kill”。

此外,今年的经典论文奖,也颁给了我们的“老朋友”李飞飞。

CVPR的这一奖项,名为PAMI Longuet-Higgins奖,相当于其他顶级学术会议的Test-of-Time Award,主要颁给为计算机视觉领域作出极大贡献的研究。

2009年,李飞飞带领的研究团队在CVPR发表论文ImageNet: 一个大规模的分层图像数据库。伴随着ImageNet挑战赛举办,这一成果已然成为了计算机视觉领域的试金石,开启了一个新的时代,重要性毋庸置疑。

李飞飞和她的学生李佳、李凯上台领奖。图片来自雷锋网

华人,拿下“Triple Kill”。

此外,加州大学伯克利分校Jitendra Malik教授获得计算机先驱奖。

详解最佳论文&最佳学生论文

最佳论文

今年最佳论文的第一作者是来自CMU的中国学生辛书冕。

这篇文章提出了一个新的理论,研究了在一个已知的可见场景和一个不在瞬态相机视线范围内的未知物体之间的费马光路。

通俗地说,就是还原被遮挡物体的形状。

所谓费马光路,要么遵守镜面反射,要么被物体的边界反射。光学中的费马原理指出,光线总是按光路长度最小值行进,因此这些反射的光线中隐藏着物体形状的信息。

研究人员证明了费马光路对瞬态测量中的不连续性,然后推导出一种新的约束,将这些不连续处的路径长度的空间导数与物体表面法线相关联。

基于这一理论,这篇文章提出了一种名为Fermat Flow的算法来估计非视线内物体的形状,对复杂物体的精确形状进行恢复,范围从隐藏在拐角处的漫反射,到隐藏在物体后的散射。

研究人员实现了用SPAD和超快激光从皮秒级瞬态恢复物体的毫米级形状,以及使用干涉测量法从飞秒级瞬态重建物体微米级形状。

之前,量子位对一篇类似研究的Nature论文进行过报道,利用漫反射的光线信息,恢复被遮挡的物体形状。

今年CVPR最佳论文与前者的最大不同之处在于,它使用的是不是普通光源,而是使用飞秒级别的激光,虽然成本更高,但是成像效果更精细,甚至能还原硬币上的图案。而那篇Nature论文只能恢复单个像素尺寸很大的图片。

因此,作者也认为这项工作是非视线内成像技术的重大进步。

此外,还有两篇论文获得了最佳荣誉提名,分别是:

A Style-Based Generator Architecture for Generative Adversarial Networks https://arxiv.org/abs/1812.04948

Learning the Depths of Moving People by Watching Frozen People https://arxiv.org/abs/1904.11111

最佳学生论文

今年的最佳学生论文颁给了来自加州大学圣巴巴拉分校(UCSB)王鑫的论文《视觉语言导航中的强化跨模态匹配和自监督模仿学习》,用自然语言为AI智能体指路。

早在今年3月,王威廉就宣布自己组的学生王鑫论文成为今年CVPR满分论文,并将在在大会上做口头报告。

这篇论文基于强化学习,提出一种使用自然语言指挥智能体行动的新方法,在基准数据集上评估,比现有最好的方法性能显著提高了10%。

这一研究成果,如果用于现实世界中,将能够进一步提高家庭机器人以及个人虚拟助理的性能,只要你认识路,机器人就能根据你的描述,找到正确的路。行动会更加高效。

关于这篇论文详细的技术解读,可以前往量子位之前的报道《CVPR出了篇满分论文!中国小哥用人话为机器人导航,5000多篇论文里夺魁》

一场CCVPR

这场大会,由华人学者朱松纯开场,他也是CVPR 2019大会主席之一。

他介绍称,今年的CVPR参会人数再度刷新纪录,提交了5160篇论文,公接收1294篇,论文接受率为25.5%。

其中,投稿论文作者中,来自中国的最多,占比39%。

注册参会人数达到9227人,来自美国的人数最多,达4743人,来自中国大陆的有1044人,排在第二。

虽然参会人数不多,但中国公司的钱很多。

根据CVPR 2019公布的赞助商,三家钻石赞助商,有两家来自中国(旷视、商汤)。

白金赞助商中,更是有大量中国公司的身影:百度、字节跳动、华为、浪潮、Pony.ai、快手、腾讯优图等等。

然后是金牌赞助商:阿里巴巴、地平线、滴滴、大疆、京东、码隆科技等等。

不论是投稿人数、还是赞助情况,都彰显出了中国AI的实力与能量。中国AI在世界范围内的影响力,正在逐步扩大。

One more thing

CVPR 2019的官网上,也上线了一个可视化工具。可以根据论文机构对论文进行筛选,从中可以看出,当前学者们的研究,也大多集中在深度学习、识别、以及面部姿态等主题。

通过这一工具,我们也对国内一些科技公司和高校在CVPR上的成绩进行了不完全统计:

  • 阿里巴巴+蚂蚁金服:2篇oral,10篇Poster;
  • 百度:1篇oral,8篇Poster;
  • 字节跳动:2篇oral,6篇Poster;
  • 华为:4篇oral,17篇Poster;
  • 京东:4篇oral,11篇Poster;
  • 旷视:1篇oral,10篇Poster;
  • 商汤:7篇oral,24篇Poster;
  • 腾讯:11篇oral,43篇Poster;
  • 清华大学:9篇oral,47篇Poster;
  • 北京大学:5篇oral,41篇Poster;
  • 中科院:14篇oral,62篇Poster;

作者系网易新闻·网易号“各有态度”签约作者

原文发布于微信公众号 - CVer(CVerNews)

原文发表时间:2019-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券