专栏首页量子位一文看尽CVPR 2019十大新研究:“不看也知”成热点,无人车新增重磅开源数据集

一文看尽CVPR 2019十大新研究:“不看也知”成热点,无人车新增重磅开源数据集

雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI

哪些研究闪耀CVPR 2019?

在该备受瞩目的AI顶会落幕之际,外媒VentureBeat盘点了十项不能错过的新研究、新进展。

基本从今年5165篇论文中找出了最受关注的研究。

详情如下:

英特尔的论文:Acoustic Non-Line-of-Sight Imaging,描述了一种用声学方法重建非视线内物体图像的系统。

传送门:http://vladlen.info/publications/acoustic-non-line-sight-imaging/

英伟达的STEAL AI,提出一种更精确地检测和预测物体开始和结束位置的方法,可以改进对现有计算机视觉模型的推断,并为未来模型标记训练数据。

传送门:https://arxiv.org/abs/1904.07934

微软提出了ObjGAN,可以理解一段说明文字,生成草图布局,并根据确切描述完善图像细节。

传送门:https://www.microsoft.com/en-us/research/publication/object-driven-text-to-image-synthesis-via-adversarial-training/

给GAN一句描述,它就能按要求画画,微软CVPR新研究 | 附PyTorch代码

IBM则提出了标签集操作(LaSO)网络。

传送门:https://arxiv.org/pdf/1902.09811.pdf

Facebook展示了AI Habitat,这是一个开源模拟器,可以训练智能体在模拟公共环境中运行。

传送门:https://arxiv.org/abs/1904.01201

最佳论文,由CMU、多伦多大学和伦敦大学学院拿下。

题为一个用于非视线内物体形状重建的费马路径理论。

他们提出了一种使用光源、传感器和计算机视觉算法,用于推断角落隐藏的物品的形状。

论文委员会表示,这一研究成果,在解决“非视线内的物体形状重建”方面向前跨越了一大步。

这篇论文的第一作者为Shumian Xin,中文名为辛书冕,本科毕业于西安交通大学,现在是CMU博士二年级学生。

传送门:https://www.cmu.edu/news/stories/archives/2019/june/nlos-imaging.html

最佳学生论文,花落加州大学圣巴巴拉分校、微软雷蒙德研究院和杜克大学。

题为用于视觉—语言导航的强化跨模态匹配和自我监督模仿学习。

论文委员会在授奖时表示,在计算机视觉非常重要的视觉导航领域,这一研究通过视觉语言相结合,展现了令人激动的成果。

这篇论文的第一作者王鑫,2015年本科毕业于浙江大学,正在UCSB攻读博士学位,研究方向为自然语言处理、计算机视觉和机器学习。

传送门:https://arxiv.org/abs/1811.10092

荣誉奖,一篇英伟达新研究,提出替代GAN的生成器。

传送门:https://arxiv.org/abs/1812.04948

另一篇来自Google,世界首个在摄像机和人体同时运动情况下的深度学习景深预测算法,优于制作深度图的最先进工具。

传送门:https://arxiv.org/abs/1904.11111

https://mp.weixin.qq.com/s/vb7_XMsJ_LkFMqZmgUtUVA

最后,还有两项来自无人驾驶领域的重要开源数据集

一项是Google兄弟公司Waymo,宣布开源包含完整传感器信息的全新标注数据集 Waymo Open Dataset,相比业内主流开源数据集,在传感器配置、数据集大小上都有很大提升。

包含了3,000个驾驶场景,600,000帧,大约2500万个3D边界框和2200万个2D边界框的16.7小时视频数据

传送门:https://waymo.com/open/

另一项是福特旗下的ArgoAI的开源数据集:Argoverse.

包括113个场景的3D跟踪注释,超过300,000个车辆轨迹,测试基准,290公里记录的道路车道,以及用于将传感器数据与地图数据连接的API。

传送门:https://www.argo.ai/2019/06/introducing-argoverse-data-and-hd-maps-for-computer-vision-and-machine-learning-research-to-advance-self-driving-technology/

值得一提的是,今年的CVPR参会人数再度刷新纪录,提交了5160篇论文,共接收1294篇,论文接受率为25.5%。

其中,投稿论文作者中,来自中国的最多,占比39%。

注册参会人数达到9227人,来自美国的人数最多,达4743人,来自中国大陆的有1044人,排在第二。

对今年CVPR,还有什么令你感到激动的研究吗?

欢迎在评论区补充~

本文分享自微信公众号 - 量子位(QbitAI),作者:关注前沿科技

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 多图对比看懂GAN与VAE的各种变体|附论文

    安妮 整理自 GitHub 作者:Pawel.io 量子位 出品 | 公众号 QbitAI 近日,英国小哥Pawel.io在GitHub上图解了一系列生成式对抗...

    量子位
  • 谷歌这个AI“吵架预防器”,可带你提前远离杠精们

    回想一下,你在微博上针对问题提出看法,几小时后发现一队人马@你排队挑衅,他们奉行“只对人不对事”和“以抬杠为己任”的基本原则,试图和你吵架。

    量子位
  • GitHub热榜第一,标星近万:这个用Python做交互式图形的项目火了

    这一工具名为Bokeh,官方介绍称,它能读取大型数据集或者流数据,以简单快速的方式为网页提供优美、高交互性能的图形。

    量子位
  • 预训练语言模型(PLM)必读论文清单(附论文PDF、源码和模型链接)

    [ 导读 ]近两年来,ELMO、BERT等预训练语言模型(PLM)在多项任务中刷新了榜单,引起了学术界和工业界的大量关注。

    数据派THU
  • https与http的区别?

    Dawnzhang
  • Linux操作系统中删除ARP缓存的命令

    在Windows下,使用比较多的两个操作ARP缓存的命令是arp -a和arp -d,前者是查看所有ARP条目,后者是删除所有ARP条目。

    雷大亨
  • 【干货】2018年深度学习必读的31篇论文,赶紧收藏!

    Kloud Strife在其博客上盘点了今年最值得关注的有关深度学习的论文,包括架构/模型、生成模型、强化学习、SGD & 优化及理论等各个方面,有些论文名扬四...

    钱塘数据
  • 2017年深度学习必读31篇论文

    一如既往,首先,标准免责声明适用,因为今年仅与GAN有关的论文就超过1660篇。我肯定会有疏漏,试图缩减到每两周一篇论文,包含了Imperial Deep Le...

    华章科技
  • 大考在即,互联网保险该如何突围?

    从2011年的32亿元到2015年的2234亿元,互联网保险保费规模只用了4年就实现了69倍的增长,这种井喷式的爆发,众人咂舌之余也吸引了越来越多的人挤进互联网...

    曾响铃
  • 我的 github 开源软件列表

    如果您在使用上述开源项目的过程中遇到技术问题,可通过这个公众号与我取得联系,或者加入我们的 QQ 群 729995516 进行技术交流。

    范蠡

扫码关注云+社区

领取腾讯云代金券