专栏首页AI科技评论动态 | 商汤 37 篇论文入选 ECCV 2018,开源 mm-detection 检测库

动态 | 商汤 37 篇论文入选 ECCV 2018,开源 mm-detection 检测库

AI 科技评论消息,9 月 8 日-14 日,2018 欧洲计算机视觉大会(ECCV 2018)在德国慕尼黑召开,ECCV 每两年举办一次,与 CVPR、ICCV 共称为计算机视觉领域三大顶级学术会议,每年录用论文约 300 篇。根据 ECCV 2018 宣布的最终结果,商汤科技及联合实验室共有 37 篇论文入选,主要集中在以下领域:大规模人脸与人体识别、物体检测与跟踪、自动驾驶场景理解与分析、视频分析、3D 视觉、底层视觉算法、视觉与自然语言的综合理解等。此外,商汤科技在 2018 年 COCO 比赛物体检测(Detection)项目中夺得冠军,开源 mm-detection 检测库。凭借以上事项,商汤科技在雷锋网旗下学术频道 AI 科技评论数据库产品「AI 影响因子」中有相应加分。

在商汤入选 ECCV 2018 论文《人脸识别的瓶颈在于数据集噪声(The Devil of Face Recognition is in the Noise)》中,对于现有人脸数据集中的标签噪声问题进行了深入研究,对 MegaFace 和 MS-Celeb-1M 数据集中的噪声特性和来源做了全面的分析,发现干净子集对于提高人脸识别精度效果显著。

在入选论文《量化模仿-训练面向物体检测的极小 CNN 模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》中,提出了一种简单而通用的框架—量化模仿,来训练面向物体检测任务的极小 CNN 模型。作者提出联合模仿与量化的方法来减小物体检测 CNN 模型的参数量实现加速。在有限计算量的限制下,该框架在 Pascal VOC 和 WIDER Face 数据集的物体检测性能均超越了当前物体检测的先进水平。

在 2018 年的 COCO 比赛中,商汤科技研究员和中国香港中文大学-商汤联合实验室同学组成的团队在物体检测(Detection)项目中夺得冠军。在此次竞赛中,商汤团队开发了如下三项全新技术,获得了大幅度的性能提升:

(1)新的多任务混合级联架构(hybrid cascade)。通过把不同子任务进行逐级混合,这种新架构有效地改善了整个检测过程中的信息流动。

(2)通过特征导引产生稀疏锚点,而不是使用传统的规则分布的密集锚点。这种特征导引的方案使得锚点的投放更为精准,平均召回率提升了超过10个百分点。

(3)采用一种新型的FishNet网络结构,它有效地保留和修正多个尺度的信息,能更有效地用于图像级,区域级,以及像素级预测任务。

在 test-dev 上,商汤团队对上述框架进行了全面测试,其中单模型和多模型(最终提交的结果来自于五个模型混合的框架)的 mask AP 分别达到了 47.4% 和 49.0%,比去年冠军(也是商汤团队获得)的结果(44.0% 和 46.3%)有约 3 个百分点的明显提高。在传统的基于检测框的指标 bbox AP 上,这个新的框架也分别达到了单模型 54.1% 和多模型的 56.0% 的性能,比去年冠军的结果(50.5% 和 52.6%)也有较大的提升。

此外,在 ECCV 期间,中国香港中文大学-商汤联合实验室还开源了检测库 mm-detection(https://github.com/open-mmlab/mmdetection),这个开源库提供了已公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架,比如 Faster RCNN,Mask RCNN 和 R-FCN 等,以及各种新型框架,从而大大加快检测技术研究的效率。

本文分享自微信公众号 - AI科技评论(aitechtalk)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-09-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • ICCV 2019 | 旷视研究院11篇接收论文抢先读

    两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于 ...

    AI科技评论
  • 干货 | 基于深度学习的目标检测算法综述

    目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基...

    AI科技评论
  • 苹果Face ID不只是人脸识别,更重要的是那层深度信息

    AI科技评论按:昨晚凌晨一点,号称是科技界春晚的苹果发布会如期而至,此次共发布了3款iPhone手机,命名也与之前曝光的信息相符,分别为iPhone X、iPh...

    AI科技评论
  • 数据类型判断

    typeof 操作符返回一个表示数据类型的字符串,它可以应付常规场景下的数据类型判断。对基本数据类型 undefined, boolean, string, n...

    Chor
  • 【深度学习】经典神经网络 ResNet 论文解读

    ResNet 是何凯明团队的作品,对应的论文 《Deep Residual Learning for Image Recognition》是 2016 CVPR...

    Frank909
  • 科学与艺术的融合:遗传算法绘制蒙娜丽莎

    读研究生的时候上了智能控制的课,课上讲了遗传算法、粒子群算法还有模糊控制等等。我对遗传算法非常感兴趣,用MATLAB复现了遗传算法进化蒙娜丽莎,这也是我公众号头...

    用户7699929
  • 算法篇:双指针之接雨水

    接雨水的题目在leetcode上面出现了两次,不过解法却很不相同,一类是简单的双指针使用场景;一类是栈的典型实用。

    灰子学技术
  • 深度学习目标检测法进化史,看这一篇就够了

    本文将介绍自动驾驶中的深度学习目标检测的基本概念和方法,并对几个主要 Anchor free 方法进行了比较,希望对读者有所帮助,以下为正文:

    AI科技大本营
  • React v16 与 Webpack v4 的多特性模板项目

    React & Webpack Boilerplate V4 是笔者前端常用模板集锦项目 fe-boilerplate 的一部分,尽可能地使用无异议的工具,提供...

    王下邀月熊
  • 装上后这 14 个插件后,PyCharm 真的是无敌的存在!

    如果让我给新手推荐一个 PyCharm 必装插件,那一定是 Key Promoter X 。

    abs_zero

扫码关注云+社区

领取腾讯云代金券