动态 | 商汤科技正式开源 mmdetection 和 mmcv

AI 科技评论消息,10 月 12 日,商汤科技正式开源 mmdetection (https://github.com/open-mmlab/mmdetection)和 mmcv (https://github.com/open-mmlab/mmcv)两个项目。

据悉,mmdetection 检测库是基于商汤在 COCO 比赛(Detection 2018 winner)时的 codebase 重构,这个开源库提供了已公开发表的多种视觉检测核心模块,通过这些模块的组合,可以迅速搭建出各种著名的检测框架。据该开源库作者之一、香港中文大学陈恺介绍,这一版本中实现了 RPN,Fast R-CNN,Faster R-CNN,Mask R-CNN,近期还计划释放 RetinaNet 和 Cascade R-CNN。

mmcv 是一个基础库,主要分为两个部分,一部分是和 deep learning framework 无关的一些工具函数,比如 IO/Image/Video 相关的一些操作,另一部分是为 PyTorch 写的一套训练工具,可以大大减少用户需要写的代码量,同时让整个流程的定制变得容易。

在该库开源之后,知乎上有人提出问题:

如何评价商汤开源的 mm-detection 检测库?mm-detection 相比 FAIR 的 Detectron 如何?

陈恺也第一时间进行解答,他表示,mmdetection 和 Detectron 主要有如下三点差异:

  1. performance 稍高
  2. 训练速度稍快
  3. 所需显存稍小

他进一步解释道,在 performance 上 ,由于 PyTorch 官方 model zoo 里的 ResNet 结构和 Detectron 所用的 ResNet 有细微差别(mmdetection 中可以通过 backbone 的 style 参数指定),导致模型收敛速度不一样。他们用两种结构都进行了实验,和 Detectron 使用相同的 pretrain model 的情况下,performance 比 Detectron 稍高,在使用 PyTorch 官方的 model 进行训练时, 1x 的 lr schedule 下比 Detectron 的 performance 略低,但 2x 的情况下更高。

速度方面 Mask R-CNN 的差异比较大,其余框架的差异很小。采用相同的 setting,Detectron 每个 iteration 需要 0.89s,而 mmdetection 只需要 0.69s。Fast R-CNN 比较例外,比 Detectron 的速度稍慢。另外,他们在服务器上跑 Detectron 会比官方 report 的速度慢 20% 左右,他提出猜测,可能是 FB 的 Big Basin 服务器性能比他们好。

在显存方面这一检测库的优势比较明显,会小 30% 左右。但他表示,这和框架有关,不完全是 codebase 优化的功劳。一个让他们比较意外的结果是,现在的 codebase 版本跑 ResNet-50 的 Mask R-CNN,每张卡(12 G)可以放 4 张图,显存消耗比他们在 COCO 比赛时小了不少。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2018-10-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

AI 每周必读:The Ones

【AI100 导读】人工智能真的只需要懂些高数,会用深度学习框架跑示例就可以了吗?投稿会议之前将 paper 发布在 arXiv 上,盲审如何保证公平?一起来看...

36812
来自专栏PPV课数据科学社区

【学习】详解数据挖掘十大经典算法!

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖...

4437
来自专栏企鹅号快讯

分享一波关于做 Kaggle 比赛,Jdata,天池的经验,看完我这篇就够了

本文作者Jasperyang,毕业于BUPT。本文原载于知乎专栏,AI 研习社授权转载。 Kaggle 的数据挖掘比赛近年来很火,以至于中国兴起了很多很多类似的...

7338
来自专栏美团技术团队

【AI in 美团】深度学习在美团搜索广告排序的应用实践

AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法工程师正致力于将AI技...

1843
来自专栏大数据文摘

Kaggle大神带你上榜单Top2%:点击预测大赛纪实(上)

2543
来自专栏周鸿宇的专栏

【SPA大赛】如何预测移动 App 广告点击率

计算广告是互联网最重要的商业模式之一,广告投放效果通常通过曝光、点击和转化各环节来衡量,大多数广告系统受广告效果数据回流的限制只能通过曝光或点击作为投放效果的衡...

7220
来自专栏专知

【前沿】飞入寻常百姓家:DeepCognition.ai教你轻松部署AI应用

【导读】你是否曾为选择TensorFlow或Keras而感到纠结?又是否认深度学习编程费时费力而感到苦恼?本文带大家领略一下DeepCognition.ai,其...

4594
来自专栏专知

八月·机器学习热门开源项目(Aug.2018)

【导读】整理了一份8月热门机器学习开源项目,包含了Auto Keras,Glow,Videoto Video,机器翻译,舞蹈生成器,足球视频到3D,垃圾邮件过滤...

1412
来自专栏AI科技大本营的专栏

实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型

翻译 | AI科技大本营 参与 | 王赫 上个月,我有幸结识了 DeepCognition.ai 的创始人。 Deep Cognition (深度认知) 建立的...

37310
来自专栏PPV课数据科学社区

人人都应该掌握的9种数据分析思维-深度学习世界

说到数据分析,啤酒和尿布的例子大家应该都听腻了。再具体、深入一些的内容,往往因为数学就令很多人望而却步了。给大家分享9个不带数学推导的数据分析思路,希望大家能喜...

33712

扫码关注云+社区

领取腾讯云代金券