业界 | DAC 2018目标检测系统挑战赛落幕:中科院、清华分获GPU与FPGA组冠军

机器之心发布

机器之心编辑部

2018 年 6 月 28 日,由电子自动化设计顶级会议 DAC' 2018 主办的「低功耗目标检测系统设计挑战赛」于加州旧金山于落下帷幕。来自中科院计算所的 ICT-CAS 团队和来自清华大学的 TGIIF 团队在全球 114 支参赛队伍中脱颖而出,分获 GPU 组和 FPGA 组的冠军。本届比赛旨在为无人机设计高精度且高能效的物体检测系统,以满足实际复杂场景的需要。比赛任务极具挑战性,参赛设计需要考虑小物体及被遮蔽物体检测,需要区分同场景多个相似目标,也需要考虑检测速度及功耗等多方面因素。参赛队伍来自清华大学、北京大学、中科院、UIUC、CMU、IBM、Cadence 等全球多个优秀科研机构。

无人机在工业、农业、军事及消费级市场均有如土地测绘、巡检监测、物资配送、灾后救援等重要作用。其中,实现高精度且高能效物体检测是开展所有无人机任务的基本要素,也是本领域急需提高的方向。由于航拍数据集(无人机视角)的缺失,进一步提升无人机物体检测系统变得更加困难。

在这样的背景下,圣母大学的史弋宇教授,匹兹堡大学的胡京通教授,香港城市大学的余备教授和 Cognite Ventures 公司的 CEO Christopher Rowen 发起「低功耗目标检测系统设计挑战赛」,并在 DAC' 2018 成功举办。该比赛由 Nvidia、Xilinx 和 DJI 大疆创新赞助,由圣母大学博士后徐小维和匹兹堡大学博士生张鑫燚进行评测。Nvidia 和 Xilinx 分别为 GPU 和 FPGA 组的参赛队伍提供免费的嵌入式计算设备 TX2 GPU 和 PYNQ Z-1 FPGA。大疆创新为比赛提供了高达 150k 份由无人机在实际环境中采集的数据并提供了准确标注。

比赛中使用到的两种硬件平台: TX2 GPU(左)和 PYNQ Z-1 FPGA(右)

比赛从 2017 年 10 月 16 日正式开始,于 2018 年 5 月 28 日结束,共吸引 114 支来自全球多个科研机构的队伍参加。其中,53 支队伍参与 GPU 组比赛,61 支队伍参与 FPGA 组比赛。最终,两个组别前三名的队伍将被邀请至旧金山,在 DAC' 2018 上接受颁奖。同时,获奖队伍将能在大会上分享他们的设计并进行现场展示。

挑战 1: 小物体及遮蔽物检测

由于所有图片均在无人机视角下拍摄,大量图片中的待检测物体都非常小,且有很大的概率被树木和建筑物遮挡。这些物体本身的特征在如此小的尺度下会大大提升检测的难度。

小物体检测:绿色框对应行驶中的汽车为检测目标

挑战 2: 同一物体检测

与传统的物体检测不一样,本次比赛需要参赛队伍检测同一个物体。在无人机跟随应用中,无人机需要准确地检测出指定物体(如无人机操控者、车辆、动物等)并进行跟随飞行。当场景出现多个相似物体时,无人机也不能跟丢或跟错对象。此应用给物体检测带来了新的挑战。

特定行人检测:绿色框对应的是正确的检测目标,蓝色和红色狂均对应错误的行人。

挑战 3:高精度 vs 低功耗

比赛采用的评价指标是精度,速度和能耗的结合(评分细则详见 1)。考虑到 GPU 组及 FPGA 组使用了不同的计算能力硬件设备,比赛对检测速度提出了不同的要求。其中 GPU 设计需运行至 20 FPS,FPGA 设计需达到 5 FPS。

GPU 组前三强

GPU 组的前三名分别是中科院计算所的 ICT-CAS 团队,浙江大学的 DeepZ 团队和山东大学的 SDU-Legend 团队。三个队伍均采用了深度学习完成比赛,也都采用 Yolo 神经网络作为他们的基础设计。

GPU 组第一名: ICT-CAS

ICT-CAS 团队使用了 feature extractor, tucker decomposition and precision scaling 相关技术。在每一种具体的方案中尝试了多种技术记忆组合以减少计算和内存消耗。在计算中采用了半精度(16bits)进行计算并使用 TensorRT 来提高计算速度。

GPU 组第二名: DeepZ

DeepZ 团队使用 Yolo-v2 作为骨干网络进行特征提取和检测。为了应对较小物体检测的问题,该团队使用了 Feature Pyramid Network 来获得上下文相关的特征。同时,focal loss function 的引入来缓解单一物体检测与多个候选框的不平衡问题。该团队 对 Yolo-v2 网络进行了一定的改进,改进后的网络结构如下图所示。

GPU 组第三名: SDU-Legend

SDU-Legend 团队基于 Yolo v-2 进行优化。首先,该团队将 Yolo v-2 网络由 32 层删减为 27 层。其次,为了满足检测小目标的要求,该团队降低了下采样率。在体系层次,该团队也做了一些优化:将网络最后两层的计算放在 CPU 上进行。该团队实现了 16bits 的半精度计算来进一步提升计算速度。

FPGA 组前三强

FPGA 组的冠军是来自清华大学的 TGIIF 团队,亚军是苏黎世联邦理工大学的 SystemsETHZ,季军来自 UIUC 的 iSmart2 团队。这三支参赛队伍分别在 FPGA 上部署了 SSD,SqueezeNet 和 MobileNet 神经网络,完成了比赛要求的物体检测任务。

FPGA 组第一名: TGIIF

TGIIF 团队在采用了深鉴科技的硬件加速器架构 DPU、全栈式工具链 DNNDK 和深度压缩技术的基础上,从算法、软件和硬件对整个目标检测系统进行了全栈式的协同优化。通过采用硬件友好的 SSD 网络和多线程优化技术,结合深度压缩和定点训练,在保证识别精度的前提下,满足了低功耗和实时性的要求。

FPGA 组第二名: SystemsETHZ

SystemsETHZ 团队使用低量化网络进行物体检测。特别的该团队采用 squeezenet 为基础进行设计,并将网络层数修改为 18 层。在具体的实现中,该团队采用了 folded computing 的方式来配置多路复用器和多路输出选择器进而实现神经网络不同阶段的计算。该团队使用一个 DMA 引擎实现 CPU 和 FPGA 间的数据传输。

FPGA 组第三名: iSmart2

iSmart2 组采用以 Mobilenet 为基础的轻量化网络设计,共 12 层。网络包含 depth-wise 3x3 卷积层,传统 1x1 卷积层和 max pooling 层,并采用简化的 Yolo 后端进行物体检测。在硬件实现上,该团队采用基于模块(IP)复用的结构,让相同种类的网络层复用同一个模块以节约硬件资源。此外,该团队将每层特征图分割成大小相同的数据块,以数据块为单位进行计算,实现了数据块之间的细粒度流水线结构,以缩短图片的处理延时。

大赛链接:http://www.cse.cuhk.edu.hk/~byu/2018-DAC-HDC/

本文为机器之心发布,转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心(almosthuman2014)

原文发表时间:2018-07-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据派THU

独家 | 人工智能技术在医学领域的应用与前景(附PPT)

[导读]2017年6月20日,零氪科技首席架构师王晓哲,在清华大学“天池医疗AI大赛”第一季肺部结节智能诊断 《医学影像在肿瘤诊疗中的应用及智能诊断探索》发表演...

88370
来自专栏机器之心

使用Faster R-CNN、ResNet诊断皮肤病,深度学习再次超越人类专家

选自IEEE 作者:Jeremy Hsu 机器之心编译 由于在特征识别任务上具有优势,医疗图像诊断一直是人工智能技术应用的重要方向。近日,韩国研究人员应用深度学...

77050
来自专栏ATYUN订阅号

【科技】医学界新突破!通过机器学习技术可准确地预测肾脏的生存时间

近日,《肾脏国际报告》发表的一项研究表明,肾脏活检的机器学习和成像分析有助于帮助预测肾脏在慢性肾损伤患者中能充分发挥作用的时间。 ? 研究人员利用深度学习和神经...

381130
来自专栏大数据文摘

大数据下客户金融产品购买概率预测

25090
来自专栏杂七杂八

CS231n学习笔记--计算机视觉历史回顾与介绍1

首先我们来看看官方对这门课的介绍: 计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。...

14920
来自专栏AI科技大本营的专栏

《自然》杂志医疗AI领域最新成果系列二:关于皮肤患者的AI解决方式

图片来源:CDAPEX 编译 | Ziqi Zhang 编辑 | Donna 【AI科技大本营导读】澳大利亚阿德莱德大学的在读医学博士生、放射线学专家Luke...

38660
来自专栏AI科技评论

中科院百人计划专家深度解析:银行业务光凭“刷脸”真的靠谱吗?

雷锋网按:本文内容来自云从科技创始人、中国科学院百人计划周曦博士在硬创公开课的分享。在未改变原意的基础上进行了编辑整理。 明明可以靠脸吃饭”这句话不再只是一个网...

39160
来自专栏新智元

【Nature 封面论文】机器学习掀起材料革命,人工智能或将颠覆人类科研方式

【新智元导读】昨日Nature封面论文:哈佛大学研究者借助机器学习算法,利用“废弃”数据成功预测新材料的合成,引发学界激论:人工智能真能加速发现神奇新材料吗?该...

48360
来自专栏量子位

LeCun:现在还没有真正的AI系统,机器与生物系统差远了

? 可能我们现在提到的AI都是假AI。 近日,Facebook首席人工智能科学家Yann LeCun在纽约大学坦登工程学院的AI研讨会上谈了谈AI的历史和方向...

33790
来自专栏目标检测和深度学习

使用Faster R-CNN、ResNet诊断皮肤病,深度学习再次超越人类专家

选自IEEE 作者:Jeremy Hsu 机器之心编译 由于在特征识别任务上具有优势,医疗图像诊断一直是人工智能技术应用的重要方向。近日,韩国研究人员应用深度学...

434140

扫码关注云+社区

领取腾讯云代金券