英伟达帮助开发人员通过合成数据训练和完善他们的深度网络

手工注释训练数据既费力又耗时。这意味着,针对计算机视觉任务的深度网络训练通常需要大量标记的训练数据,这可能既昂贵又难以获取。为了让深度学习变得更容易获取,英伟达的研究人员引入了一个结构化域随机化(structured Domain Randomization )系统,帮助开发人员通过合成数据训练和完善他们的深度网络。

“合成数据是一个有吸引力的选择,因为数据注释基本上是免费的,”研究人员在他们的论文中说。

为了生成合成数据,团队使用了一种称为结构化域随机化(SDR)的方法。这是一种通用技术,用于程序生成合成的随机图像,以保留当前问题的结构或Context。

“我们的方法只使用SDR生成的合成数据,”该团队表示。“我们发现,这个过程产生的结果不仅优于其他合成数据的生成方法,也优于来自不同领域的真实数据。”

在结构化域随机化(Structured Domain Randomization, SDR)中,随机选择一个场景,然后全局参数(道路曲率、照明、摄像机姿态等),这些参数将导致产生context样条曲线(道路车道、人行道等),并在其上放置对象(汽车、卡车、行人、自行车、房屋、建筑物等)。context样条显示为细的白色叠加线,白色点表示控制点。请注意,这些说明性的图像是从不同于用于训练的摄像机视点生成的。

SDR生成的图像可用于训练神经网络,用于对真实图像进行目标检测等感知任务。

在生成这些合成场景时,团队将场景中创建的对象随机化,包括车道、汽车、行人、路标和人行道。对于每个对象,其位置、纹理、形状和颜色都是随机的,但仅在实际范围内。该技术还随机化了照明参数,如白天的时间和图像饱和度。

以上视频显示的是在KITTI基准测试上的检测结果,仅在模拟训练后。

在合成数据(DR, SDR)或真实数据(BDD100K, KITTI)上比较Fast- RCNN。这里显示的是AP@0.7 IOU,用于从现实世界的KITTI数据集的1500幅图像中检测车辆。虽然合成数据很难胜过来自测试集(KITTI)相同分布的真实数据,但NVIDIA的SDR方法仍然优于来自另一个分布(BDD100K)的真实数据。

无论是视频还是静态图像,该网络都可以高效(或者用高准确度)的识别物体,这是值得注意的,因为网络从来没有在训练中看到过真实的图像。

Fast- RCNN在各种合成数据集上训练的比较。这里显示的是AP@0.7 IOU,用于在包含7500幅图像的整个现实世界的KITTI数据集中检测车辆。

DR数据还可以用于 pre-train的检测网络,这些网络稍后会对真实数据进行微调。

该团队还在Cityscapes数据集上测试了他们的网络,结果显示,经过特别提款权训练的网络能很好地跨越多个现实世界领域。

在未来的研究中,研究小组称他们将研究用于检测多个对象类、语义分割、实例分割和其他计算机视觉问题的SDR。

原文发布于微信公众号 - 吉浦迅科技(gpusolution)

原文发表时间:2018-11-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数值分析与有限元编程

广义特征值问题标准化

求解广义特征值 Kx = λMx 问题,一种方法是用广义雅可比方法,另一种方法就是化为标准特征值问题,然后用标准特征值的方法求解。 若质量矩阵M是正定矩阵,那么...

3769
来自专栏人工智能头条

CS231n李飞飞CV课程辅导笔记(2):KNN

全球最大的专注于大数据分析、数据仓库和整合营销管理解决方案的供应商之一的Teradata, VP Atif Kureishy 预言人工智能的未来,是机器人和计算...

823
来自专栏目标检测和深度学习

如何从零开始构建深度学习项目?这里有一份详细的教程

选自Medium 作者:Jonathan Hui 机器之心编译 在学习了有关深度学习的理论课程之后,很多人都会有兴趣尝试构建一个属于自己的项目。本文将会从第一步...

3708
来自专栏贾志刚-OpenCV学堂

谷歌机器学习速成课程系列二

谷歌tensorflow官方推出了免费的机器学习视频课,总计25个课时,支持中英文语言播放、大量练习、实例代码学习,是初学tensorflow与机器学习爱好者必...

1412
来自专栏新智元

【ICML2016】谷歌 DeepMind 论文下辑

【新智元导读】深度学习重要会议 ICML2016 接收谷歌 DeepMind 9篇论文,新智元系统整理,继上篇之后,本次邀请国家千人计划专家、平安科技数据平台部...

3755
来自专栏数据派THU

独家 | 面部识别技术能用来识别鲸鱼? Kaggle露脊鲸识别大赛NO.1教你实现!

本文长度为5624字,建议阅读10分钟 本文为你分享《露脊鲸识别大赛》冠军的竞赛经验。 《露脊鲸识别大赛》是由NOAA渔场和Kaggle数据科学平台组织的计算机...

2867
来自专栏量子位

谷歌新论文:让机器人依靠视觉识别抓取特定物体

安妮 编译自 arXiv 量子位出品 | 公众号 QbitAI 近日,谷歌团队在arXiv上发布了新论文《End-to-End Learning of Sema...

3624
来自专栏深度学习

机器学习中的七大经典问题

这是最有名错误判断,现在的教科书几乎已经不再有这样的结论,但如果看15年、20年前的机器学习教科书,会有一个很有趣的结论:神经网络不能超过三层。这和我们现在说的...

42812
来自专栏企鹅号快讯

从Q学习到DDPG,一文简述多种强化学习算法

选自towardsdatascience 作者:Steeve Huang 机器之心编译 参与:Edison Ke、路雪 本文简要介绍了强化学习及其重要概念和术语...

3147
来自专栏AI研习社

用神经网络预测 2018 年美国中期选举

本文中,研究人员使用Python从网上爬取历史数据,并采用神经网络分析这些数据,然后搭建了一个预测模型,用来预测2018年各个地区众议院的中期选举结果。提供给模...

662

扫码关注云+社区

领取腾讯云代金券