前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >索尼刷新纪录,训练ImageNet仅用224秒,准确率达75%

索尼刷新纪录,训练ImageNet仅用224秒,准确率达75%

作者头像
AiTechYun
发布2018-12-13 11:29:10
6680
发布2018-12-13 11:29:10
举报

编译:chux

出品:ATYUN订阅号

索尼的研究人员宣布了训练ImageNet / ResNet 50的新纪录,通过使用2100个NVIDIA Tesla V100 Tensor Core GPU,仅用224秒(3分44秒)就可以获得75%的准确率,对于ResNet-50来说这是训练时间是最短的。

该团队还通过1088个NVIDIA Tesla V100 Tensor Core GPU实现了超过90%的GPU缩放效率。

使用ImageNet / ResNet-50的训练时间和验证准确性

索尼团队在论文中表示,“随着深度学习的数据集和深度神经网络(DNN)模型大小增加,训练模型所需的时间也在增加。”

为了实现这一记录,研究人员解决了大规模分布式训练的两个主要问题:大型的小批量训练的不稳定性和同步通信开销。

“我们采用批量控制技术来解决大型的小批量不稳定问题,”研究人员说,“我们还开发了一种2D-Torus all-reducing方案,以便有效地在GPU之间交换梯度。”

2D-Torus作为有效的通讯拓扑结构,减少了集体操作的通讯开销。

团队指出,“我们使用神经网络库(NNL)及其CUDA扩展作为DNN训练框架,我们还使用了基于NNL 1.0.0版本和CUDA 9.0版本的开发分支结构,cuDNN7.3.1版本在GPU中训练DNN。”

索尼表示,“我们使用NCCL版本2.3.5和OpenMPI版本2.1.3作为通讯库。2D-Torus all-reduce用NCCL2实现。上述软件封装在Singularity容器中。我们使用Singularity 2.5.2版本来运行分布式DNN训练。”

论文:nnabla.org/paper/imagenet_in_224sec.pdf

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ATYUN订阅号 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档