前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【在线视频】如何在GPU上进行混合精度训练

【在线视频】如何在GPU上进行混合精度训练

作者头像
GPUS Lady
发布2018-09-29 17:55:37
1.8K0
发布2018-09-29 17:55:37
举报
文章被收录于专栏:GPUS开发者GPUS开发者

混合精度在计算方法中结合了不同的数值精度。

使用精度低于FP32的系统可以减少内存使用,允许部署更大的网络。数据传输需要更少的时间,而且计算性能会提高,尤其是在NVIDIA gpu上,它的Tensor Core支持这种精度。DNNs的混合精度训练实现了两个主要目标:

-减少需要的内存,使训练更大的模型或训练更大的小批量

-通过低精度算法降低所需资源,缩短训练/推理时间。

本视频演示了如何在TensorFlow里训练ResNet-50与混合精度。

在这个视频中有五件重要的事情:

  1. 混合精度训练可以提高计算性能,并在保持训练精度的同时减少内存带宽。
  2. 充分利用了Tensor Cores在FP16中进行计算操作。
  3. 权重的主副本保存在FP32中,以避免在反向传播期间进行不精确的权重更新。
  4. 为了确保梯度在FP16中得到安全地表示,进行了损耗缩放,并在FP32中计算了损耗,以避免FP16中出现的溢出问题。
  5. Tensor Core加速的最佳实践指南:使用8的倍数做为Linear层矩阵的大小, 和做为卷积通道的数量.。
视频内容

NVIDIA官网关于混合精度的文档:

更多学习视频:

确认过的眼神:这是一份NVIDIA TensorRT 4.0的实战教程

MATLAB 与 NVIDIA TensorRT 在一起啦,你不看看么?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档