首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1033428
阅读量
52
订阅数
突破 PyTorch、TensorFlow 并行瓶颈的开源训练加速框架到底是啥?
随着摩尔定律的失效,单个计算单元的能力已经远远无法满足数据的指数级增长。比如,快手每天上传的新视频超过千万条,即便训练简单的分类模型(比如 ResNet),使用单机单卡的算力,训练快手日内新增视频都需要超过一百天的时间。因此,在数据爆炸性增长的互联网行业,多机多卡的并行训练成为了大数据时代的必然。随着深度学习模型功能的日益强大,分布式训练任务的通信成本和所需算力也随之急剧增长。
代码医生工作室
2021-10-19
4040
TensorFlow,Raspberry Pi和Pan-Tilt HAT实时对象跟踪
https://github.com/leigh-johnson/rpi-deep-pantilt
代码医生工作室
2019-12-19
2.3K0
优化NVIDIA GPU性能,实现高效的模型推理
GPU已被证明是加速深度学习和AI工作负载(如计算机视觉和自然语言处理(NLP))的有效解决方案。如今许多基于深度学习的应用程序在其生产环境中使用GPU设备,例如用于数据中心的NVIDIA Tesla和用于嵌入式平台的Jetson。这提出了一个问题:如何从NVIDIA GPU设备获得最佳推理性能?
代码医生工作室
2019-07-23
2.8K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档