腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
技术百科
搜索技术百科
搜索
技术百科
搜索
关闭
发布
技术百科首页
>
GPU 云服务器
>
哪些 GPU 机型支持 HARP 网络协议?
哪些 GPU 机型支持 HARP 网络协议?
修改于 2023-08-30 18:05:33
100
词条归属:
GPU 云服务器
所有的 GPU 实例类型均支持 HARP 网络协议,配置步骤可参见
配置 HARP 分布式训练环境
。
相关文章
dubbo 支持哪些通信协议?支持哪些序列化协议?
文件存储
dubbo
xml
数据结构
json
序列化,就是把数据结构或者是一些对象,转换为二进制串的过程,而反序列化是将在序列化过程中所生成的二进制串转换成数据结构或者对象的过程。
IT技术小咖
2019-06-26
1.8K
0
GPU 分布式 AI 训练加速引擎 TACO-Training 容器方案首发!
分布式
GPU 云服务器
tcp/ip
弹性网卡
私有网络
背景 随着 AI 模型规模的越来越大,训练数据的越来越多,用户对模型的迭代效率也要求越来越高,单个 GPU 的算力显然无法满足大部分业务场景,使用单机多卡或多机多卡训练成为趋势。单机多卡训练场景的参数同步借助目前 NVIDIA NVLINK 技术已经得到了很好地解决,而多机多卡场景由于对网络通信的强依赖就没有那么简单。 目前网卡厂商提供的 RoCE 等 RDMA 技术,使得多机通信效率大幅提升,但是如何在25G或 50G VPC 网络环境下提升分布式训练系统的通信效率,仍然是目前公有云厂商亟需解决的
腾讯云计算产品团队
2021-11-26
1.7K
0
GPU 分布式 AI 训练加速引擎 TACO-Training 容器方案首发!
分布式
弹性网卡
私有网络
tcp/ip
kubernetes
冯克环,腾讯云异构计算研发工程师,专注于云上 AI 训练加速相关技术,对 GPU 虚拟化、GPU 训练加速有深厚的积累,目前负责腾讯云 AI 训练加速相关技术的研发以及性能优化工作。 张锐,腾讯云网络虚拟化研发工程师,在之前的工作中专注于 AI 训练网络优化方面的工作,在 RDMA、GPU 通信优化等方面有较多经验,目前专注于做云上AI训练通信优化方面的工作。 背景 随着 AI 模型规模的越来越大,训练数据的越来越多,用户对模型的迭代效率也要求越来越高,单个 GPU 的算力显然无法满足大部分业务场景,使
腾讯云原生
2021-11-26
1.5K
0
全网首次揭秘:微秒级“复活”网络的HARP协议及其关键技术
tcp/ip
高性能计算
导读|云计算时代,承担服务器之间数据传输工作的交换机成了数据中心的“神经枢纽”,一旦出故障将波及上层业务。然而单个交换机故障时,腾讯云的新一代高性能网络却可以在100微秒内找到新的通路实现0断链,做到高可用、高可扩展、高性能,从而保证业务不受影响。本文邀请到了腾讯云资深网络专家金峰及其带领的IaaS前沿技术研究团队来揭秘背后的武器——高性能网络传输协议HARP。通过本文希望可以带你了解传统网络传输协议面临的困难和挑战、HARP是如何应对并全网首次解析其中4个关键技术。 腾讯云一直在自研一款高性能网络协议——
腾讯云开发者
2022-12-21
3.5K
1
Dubbo 支持哪些序列化协议?
文件存储
dubbo
数据结构
xml
json
dubbo 支持哪些通信协议?支持哪些序列化协议?说一下 Hessian 的数据结构?PB 知道吗?为什么 PB 的效率是最高的?
李红
2019-05-29
1.8K
0
点击加载更多
词条知识树
15个知识点
更多
什么是GPU云服务器与CPU云服务器?
为什么选择 GPU 云服务器?
GPU云服务器相对于CPU云服务器有什么优势?
如何选择GPU云服务器?
何时应选择使用 GPU 的实例?
GPU 云服务器如何计费?
什么是 NVIDIA Tesla?
什么是加速计算?
如何根据不同实例类型和场景选择驱动?
GPU 实例如何安装驱动?
GPU 云服务器是否支持调整实例配置?
什么是 SSD 本地盘?
GPU 云服务器是否支持访问 CVM ?
哪些 GPU 机型支持 HARP 网络协议?
为何 GPU 云服务器 nvidia-smi 展示显存比实际 GPU 显存小?
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档
领券