今天在各个群里看到了:
「DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升」
追到了对应的 PR(提交代码),在这(两周前):
https://github.com/deepseek-ai/DeepEP/pull/130
---
中译中:
前段时间,开源了通信框架 DeepEP
框架很棒,尤其是在高端网络下。
但很多数据中心,网不好,表现差。
腾讯
- 优化网络资源使用
- 降低通信控制成本
- 保证数据处理顺序
结果
- DeepEP在RoCE网络上的通信性能提升约2倍
- 在高端InfiniBand网络上,已有性能基础上再提升约30%
- 技术成果已应用于腾讯内部大模型训练
开源
- 优化已开源,并入了 DeepEP 项目
- DeepSeek 团队表示感谢
One Morething
开源不是智商税
领取专属 10元无门槛券
私享最新 技术干货