



2026 年 2 月 1 日,DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强,进一步完善了在多设备(尤其是 MPS 与 BF16 环境)下的兼容性与性能优化。以下为本次更新的详细内容整理。
DeepSpeed v0.18.5 共包含 34 次提交(Commits)、15 位贡献者、50 个文件变更,主要集中于以下几个方向:
using namespace std. 语句,提升代码规范性。use_reentrant=True、PyTorch-style backward、ZeRO-3 模式下的兼容性问题。modifier_rank 的情况下,对 GatheredParameters 原地修改的清晰报错提示,帮助开发者快速定位问题。代码地址:github.com/deepspeedai/DeepSpeed
DeepSpeed v0.18.5 是一次稳定而重要的更新。该版本在 多平台支持、分布式训练性能、BF16 与 ZeRO 模式兼容性、文档一致性 等方面都进行了全面优化。随着 PyTorch 2.9 的支持加入,DeepSpeed 在高性能大模型训练领域的工程成熟度再度提升。
这次更新不仅强化了核心训练引擎的健壮性,也为未来的性能扩展和多平台支持奠定了基础。
版本信息:
结语: DeepSpeed v0.18.5 的推出,再次展示了其在分布式训练与模型加速领域的持续领先。对于追求极致性能与兼容性的开发者而言,本次升级值得立即尝试与部署。