zero - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签zero

#zero

DeepSpeed v0.19.0 重大更新：训练稳定性、ZeRO、FPQuantizer、DeepCompile、Sequence Parallelism 全面增强，20 位贡献者带来 28 次提交

福大大架构师每日一题 15天前2026-05-21 20:21:28

如果你正在关注 DeepSpeed 的最新版本，那么 v0.19.0 绝对值得重点解读。这次更新覆盖范围非常广，从版本号更新、Transpose 重构、进程...

21310

Agent Zero：你的AI“数字分身”，一个会自我进化的个人智能体框架

沈宥 27天前2026-05-09 13:46:21

在AI领域，我们已经习惯了向模型提问并获得答案。但如果我们能拥有一个真正理解我们、能代表我们行动、并在过程中不断学习成长的“数字分身”呢？

23910

unity给物体添加可以包裹所有子物体的BoxCollider

用户12298955 30天前2026-05-06 16:09:22

9210

25：Few-Shot到Zero-Shot的自动化转换技巧

安全风信子 2026-04-052026-04-05 08:03:35

作者： HOS(安全风信子) 日期： 2026-04-02 主要来源平台： GitHub 摘要：本文深入探讨Few-Shot到Zero-Shot的自动化...

14610

三星Zero-ETL：计算下沉存储，告别数据搬家

数据存储前沿技术 2026-04-022026-04-02 10:44:19

在大数据和AI时代，海量数据如洪水般涌来，你是否还在为传统ETL流程中数据反复跨网络传输的I/O瓶颈和天价TCO买单？三星Zero-ETL架构横空出世，以“近数...

17510

DeepSpeed v0.18.8 发布：稳定性、Evoformer、多架构构建与ZeRO优化全面升级详解

福大大架构师每日一题 2026-03-312026-03-31 21:09:30

DeepSpeed v0.18.8 于 2026 年 3 月 13 日正式发布，这是一次以“修复问题 + 提升稳定性 + 改善开发与构建体验”为核心目标的补丁...

35310

神器分支OpenClaw-Zero-Token，告别 Token 账单

灬沙师弟 2026-03-302026-03-30 15:01:07

在 AI 开发领域，API Token 费用始终是绕不开的成本痛点——学生党尝鲜怕超支、中小企业高频调用成本高、个人开发者长期投入压力大。

2.7K22

优化DeepSpeed ZeRO，让大模型训练更经济

用户11764306 2026-03-182026-03-18 06:21:27

现代自然语言处理应用大多建立在预训练语言模型之上，这些模型编码了整门语言的词序列概率。随着时间的推移，这些模型变得越来越大，达到数十亿甚至数万亿参数的规模。在合...

26110

DeepSpeed v0.18.5 发布：PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级！

福大大架构师每日一题 2026-02-092026-02-09 14:47:02

2026 年 2 月 1 日，DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强，进一步完善了在多设备（尤其是 ...

83710

ZeRO-offload内存卸载｜CPU内存不该"躺平"

AI老马 2026-01-132026-01-13 20:34:49

zero-offload 主要结合了zero-2的训练策略，每个GPU上保留一份参数副本，将梯度和优化器分片后，由不同的GPU进行通信和更新。

45510

大模型训练｜ZeRO三阶段显存"压榨"指南

AI老马 2026-01-132026-01-13 20:34:10

混合精度训练过程中显存占用主要来自参数、梯度、优化器和中间激活值。仅参数、梯度和优化器占用内存为参数量的16倍，假如全参训练一个7.5B的模型，至少要120G的...

50910

大模型-零冗余优化器zero

AI老马 2026-01-132026-01-13 14:51:46

在训练过程中显存的用一般是四部分组成参数，梯度，优化器和中间激活值，前三项和参数量的的关系约为16倍。假如一个3B的模型，至少要48G的显存，加上中间激活着占用...

24410

ZeRo零冗余优化器参数更新过程和通信量计算

AI老马 2026-01-132026-01-13 14:50:03

策略：将模型的梯度和优化器状态进行分片。每个GPU上，保存一份完整的参数副本，以及分片后的梯度和优化器状态。

29410

Zero-Drift Op 在精密小电流中采集的优势

云深无际 2026-01-072026-01-07 14:44:37

下面那个 RSENSE = 1kΩ 串在负载回路的地线上，是一个低端电流采样电阻。（这个低端的意思是一段接在地）

27510

解决MySQL-sql_mode=only_full_group_by报错

用户4128047 2025-12-232025-12-23 15:28:53

具体报错：[Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clause and...

60110

go-zero v1.9.3 版本更新：一致性哈希负载均衡、gRPC优化、链路追踪修复、ORM完善等重要提升

福大大架构师每日一题 2025-12-192025-12-19 09:10:29

go-zero 发布了 v1.9.3 版本，本次更新在可靠性、性能以及与行业最佳实践的对齐方面做出了多项重要增强。包括一致性哈希负载均衡器、gRPC 连接默认行...

32610

DeepSpeed v0.18.1 发布：新增 DataStates 异步检查点引擎，优化 Zero 优化器与存储共享机制

福大大架构师每日一题 2025-12-182025-12-18 15:49:36

DeepSpeed v0.18.1 在性能优化、功能扩展与稳定性方面进行了多项改进，尤其在优化器灵活性、学习率控制、检查点引擎以及 HF Accelerate ...

59810

DeepSpeed v0.18.0 更新详解：DeepCompile、SuperOffload 与 ZeRO 优化全面升级

福大大架构师每日一题 2025-12-182025-12-18 14:17:09

DeepSpeed 发布了 v0.18.0 版本，本次更新在分布式训练性能优化、内存管理、日志系统、模型检查点等方面进行了大量改进和修复，重点增强了 DeepC...

45310

go-zero v1.9.2 发布：修复 go-redis 依赖版本回撤问题，提升阻塞型 Redis 操作的稳定性

福大大架构师每日一题 2025-12-182025-12-18 14:16:47

在 2025年10月11日，go-zero 发布了 v1.9.2 版本。本次更新并没有带来新的功能或重大改动，而是针对一个关键依赖问题进行修复，目的是保证整个项...

23110

go-zero v1.9.1 发布：日志增强、REST/SSE稳定性优化及性能提升详解

福大大架构师每日一题 2025-12-182025-12-18 13:52:29

2025年10月2日，go-zero 正式发布了 v1.9.1 版本。本次更新带来了日志系统的增强、REST/SSE 的稳定性与可操作性的改善、诊断能力提升以及...

26310