首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

DeepSeek开源周亮点频现,DeepGEMM等三大开源库引关注

港股研究社讯,DeepSeek在开源周活动中大放异彩,连续三天宣布开源三大重要库,为人工智能领域注入新的活力。

在开源周的第三天,DeepSeek宣布开源DeepGEMM。这是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能。它支持普通和混合专家(MoE)分组的GEMM,并采用CUDA编写。无需编译,通过使用轻量级的即时编译(JIT)模块,DeepGEMM能够在运行时编译所有内核,为V3/R1的训练和推理提供支持。

此前一天,DeepSeek官宣开源DeepEP,这是第一个用于MoE模型训练和推理的开源EP通信库。DeepEP以高效、优化的全员沟通为特点,支持NVLink和RDMA,无论是节点内还是节点间都能实现高性能通信。同时,它还具备高吞吐量内核和低延迟内核,原生支持FP8调度,并能灵活控制GPU资源,实现计算与通信的重叠。

而开源周首日,DeepSeek便已启动首个代码库FlashMLA的开源。此前,DeepSeek还宣布将组建一支探索AGI(通用人工智能)的小团队,并计划开源5个代码库,以透明的方式分享研究进展。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMlukN5tlwLkMY43PenRgq7A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券