首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

摩尔线程发布 MTT S4000 国产大语言模型专用加速卡、并宣布 KUAE 纯国产大模型训练平台

国产显卡领军者摩尔线程发布了 MTT S4000 加速卡,并宣布全国首个千卡、千亿模型训练平台问世,叫“摩尔线程 KUAE ” 智算中心。

这意味着,国内首个以国产 GPU 为基础的大规模算力集群正式落地,对于国内 AI 研究和市场,具有里程碑意义。

先来了解下摩尔线程 MTT S4000 。这是一款国产大语言模型专用加速卡,采用第三代 MUSA 内核,配备 48GB 显存,拥有 768GB/s 大带宽,支持 PCIe 5.0 x 16 通道,单卡最多支持 96路1080p 硬件级解码,支持多种加密算法。

至于算力,单卡拥有 25 TFLOPS FP32、50 TFLOPS TF32 以及 200 TOPS INT8算力,另外,自研 MTLink1.0 技术,支持多卡互联,助力千亿大模型的分布式计算加速。

重点是,借助摩尔线程自研 MUSIFY 开发工具,MTT S4000 计算卡可以充分利用现有 CUDA 软件生态,实现 CUDA 代码零成本迁移到 MUSA 平台。

至于 KUAE 智算平台,包括以 KUAE 计算集群为核心的基础设施、KUAE Platform 集群管理平台以及 KUAE ModelStudio 模型服务,该方案可实现开箱即用,大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本,实现快速投放市场开展商业化运营。

基于摩尔线程 KUAE 千卡集群,可以实现 70B 到 130B 参数的大模型训练,线性加速比均可达到 91%,算力利用率基本保持不变。以 2000 亿训练数据量为例,智源研究院 700 亿参数 Aquila2 可在 33 天完成训练;1300 亿参数规模的模型可在 56 天完成训练。

此外,摩尔线程 KUAE 千卡集群支持长时间连续稳定运行,支持断点续训,异步 Checkpoint 少于 2 分钟。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OQICV9qcyAm7qpzCCGTeJaAA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券