首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

华为推出全新架构昇腾 AI 计算集群,支持超万亿参数大模型训练

IT之家 9 月 20 日消息,在今日举行的华为全联接大会 2023 期间,华为常务董事、ICT 基础设施业务管理委员会主任、企业 BG 总裁汪涛正式发布全新架构的昇腾 AI 计算集群 ——Atlas 900 SuperCluster,可支持超万亿参数的大模型训练。

据介绍,新集群采用了全新的华为星河 AI 智算交换机 CloudEngine XH16800,借助其高密的 800GE 端口能力,两层交换网络即可实现 2250 节点(等效于 18000 张卡)超大规模无收敛集群组网。

新集群同时使用了创新的超节点架构,大大提升了大模型训练能力。此外,发挥华为在计算、网络、存储、能源等领域的综合优势,从器件级、节点级、集群级和业务级全面提升系统可靠性,将大模型训练稳定性从天级提升到月级。

此外,华为发布了更开放、更易用的 CANN 7.0 异构计算架构,不仅全面兼容业界的 AI 框架、加速库和主流大模型,还深度开放底层能力,让 AI 框架和加速库可以更直接地调用和管理计算资源,使能开发者自定义高性能算子,让大模型具备差异化的竞争力。

华为还升级了 Ascend C 编程语言,以更高效的编程方式,简化算子实现逻辑,大幅缩短融合算子的开发周期,为 AI 模型与应用的快速开发赋能。

IT之家查询获悉,截至今年 7 月,昇腾 AI 集群已支撑全国 25 个城市的人工智能计算中心建设,其中 7 个城市公共算力平台入选首批国家“新一代人工智能公共算力开放创新平台”。

同时,昇腾 AI 已发展 30 多家硬件伙伴、1200 多家 ISV,联合推出了 2500 多个行业 AI 解决方案,规模服务于运营商、互联网、金融等行业。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OYObOKzXMMkNF2cRLZHUcdLg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券