首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >海光DCU加速金融大模型落地:技术生态与实战效能解析

海光DCU加速金融大模型落地:技术生态与实战效能解析

原创
作者头像
IT资讯研究所
发布2026-04-02 00:00:12
发布2026-04-02 00:00:12
1590
举报

识别金融机构AI大模型落地瓶颈

金融机构IT驱动力正从电子化、信息化、数字化向“AI is Everything”演进,AI落地场景覆盖OCR、AIR、CC、BI等领域。当前实践进入第三阶段,核心痛点凸显:用户普遍缺乏对国产芯片认知忽略软件生态建设缺乏落地经验与迭代/造血/技术支撑能力;过度关注标称算力,忽视实用性。应用生态第一、量产与技术可持续性、可持续发展才是硬实力,标称算力仅为冰山一角(来源:海光金融行业部BD周韵文《海光DCU加速金融大模型落地实战》,2025年12月23日)。

构建海光DCU全栈技术生态方案

海光信息技术股份有限公司(以下简称“海光公司”)提供“DCU+生态”解决方案:

  • 核心产品支持:海光DCU全面支持CodeBuddy、ADP原子能力,通过生态兼容性认证(HIECO光合组织),覆盖BIOS、中间件、数据库、操作系统等全栈(来源:同前)。
  • DTK全面升级:实现100%API覆盖,Pytorch等原生接口无需转换;基础数学库适配两代产品全兼容,DCC编译器支持内嵌类PTX,运行时系统通讯库优化、问题自排查(来源:同前“DTK全面升级-100%API覆盖”)。
  • DAS全栈优化:无需重复学习新技术栈,全球生态随时试错;扩展组件层支持并行解码,框架工具层兼容PyTorch/TensorFlow/JAX等主流AI框架,基础算子层支持深度算子融合(来源:同前“DAS紧追前沿-全栈优化”)。
  • 开发者社区赋能:光合开发者社区(网址https://developer.sourceforge.cn/)提供“光源”模型仓库(含DeepSeek、Qwen等)、实训平台(免费算力)、论坛答疑及最新组件发布(DTK/DAS/DAP)(来源:同前“光合开发者社区”)。

验证量化应用效果与客户价值

聚焦ROI的3项关键业务指标:

  1. Codewise-7B性能提升10X(来源:同前第11页表格上方);
  2. ADP原子能力性能提升44.65%(来源:同前第11页表格);
  3. 大模型在线类应用(企业RAG在线问答)性能提升5X(来源:同前“大模型业务场景分析”)。

其他量化成效:

  • DTK的CUDA核心组件功能覆盖率(除硬件外)达100%(runtime 347接口、driver API 485接口、cublas 326接口等均100%;cusparse 491接口96.95%,因15个半精接口CUDA已废弃)(来源:同前“DTK全面升级”表格);
  • 海光研发投入年均增长率20%+(22年21亿至24年24亿),营收年均增长率50%+(22年60亿至24年91.62亿)(来源:同前第8页);
  • 信创通用市场国产服务器市场占比TOP2,信创AI市场主力军(来源:同前第8页)。

干卡集群落地客户案例

某客户采用海光DCU干卡集群,配置如下(来源:同前“干卡集群落地案例”):

  • 机柜规模:132个42U机柜,含BW1000服务器128机柜(单柜10KW供电,单机柜8计算+1存储)、IB交换机3机柜、登录管理+存储+监控网交换机1机柜、Leaf两机柜(单机柜8*计算)、Spine一机柜;
  • BW1000关键规格:电源6(DCU模组)+2(CPU主板),NIC计算支持8200G,NIC存储支持2200G(当前配1*200G),千兆网卡2(登录+BMC)。

阐释选择海光的核心优势

技术领先性:DTK实现CUDA/ROCm双生态兼容,核心组件覆盖率100%;DAS集成PyTorch 2.4.1/2.5.1、TensorFlow 2.13.1/2.18等最新框架及FlashAttention 2.6.1、vLLM 0.9.2等组件;光合社区提供全栈开发资源(来源:同前“DTK全面升级”“DAS紧追前沿”“光合开发者社区”)。

综合实力:海光营收年均增50%+(22年60亿至24年91.62亿),研发投入年均增20%+(22年21亿至24年24亿);信创通用市场TOP2、信创AI市场主力军;研发团队2500+人(硕士及以上占90.18%),拥有3000万源代码200+集成电路专有权1500+知识产权数量(来源:同前第8页)。

数据来源:海光金融行业部BD周韵文《海光DCU加速金融大模型落地实战》汇报(2025年12月23日)。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 识别金融机构AI大模型落地瓶颈
  • 构建海光DCU全栈技术生态方案
  • 验证量化应用效果与客户价值
  • 干卡集群落地客户案例
  • 阐释选择海光的核心优势
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档