识别金融机构AI大模型落地瓶颈
金融机构IT驱动力正从电子化、信息化、数字化向“AI is Everything”演进,AI落地场景覆盖OCR、AIR、CC、BI等领域。当前实践进入第三阶段,核心痛点凸显:用户普遍缺乏对国产芯片认知,忽略软件生态建设,缺乏落地经验与迭代/造血/技术支撑能力;过度关注标称算力,忽视实用性。应用生态第一、量产与技术可持续性、可持续发展才是硬实力,标称算力仅为冰山一角(来源:海光金融行业部BD周韵文《海光DCU加速金融大模型落地实战》,2025年12月23日)。
构建海光DCU全栈技术生态方案
海光信息技术股份有限公司(以下简称“海光公司”)提供“DCU+生态”解决方案:
- 核心产品支持:海光DCU全面支持CodeBuddy、ADP原子能力,通过生态兼容性认证(HIECO光合组织),覆盖BIOS、中间件、数据库、操作系统等全栈(来源:同前)。
- DTK全面升级:实现100%API覆盖,Pytorch等原生接口无需转换;基础数学库适配两代产品全兼容,DCC编译器支持内嵌类PTX,运行时系统通讯库优化、问题自排查(来源:同前“DTK全面升级-100%API覆盖”)。
- DAS全栈优化:无需重复学习新技术栈,全球生态随时试错;扩展组件层支持并行解码,框架工具层兼容PyTorch/TensorFlow/JAX等主流AI框架,基础算子层支持深度算子融合(来源:同前“DAS紧追前沿-全栈优化”)。
- 开发者社区赋能:光合开发者社区(网址https://developer.sourceforge.cn/)提供“光源”模型仓库(含DeepSeek、Qwen等)、实训平台(免费算力)、论坛答疑及最新组件发布(DTK/DAS/DAP)(来源:同前“光合开发者社区”)。
验证量化应用效果与客户价值
聚焦ROI的3项关键业务指标:
- Codewise-7B性能提升10X(来源:同前第11页表格上方);
- ADP原子能力性能提升44.65%(来源:同前第11页表格);
- 大模型在线类应用(企业RAG在线问答)性能提升5X(来源:同前“大模型业务场景分析”)。
其他量化成效:
- DTK的CUDA核心组件功能覆盖率(除硬件外)达100%(runtime 347接口、driver API 485接口、cublas 326接口等均100%;cusparse 491接口96.95%,因15个半精接口CUDA已废弃)(来源:同前“DTK全面升级”表格);
- 海光研发投入年均增长率20%+(22年21亿至24年24亿),营收年均增长率50%+(22年60亿至24年91.62亿)(来源:同前第8页);
- 信创通用市场国产服务器市场占比TOP2,信创AI市场主力军(来源:同前第8页)。
干卡集群落地客户案例
某客户采用海光DCU干卡集群,配置如下(来源:同前“干卡集群落地案例”):
- 机柜规模:132个42U机柜,含BW1000服务器128机柜(单柜10KW供电,单机柜8计算+1存储)、IB交换机3机柜、登录管理+存储+监控网交换机1机柜、Leaf两机柜(单机柜8*计算)、Spine一机柜;
- BW1000关键规格:电源6(DCU模组)+2(CPU主板),NIC计算支持8200G,NIC存储支持2200G(当前配1*200G),千兆网卡2(登录+BMC)。
阐释选择海光的核心优势
技术领先性:DTK实现CUDA/ROCm双生态兼容,核心组件覆盖率100%;DAS集成PyTorch 2.4.1/2.5.1、TensorFlow 2.13.1/2.18等最新框架及FlashAttention 2.6.1、vLLM 0.9.2等组件;光合社区提供全栈开发资源(来源:同前“DTK全面升级”“DAS紧追前沿”“光合开发者社区”)。
综合实力:海光营收年均增50%+(22年60亿至24年91.62亿),研发投入年均增20%+(22年21亿至24年24亿);信创通用市场TOP2、信创AI市场主力军;研发团队2500+人(硕士及以上占90.18%),拥有3000万源代码、200+集成电路专有权、1500+知识产权数量(来源:同前第8页)。
数据来源:海光金融行业部BD周韵文《海光DCU加速金融大模型落地实战》汇报(2025年12月23日)。