
• 报告标题:AI大模型应用发展研究报告——电信运营商与云服务商的合作探索
• 发布机构:腾讯云计算(北京)有限责任公司、中国信息通信研究院云计算与大数据研究所、中国通信标准化协会
• 发布时间:2024年
• 行业标签:运营商, 社交娱乐, 医疗, 金融, 教育, 电商, 游戏, 传媒
• 产品标签:
#腾讯混元大模型
#腾讯云知识引擎
#腾讯云AI代码助手
#腾讯云混元文生图模型
#腾讯云IHN星脉网络
#腾讯云高性能集合通信库TCCL
#腾讯云对象存储COS
#腾讯云数据加速器GooseFS
#腾讯云高性能并行文件存储CFS Turbo
#腾讯云训练加速引擎TACO Train
#腾讯云企点客服
#视觉感知大模型LPM
• 背景:截至2023年底,我国累计发布200多个AI大模型,国内市场呈现“百模大战”格局,产业角色已多元化至云服务商、电信运营商、设备厂商等。数据来源:微信公众号“工信微报”2024年2月27日《数字经济时代如何推进中国工业数字化?》。
• 目标:报告旨在研究云服务商与电信运营商的竞合关系,提出“1+3+N”合作体系(1个算力集群、3条研发路线、N个场景方案),探索云服务商全流程支持电信运营商AI大模型发展的路径,发挥双方优势助力生态建设。
1.1 人工智能研究持续深入,大模型再掀浪潮
1.2 AI大模型市场规模持续增长,国内外呈现混战格局
1.2.1 海外企业占据先发优势,AI大模型已经多轮迭代
1.2.2 国内企业抓发展机遇,通用、专用、开源、闭源全面发展
1.3 大模型建设方持续多元化发展,电信运营商走出“体系化”建设道路
2.1 电信运营商AI大模型发挥通信业语料优势,用语音大模型打开市场
2.2 云服务商AI大模型发展发挥快速迭代落地优势,积累丰富市场反馈
2.3 “1+3+N”合作体系,云服务商全面助力电信运营商发展AI大模型
3.1 云服务商支持高效算力集群建设
3.1.1 算力集群建设与发展面临的挑战
3.1.2 构建高效算力集群的关键技术
3.2 云服务商打造三大软件合作路线
3.2.1 行业智算云+标准化应用:合力推广开箱即用的大模型软件
3.2.2 私有云集成+标准化组件:合力承建私域化的知识增强型应用
3.2.3 项目总集成+智算技术底座:合力支持按需定制的客户大模型
3.3 运营商和云服务商的融合共建价值
3.3.1 同质化的硬件堆叠难以保证竞争中的优势
3.3.2 运营商优质资源和云服务商最佳实践的结合
4.1 企业知识应用场景
4.2 视联网内容分析场景
4.3 增值内容创作场景
4.4 客户服务场景
4.5 DICT合作场景
5.1 强强联合共建大模型算力集群
5.2 帮助运营商提高视频分析能力
5.3 为5G视频彩铃提供内容制作能力
5.4 AI代码助手助力运营商研效提升
5.5 行业大模型拓展运营商CH端场景
6.1 技术演进,大模型建设与应用不断探索高效率、高精度、高适用性
6.2 应用创新,电信运营商大模型要紧抓行业内、外痛点,打造差异化竞争力
6.3 跨领域协同,电信运营商与其他产业角色优势互补,谋求双赢
• 研究方法:本报告采用案头研究、行业数据分析与典型案例剖析相结合的方法。定性分析涵盖技术架构对比与产业角色优劣势分析;定量分析引用IDC市场规模预测及工业和信息化部统计数据(截至2023年底,中国发布200+个大模型)。
• 分析架构:报告构建了“1+3+N”合作分析框架,解析从算力底座(硬件)、软件路线(平台)到场景应用(落地)的全链路逻辑。
• 数据来源:腾讯云计算(北京)有限责任公司、中国信息通信研究院云计算与大数据研究所、中国通信标准化协会联合研究;工信部公开数据;2024全球数字经济大会数据。
• 调研时间范围:报告内容覆盖2021年至2024年8月的AI大模型行业发展动态及技术迭代情况。
• 运营商体系化建设:电信运营商依托算力、网络及用户数据基础,已形成体系化AI大模型建设路径。中国移动具备万卡级智算集群与千亿多模态大模型;中国电信布局“1+N+M”星辰大模型体系,面向垂直领域推出12个行业大模型;中国联通发布“1+1+M”元景大模型体系,形成35+行业大模型和100余个标杆应用。
• 云服务商迭代优势:云服务商发挥快速迭代与开源优势。腾讯混元大模型已在腾讯内部600多个业务场景中进行测试,并对外提供API服务;云服务商普遍注重开源贡献,如腾讯开源MimicMotion、ToonCrafter等大模型相关组件。
• 算力瓶颈与优化:AI大模型参数呈指数级增长,千亿级模型训练通信占比最大可达50%,仅0.1%的网络丢包就可能导致30%-50%的算力损失。腾讯云基于RoCEv2构建的智能高性能网络,在高效训练中实现业务0中断;通过高性能通信库TCCL可减少50%-80%流量绕路,将通信占比降至6%左右。
• 存储效率提升:采用高性能并行文件存储服务,将读写吞吐能力升级至TiB/s级别,让3TB checkpoint写入时间从10分钟缩短至10秒内,时间降低90%;通过智能分层技术,可节省80%的存储成本。
• 合作模式创新:双方合作形成“1+3+N”体系。1个算力集群指联合打造适合AI大模型培育的算力集群;3条路线包括标准软件、标准模型能力增强、定制化模型精调;N个场景覆盖企业知识、视联网分析、增值内容创作等。
• 运营商痛点与差异化:运营商缺乏普适性的C端应用入口,但在行业DICT集成领域具有优势。建议利用资源、数据优势打造差异化竞争力,例如星辰语音大模型识别30多种方言,已在多地试点实现日均处理约200万通电话。
• 技术架构先进性:腾讯云混元大模型基于RoCEv2构建的智能高性能网络,实现了业务0中断的高可用性。其集群通信效率达90%以上,支持单集群高达26万个GPU的组网规模(最高支持262144个GPU),满足当前及未来大模型训练需求。
• 运营运维效率:腾讯云提供毫秒级时延度量与分钟级自愈运营系统,故障可实现1分钟发现、3分钟定位、5分钟自愈,实现数千卡级规模在整个训练周期(数十天)无网络问题导致的训练中断,并将交付周期缩短50%。
• 核心产品能力:
• 产业协同经验:腾讯云已与运营商联合搭建智算集群(采用私有云集成+标准化组件路线),提供从高性能计算、高性能网络到高效模型生产框架的全栈支持,助力运营商应对AI大模型算力需求的爆炸式增长。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。