首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >福布斯 U30 峰会洞察:全栈协同芯模协同重构 国产AI 算力生态

福布斯 U30 峰会洞察:全栈协同芯模协同重构 国产AI 算力生态

作者头像
早起的鸟儿有虫吃
发布2026-05-15 10:42:54
发布2026-05-15 10:42:54
700
举报

2026 福布斯 U30 峰会为行业闭门会议。

我们秉持收费的会议均不参与的原则。

依托现有优质资源,我们仍能从行业蛛丝马迹中,明确下一步发展方向。

全栈协同才是未来:“芯、模、云、端”四位一体国产生态构筑智能世界新底座

一、背景:福布斯全球 U30 视角下的青年创新实践

1.1 福布斯全球 U30 的核心愿景

福布斯全球 U30 的愿景是:成为由大量改变世界、书写未来的青年组成的大家庭。

世界与未来的形态始终处于动态变化中。

职场规则、技术边界、生活范式、价值坐标,这些曾被认为固定不变的事物,正被重新塑造。

每一代年轻人如何看待世界?

在医疗、教育、消费、艺术等更广阔的领域,他们用行动证明,没有什么固有规则不可打破,没有什么梦想不可点亮。

福布斯中国长期关注这群追梦、拼搏、突破、创新的年轻人。

我们为他们的成就喝彩,也为他们的未来祝福。

第 14 届福布斯中国 30 Under 30 榜单中,创业者占比高达 93%。

其中至少 12 位为连续创业者。

1.2 U30 榜单中的创新特征:创业者与大厂背景新趋势

本届榜单中,24 岁的薛轲翰成为最年轻的连续创业者。

他 15 岁考入西北工业大学,18 岁创立首家公司。

后来,他以 CTO 身份参与创办医院场景机器人公司莱陆科技。

如今,他将目光投向竞争激烈的家用清洁机器人赛道。

另一值得关注的现象正在显现。

近两年,从科技大厂离职创业的青年中高层管理者规模快速扩大。

本届榜单中,拥有头部平台履历的创业者已超 19 人。

字节跳动旗下剪映核心成员明超平,于 2025 年 3 月创立 YouWare。

近期,该公司推出全球首个面向 AI 编码创作者的交互平台。

平台上线 48 小时内,访问量就突破百万,覆盖全球 180 多个国家。

明超平希望通过 Vibe Coding 理念,帮助每个人将创意转化为互动作品。

他坚信,技术门槛的系统性下降,必将催生出前所未有的应用场景,最终实现指数级增长。

明超平对福布斯中国表示,2019年以前,很少有人相信手机能成为视频编辑的载体。

直到他们将专业剪辑功能移植到手机APP,这一局面才被改变。

尽管当前面向非开发者的 Vibe Coding 仍存在质疑,但这恰恰是最好的机会,也是值得期待的未来。

核心认知:任何新技术的诞生,要么源于全新场景的突破,要么是对原有流程的封装优化。

1.3 案例:YouWare——AI Coding 时代的创意基础设施突破

1.3.1 产品定位与核心价值

YouWare 成立于 2025 年 3 月,由创始人兼 CEO 明超平打造。

它是全球首个链接 AI Coding 创作者的创意平台。

平台聚焦 AI 编程创作,结合 AI 编码、可视化展示、创作激励与社区互动。

其核心目标是帮助普通用户通过 AI Coding,将创意和灵感快速转化为作品。

平台尤其聚焦网站和前端内容创作,致力于打造 AI Coding 时代的创意基础设施。

1.3.2 核心问题:为何大厂布局下 YouWare 仍能突围?

2025 年 3 月初的夜晚,明超平在 X 浏览时发现一个关键问题。

大量用户用 Grok 3 编写游戏后,仅能通过录屏方式分享至 X 平台。

这让他意识到行业核心痛点:新的 AI Coding 时代,创作者产出的作品与传统社交媒体平台不兼容。

录屏分享对创作者和消费者都是双输。

它既无法实现交互,也难以完整传递编码作品的创意与效果。

行业亟需一种新的载体,解决这一痛点。

当晚 22 点,明超平与团队用 Cursor 完成 YouWare 初版开发。

用户只需将代码粘贴至平台,即可生成可访问的网站。

次日,团队完成产品大幅升级。

平台访问量在两天内从 1000 跃升至 100 万。

截至 2025 年 5 月下旬,平台创作项目已达数十万。

这一数据,印证了 AI Coding 时代创作者的 UGC 潜力。

1.3.3 核心优势与团队背景

创立 YouWare 前,明超平有着丰富的从业经历。

他曾任职于一加,担任手机影像产品经理。

之后加入字节跳动,负责剪映、Capcut 手机端工具。

还曾在 AI 独角兽月之暗面,担任核心产品负责人。

跨硬件、互联网大厂、AI 独角兽的经历,让他形成了系统性的 AI 发展视角。

他认为,AI 的到来不应消减人的创意能力。

创意始终掌握在人手中,他们要做的,是在科技迭代中,让人们的创意得到充分呈现。

为降低 Coding 技术门槛、提升创作者效率,YouWare 自研了 AI Agent 和 Sandbox 引擎。

这一举措实现了快速启动、稳定编辑、三方数据打通的体验优化。

用户只需用自然语言描述想法,或粘贴 AI 生成的代码。

短短 5 秒内,就能生成可访问网页,实现从创意到作品的快速落地。

关键启示:当大厂聚焦大模型训练时,YouWare 团队以 Cursor 快速完成初版开发。相较企业内部周、月、年级的测试周期,敏捷的动作速度加自研新框架、引擎,成为核心突破点。

题外话:福布斯全球 U30 对名校、大厂背景的过度关注,本质是急功近利的思维。这也让普通大众觉得此类榜单缺乏实际价值。

二、“芯、模、云、端” 四位一体:构筑国产智算生态核心逻辑

2.1 核心信息总览

项目

关键内容

演讲人

——

演讲主题

芯模协同,共筑国产算力生态

核心技术

DTK、DAS、DAP 自研软件栈,DCU+CPU 双芯算力

核心策略

硬件紧耦合、应用解耦合

核心目标

构建开放、融合、高效的国产智算基础设施

2.2 AI 算力面临的新挑战

全球 AI 正加速向三大方向演进。

这三大方向分别是大模型升级、行业渗透、大众普及。

随之而来的,是算力需求创下历史新高。

面对万亿参数模型的训练与推理,构建从芯片到应用的全链路工程化能力,成为行业核心课题。

2.3 核心技术突破:硬件紧耦合 + 应用解耦合

2.3.1 技术架构分层
代码语言:javascript
复制
┌─────────────────────────────────────────┐
│ 应用层:标准编程模型(CUDA/OpenMP/C++) │  ← 应用解耦合,开发者仅需聚焦该层
├─────────────────────────────────────────┤
│ 系统层:统一调度器 + 统一内存管理器     │  ← 自动处理任务与数据分配
├─────────────────────────────────────────┤
│ 硬件层:CPU + HSL互联 + DCU             │  ← 硬件紧耦合,原生高速通信
└─────────────────────────────────────────┘

类比:操作系统提供线程、进程调度及内存分配等基础能力,该架构与之逻辑相通。

2.3.2 软件组件核心价值

软件组件

核心功能

解耦合价值

DTK(异构计算平台)

提供统一异构编程工具包 openDU、统一映射接口(UPTK)

开发者无需关注底层硬件差异,一套代码适配多平台

DAS(人工智能基础软件系统)

集成 2000 + 算子,支持 100 + 主流 AI 工具

应用直接调用算子库,无需适配不同硬件架构

DAP(人工智能应用平台)

内置知识库引擎、智能体编排引擎

垂直行业应用可快速集成,开发周期缩短 60%+

2.3.3 DCU+CPU 双芯协同:硬件紧耦合的核心定义

DCU 全称 Deep Computing Unit,即深度计算单元。

它是国产高端 AI 服务器 GPU 的国产化名称,由海光信息研发。

海光是天津市高新技术企业,属于 Fabless 芯片设计公司。

海光不直接拥有晶圆生产线,通过与国内顶尖制造企业合作,实现 DCU 量产。

其产品覆盖 AI 大模型训练推理、超算中心等高性能计算场景。

类比:苹果公司不生产手机,仅负责产品设计,海光 DCU 的研发模式与之相似。

硬件紧耦合并非简单将 CPU 和 DCU 插在同一块主板上。

它是从芯片设计、互联协议、内存架构三个层面,实现原生深度融合。

最终让两个芯片如同一个芯片般协同工作。

对比维度

传统 CPU+GPU(松耦合)

DCU+CPU(硬件紧耦合)

互联方式

通用 PCIe 总线

自研专用高速互联(如曙光 HSL)

内存架构

分离式内存,数据需显式拷贝

统一内存架构(UMA),全局统一寻址

通信延迟

微秒级(PCIe 5.0 x16 约 1-2μs)

纳秒级(HSL 3.0 约 100ns 以内)

带宽

PCIe 5.0 x16:32GB/s

HSL 3.0 单链路:64GB/s,多链路可扩展

本质

两个独立芯片,通过外部总线通信

一个逻辑上的单芯片,内部原生通信

2.3.4 应用解耦合:屏蔽硬件复杂性

定义:硬件层的所有紧耦合细节,对上层应用开发者完全透明。

开发者无需关注 CPU 与 DCU 的通信方式。

也不用关心数据分发逻辑、任务调度规则。

只需编写标准代码,就能自动运行在双芯协同架构上。

思考:这是否类似 RPC 的思路?让业务层无需关注内部通信细节。

传统松耦合的核心痛点
  • 开发者需手动编写 CUDA 核函数;
  • 需手动管理 CPU 内存与 GPU 显存间的数据拷贝;
  • 需手动拆分任务并分配给不同 GPU;
  • 更换硬件平台后,代码需重新编写。

为什么写这篇文章

知识地图:年度目标--沟通交流

目前状态:

  • 声音太小 别人别人听不清楚
  • 哪怕听到了,根本不知道表达什么,无法编解码
  • 自己也不清楚自己表示什么

换个方式:

  • 先写清楚,然后在说清楚

最小行动:

  • 做知识搬运工,把别人最新演讲/文章 在重复写一次

欢迎交流:

如果这篇文章确实帮助到了你, 希望可以点赞、收藏、关注一下, 这也是我持续创作的最大动力!

参考(GB/T 7714-2015 格式)

  1. 布斯中国官方报道 2024-2025 福布斯中国 UNDER 30 峰会
  2. https://www.geekpark.net/news/349778
  3. https://www7.zzu.edu.cn/nscczz/info/1212/3144.htm
  4. 今日头条. 海光发布“双芯战略”:海光DCU + 海光CPU[EB/OL]. (2025-07-08).
  5. 国产智算十字路口:AI计算开放架构引领生态突围https://www.sugon.com/cut?id=2695
  6. 研报集纳 | 全栈协同才是未来,“芯、模、云、端”四位一体生态如何构筑智能世界新底座?
  7. 芯模联动,探索AI产业发展新路径 今年5月,浙江省人民政府印发《关于支持人工智能创新发展的若干措施》,明确将“强化芯模联动发展”列为发展任务
  8. 深算三号 百度百科 https://www.hygon.cn/news?newsid=102
  9. 芯模协同技术白皮书,华为技术有限公司,2026 年 4 月
  10. https://www.caict.ac.cn/kxyj/qwfb/ztbg/202604/P020260430517209165899.pdf中国信通院 2026 年 4 月发布的官方报告
  11. 两部门关于联合实施2026年“模数共振”行动的通知https://www.ncsti.gov.cn/zcfg/zcwj/202605/t20260506_245797.html
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 后端开发成长指南 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、背景:福布斯全球 U30 视角下的青年创新实践
    • 1.1 福布斯全球 U30 的核心愿景
    • 1.2 U30 榜单中的创新特征:创业者与大厂背景新趋势
    • 1.3 案例:YouWare——AI Coding 时代的创意基础设施突破
      • 1.3.1 产品定位与核心价值
      • 1.3.2 核心问题:为何大厂布局下 YouWare 仍能突围?
      • 1.3.3 核心优势与团队背景
  • 二、“芯、模、云、端” 四位一体:构筑国产智算生态核心逻辑
    • 2.1 核心信息总览
    • 2.2 AI 算力面临的新挑战
    • 2.3 核心技术突破:硬件紧耦合 + 应用解耦合
      • 2.3.1 技术架构分层
      • 2.3.2 软件组件核心价值
      • 2.3.3 DCU+CPU 双芯协同:硬件紧耦合的核心定义
      • 2.3.4 应用解耦合:屏蔽硬件复杂性
  • 为什么写这篇文章
    • 参考(GB/T 7714-2015 格式)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档