
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!

AI/ML 趋势报告为读者提供人工智能、机器学习与数据工程领域的新兴趋势与技术概览。本报告总结了与多位嘉宾的播客讨论,重点介绍未来 12 个月值得关注趋势。
报告中的核心部分是 年度趋势图(Trends Graph),展示了不同技术从“创新者阶段”到“早期采用者”、“早期大众”的演进路径。
这一框架基于 Geoffrey Moore 的著作《跨越鸿沟》(Crossing the Chasm)。主要聚焦尚未“跨越鸿沟”的新兴技术领域。

自 2022 年 11 月 ChatGPT 发布以来,生成式 AI 与LLMs)彻底主导了 AI 技术版图。各大科技巨头持续推出更强的语言模型版本。延续过去几年的爆发式增长,AI 领域在过去一年中出现了大量重大创新。
与去年趋势报告的对比更新:

本文重点介绍趋势图中新增与更新的技术主题,并说明它们在采用曲线中的最新位置。
今年的“创新者”类别新增了多个前沿主题。
今年 AI 代理领域发展迅猛。Anthropic 推出了 Claude Subagents,Amazon 发布 Bedrock Agents,AI 代理正从执行单一任务进化为能够编排复杂工作流、做出上下文决策的系统。
其他重要进展包括:
Daniel Dominguez 指出:
我们正从简单的聊天机器人,迈向能帮我们安排会议、更新数据库、启动云资源的 AI 助手。如 Amazon Bedrock Agents 能在不管理基础设施的前提下,基于任意基础模型创建生产级代理,这些代理可安全地链式调用任务与服务,将“代理范式”引入 AWS 生态中,大大缩短从实验到生产的路径。
Anthony Alford 补充:
代理功能强大但也潜藏风险。如能访问文件系统的代理若执行错误命令(如“rm -rf”)可能造成灾难性后果。这些工具极大地提高了生产力,但也放大了安全隐患——当 AI 能访问你的银行账户或删除硬盘时,安全问题比以往更严峻。
语言模型如今具备多模态能力,可同时处理文本、图像、音频与视频等多种数据类型,实现更深层的语义理解与跨模态推理,从而生成更准确、有价值的输出。
物理智能 是今年 AI 技术格局中的重大突破,即 AI 在机器人和本地设备中的实体化。
Savannah Kunovsky 表示:
当 AI 进入家庭等私密空间时,设计“可信赖的边缘体验”至关重要。用户更希望数据在本地处理,而不是传输到遥远的服务器。未来的物理 AI 应在实用性与隐私保护之间取得平衡,让人们愿意“邀请”它进入生活。
Anthony Alford 补充:
推理型语言模型正成为机器人智能的重要路径。NVIDIA 的机器人主管 Jim Fan 认为:“若没有实体化,AGI 永远不会到来。”换言之,真正的通用人工智能必须以物理形式存在。
Anthropic 于 2024 年 11 月提出,是一种开放标准,在为LLM提供统一的数据集成接口,减少碎片化和定制化集成的复杂度。
OpenAI、Microsoft、Google 均宣布支持 MCP。
Anthony Alford:
MCP 已被广泛采纳,它是实现 AI 代理互通的关键技术。尽管存在安全挑战,但它已成为主流,如用于运行测试的 Playwright MCP 服务器、或让代理读取 Figma 原型的应用,都是当前热门场景。
Daniel Dominguez:
MCP 最令人兴奋的地方在于“互操作性”。它让不同公司的模型与数据源共享同一协议,实现多代理系统协作,真正让 AI 跨平台协同工作。
借助 Agentic AI 与 Physical AI,人机交互正迎来重大变革。我们与软件交互的方式将更加自然与情境化。
Savannah Kunovsky(IDEO 设计专家):
如今要用好大语言模型,必须懂得“提示工程”,这阻碍了大众采用。我们应让技术界面更流动、更自然。比如,信息应出现在我们需要的地方:烹饪时显示食谱、行走时轻松回复消息,而非停下来掏出手机。技术的目标是将信息嵌入日常情境中。
她还提到 AI 在设计行业的应用:
设计师现在能用生成式工具更快表达创意。如 IDEO 的一位设计师利用 AI 为儿童玩具设计制作“预告片”,通过视觉短片展示可持续材料的理念,沟通效率显著提高。这种跨领域协作正在改变设计的创作方式。
其他新增至“创新者”类别的趋势还包括 推理模型(Reasoning Models) 与 AI DevOps。
主要关注:语言模型创新 与 RAG。
大型语言模型是生成式 AI 的基础。
今年出现了多种新类型与突破:视觉语言模型(VLM)、小语言模型(SLM)、推理模型与状态空间模型(SSM)等。
代表性成果包括:
小语言模型(SLM) 继续在端侧推理、隐私保护与成本优化领域扩展应用。
Anthony Alford:
GPT-5 的发布方式让人意外:用户无需选择,系统自动选用最合适的模型版本。 这解决了命名混乱问题(如 4o 与 o4),简化了体验。
Savannah Kunovsky:
这种做法旨在简化用户界面。 随着技术成熟,真正的差异化将来自“交互体验”, 即如何让普通用户更自然地使用这些强大能力。
过去一年,RAG 应用在企业级开发中实现了爆发式增长,已从创新走向标准配置。
Anthony Alford:
几乎所有拥有大量文档与知识库的企业,都在考虑构建自己的 RAG 系统。
Savannah Kunovsky:
RAG 改变了我们的设计调研方式。以往我们需要与多人访谈、收集资料;现在系统能自动整合公司内部文件与报告,让设计团队在动手前就获得充足上下文。这让非技术团队也能轻松构建基于 RAG 的应用。
此外,自动化机器学习(AutoML) 也进入早期采用阶段,已被多家机构纳入生产流程。
以下技术已在各类组织的开发团队中普遍采用:
这些技术现已完全成熟,成为企业核心架构的一部分:
AI 技术正从“任务执行者”演变为值得信赖的智能协作者,能够解决现实世界的复杂问题。AI 将持续深化并拓展至我们尚未设想的领域。未来一年预测:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。