
01
智能体的定义
如果说去年是大型语言模型(LLM)的元年,那么今年可以称之为智能体(AI Agent)的元年,根据智能体(AI Agent)架构和组成方式不同,智能体可进一步分为两类:
02
智能体核心灵魂组成部分
2.1 智能体运行时核心组件
用一个简洁公式概括智能体的核心构成:智能体(AI Agent) = 大语言模型 (LLM) + 记忆 (Memory) + 规划 (Planning) + 工具 (Tools)+反馈(Reflection),智能体核心组件介绍如下:

图1:智能体的核心组件
2.2 RAG (检索增强生成)在企业落地最佳实践
检索增强生成(RAG)技术辅助智能体提升信息存储利用率,提高信息更新速度,增强内容生成的可追溯性,支持智能体的持续学习和迭代。RAG 技术结合了信息检索(Retrieval)和文本生成(Generation),通过从外部知识库中检索相关信息来辅助生成更准确和上下文相关的文本这不仅是解决知识性幻觉、“开卷考试”的条件,从根本上降低了其“凭空捏造”的风险。
在企业级的复杂场景中,Naive RAG即简单地将用户问题向量化后进行搜索效果往往不佳,迫切需要采用更先进的RAG技术栈解决召回率(Recall)和精准度(Precision)的瓶颈,企业级RAG优化主要核心步骤如下:
随着RAG技术的发展,智能体在调用RAG技术时变得更加智能和高效,尤其是在面对复杂的需要多级拆解的问题时:
03
智能体成熟度模型:从简单工具到自主集群
腾讯研究院的《企业级智能体产业落地研究报告》提供了一个极具价值的 L1-L5 能力分级框架,模型的核心划分依据是智能体的自主性以及它与人类的协作关系,市场上主流智能体“绝大多数产品仍停留在 L1-L2 级别”,例如企业落地的“数字员工”主要是 L1 的智能知识库和 L2 的流程自动化助手,但是Gartner 预测到 2028 年70% 的 AI 应用将使用多智能体系统(L5)。
等级 | 名称 | 角色类比 | 核心特征 | 典型技术 | 典型应用 |
|---|---|---|---|---|---|
L1 | 被动执行 | 问答客服 | “你问我答”:能理解指令,但依赖预设提示词或 RAG。 | Prompt + RAG | 智能客服、知识库问答 |
L2 | 项目助理 | 工具使用者 | “你让我做,我就做”:能调用工具,但必须在预定义的工作流内执行。 | Workflow + RAG + Function Calling | 自动查订单、发邮件、会议预订 |
L3 | 初级项目负责人 | 规划执行者 | “你说目标,我来规划”:能理解模糊任务,自主规划多步骤,动态调用工具。 | ReAct / Plan-and-Execute | 生成会议纪要、写周报、规划旅行 |
L4 | 专业骨干 | 主动贡献者 | “我发现问题,我来解决”:能主动感知环境(如 CRM 数据变化),自主发起任务。 | 环境感知 + L3 能力 | 智能营销(发现客户流失风险并主动触达) |
L5 | 领导者 | 团队协调者 | “我来组织”:能定义目标,并将复杂系统工程分解给其他 L2-L4 智能体(或人类)协同完成。 | Multi-Agent (多智能体) 协同 | 自动化软件开发、虚拟项目组 |
表1:L1-L5 能力分级框架
04
主流平台与框架对比:智能体构建者的工具箱
4.1 主流低代码平台对比:Coze VS Dify VS n8n
Coze 和 Dify 是原生智能体平台(以 LLM 为核心),n8n 是自动化平台(以流程为核心)。
平台 | 定位 | 核心优势 | 局限性 | 适合谁/适合场景 |
|---|---|---|---|---|
Coze (扣子) | C 端创作者平台 | 免费、插件丰富、一键发布(飞书/豆包),对非开发岗极其友好。 | 私有化能力弱且有严格的资源限制(如总知识库容量10GB 、工作流超时10分钟),难以满足企业级需求。 | 互联网产品经理,快速验证 C 端创意和 Demo。 |
Dify.ai | 开源+企业级 LLM 应用平台 | 平衡易用性与专业性。支持私有化部署、国产模型、知识库精细管理。 | 流程编排(Workflow)能力相对 n8n 较弱。 | 企业应用专家,在私有化/国产化环境中构建严肃的 B 端应用。 |
n8n | 自动化工作流引擎 | 极其强大的流程编排(Workflow),连接器(Connector)极多。 | LLM 能力是“外挂”的,而非原生。智能体(Agent)概念较弱。 | 解决方案架构师,核心是“流程自动化”(RPA+AI)而非“智能体”。 |
表2:Coze VS Dify VS n8n平台对比
4.2 框架的核心思想:LangChain & LlamaIndex
05
智能体的“社会化”:协同、协议与互联
由于每个智能体往往只擅长特定领域的一件或者一类任务,复杂事件的完成需要多个不同功能的智能体一起完成,那么智能体之间如何协同、协议与互联的呢?不同公司纷纷推出了支持智能体互联的协议,可以分为上下文协议和智能体交互协议两类,其中前一类比较典型的有Anthropic的模型上下文协议(model context protocol,MCP),后一类比较典型的有智能体网络协议(agent network protocol,ANP)、谷歌的智能体对智能体协议(Agent2Agent,A2A)等。
5.1 新兴的AI协议“三件套”
以下是新兴的AI协议“三件套”核心协议草案(资料来源:中国信通院、中移/联通白皮书等):
5.2 产业落地:应用场景蓝图

图2:智能体应用场景
上图清晰地展示了智能体在金融、零售、文旅、教育、医学、出行、互联网等14个行业上百个具有代表性的智能体应用场景(图片来源于《企业级智能体产业落地研究报告》),其核心价值还体现在识别出那些最迫切需要“自主生产力”的业务环节,并设计出“稳定可用”乃至“成熟好用”的智能体解决方案,推动技术从“可能”走向“可行”,从“可行”走向“价值”。
另外IDC数据显示,超过64%的中国企业已进入智能体的测试验证和采购培训阶段,预计到2028年中国企业级智能体应用市场规模将达到270 亿美元。与此同时,生成式AI正加速渗透各个领域,2028年预计中国生成式AI占AI市场总投资规 模比例将达到30.6%,突破300亿美元,五年年复合增长率(CAGR)高达51.5%。当前,软件与信息服务行业以41亿美元领跑投资规模,预计2028年将达149亿美元;此外,医疗健康、能源、制造、交通出行和教育五大行业投资增速值得关注,预计将保持在64.3%-67.2%的高速年复合增长率,展示出强大发展潜力。
06
结论
如果说去年是大模型的元年,那么今年是智能体的(AI Agent)的元年,与此同时,智能体正推动AI基础设施从“资源规模导向”转向“业务价值创造”。智能体需要的不再是通用的算力,而是对特定能力的支撑。智能体的规模化落地,对AI基础设施提出了四大全新要求:
AI基础设施的演进加速智能体落地:反过来,新一代的AI基础设施正在通过提供“AI Agent服务平台”来加速智能体的落地。未来的AI基础设施不再仅仅是“卖算力”,而是会提供包括Agent运行时、安全沙箱、可观测性工具、乃至MCP协议栈等开箱即用的技术组件。这使得我们不必从零开始构建智能体的“身体”和“神经系统”,极大地降低了构建和部署智能体的门槛,让智能体的规模化应用成为可能。
往
期
回
顾
三大超节点:昇腾384 VS 阿里磐久AL128 VS NVIDIA GB200 NVL72,网工视角,谁主沉浮? 博通一统以太网江湖阳谋:SUE一超多强(字节Ethlink、NVLink与UALink)?