人工智能综合评述AGI、Agentic AI和GenAI当前趋势和未来方向
Comprehensive Review of Artificial General Intelligence AGI, Agentic AI and GenAI:Current Trends and Future Directions
https://philarchive.org/archive/JOSCRO-2
摘要
本文对人工通用智能(AGI)与智能体AI(Agentic AI)进行了全面综述,考察其技术基础、当前能力及未来发展方向。研究识别了这两种人工智能范式的关键技术差异,包括架构需求、计算要求与学习机制。我们调研了当前技术格局,涵盖如OpenAI的AGI分类体系等专用框架,以及Vectara-agentic、CrewAI等新兴智能体AI平台。本文还探讨了支撑这些先进AI系统的硬件基础设施与云服务,从NVIDIA专用GPU到OpenAI拟议的“Stargate”等大型项目。对比分析表明,智能体AI正快速从研究走向法律服务、DevOps和企业自动化等行业的实际部署,而AGI仍处于研究阶段,其可行性与实现时间表尚存争议。文章讨论了两个领域面临的关键挑战,包括安全性考量、对齐问题与治理需求,并强调智能体AI作为当前生成式AI能力与未来AGI愿景之间的桥梁,在提供自主功能的同时规避了部分AGI尚未解决的风险。
DOI: https://doi.org/10.54660/.IJMRGE.2025.6.3.681-688
关键词:人工通用智能,AGI,智能体AI,生成式AI(GenAI),自主系统,AI安全
1. 引言
人工智能领域正经历快速变革,其中两项尤为重要的发展正吸引着研究者的关注:人工通用智能(AGI)的追求与智能体AI(Agentic AI)系统的兴起[1, 2]。AGI代表了长期以来创造具备人类水平通用智能机器的目标[3],而智能体AI则聚焦于开发能够在特定领域内进行复杂决策的自主系统[4]。近期的技术进展重新点燃了关于实现AGI可行性与时间表的争论。部分专家预测AGI最早可能在2025年出现[5, 6],而另一些人则持怀疑态度,认为一些根本性挑战仍未解决[7, 8]。与此同时,智能体AI作为一种实用路径,正日益受到重视,旨在构建更自主、能力更强的AI系统[9, 10]。本文将探讨AGI与智能体AI的当前发展状况、二者之间的关系,以及它们对产业与社会的潜在影响。第二部分将探讨定义与核心概念;第三部分分析近期技术进展;第四部分讨论挑战与局限;第五部分审视应用与影响;第六部分总结并展望未来方向。
2. 技术概念与术语导论
本节将定义并阐释文献综述中所识别的更为技术性的术语与概念。
A) 定义与核心概念
1. 人工通用智能(AGI)
AGI 指的是具备在广泛任务范围内理解、学习并应用知识的能力,其水平可与人类智能相媲美的人工智能系统 [3,11,58]。与专为特定任务设计的狭义AI系统不同,AGI 将展现出灵活且通用目的的智能 [12]。
追求 AGI 被一些人视为人工智能研究领域的“圣杯”[13]。然而,关于 AGI 的定义及其实现路径,仍存在显著争议 [14]。
2. 智能体AI(Agentic AI)
智能体AI 代表了从被动式AI系统向自主智能体的范式转变,这些智能体能够主动发起行动、做出决策,并在无需持续人类监督的情况下完成复杂工作流程 [2,15]。这类系统超越了生成式AI的能力,通过引入目标导向行为和功能自主性来实现 [4,16]。
智能体AI的关键特征包括:
- 具备自主决策能力 [17]
- 能够处理多步骤工作流程 [18]
- 在给定参数范围内具备自我改进能力 [19]
- 具备情境理解与适应能力 [20]
B) 技术概念与术语
1. 人工通用智能(AGI):具备在多样领域中实现人类水平的理解与推理能力的系统 [3]。其特征包括:
10. AI安全基准:用于评估先进人工智能中危险能力的指标 [25]。用于评估先进AI中危险能力的指标 [25],包括自我改进潜力、目标错位风险以及欺骗能力。
关键维度包括:
这些概念代表了当前AGI与智能体AI研究中涌现出的基础性技术术语。它们在未来的持续发展中,将塑造高级人工智能系统的演进方向 [59-73]。本工作是在我们先前研究基础上的进一步拓展 [59-73]。
3. 近期技术进展
A) AGI进展与基准
OpenAI提出了一套五级框架,用于衡量向AGI迈进的进展,目前系统估计处于第1级 [23, 26]。该公司还开发了新的基准,以评估AGI的潜力及其相关风险 [25]。近期研究探索了多范式方法在AGI发展中的应用 [21],包括引入受人类认知启发的情景记忆系统 [22]。与此同时,一些组织因“AGI”一词具有争议性,正逐渐放弃使用该术语 [27]。
B) 智能体AI进展
智能体AI系统在多个领域展现出日益复杂的能力,包括:
- DevOps与Kubernetes管理 [10]
- 法律服务与文档分析 [28]
- 零售与商业应用 [29]
- 企业自动化与工作流管理 [30]
- 像Vectara-agentic这样的框架正在推动智能体RAG(检索增强生成)应用的开发 [24],而像CrewAI这样的平台则促进了协作式AI智能体系统的构建 [31]。
C) 行业采纳与投资
主要科技公司正在大力投资AGI研究和智能体AI应用。OpenAI勾勒出一条通往超级智能的雄心勃勃的道路,同时保持非营利机构的监督机制 [32, 33]。德勤的调查显示,企业对智能体AI解决方案的兴趣日益增长 [34],部分专家认为其比AGI更具短期实用性 [35]。
- 技术格局:工具、库与基础设施人工通用智能(AGI)和智能体AI的快速发展催生了一个多样化的技术生态系统,涵盖专用框架、库和基础设施。本节基于近期文献与行业进展,对当前的技术格局进行综述。
A) AGI开发的框架与库AGI研究由一系列先进的框架和库支持,包括:
- OpenAI生态系统:GPT架构系列(如GPT-4及其后续版本)构成了AGI研究的基础,其工具如GPT-4 API和ChatGPT的Operator Mode支持具备日益广泛能力的实验 [36, 37]。
- DeepMind的Symphony:DeepMind整合了TensorFlow、JAX以及AlphaFold等专有架构,通过多框架方法推动AGI导向的研究 [38]。
- 混合与神经-符号方法:近期进展包括结合神经网络与符号推理的混合架构,由PyTorch Geometric和DeepGraphLibrary等库支持 [21]。记忆增强系统利用FAISS等工具实现情景记忆功能 [22]。
B) 智能体AI工具包与平台智能体AI强调自主、目标导向的系统,从而催生了新的工具类别,包括:
- Vectara-agentic:一个专为构建智能体检索增强生成(RAG)应用而设计的Python软件包,内置编排与自主功能 [24]。
- CrewAI:一个开源框架,支持创建具有角色专业化和任务委派功能的协作式AI智能体 [31]。
- AutoGen:由微软开发,AutoGen支持构建复杂的多智能体对话系统,并支持可定制的智能体行为。
- AgentGPT:一个基于浏览器的平台,用于部署具备动态目标设定与执行能力的自主智能体。
- SynEchron的智能体栈:一个专有平台,将大语言模型(LLM)与函数调用及工作流自动化相结合 [44]。
C) 云服务与部署基础设施主要云服务提供商在支持AGI和智能体AI工作负载方面发挥关键作用,包括:
- AWS Bedrock:提供对基础模型和智能体工作流工具的访问,例如Amazon Bedrock上的Agents。
- Microsoft Azure AI Studio:为多智能体系统提供编排能力,并实现与认知服务的无缝集成。
- Google Cloud Vertex AI:支持使用TPU加速的自定义模型训练,并支持智能体工作流管道。
- NVIDIA AI Foundations:以云服务形式提供生成式AI模型和智能体工具,利用H100和B100 GPU等先进硬件 [48]。
- 专用硬件:研究系统通常采用高端加速器(如NVIDIA H100/B100、Cerebras晶圆级引擎、SambaNova数据流单元),以满足AGI和智能体工作负载的计算需求。
D) 计算需求与硬件高级人工智能系统的开发与部署需要强大的计算基础设施,包括:
- 训练基础设施:大规模AGI实验依赖于配备高速互连(如NVLink、InfiniBand)的GPU/TPU集群。OpenAI的“Stargate”项目设想建设庞大、专用的人工智能基础设施 [39]。
- 边缘部署:智能体AI越来越多地部署在边缘设备上,使用TensorRT-LLM等框架在NVIDIA Jetson等平台上实现优化推理。
- 量子混合方法:部分研究探索针对特定AGI组件的量子-经典混合系统,利用IBM Quantum和Amazon Braket等平台。
- 能效:新型架构通过专家混合(MoE)模型和稀疏性技术提升能效 [40]。
E) 基准测试与评估工具衡量AGI与智能体AI进展需要稳健的基准测试工具,包括:
- OpenAI的AGI等级:一个五级分类系统,用于追踪AGI进展 [23]。
- 智能体能力指标:如Outshift提出的5级智能体AI智能水平,为企业级评估提供标准 [9]。
- AGI安全基准:新的评估套件用于检测危险能力与对齐特性 [25]。
- 多智能体测试环境:NetHack和Minecraft等平台提供丰富交互环境,用于测试智能体行为 [49]。
F) AGI开发的框架与库对AGI的追求推动了多个专用框架与库的发展,包括:
- OpenAI生态系统:GPT架构系列(包括GPT-4及以后版本)作为AGI研究的基础模型 [36]。OpenAI发布了GPT-4 API和ChatGPT的Operator Mode等工具,作为迈向AGI的重要里程碑 [37]。
- DeepMind的Symphony:DeepMind采用TensorFlow、JAX以及AlphaFold等专有架构的组合,推进AGI导向的研究 [38]。
- 多范式方法:近期研究探索结合神经网络与符号推理系统的混合架构 [21]。PyTorch Geometric和DeepGraphLibrary等框架支持图结构推理。
- 内存架构:实现情景记忆的系统采用FAISS(Facebook AI相似性搜索)的修改版本以及专用内存网络 [22]。
G) 智能体AI工具包与平台
智能体AI的发展催生了专门的工具生态系统,包括:
- Vectara-agentic:一个用于构建智能体RAG(检索增强生成)应用的Python软件包,具备内置编排能力 [24]。
- CrewAI:一个开源框架,支持创建可协作的AI智能体,能够以团队形式工作,并支持角色专业化和任务委派 [31]。
- Autogen:微软开发的框架,用于构建多智能体对话系统,支持可定制的智能体行为。
- AgentGPT:一个基于浏览器的平台,用于创建和部署具备目标设定能力的自主AI智能体。
- SynEchron的智能体栈:专有平台,将大语言模型(LLM)与函数调用及工作流自动化相结合 [44]。
H) 云服务与部署基础设施
主要云服务提供商为AGI和智能体AI提供专用服务,包括:
- AWS Bedrock:通过如Amazon Bedrock上的Agents等服务,提供基础模型访问和智能体工作流工具。
- Microsoft Azure AI Studio:提供多智能体系统的编排工具以及与认知服务的集成能力。
- Google Cloud Vertex AI:支持使用TPU加速的自定义模型训练,并提供智能体工作流管道。
- NVIDIA AI Foundations:提供对NVIDIA生成式AI模型和智能体工具的云服务访问 [18]。
- 专用硬件:部署常采用NVIDIA H100及即将推出的B100 GPU,部分研究系统使用Cerebras晶圆级引擎或SambaNova可重构数据流单元。
I) 计算需求与硬件
高级人工智能系统的开发需要大量计算资源,包括:
- 训练基础设施:大规模AGI实验依赖配备高速互连(如NVLink、InfiniBand)的GPU/TPU集群。OpenAI的“Stargate”项目提议投资500亿美元建设AI基础设施 [39]。
- 边缘部署:智能体AI系统越来越多地利用TensorRT-LLM等框架,在NVIDIA Jetson等平台上实现优化推理。
- 量子混合方法:一些研究探索针对特定AGI组件的量子-经典混合系统,使用IBM Quantum或Amazon Braket等平台。
- 能效:新型架构通过专家混合(MoE)模型和稀疏性技术降低功耗 [40]。
J) 基准测试与评估工具
评估向AGI迈进的进展需要专用的测量工具,包括:
- OpenAI的AGI等级:一个五级分类系统,用于衡量向AGI的进展 [23]。
- 智能体能力指标:如Outshift的5级智能体AI智能水平,为企业级评估提供标准 [9]。
- AGI安全基准:新的评估套件用于测量危险能力与对齐特性 [25]。
- 多智能体测试环境:NetHack和Minecraft等平台作为丰富环境,用于测试智能体能力 [49]。
K) 总结与展望
AGI与智能体AI的技术格局以开源和专有框架、云与硬件基础设施以及严格的基准测试工具中的快速创新为特征。智能体AI工具包通过支持自主、多步骤工作流和无缝工具集成,弥合了狭义生成模型与AGI更广泛目标之间的差距 [2,4,24]。随着研究和行业采纳的加速,该生态系统预计将变得更加模块化、协作化,并能够支持复杂的现实世界应用。
- 应用与影响
A) 商业与行业影响
AGI与智能体AI的出现正在重塑各行业的商业战略,包括:
- 零售与商业转型 [29]
- 法律服务自动化 [20]
- 企业工作流程优化 [41]
- 新兴创业机会与商业模式 [42]
德勤调查显示,78%的技术领袖认为智能体AI是实现可持续价值的关键驱动因素 [34],而普华永道分析指出,AI正在从根本上改写竞争策略 [41]。
B) 社会影响
先进人工智能系统的发展具有广泛的社会影响,包括:
- 劳动力转型与就业市场影响 [43]
- 创新流程与科学发现方式的变革 [44]
- 教育与技能发展的新要求 [45]
- 法律与监管框架的演变 [28]
- 人工智能范式的比较分析
A) 人工智能分类体系
现代人工智能系统可分为多个具有不同能力的独立范式:
- 传统/狭义AI:专为特定应用设计的任务型系统(例如推荐引擎、计算机视觉)[12]。这些构成了当前大多数部署的AI系统。
- 生成式AI(GenAI):能够基于学习到的模式生成新颖内容(文本、图像、代码)的系统 [16,46]。例如GPT模型和Stable Diffusion。
- 智能体AI:能够规划、决策并执行多步骤工作流的自主系统 [2,15]。这些系统超越生成能力,包含行动导向的能力 [12]。
- 人工通用智能(AGI):假设性的系统,具备在多个领域实现人类水平泛化能力 [3,44]。AGI尚未实现,但正被积极研究 [46]。
B) 能力比较
人工智能范式的能力对比如表所示。
C) 技术差异
这些范式在架构和需求方面存在根本性差异:
- 数据需求:尽管狭义AI和生成式AI(GenAI)通常需要大规模、特定领域的数据集 [45],AGI系统则旨在从多样化数据中实现高效学习 [47]。智能体AI引入了基于环境反馈的强化学习 [19]。
- 架构复杂性:GenAI主要采用Transformer架构 [48],而智能体AI则整合了规划模块和记忆系统 [22]。AGI研究探索混合神经-符号方法 [21]。
- 计算需求:GenAI系统需要大量推理资源,但智能体AI还需持续计算以支持决策过程 [10]。理论上,AGI将需要前所未有的计算规模 [39]。
D) 应用场景区分
这些范式在不同应用领域表现出各自优势:
- 狭义AI:适用于欺诈检测或预测性维护等特定任务 [49]。
- 生成式AI(GenAI):适用于内容创作、代码生成和数据增强 [16]。
- 智能体AI:适用于自主客户服务、DevOps自动化 [10] 和法律文档分析 [20]。
- AGI:潜在的未来应用包括科学发现和复杂问题求解 [43]。
E) 演进视角
发展轨迹显示能力逐步提升:
- 第一波:狭义AI系统(2010年代),专注于特定任务 [12]。
- 第二波:生成式AI(2020年代),展现出创造性生成能力 [46]。
- 第三波:智能体AI(2024+),引入自主行动能力 [4]。
- 未来:潜在的AGI将代表能力上的质的飞跃 [13]。
F) 安全考量
每个范式都带来独特的挑战:
- 狭义AI:训练数据中的偏见和过拟合问题 [JonesAGIHypeDamaging2024?]。
- 生成式AI(GenAI):错误信息风险和知识产权问题 [28]。
- 智能体AI:自主行为带来的意外后果 [50]。
- AGI:存在性风险与目标对齐问题 [38]。
这一比较分析表明,尽管这些范式共享技术基础,但它们代表了人工智能的不同根本路径,具有各自独特的能力和应用场景 [51,52]。人工智能领域正持续快速演进,智能体AI正作为连接当前生成式AI与未来AGI愿景之间的实用中间阶段而兴起 [9]。
- 挑战与局限
A) 技术挑战
通往AGI的道路面临多项重大技术障碍:
- 开发具备真正理解与推理能力的系统 [53]
- 创建能够在不同领域之间泛化的人工智能 [49]
- 实现稳健的记忆与学习机制 [47]
- 达到人类水平的适应性与创造力 [48]
B) 智能体AI系统也面临自身的一系列挑战:
- 确保可靠自主运行 [19]
- 保持适当的人类监督 [50]
- 管理复杂的多智能体交互 [54]
- 在自主性与安全约束之间取得平衡 [38]
C) 安全与伦理考量
AGI和先进的智能体AI系统均引发重要的安全问题:
- 被滥用或产生意外后果的潜在风险 [36]
- 与人类价值观和意图对齐的问题 [40]
- 治理与控制机制的缺失 [39]
- 长期社会影响 [42]
近期提案强调,随着这些技术的发展,亟需采取紧急的安全措施 [38,55]。
- 结论
尽管AGI仍是一个雄心勃勃且可能遥不可及的目标 [47],智能体AI则代表了一个实用的阶段性成果,已在多个行业中实现价值交付 [9,56]。未来几年,这两个领域预计将持续取得进展,前景中将出现若干关键发展:
- AGI基准和测量框架的进一步完善 [57]
- 智能体AI在各行业应用的扩展 [18]
- 对安全与治理机制的关注度提升 [38]
- 融合生成式与智能体能力的混合系统开发 [46]
随着这些技术的发展,必须保持平衡的视角,既承认其潜力,也正视其局限性。未来研究应聚焦于开发稳健的评估方法、安全协议以及实用的实施框架,以确保这些强大技术在最大限度发挥效益的同时最小化风险。
本综述全面考察了人工通用智能(AGI)与智能体AI的当前发展状况,分析了其技术基础、能力特征及演进路径。我们的研究揭示了人工智能领域演变过程中的若干关键洞见:
首先,尽管AGI仍是一个充满挑战的愿景目标 [7–8],智能体AI已作为一种实用的中间步骤浮现,并正在展现真实世界的价值 [9,10]。OpenAI的五级AGI分类体系 [23] 和专用智能体AI平台 [24] 的发展表明,这两个领域都在不断走向成熟。
其次,比较分析突显了不同AI范式之间的根本差异。传统狭义AI擅长特定任务,生成式AI擅长内容创作,而智能体AI引入了自主决策能力 [2];AGI则承诺(但尚未实现)人类水平的泛化能力 [4]。这种能力谱系暗示了AI系统的成熟路径,其中智能体AI作为连接当前技术与未来AGI愿景的关键桥梁 [51]。
第三,这些先进AI系统的技术需求日益严苛,从专用硬件架构 [39] 到支持自主智能体部署的新型云服务 [18]。这些基础设施的发展既推动了进步,也对技术演进构成了制约。
展望未来,研究人员和实践者有三大关键优先事项:
- 开发鲁棒评估框架:随着智能体AI系统日益自主、AGI研究不断推进,标准化的评估指标和测试环境 [25] 将成为衡量进展和确保可靠性的关键。
- 安全与治理机制:自主系统 [50] 和潜在的AGI [38] 所带来的独特风险,要求持续投入对齐研究和伦理框架建设。
- 实用实施策略:组织应采取渐进式方式采用智能体AI解决方案 [34],同时保持对AGI时间表的现实预期。
这些技术的快速演进表明,尽管AGI可能仍需数年甚至数十年才能实现,智能体AI已准备在短期内向各行业广泛扩展 [20–29]。通过保持平衡的视角,充分认识这些范式的潜力与局限,人工智能社区能够引导技术发展走向有益的结果,同时有效缓解风险。
未来研究应特别关注融合不同方法优势的混合架构 [21],以及跨学科努力,以应对日益自主的AI系统带来的社会影响 [28,43]。
原文链接:https://philarchive.org/archive/JOSCRO-2