前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI Agent深度解析:潜力与挑战并存的智能新世界

AI Agent深度解析:潜力与挑战并存的智能新世界

原创
作者头像
机器智能社区
发布2024-05-17 10:50:47
5380
发布2024-05-17 10:50:47
举报

文章推荐

GPT-4o 重磅发布,第一时间用户测评,OpenAI 也存在夸张宣传?

蚁起同乐!蚂蚁 “510 亲友日” AI 心愿奇妙之旅

OpenAI 直播倒计时,GPT-5 被证缺席,GPT-3.5 至 5,一文看懂 AI 进化大不同!

本文来自蚂蚁的吴俊去年参加 QCon 后的总结,将围绕 AI Agent 展开叙述,重点介绍了当前 AI Agent 的应用和挑战。以下为原文:

** 作者简介:** 吴俊(弈德) ,蚂蚁集团消金风管技术部 AI 工程团队 TL,当前负责风管大模型应用工程,承担风管部分业务场景的大模型评测,大模型推理优化及大模型应用落地。

本次 QCon 重要主角毫无疑问非大模型莫属,两天关于大模型的三个方面,也正好能对应当前大模型架构的经典分层,即:应用层、工具层、模型层 & AI Infra:

  • ** 应用层 - 大模型应用:** 主要以 RAG&AI Agent 初代的模式透出,主要的落地场景包括内部数据分析 - GBI 即生成式 BI、研发辅助提效 - 生成式 Code、面向外部用户和小二的知识库问答 - 如 ChatPDF;
  • ** 工具层 - 应用构建能力:** 主要介绍如何高效快速去构建自己场景的大模型应用(重点在 AI Agent 的构建),有应用构建工具 - LangChain, Agent 开发框架如:MetaGPT,MaaS 平台如 ModelScop-Agent&Agents for Amazon Bedrock 等;
  • ** 模型及基建层 - 大模型优化加速:** 核心在模型推理加速上的探索,未来以应对有限算力情况下,大模型应用规模化投产的性能和安全性诉求,目前也是业界争相要探索突破的重点。

AI Agent 是什么?

AI Agent 的定义

AI Agent 是人工智能代理(Artificial Intelligence Agent)的概念,它是一种能够感知环境、进行决策和执行动作的智能实体,通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。一个更完整的 Agent,一定是与环境充分交互的,它包括两部分 —— 一是 Agent 的部分,二是环境的部分。此刻的 Agent 就如同物理世界中的「人类」,物理世界就是人类的「外部环境」。

AI Agent 的主要组成部分

在 LLM 赋能的自主 agent 系统中 (LLM Agent),LLM 充当 agent 大脑的角色,并与若干关键组件协作 。

规划(planning)

  • 子目标分解:agent 将大任务拆分为更小的可管理的子目标,使得可以有效处理复杂任务。
  • 反思与完善:agent 对历史动作可以自我批评和自我反思,从错误中学习并在后续步骤里完善,从而改善最终结果的质量。

记忆(Memory)

  • 短期记忆:上下文学习即是利用模型的短期记忆学习。
  • 长期记忆:为 agent 提供保留和召回长期信息的能力,通常利用外部向量存储和检索实现。

工具使用(tool use)

  • 对模型权重丢失的信息,agent 学习调用外部 API 获取额外信息,包括当前信息、代码执行能力、专有信息源的访问等。

行动(Action)

  • 行动模块是智能体实际执行决定或响应的部分。面对不同的任务,智能体系统有一个完整的行动策略集,在决策时可以选择需要执行的行动,比如广为熟知的记忆检索、推理、学习、编程等。

人机协同模式

基于大模型的 Agent 不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式,带来更为广泛的人机融合。生成式 AI 的智能革命演化至今,从人机协同呈现了三种模式:

嵌入模式:

用户通过语言交流与 AI 合作,使用提示词设定目标,AI 协助完成任务,比如用户使用生成式 AI 创作小说、音乐作品、3D 内容等。在这种模式下,AI 执行命令,人类是决策者和指挥者。

副驾驶模式:

人类和 AI 是合作伙伴,共同参与工作流程。AI 提供建议、协助完成工作,比如在软件开发中为程序员编写代码、检测错误或优化性能。AI 是知识丰富的合作伙伴,而非简单的工具。

智能体模式:

人类设定目标和提供资源,AI 独立承担大部分工作,人类监督进程和评估结果。AI 体现了自主性和适应性,接近独立行动者,人类扮演监督者和评估者的角色。智能体模式比嵌入模式和副驾驶模式更高效,可能成为未来人机协同的主要模式。

在智能体的人机协同模式下,每个普通个体都有可能成为超级个体,拥有自己的 AI 团队和自动化任务工作流。他们可以与其他超级个体建立更智能化、自动化的协作关系。现在业内已经有一些一人公司和超级个体在积极探索这一模式。

AI Agent 应用

当前,AI Agent 已是公认大语言模型落地的有效方式之一,它让更多人看清了大语言模型创业的方向,以及 LLM、Agent 与已有的行业技术融合应用的前景。目前大语言模型的 Agent,在代码生成、数据分析、通用问题解答、科学研究等多个领域内,都有一众开源或闭源项目,可见其火爆程度。

业界相关 AI Agent 举例

AI Agent 应用

本文将核心聚焦在三类应用或场景:ABI/GBI 生成式 BI 或是数据分析;Code Agent 代码助手;基于 RAG 技术的知识问答。

01. BI(Data Analysis) Agent - 生成式 BI

LLM 在金融智能应用研发实战与探索

在生成式 BI(Data Agent)方面,白天专题演讲听了由腾讯云的技术总监分享的主题,他分享了 txt2SQL 的智能问答系统方案设计,整体准确度能达到惊人的 99%(纯大模型生成且复杂度不高的 SQL 准确率大概在 80%+)。但其实质上他们的方案主要还是依靠工程能力,并未完全使用大模型的 NL2SQL 的生成能力,而是结合 RAG,通过 Query 去匹配 RAG 里的常见的查询问题及对应的 SQL 示例,然后再基于检索到的 SQL 去与数据源联通。

数势大模型 SwiftAgent 在企业经营分析领域的应用

由数势科技 / 金融数字化产品总经理,分享的同类 DataAgent 产品 - swiftAgent,将传统的 BI 手动全流程产品(GUI)通过大模型进行基于语言的(LUI)模式重构,包括交互的指标问询、智能的洞察归因、分析报告自动生成、指标的全生命周期管理等能力。

AIGC 与数据分析融合打造数据消费新模式

网易数帆的大数据解决方案专家分享了网易在 Data Agent 方面的工作。面对大模型出错的情况,他们核心瞄可信方向,做了很多产品交互上的工作,去保障 NL2SQL 查询出的数据可信:

  • 需求可理解:通过自研 NL2SQL 专属大模型,针对相关数据相关函数如同比 / 环比 / 分组排序等函数进行增强。
  • 过程可验证:通过交互界面上以自然语言的方式生成查询的解释,让用户容易去识别模型生成过程的对错,去保障生成过程的可信。
  • 用户可干预:基于查询解释,用户可手动在查询结果的查询条件上进行调整查询条件,用确定性的手段获取正确性的结果。
  • 结果可运营:通过实时针对结果,进行正误标记反馈持续优化大模型的生成正确性。

另外还有一些企业进行了有关 NL2SQL 的场景尝试,这里不做一一列举。

02. Coding Agent

因为前期对 Github Copilot、codeGeex、CodeFuse 等做过深入的使用体验,核心功能是帮助程序员进行代码生成、代码优化、代码检测等研发辅助提效,场景上核心关注的更多是代码安全性的问题。这里就不做赘述,相关的分享和 PPT 下载链接如下:

  • aiXcoder 代码大模型在企业的应用实践:

https://qcon.infoq.cn/2023/shanghai/presentation/5683

  • 基于 CodeFuse 的下一代研发探索:

https://qcon.infoq.cn/2023/shanghai/presentation/5681

  • 大模型落地到代码助手场景的探索实践:

https://qcon.infoq.cn/2023/shanghai/presentation/5690

  • 百度大模型驱动下的智能代码助手提效实践:

https://qcon.infoq.cn/2023/shanghai/presentation/5679

03. 基于 RAG 的知识问答

由于篇幅的关系,RAG 相关的大模型应用,将在另外一篇文章中进行详细阐述和分解。

挑战

从技术上看,AI Agent 的发展仍然缓慢,大多数应用仍处于 POC 或理论实验阶段。目前几乎很少能看到能够在复杂领域场景中完全自主的规模化 AI Agent 应用。主要原因还是充当 AI Agent 大脑的 LLM 模型仍不够强大。即使是最强大的 GPT4,在应用时仍面临一些问题:

1. 上下文长度有限,限制了历史信息、详细说明、API 调用上下文和响应的包含;

2. 长期规划和任务分解仍然具有挑战性;

3. 当前 Agent 系统依赖自然语言作为与外部组件之间的接口,但模型输出的可靠性值得怀疑。

此外,AI Agent 的成本较高,特别是多智能体系统。在很多场景中,使用 AI Agent 与 Copilot 模式相比,效果提升不明显,或者无法覆盖增加的成本。大部分 AI Agent 技术仍处于研究阶段。最后,AI Agent 可能面临诸如安全性与隐私性、伦理与责任、经济和社会就业影响等多方面的挑战。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章推荐
  • AI Agent 是什么?
    • AI Agent 的定义
      • AI Agent 的主要组成部分
      • AI Agent 应用
        • 业界相关 AI Agent 举例
        • AI Agent 应用
          • 01. BI(Data Analysis) Agent - 生成式 BI
            • 02. Coding Agent
              • 03. 基于 RAG 的知识问答
              • 挑战
              相关产品与服务
              腾讯云 BI
              腾讯云 BI(Business Intelligence,BI)提供从数据源接入、数据建模到数据可视化分析全流程的BI能力,帮助经营者快速获取决策数据依据。系统采用敏捷自助式设计,使用者仅需通过简单拖拽即可完成原本复杂的报表开发过程,并支持报表的分享、推送等企业协作场景。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档