前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >微软开源Magentic-One:用于解决复杂任务的通才多代理系统

微软开源Magentic-One:用于解决复杂任务的通才多代理系统

作者头像
AIGC新知
发布2024-11-11 19:37:14
640
发布2024-11-11 19:37:14
举报
文章被收录于专栏:AIGC新知

微软于11月7日发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。

Magentic-One 是一个通才多智能体系统,用于自主完成复杂任务。

主体工作由 Orchestrator 代理协调,该代理负责任务分解和规划、指导其他代理执行子任务、跟踪总体进度以及根据需要采取纠正措施。

其他代理专门具备完成临时、开放式任务所需的不同能力,例如浏览 Web 和与基于 Web 的应用程序交互、处理文件以及编写和执行 Python 代码

Magentic-One 的 Orchestrator 代理会创建计划,将任务委派给其他代理,并跟踪目标的进度,并根据需要动态修改计划。

Magentic-One 的代理架构

Orchestrator 可以将任务分别委派给 FileSurfer 代理来读取和处理文件,将 WebSurfer 代理委派给 WebSurfer 代理来操作 Web 浏览器,或者将任务委派给 Coder 或 Computer Terminal 代理来编写或执行代码。

Magentic-One 中的 Orchestrator 代理与四个专用代理进行协调:WebSurfer、FileSurfer、Coder 和 ComputerTerminal。

  • WebSurfer是一个基于LLM的代理,擅长理解和执行与Chromium浏览器相关的命令,并将网页状态变化反馈给Orchestrator,类似于电话技术支持中的操作员。
  • WebSurfer能够执行网页导航、操作和阅读任务,通过直接使用文档Q&A技术,减少了与Orchestrator的通信次数,提高了任务效率。
  • WebSurfer在与网页元素交互时,使用标记集提示和带注释的屏幕截图来确定操作的具体位置,实现了多模式操作。
  • FileSurfer与WebSurfer类似,但它操作的是自定义的文件预览应用程序,支持多种文件类型,并能执行文件导航任务。
  • Coder是一个专注于编写代码和分析信息的LLM代理,能够创建新程序或调试旧程序,并显示控制台输出。
  • ComputerTerminal提供了对控制台shell的访问,允许执行Coder编写的程序和运行shell命令,以扩展编程工具集。

Magentic-One 的多代理工作流程

Magentic-One 具有一个 Orchestrator 代理,该代理实现了两个循环:一个外部循环和一个内部循环。

  • 外部循环(带有实心箭头的较浅背景)管理任务分类账(包含事实、猜测和计划)。
  • 内部循环(带有虚线箭头的深色背景)管理进度分类账(包含当前进度、分配给代理的任务)。

在高级别上,工作流包含两个循环,外部循环维护任务分类账,其中包含整体计划,而内部循环维护进度分类账,该分类账指导和评估包含对专用代理的指令的各个步骤。

外循环

外部循环由初始提示或任务触发。作为响应,Orchestrator 会创建任务账本,作为任务持续时间的短期内存。

收到任务后,Orchestrator 会反映请求,并在任务分类账中预先填充重要信息 - 给定或验证的事实、要查找的事实(例如,通过 Web 搜索)、要派生的事实(例如,以编程方式或通过推理)以及有根据的猜测。

内循环。

在内部循环的每次迭代期间,Orchestrator 会回答 5 个问题以创建进度账本:

请求是否完全满足(即任务完成)?报告前一个元素的问题

团队是循环还是重复?报告前一个元素的问题

是否取得了进展?报告前一个元素的问题

接下来应该由哪个座席发言?报告前一个元素的问题

应该向该团队成员提出什么指示或问题?报告前一个元素的问题

在回答这些问题时,Orchestrator 会同时考虑任务分类账(包含事实、猜测和计划)和当前座席对话上下文。

项目官网:magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks

GitHub仓库:https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

技术论文:https://www.microsoft.com/en-us/research/publication/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-11-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 外循环
  • 内循环。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档