这几天,最为热闹的还是要数 Manus,这个号称是目前最强的 AI Agent 在多项测试上都超过了 OpenAI的Deep Research。可以看到,Manus在GAIA上进行评测的结果,取得的分数很高。数值越高代表表现越好;纵轴则依次列出了三个难度等级。
GAIA 说白了就是一个专为通用人工智能助手设计的基准数据集,主要用来评估 AI 系统在推理、多模态处理、网络浏览和工具使用等基本能力。这个数据集是由Meta、HuggingFace 和 AutoGPT 等组织于 2024 年联合推出,共包含了 466个问题和其答案。
从官方演示的效果来看,它能够做很多不同方面的工作。包括像旅行规划、股票分析、供应商采购、财务报告分析等等,都能够给你提供专业的意见。
就比如,如果你想要一份“特斯拉”股票分析详细数据,它能够对你的问题进行有效分析,然后获取网页上的特斯拉数据
最后,他会分析完数据之后,生成一个网页投资建议:
打开之后可以看到很详细的分析报告数据:
但是就是这么一个演示效果极强的Manus 智能体。大部分人都不能够进行有效体验,如果想要一个邀请码,在二手平台上的标价从999元到8.8万元不等,其中5万元左右的标价较为常见,甚至有卖家声称“不接受砍价”
但是仅仅过了一天多的时间,在 github 上就有人开源了一个 OpenManus等复刻项目,这个开源项目来自于@MetaGPT的团队成员。同时在短短时间内,这个项目的 github 星星数就已经上涨到了14.5k
而且能够在本地进行部署,仅需三个步骤就能够让你的电脑化身成为强大无比的 AI Agent。
从 github 官网下下载其项目,具体的网址如下: GitHub - mannaandpoem/OpenManus: No fortress, purely open ground. OpenManus is Coming. 然后仅需下面三个步骤就可以复刻 Manus
conda create -n open_manus python=3.12
conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
pip install -r requirements.txt
从官方演示的效果上来看,他能够把输入的问题进行拆分
最后会显示一个执行步骤出来:
如果感兴趣的,可以快速去部署一下这个项目玩一下。
OpenManus采用“主代理(项目经理)+ PlanningAgent(战略专家)+ ToolCallAgent(技术专家)”的三层架构,用户可自由组合功能模块。例如,主代理解析用户需求后,PlanningAgent将任务拆解为“搜索竞品数据→生成分析图表→编写HTML报告”等子步骤,ToolCallAgent则调用Python执行器、浏览器自动化等工具完成操作。这种设计使开发者能快速构建垂直领域智能体(如医疗诊断助手、金融分析工具) 整体的Agent 执行步骤如下
整体的过程主要依赖于大模型进行任务拆解和分配,任务执行中,终端会实时显示AI的思考日志(如“正在分析网页结构”“尝试第三次重试方案”)和进度更新。开发者可随时介入调整指令,形成“人类监督-AI执行”的协同闭环。测试案例显示,生成SEO优化报告时,AI甚至主动补充缺失数据并标注置信度
尽管OpenManus仅仅经过了 48 小时就开源引起了大规模的追捧,但还是有其局限性
MetaGPT团队公布的路线图显示,未来将重点开发强化学习微调框架和跨平台任务调度器。若这些目标实现,OpenManus或将成为首个覆盖“感知-决策-执行”全链路的开源智能体平台,推动AI从“对话工具”向“生产力引擎”的质变
像这样的Agent,本质上还是要依赖于大模型的能力,尤其是在理解复杂指令、多模态融合、推理决策等方面,其表现高度依赖于基础大模型的预训练质量和上下文适应能力。因此,其调用大模型能力越强,相应的Agent的能力也会越强。 就比如最近发布的Claude 3.7 Sonnet,也表现出了很强的编码、数学等推理能力,这些说白了本质上也可以看作是一个简单的Agent。
所以我们应该更多的关注于大模型能力的提升,Agent这类依赖于大模型能力的应用,其天然就会被更强的大模型所替代。因此,长期来看,Agent 并不是一个独立的技术方向,而是大模型能力演进的附属产物。
随着基础模型的不断升级,现有的 Agent 可能会被更强大的模型直接取代,而无需额外构建复杂的调度与管理机制。这意味着,与其过度优化当前的 Agent 方案,不如将研发重点放在提升大模型的推理能力、上下文理解能力和任务执行能力上,让大模型自身具备更强的自主决策与任务处理能力,从而自然演化出更高效的智能体。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。