前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >不到 48 小时,Manus 智能体复刻项目就来了~

不到 48 小时,Manus 智能体复刻项目就来了~

原创
作者头像
算法一只狗
发布2025-03-11 16:10:55
发布2025-03-11 16:10:55
24000
代码可运行
举报
文章被收录于专栏:算法一只狗算法一只狗
运行总次数:0
代码可运行

这几天,最为热闹的还是要数 Manus,这个号称是目前最强的 AI Agent 在多项测试上都超过了 OpenAI的Deep Research。可以看到,Manus在GAIA上进行评测的结果,取得的分数很高。数值越高代表表现越好;纵轴则依次列出了三个难度等级。

​GAIA 说白了就是一个专为通用人工智能助手设计的基准数据集,主要用来评估 AI 系统在推理、多模态处理、网络浏览和工具使用等基本能力。这个数据集是由Meta、HuggingFace 和 AutoGPT 等组织于 2024 年联合推出,共包含了 466个问题和其答案。

从官方演示的效果来看,它能够做很多不同方面的工作。包括像旅行规划、股票分析、供应商采购、财务报告分析等等,都能够给你提供专业的意见。

就比如,如果你想要一份“特斯拉”股票分析详细数据,它能够对你的问题进行有效分析,然后获取网页上的特斯拉数据

最后,他会分析完数据之后,生成一个网页投资建议:

打开之后可以看到很详细的分析报告数据:

但是就是这么一个演示效果极强的Manus 智能体。大部分人都不能够进行有效体验,如果想要一个邀请码,在二手平台上的标价从999元到8.8万元不等,其中5万元左右的标价较为常见,甚至有卖家声称“不接受砍价”

但是仅仅过了一天多的时间,在 github 上就有人开源了一个 OpenManus等复刻项目,这个开源项目来自于@MetaGPT的团队成员。同时在短短时间内,这个项目的 github 星星数就已经上涨到了14.5k

而且能够在本地进行部署,仅需三个步骤就能够让你的电脑化身成为强大无比的 AI Agent。

安装步骤和使用

从 github 官网下下载其项目,具体的网址如下: GitHub - mannaandpoem/OpenManus: No fortress, purely open ground. OpenManus is Coming. 然后仅需下面三个步骤就可以复刻 Manus

  • 创建新的 conda 环境:
代码语言:javascript
代码运行次数:0
复制
conda create -n open_manus python=3.12
conda activate open_manus
  • 克隆仓库:
代码语言:javascript
代码运行次数:0
复制
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
  • 安装依赖:
代码语言:javascript
代码运行次数:0
复制
pip install -r requirements.txt

从官方演示的效果上来看,他能够把输入的问题进行拆分

最后会显示一个执行步骤出来:

如果感兴趣的,可以快速去部署一下这个项目玩一下。

它是怎么实现的?

OpenManus采用“主代理(项目经理)+ PlanningAgent(战略专家)+ ToolCallAgent(技术专家)”的三层架构,用户可自由组合功能模块。例如,主代理解析用户需求后,PlanningAgent将任务拆解为“搜索竞品数据→生成分析图表→编写HTML报告”等子步骤,ToolCallAgent则调用Python执行器、浏览器自动化等工具完成操作。这种设计使开发者能快速构建垂直领域智能体(如医疗诊断助手、金融分析工具) 整体的Agent 执行步骤如下

  • OpenManus 接收用户的需求,作为任务处理的起点
  • 使用 PlanningTool 进行规划,并将规划结果写入文件
  • 进入任务执行循环,该过程会遍历已有的规划
  • 判断是否有待执行任务? 如果是取出任务并分配给 Agent 。Agent 循环调用 Tool 执行任务,并在完成后将结果写入本地存储。任务完成后,Agent 进行规划更新。如果不是,说明所有任务已经执行完毕,跳出循环
  • 整理任务执行结果
  • 向用户提供任务执行结果。
  • 收集用户反馈
  • 任务流程结束

整体的过程主要依赖于大模型进行任务拆解和分配,任务执行中,终端会实时显示AI的思考日志(如“正在分析网页结构”“尝试第三次重试方案”)和进度更新。开发者可随时介入调整指令,形成“人类监督-AI执行”的协同闭环。测试案例显示,生成SEO优化报告时,AI甚至主动补充缺失数据并标注置信度

尽管OpenManus仅仅经过了 48 小时就开源引起了大规模的追捧,但还是有其局限性

  • 功能完整性暂时还是不够:暂不支持Manus的异步任务调度和多设备协同
  • 性能存在瓶颈:复杂任务(如百页PDF解析)响应时间波动较大

MetaGPT团队公布的路线图显示,未来将重点开发强化学习微调框架和跨平台任务调度器。若这些目标实现,OpenManus或将成为首个覆盖“感知-决策-执行”全链路的开源智能体平台,推动AI从“对话工具”向“生产力引擎”的质变

写在最后

像这样的Agent,本质上还是要依赖于大模型的能力,尤其是在理解复杂指令、多模态融合、推理决策等方面,其表现高度依赖于基础大模型的预训练质量和上下文适应能力。因此,其调用大模型能力越强,相应的Agent的能力也会越强。 就比如最近发布的Claude 3.7 Sonnet,也表现出了很强的编码、数学等推理能力,这些说白了本质上也可以看作是一个简单的Agent。

所以我们应该更多的关注于大模型能力的提升,Agent这类依赖于大模型能力的应用,其天然就会被更强的大模型所替代。因此,长期来看,Agent 并不是一个独立的技术方向,而是大模型能力演进的附属产物。

随着基础模型的不断升级,现有的 Agent 可能会被更强大的模型直接取代,而无需额外构建复杂的调度与管理机制。这意味着,与其过度优化当前的 Agent 方案,不如将研发重点放在提升大模型的推理能力、上下文理解能力和任务执行能力上,让大模型自身具备更强的自主决策与任务处理能力,从而自然演化出更高效的智能体。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 安装步骤和使用
  • 它是怎么实现的?
  • 写在最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档