不到 48 小时，Manus 智能体复刻项目就来了～

原创

算法一只狗

发布于 2025-03-11 16:10:55

24000

代码可运行

文章被收录于专栏：算法一只狗算法一只狗

运行总次数：0

代码可运行

这几天，最为热闹的还是要数 Manus，这个号称是目前最强的 AI Agent 在多项测试上都超过了 OpenAI的Deep Research。可以看到，Manus在GAIA上进行评测的结果，取得的分数很高。数值越高代表表现越好；纵轴则依次列出了三个难度等级。

GAIA 说白了就是一个专为通用人工智能助手设计的基准数据集，主要用来评估 AI 系统在推理、多模态处理、网络浏览和工具使用等基本能力。这个数据集是由Meta、HuggingFace 和 AutoGPT 等组织于 2024 年联合推出，共包含了 466个问题和其答案。

从官方演示的效果来看，它能够做很多不同方面的工作。包括像旅行规划、股票分析、供应商采购、财务报告分析等等，都能够给你提供专业的意见。

就比如，如果你想要一份“特斯拉”股票分析详细数据，它能够对你的问题进行有效分析，然后获取网页上的特斯拉数据

最后，他会分析完数据之后，生成一个网页投资建议：

打开之后可以看到很详细的分析报告数据：

但是就是这么一个演示效果极强的Manus 智能体。大部分人都不能够进行有效体验，如果想要一个邀请码，在二手平台上的标价从999元到8.8万元不等，其中5万元左右的标价较为常见，甚至有卖家声称“不接受砍价”

但是仅仅过了一天多的时间，在 github 上就有人开源了一个 OpenManus等复刻项目，这个开源项目来自于@MetaGPT的团队成员。同时在短短时间内，这个项目的 github 星星数就已经上涨到了14.5k

而且能够在本地进行部署，仅需三个步骤就能够让你的电脑化身成为强大无比的 AI Agent。

安装步骤和使用

从 github 官网下下载其项目，具体的网址如下： GitHub - mannaandpoem/OpenManus: No fortress, purely open ground. OpenManus is Coming. 然后仅需下面三个步骤就可以复刻 Manus

创建新的 conda 环境：

conda create -n open_manus python=3.12
conda activate open_manus

克隆仓库：

git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus

安装依赖：

pip install -r requirements.txt

从官方演示的效果上来看，他能够把输入的问题进行拆分

最后会显示一个执行步骤出来：

如果感兴趣的，可以快速去部署一下这个项目玩一下。

它是怎么实现的？

OpenManus采用“主代理（项目经理）+ PlanningAgent（战略专家）+ ToolCallAgent（技术专家）”的三层架构，用户可自由组合功能模块。例如，主代理解析用户需求后，PlanningAgent将任务拆解为“搜索竞品数据→生成分析图表→编写HTML报告”等子步骤，ToolCallAgent则调用Python执行器、浏览器自动化等工具完成操作。这种设计使开发者能快速构建垂直领域智能体（如医疗诊断助手、金融分析工具）整体的Agent 执行步骤如下

OpenManus 接收用户的需求，作为任务处理的起点
使用 PlanningTool 进行规划，并将规划结果写入文件
进入任务执行循环，该过程会遍历已有的规划
判断是否有待执行任务？ 如果是取出任务并分配给 Agent 。Agent 循环调用 Tool 执行任务，并在完成后将结果写入本地存储。任务完成后，Agent 进行规划更新。如果不是，说明所有任务已经执行完毕，跳出循环
整理任务执行结果
向用户提供任务执行结果。
收集用户反馈
任务流程结束

整体的过程主要依赖于大模型进行任务拆解和分配，任务执行中，终端会实时显示AI的思考日志（如“正在分析网页结构”“尝试第三次重试方案”）和进度更新。开发者可随时介入调整指令，形成“人类监督-AI执行”的协同闭环。测试案例显示，生成SEO优化报告时，AI甚至主动补充缺失数据并标注置信度

尽管OpenManus仅仅经过了 48 小时就开源引起了大规模的追捧，但还是有其局限性

功能完整性暂时还是不够：暂不支持Manus的异步任务调度和多设备协同
性能存在瓶颈：复杂任务（如百页PDF解析）响应时间波动较大

MetaGPT团队公布的路线图显示，未来将重点开发强化学习微调框架和跨平台任务调度器。若这些目标实现，OpenManus或将成为首个覆盖“感知-决策-执行”全链路的开源智能体平台，推动AI从“对话工具”向“生产力引擎”的质变

写在最后

像这样的Agent，本质上还是要依赖于大模型的能力，尤其是在理解复杂指令、多模态融合、推理决策等方面，其表现高度依赖于基础大模型的预训练质量和上下文适应能力。因此，其调用大模型能力越强，相应的Agent的能力也会越强。就比如最近发布的Claude 3.7 Sonnet，也表现出了很强的编码、数学等推理能力，这些说白了本质上也可以看作是一个简单的Agent。

所以我们应该更多的关注于大模型能力的提升，Agent这类依赖于大模型能力的应用，其天然就会被更强的大模型所替代。因此，长期来看，Agent 并不是一个独立的技术方向，而是大模型能力演进的附属产物。

随着基础模型的不断升级，现有的 Agent 可能会被更强大的模型直接取代，而无需额外构建复杂的调度与管理机制。这意味着，与其过度优化当前的 Agent 方案，不如将研发重点放在提升大模型的推理能力、上下文理解能力和任务执行能力上，让大模型自身具备更强的自主决策与任务处理能力，从而自然演化出更高效的智能体。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S12#AI进化论