首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >来了!腾讯优图开源智能体框架Youtu-Agent,开箱即用!

来了!腾讯优图开源智能体框架Youtu-Agent,开箱即用!

作者头像
腾讯云开发者
发布2025-09-04 10:02:18
发布2025-09-04 10:02:18
1.1K00
代码可运行
举报
运行总次数:0
代码可运行

智能体(Agent)正成为大模型落地的关键载体。无论是研究探索还是实际应用,高效、易用、可复现的智能体框架,都是推动智能体生态发展的基础设施。然而,研究者和开发者却常常遇到一些难题:例如上手门槛高、依赖环境复杂、实验难以复现,以及动辄需要训练模型或者充值海外昂贵的闭源模型API才能取得可靠的效果表现!

9月2日,腾讯优图实验室正式开源Youtu-Agent ——一个简单而强大的智能体框架,兼顾极简设计高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖海外闭源模型就能取得极佳的效果表现!

性能验证:开源模型上的强劲表现

在多个挑战性基准上,Youtu-Agent已展现出领先的性能:

  • WebWalkerQA:基于DeepSeek-V3.1达到 71.47% 准确率,刷新开源效果SOTA,同样是使用开源模型QwQ,不用训练也能达到SOTA效果
  • GAIA(文本子集):基于DeepSeek-V3Pass@1达到72.8%,不用充值 Claude/GPT 等闭源模型,验证了强大的研究和应用潜力。

这意味着,Youtu-Agent在完全开源可复现的条件下,已经接近甚至超越部分依赖付费工具的智能体框架。

核心亮点

1. 开源友好 & 成本敏感

完全基于开源生态,不依赖封闭模型,适配可访问、低成本的部署环境。

2. 灵活架构

构建于openai-agents之上,兼容DeepSeek、gpt-oss等多类模型 API 与工具集。

3. 自动智能体生成

基于YAML配置和“元智能体”对话机制,用户只需描述需求,即可一键生成并运行智能体配置。

4. 简洁高效

模块化+异步化设计,支持streaming、tracing与agent-loop,高效调试与扩展。

开箱即用的应用场景

Youtu-Agent并非实验室里的“纸上框架”,而是面向真实场景的即用型智能体工具。研究团队梳理了四个典型案例,覆盖文件管理、数据分析、学术研究与广域综述,展示了框架的灵活性与实用性。

案例1:本地文件管理 🗂️

在助教批改作业的场景中,用户只需将学生提交的文件放入指定文件夹。Youtu-Agent启动后会依次扫描所有文件,首先判断格式是否为PDF。如果是PDF,则根据规则自动重命名为「学号-姓名」的规范格式;如果不是PDF,则将其归档到独立的文件夹。整个过程无需人工干预,从文件识别到命名再到分类归档,一气呵成。

案例2:数据分析 📊

当面对Kaggle数据集中的cat_breeds_clean.csv文件时,用户只需给出路径.Youtu-Agent读取CSV内容,经过数据清洗和统计分析后,会自动生成结构化的结论与趋势,并转化为一份直观的HTML报告。这个过程中,原始数据被逐步转化为高价值的信息:从表格读取、到统计提取、再到结果可视化,形成完整的流水线。

(https://www.kaggle.com/datasets/joannanplkrk/its-raining-cats)

案例3:论文分析 📑

在科研工作中,研究者只需输入一篇PDF论文。Youtu-Agent首先解析文档内容,抽取核心部分;随后调用搜索工具,在外部检索与其相关的研究工作;最后将论文解读与外部成果整合,生成一份Markdown报告。整个过程就像一个“论文助理”:先读懂论文,再去查找对照,最后写出一份条理清晰的研究笔记。

案例4:Wide Research 🌐

(https://manus.im/blog/introducing-wide-research)

当用户输入一个广域主题时,Youtu-Agent便进入复合模式。它先调用搜索工具,收集大量分散的信息;再使用文档处理工具进行整理;最后由智能体进行分析与总结,生成一份结构化的Markdown综述。这个过程相当于把“调研”自动化:从需求提出,到海量资料收集,再到报告成型,整个链条由多个子智能体协同完成。

设计原则:DITA

Youtu-Agent的研究员提出了DITA原则,总结智能体设计的四个关键维度:

  • Demand(需求):明确任务目标,来源于系统提示词中的requirements或用户输入的intention。
  • I/O(输入输出):定义任务的输入形式(如CSVPDFstr)与输出形式(如HTML报告、Markdown)。
  • Tools(工具):根据任务选择或生成合适的工具,例如搜索工具、文件处理工具。
  • Agent Pattern(范式):决定智能体的交互模式,例如single agent、plan-and-execute、compound。

自动化 Agent 生成:降低门槛的核心亮点

除了 DITA 框架之外,Youtu-Agent还特别强调了一个核心亮点:自动化Agent生成。在传统方式中,用户往往需要自己手动编写prompt、配置工具和参数,这不仅对初学者来说存在较高的使用门槛,而且即使是有经验的用户,也要投入大量的时间成本。Youtu-Agent的解决思路是将这一过程进行标准化与自动化。

具体来说,它采用统一的YAML配置格式,将Agent的输入输出、工具调用和交互范式用结构化的方式加以描述;同时引入了一个“meta-agent”,用户只需提出任务需求,系统就会通过与用户的交互澄清意图,并自动生成完整的配置文件。生成的配置可以直接加载并运行,从而实现一键测试与使用。

在使用体验上,用户只需先运行python scripts/gen_simple_agent.py,meta-agent会根据需求生成相应的配置;随后再运行python scripts/cli_chat.py --stream --config generated/xxx,就能立即启动并测试生成的Agent。这一机制大幅度降低了Agent的定制难度,让初学者可以快速上手,同时也帮助高阶用户节省了繁琐的配置和调试时间。

代码语言:javascript
代码运行次数:0
运行
复制
# 第一步:生成配置
python scripts/gen_simple_agent.py
# (交互式对话,meta-agent 会澄清需求并输出配置)
 # 第二步:运行测试
python scripts/cli_chat.py --stream --config generated/xxx

面向不同用户的价值

  • 研究人员 / 模型训练师:比ReAct更强的开源基线,一键评估脚本助力实验与消融研究。
  • 应用开发者:经过验证的脚手架,轻量上手即可构建真实智能体应用。
  • AI 爱好者:丰富示例与可调试性,让开发与探索直观高效。

快速上手

这么强大的智能体框架要怎么用?其实很简单!Youtu-Agent在GitHub上开源了完整代码和示例,只要四步就能跑起来:

第一步:获取代码

在命令行输入:

代码语言:javascript
代码运行次数:0
运行
复制
git clone https://github.com/TencentCloudADP/Youtu-Agent.git
cd Youtu-Agent
uv sync# or, `make sync`
cp .env.example .env  # config necessary API keys...
source ./.venv/bin/activate

第二步:配置环境变量

通过第一步获取代码作为Youtu-Agent的“身体”后,你还需要为你的智能体装上“大脑”——大模型。

首先访问提供模型服务的平台,获取远程调用模型的凭证API key。以腾讯云DeepSeek对话接口为例,中国大陆用户可进入

https://cloud.tencent.com/document/product/1772/115969

根据页面提示在控制台申请API KEY(选择OpenAI SDK格式)。

海外用户(含港澳台地区)用户可进入

https://www.tencentcloud.com/document/product/1255/70381?lang=en&pg=

根据页面提示在控制台申请API KEY(选择OpenAI SDK格式),即可获取你的专属大模型调用密钥。

创建并复制API key,粘贴至`Youtu-Agent`项目的`.env`文件中的llm部分内。

代码语言:javascript
代码运行次数:0
运行
复制
# llm
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3 #模型型号
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1 #模型访问地址
UTU_LLM_API_KEY=[填入你在上文申请的DeepSeek API key]

这样,Youtu-Agent就正式装载完成了。你还可以在`.env`文件中配置其它环境变量,解锁框架内置的扩展、过程追踪等进阶功能!

第三步:跑一个最简单的智能体

Youtu-Agent内置了配置模板,只要写一个YAML文件,就能定义你的智能体行为。项目中提供了一个搭载搜索工具的基础agent模板configs/agents/default.yaml,你可以运行以下下面代码一键体验:

代码语言:javascript
代码运行次数:0
运行
复制
python scripts/cli_chat.py --stream --config default

第四步:探索更多示例

你也可以尝试运行官方示例中的更多实用案例。部分示例要求Agent具备联网搜索能力,因此需要在.env文件内提前配置tools模块内的工具API:

代码语言:javascript
代码运行次数:0
运行
复制
# tools
# serper api key, ref https://serper.dev/playground
SERPER_API_KEY=<访问注释内的地址,获取 API Key>
# jina api key, ref https://jina.ai/reader
JINA_API_KEY=<访问注释内的地址,获取 API Key>

例如希望Agent围绕"DeepSeek V3.1 新特性"主题,自动联网检索信息并生成SVG介绍图片,可以直接运行下面的代码:

代码语言:javascript
代码运行次数:0
运行
复制
python examples/svg_generator/main.py

如果想要借助web-ui以可视化方式预览Agent的运行情况,你可以在Youtu-Agent的releases中下载前端ui的打包文件并安装到本地:

代码语言:javascript
代码运行次数:0
运行
复制
# fetch and download the frontend package
curl -LO https://github.com/Tencent/Youtu-Agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl
 # install frontend package
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl

然后运行web版本的SVG图片生成命令:

代码语言:javascript
代码运行次数:0
运行
复制
python examples/svg_generator/main_web.py

当终端出现以下提示时,说明部署成功。点击本地链接访问项目:

代码语言:javascript
代码运行次数:0
运行
复制
Server started at http://127.0.0.1:8848/

在对话框内输入问题。例如,对于“deepseek-v3.1有哪些亮点更新?”这一问题,Agent将自行从网络搜索相关信息,最终生成如下的图片:

更进阶的,还可以用脚本一键跑基准评测:

代码语言:javascript
代码运行次数:0
运行
复制
python scripts/run_eval.py --config_name ww --exp_id demo --dataset WebWalkerQA --concurrency 5

完成评测之后,可以在分析平台上检查实验结果:

智能体的发展,正在进入“开源驱动”的新阶段。Youtu-Agent不只是一个框架,而是我们对开源智能体未来的回答。我们期待更多研究者和开发者的参与,共同推动智能体生态的演进。🚀

开源体验入口:

  • 开源代码:https://github.com/TencentCloudADP/youtu-agent
  • 文档链接:https://tencentcloudadp.github.io/youtu-agent/
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯云开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档