智能体(Agent)正成为大模型落地的关键载体。无论是研究探索还是实际应用,高效、易用、可复现的智能体框架,都是推动智能体生态发展的基础设施。然而,研究者和开发者却常常遇到一些难题:例如上手门槛高、依赖环境复杂、实验难以复现,以及动辄需要训练模型或者充值海外昂贵的闭源模型API才能取得可靠的效果表现!
9月2日,腾讯优图实验室正式开源Youtu-Agent ——一个简单而强大的智能体框架,兼顾极简设计与高性能表现,既能服务科研基线需求,也能支撑实际应用构建,最重要的是不需要训练模型、不依赖海外闭源模型就能取得极佳的效果表现!
性能验证:开源模型上的强劲表现
在多个挑战性基准上,Youtu-Agent已展现出领先的性能:
这意味着,Youtu-Agent在完全开源可复现的条件下,已经接近甚至超越部分依赖付费工具的智能体框架。
核心亮点
1. 开源友好 & 成本敏感
完全基于开源生态,不依赖封闭模型,适配可访问、低成本的部署环境。
2. 灵活架构
构建于openai-agents之上,兼容DeepSeek、gpt-oss等多类模型 API 与工具集。
3. 自动智能体生成
基于YAML配置和“元智能体”对话机制,用户只需描述需求,即可一键生成并运行智能体配置。
4. 简洁高效
模块化+异步化设计,支持streaming、tracing与agent-loop,高效调试与扩展。
开箱即用的应用场景
Youtu-Agent并非实验室里的“纸上框架”,而是面向真实场景的即用型智能体工具。研究团队梳理了四个典型案例,覆盖文件管理、数据分析、学术研究与广域综述,展示了框架的灵活性与实用性。
案例1:本地文件管理 🗂️
在助教批改作业的场景中,用户只需将学生提交的文件放入指定文件夹。Youtu-Agent启动后会依次扫描所有文件,首先判断格式是否为PDF。如果是PDF,则根据规则自动重命名为「学号-姓名」的规范格式;如果不是PDF,则将其归档到独立的文件夹。整个过程无需人工干预,从文件识别到命名再到分类归档,一气呵成。
案例2:数据分析 📊
当面对Kaggle数据集中的cat_breeds_clean.csv文件时,用户只需给出路径.Youtu-Agent读取CSV内容,经过数据清洗和统计分析后,会自动生成结构化的结论与趋势,并转化为一份直观的HTML报告。这个过程中,原始数据被逐步转化为高价值的信息:从表格读取、到统计提取、再到结果可视化,形成完整的流水线。
(https://www.kaggle.com/datasets/joannanplkrk/its-raining-cats)
案例3:论文分析 📑
在科研工作中,研究者只需输入一篇PDF论文。Youtu-Agent首先解析文档内容,抽取核心部分;随后调用搜索工具,在外部检索与其相关的研究工作;最后将论文解读与外部成果整合,生成一份Markdown报告。整个过程就像一个“论文助理”:先读懂论文,再去查找对照,最后写出一份条理清晰的研究笔记。
案例4:Wide Research 🌐
(https://manus.im/blog/introducing-wide-research)
当用户输入一个广域主题时,Youtu-Agent便进入复合模式。它先调用搜索工具,收集大量分散的信息;再使用文档处理工具进行整理;最后由智能体进行分析与总结,生成一份结构化的Markdown综述。这个过程相当于把“调研”自动化:从需求提出,到海量资料收集,再到报告成型,整个链条由多个子智能体协同完成。
设计原则:DITA
Youtu-Agent的研究员提出了DITA原则,总结智能体设计的四个关键维度:
自动化 Agent 生成:降低门槛的核心亮点
除了 DITA 框架之外,Youtu-Agent还特别强调了一个核心亮点:自动化Agent生成。在传统方式中,用户往往需要自己手动编写prompt、配置工具和参数,这不仅对初学者来说存在较高的使用门槛,而且即使是有经验的用户,也要投入大量的时间成本。Youtu-Agent的解决思路是将这一过程进行标准化与自动化。
具体来说,它采用统一的YAML配置格式,将Agent的输入输出、工具调用和交互范式用结构化的方式加以描述;同时引入了一个“meta-agent”,用户只需提出任务需求,系统就会通过与用户的交互澄清意图,并自动生成完整的配置文件。生成的配置可以直接加载并运行,从而实现一键测试与使用。
在使用体验上,用户只需先运行python scripts/gen_simple_agent.py,meta-agent会根据需求生成相应的配置;随后再运行python scripts/cli_chat.py --stream --config generated/xxx,就能立即启动并测试生成的Agent。这一机制大幅度降低了Agent的定制难度,让初学者可以快速上手,同时也帮助高阶用户节省了繁琐的配置和调试时间。
# 第一步:生成配置
python scripts/gen_simple_agent.py
# (交互式对话,meta-agent 会澄清需求并输出配置)
# 第二步:运行测试
python scripts/cli_chat.py --stream --config generated/xxx
面向不同用户的价值
快速上手
这么强大的智能体框架要怎么用?其实很简单!Youtu-Agent在GitHub上开源了完整代码和示例,只要四步就能跑起来:
第一步:获取代码
在命令行输入:
git clone https://github.com/TencentCloudADP/Youtu-Agent.git
cd Youtu-Agent
uv sync# or, `make sync`
cp .env.example .env # config necessary API keys...
source ./.venv/bin/activate
第二步:配置环境变量
通过第一步获取代码作为Youtu-Agent的“身体”后,你还需要为你的智能体装上“大脑”——大模型。
首先访问提供模型服务的平台,获取远程调用模型的凭证API key。以腾讯云DeepSeek对话接口为例,中国大陆用户可进入
https://cloud.tencent.com/document/product/1772/115969
根据页面提示在控制台申请API KEY(选择OpenAI SDK格式)。
海外用户(含港澳台地区)用户可进入
https://www.tencentcloud.com/document/product/1255/70381?lang=en&pg=
根据页面提示在控制台申请API KEY(选择OpenAI SDK格式),即可获取你的专属大模型调用密钥。
创建并复制API key,粘贴至`Youtu-Agent`项目的`.env`文件中的llm部分内。
# llm
UTU_LLM_TYPE=chat.completions
UTU_LLM_MODEL=deepseek-v3 #模型型号
UTU_LLM_BASE_URL=https://api.lkeap.cloud.tencent.com/v1 #模型访问地址
UTU_LLM_API_KEY=[填入你在上文申请的DeepSeek API key]
这样,Youtu-Agent就正式装载完成了。你还可以在`.env`文件中配置其它环境变量,解锁框架内置的扩展、过程追踪等进阶功能!
第三步:跑一个最简单的智能体
Youtu-Agent内置了配置模板,只要写一个YAML文件,就能定义你的智能体行为。项目中提供了一个搭载搜索工具的基础agent模板configs/agents/default.yaml,你可以运行以下下面代码一键体验:
python scripts/cli_chat.py --stream --config default
第四步:探索更多示例
你也可以尝试运行官方示例中的更多实用案例。部分示例要求Agent具备联网搜索能力,因此需要在.env文件内提前配置tools模块内的工具API:
# tools
# serper api key, ref https://serper.dev/playground
SERPER_API_KEY=<访问注释内的地址,获取 API Key>
# jina api key, ref https://jina.ai/reader
JINA_API_KEY=<访问注释内的地址,获取 API Key>
例如希望Agent围绕"DeepSeek V3.1 新特性"主题,自动联网检索信息并生成SVG介绍图片,可以直接运行下面的代码:
python examples/svg_generator/main.py
如果想要借助web-ui以可视化方式预览Agent的运行情况,你可以在Youtu-Agent的releases中下载前端ui的打包文件并安装到本地:
# fetch and download the frontend package
curl -LO https://github.com/Tencent/Youtu-Agent/releases/download/frontend%2Fv0.1.5/utu_agent_ui-0.1.5-py3-none-any.whl
# install frontend package
uv pip install utu_agent_ui-0.1.5-py3-none-any.whl
然后运行web版本的SVG图片生成命令:
python examples/svg_generator/main_web.py
当终端出现以下提示时,说明部署成功。点击本地链接访问项目:
Server started at http://127.0.0.1:8848/
在对话框内输入问题。例如,对于“deepseek-v3.1有哪些亮点更新?”这一问题,Agent将自行从网络搜索相关信息,最终生成如下的图片:
更进阶的,还可以用脚本一键跑基准评测:
python scripts/run_eval.py --config_name ww --exp_id demo --dataset WebWalkerQA --concurrency 5
完成评测之后,可以在分析平台上检查实验结果:
智能体的发展,正在进入“开源驱动”的新阶段。Youtu-Agent不只是一个框架,而是我们对开源智能体未来的回答。我们期待更多研究者和开发者的参与,共同推动智能体生态的演进。🚀
开源体验入口: