Agent开发-Agent Skills总结

码农戏码

发布于 2026-06-25 20:09:13

1240

🔍 WHAT（是什么）

Skills 是一种应用层的架构模式，它将完成特定任务的专业知识、业务流程和最佳实践封装成可供 LLM 按需加载的"操作说明书"。

本质特征：

• 是一个结构化的 Markdown 文件（SKILL.md）+ 可选的脚本代码

• 是写给 LLM 看的 SOP（标准作业程序）

• 是可复用、可版本化、可共享的知识资产

• 不是 LLM 的原生能力，而是建立在 Function Calling 和 MCP 之上的上层建筑

文件结构示例：

skill-name/
├── SKILL.md         # 核心指令（LLM加载）
├── scripts/         # 脚本代码（LLM不加载）
├── references/      # 参考文档（按需加载）
└── skill.json       # 元数据（应用层使用）

🎯 WHY（为什么需要）

七大核心价值：

维度	问题	Skill 的解决方案
认知负担	上下文臃肿，LLM注意力分散	渐进式加载，只加载需要的内容
知识封装	隐性知识流失，每次都要重复说	将业务规则固化在SKILL.md中
执行质量	输出不稳定，错误处理差	预设流程和容错机制，确保一致性
成本效益	Token浪费严重，响应慢	按需加载，节省50-80% token
可维护性	提示词难以版本管理	Git管理，团队协作，持续优化
安全合规	权限难以控制	应用层统一鉴权、审计
生态价值	知识无法交易传承	技能市场，知识资产化

一句话总结：Function Calling + MCP 解决了"怎么调用工具"的技术问题，而 Skill 解决了"如何让 AI 专业地工作"的系统问题。

👤 WHO（谁负责）

Skill 涉及三个角色，职责清晰分离：

角色	负责什么	核心能力
应用层（Agent框架）	技能注册、权限控制、元数据注入、实际执行	确定性、安全性、管理性
LLM	理解元数据、匹配用户意图、选择技能、按指令执行	语义理解、推理决策
开发者/领域专家	编写 SKILL.md、开发脚本、定义业务规则	领域知识、工程实现

决策分工：

• 应用层负责："有什么技能可用"（提供菜单）

• LLM 负责："该用哪个技能"（根据菜单点菜）

• 开发者负责："技能该怎么做"（写菜谱）

⏰ WHEN（何时使用）

适用场景：

场景类型	示例	是否需要用 Skill
单次、简单任务	查天气、算算术	❌ Function Calling 足够
需要多步操作	生成财报、代码审查	✅ Skill 必备
有固定业务流程	请假审批、报销流程	✅ Skill 必备
包含业务规则	财务合规、医疗规范	✅ Skill 必备
需要稳定输出	API 接口、报表生成	✅ Skill 必备
知识可复用	周报模板、会议纪要	✅ Skill 最佳

触发时机：当用户请求匹配到某个技能的 description 时，LLM 会调用 activate_skill 激活该技能。

📍 WHERE（在哪里运行）

Skill 的运行环境是分层的：

• 元数据：在 LLM 上下文中

• 完整指令：激活后加载到 LLM 上下文

• 脚本代码：在应用层执行（LLM 不加载）

• 工具调用：通过 MCP 标准化接入

🔧 HOW（如何工作）

核心机制：渐进式加载

阶段	加载内容	Token 消耗	谁负责
1. 元数据层	name + description	~20 token/技能	应用层注入
2. 决策层	语义匹配，选择技能	推理计算	LLM
3. 激活层	返回 activate_skill 调用	结构化的 tool_calls	LLM
4. 指令层	完整 SKILL.md	~2000 token/技能	应用层加载
5. 执行层	按指令调用工具	按需加载工具描述	LLM + 应用层

完整调用流程

关键技术点

LLM 调用 activate_skill 和具体工具

📊 效果总结

指标	无 Skill	有 Skill	提升
上下文占用	50,000+ token	10,000 token	5倍节省
响应时间	3-5秒	1-2秒	2-3倍
成本	$0.15/次	$0.03/次	5倍节省
错误率	20%	2%	10倍提升
开发效率	2周/功能	2天/功能	5倍提升

🎯 终极总结

# Skill 的 5W1H 一句话版
WHAT  = 给 LLM 看的 SOP（标准作业程序）
WHY   = 让 AI 从"会调用工具"变成"懂业务地工作"
WHO   = 应用层管注册 + LLM做决策 + 开发者写内容
WHEN  = 需要多步流程、业务规则、稳定输出时
WHERE = 元数据在 LLM 上下文，脚本在应用层执行
HOW   = 元数据注入 → 语义匹配 → 激活 → 按指令执行

Skill 的本质：它是 Function Calling 和 MCP 之上的智能封装层，把 LLM 的灵活性（理解与决策）和应用层的确定性（流程与管控）完美结合，让 AI 真正成为能稳定处理复杂任务的"领域专家"。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-03-25，如有侵权请联系 cloudcommunity@tencent.com 删除

工具