首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Agent开发-Agent Skills总结

Agent开发-Agent Skills总结

作者头像
码农戏码
发布2026-06-25 20:09:13
发布2026-06-25 20:09:13
1240
举报

🔍 WHAT(是什么)

Skills 是一种应用层的架构模式,它将完成特定任务的专业知识、业务流程和最佳实践封装成可供 LLM 按需加载的"操作说明书"。

本质特征

• 是一个结构化的 Markdown 文件(SKILL.md)+ 可选的脚本代码

• 是写给 LLM 看的 SOP(标准作业程序)

• 是可复用、可版本化、可共享的知识资产

不是 LLM 的原生能力,而是建立在 Function Calling 和 MCP 之上的上层建筑

文件结构示例

代码语言:javascript
复制
skill-name/
├── SKILL.md         # 核心指令(LLM加载)
├── scripts/         # 脚本代码(LLM不加载)
├── references/      # 参考文档(按需加载)
└── skill.json       # 元数据(应用层使用)

🎯 WHY(为什么需要)

七大核心价值

维度

问题

Skill 的解决方案

认知负担

上下文臃肿,LLM注意力分散

渐进式加载,只加载需要的内容

知识封装

隐性知识流失,每次都要重复说

将业务规则固化在SKILL.md中

执行质量

输出不稳定,错误处理差

预设流程和容错机制,确保一致性

成本效益

Token浪费严重,响应慢

按需加载,节省50-80% token

可维护性

提示词难以版本管理

Git管理,团队协作,持续优化

安全合规

权限难以控制

应用层统一鉴权、审计

生态价值

知识无法交易传承

技能市场,知识资产化

一句话总结:Function Calling + MCP 解决了"怎么调用工具"的技术问题,而 Skill 解决了"如何让 AI 专业地工作"的系统问题。


👤 WHO(谁负责)

Skill 涉及三个角色,职责清晰分离

角色

负责什么

核心能力

应用层(Agent框架)

技能注册、权限控制、元数据注入、实际执行

确定性、安全性、管理性

LLM

理解元数据、匹配用户意图、选择技能、按指令执行

语义理解、推理决策

开发者/领域专家

编写 SKILL.md、开发脚本、定义业务规则

领域知识、工程实现

决策分工

• 应用层负责:"有什么技能可用"(提供菜单)

• LLM 负责:"该用哪个技能"(根据菜单点菜)

• 开发者负责:"技能该怎么做"(写菜谱)


⏰ WHEN(何时使用)

适用场景

场景类型

示例

是否需要用 Skill

单次、简单任务

查天气、算算术

❌ Function Calling 足够

需要多步操作

生成财报、代码审查

✅ Skill 必备

有固定业务流程

请假审批、报销流程

✅ Skill 必备

包含业务规则

财务合规、医疗规范

✅ Skill 必备

需要稳定输出

API 接口、报表生成

✅ Skill 必备

知识可复用

周报模板、会议纪要

✅ Skill 最佳

触发时机:当用户请求匹配到某个技能的 description 时,LLM 会调用 activate_skill 激活该技能。


📍 WHERE(在哪里运行)

Skill 的运行环境是分层的

Mermaid Diagram
Mermaid Diagram

元数据:在 LLM 上下文中

完整指令:激活后加载到 LLM 上下文

脚本代码:在应用层执行(LLM 不加载)

工具调用:通过 MCP 标准化接入


🔧 HOW(如何工作)

核心机制:渐进式加载

阶段

加载内容

Token 消耗

谁负责

1. 元数据层

name + description

~20 token/技能

应用层注入

2. 决策层

语义匹配,选择技能

推理计算

LLM

3. 激活层

返回 activate_skill 调用

结构化的 tool_calls

LLM

4. 指令层

完整 SKILL.md

~2000 token/技能

应用层加载

5. 执行层

按指令调用工具

按需加载工具描述

LLM + 应用层

完整调用流程

Mermaid Diagram
Mermaid Diagram

关键技术点

代码语言:javascript
复制
LLM 调用 activate_skill 和具体工具

📊 效果总结

指标

无 Skill

有 Skill

提升

上下文占用

50,000+ token

10,000 token

5倍节省

响应时间

3-5秒

1-2秒

2-3倍

成本

$0.15/次

$0.03/次

5倍节省

错误率

20%

2%

10倍提升

开发效率

2周/功能

2天/功能

5倍提升


🎯 终极总结

代码语言:javascript
复制
# Skill 的 5W1H 一句话版
WHAT  = 给 LLM 看的 SOP(标准作业程序)
WHY   = 让 AI 从"会调用工具"变成"懂业务地工作"
WHO   = 应用层管注册 + LLM做决策 + 开发者写内容
WHEN  = 需要多步流程、业务规则、稳定输出时
WHERE = 元数据在 LLM 上下文,脚本在应用层执行
HOW   = 元数据注入 → 语义匹配 → 激活 → 按指令执行

Skill 的本质:它是 Function Calling 和 MCP 之上的智能封装层,把 LLM 的灵活性(理解与决策)和应用层的确定性(流程与管控)完美结合,让 AI 真正成为能稳定处理复杂任务的"领域专家"。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 码农戏码 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🔍 WHAT(是什么)
  • 🎯 WHY(为什么需要)
  • 👤 WHO(谁负责)
  • ⏰ WHEN(何时使用)
  • 📍 WHERE(在哪里运行)
  • 🔧 HOW(如何工作)
    • 核心机制:渐进式加载
    • 完整调用流程
    • 关键技术点
  • 📊 效果总结
  • 🎯 终极总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档