首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >深度拆解 Zilliz 两款官方 Skill:7 个文件教 AI 写 pymilvus 代码,14 个文件教 AI 管云集群

深度拆解 Zilliz 两款官方 Skill:7 个文件教 AI 写 pymilvus 代码,14 个文件教 AI 管云集群

原创
作者头像
运维有术
发布2026-04-29 00:25:39
发布2026-04-29 00:25:39
410
举报
文章被收录于专栏:运维有术运维有术

深度拆解 Zilliz 两款官方 Skill:7 个文件教 AI 写 pymilvus 代码,14 个文件教 AI 管云集群

🚩 2026 年「术哥无界」系列实战文档 X 篇原创计划 第 78 篇,Milvus最佳实战「2026」系列第 4

大家好,欢迎来到 术哥无界 | ShugeX | 运维有术

我是术哥,一名专注于 AI 编程、AI 智能体、Agent Skills、MCP、云原生、AIOps、Milvus 向量数据库的技术实践者与开源布道者

Talk is cheap, let's explore。无界探索,有术而行。

封面图:拆解 Zilliz 官方 Skill
封面图:拆解 Zilliz 官方 Skill

图 1:Zilliz 官方 Skill 全景——7 个文件覆盖 pymilvus 编码,14 个文件覆盖云端运维

假设你正在用 Claude Code 开发一个 RAG 应用,需要频繁跟 Milvus 向量数据库打交道。创建集合、定义 schema、插入向量、跑混合搜索:每一步都得翻 pymilvus 文档,找到对应的 API,再拼代码。

更烦的是,如果你用的是 Zilliz Cloud 托管服务,还得切到浏览器登录控制台去管理集群、查看监控、配置备份。

开发环境和运维环境完全是两个世界。

Zilliz 近期发布的两个 Skill 正好瞄准了这个断裂点。Milvus Skill 教 AI Agent 用 Python SDK 操作向量数据库,Zilliz Cloud Skill 教 AI Agent 通过命令行管理云端一切。两个 Skill 各管一摊,合在一起就是一条完整的开发运维链路。

翻了一圈两个 Skill 的源码之后,我发现它们的设计思路和技术实现有不少值得聊的地方。这篇文章就来拆解一下。

1. 两个 Skill,两种角色

先说一个容易搞混的点:这两个 Skill 不是同一个东西的两个版本,而是面向完全不同场景的两个独立工具。

双架构对比图:Milvus Skill vs Zilliz Cloud Skill
双架构对比图:Milvus Skill vs Zilliz Cloud Skill

图 2:两个 Skill 的架构定位——Milvus Skill 通过 pymilvus SDK 操作数据,Zilliz Cloud Skill 通过 CLI 管理云服务

Milvus Skill 的定位很明确:让 AI Agent 精通 pymilvus 这个 Python SDK。它教 AI 怎么写代码去连接 Milvus、创建集合、插入向量、执行搜索——本质上是一个编码助手。不管你用的是本地 Milvus Lite、自托管的 Standalone/Cluster,还是 Zilliz Cloud 托管服务,这个 Skill 都能覆盖。

Zilliz Cloud Skill 的定位完全不同:让 AI Agent 精通 zilliz-cli 这个命令行工具。它教 AI 怎么通过命令行去管理 Zilliz Cloud 上的集群、备份、监控、计费——本质上是一个DBA 助手。注意,它只适用于 Zilliz Cloud 托管服务,跟自托管的 Milvus 没关系。

用一句话区分:

  • Milvus Skill → 教 AI 写代码操作数据
  • Zilliz Cloud Skill → 教 AI 敲命令管理服务

两者互补,不重叠。下面这张表能看得更清楚:

维度

Milvus Skill

Zilliz Cloud Skill

操作方式

Python 代码(pymilvus)

命令行(zilliz-cli)

核心角色

编码助手

DBA 助手

适用范围

Milvus 全系列 + Zilliz Cloud

仅 Zilliz Cloud

参考文件数

7 个

14 个

典型场景

建集合、插数据、跑搜索

管集群、配备份、查账单

2. Milvus Skill:让 AI 写出靠谱的 pymilvus 代码

模块化设计:7 个参考文件各有分工

Milvus Skill 的 references/ 目录下有 7 个文件,每个文件对应一块独立的能力域:

文件

覆盖内容

collection.md

数据类型、字段定义、集合完整操作

vector.md

向量 CRUD、混合搜索、全文搜索、迭代器

index.md

索引类型对比、度量类型、索引管理

partition.md

分区管理

database.md

数据库管理

user-role.md

RBAC 权限管理

patterns.md

常见模式(RAG、混合搜索等)

这种拆法的好处是:AI Agent 在处理某个具体任务时,只需要加载相关的参考文件,不用把所有文档一股脑塞进上下文。collection.md 负责建表相关的知识,vector.md 负责数据操作相关的知识,各司其职。

说实话,这个分文件的思路比一整个大文档要聪明得多。上下文窗口是有限的,按需加载比全量灌入效率高。

支持的数据类型:比想象中丰富

collection.md 的时候,我注意到 Milvus 支持的向量类型比很多人以为的要多:

标量类型:BOOL、INT8/16/32/64、FLOAT、DOUBLE、VARCHAR、JSON、ARRAY

向量类型

  • FLOAT_VECTOR — 最常用的 32 位浮点向量
  • FLOAT16_VECTOR — 半精度,省内存
  • BFLOAT16_VECTOR — BF16 格式,深度学习常用
  • BINARY_VECTOR — 二值向量
  • SPARSE_FLOAT_VECTOR — 稀疏向量,全文搜索场景
  • INT8_VECTOR — 量化向量,进一步压缩存储

6 种向量类型对应不同场景。如果你只熟悉 FLOAT_VECTOR,那 SPARSE_FLOAT_VECTOR(稀疏向量)配合 BM25 全文搜索这个组合值得了解一下——后面会细说。

混合搜索:Skill 里最值得关注的特性

混合搜索流程图:Dense + Sparse 双路搜索与 RRF 重排
混合搜索流程图:Dense + Sparse 双路搜索与 RRF 重排

图 3:混合搜索流程——用户查询同时走语义搜索和关键词搜索两路,经 RRF 重排后合并结果

patterns.md 里记录了四种常见模式,其中混合搜索(Hybrid Search)的实现方式比较有技术含量。它的核心思路是:同时用 dense 向量(语义搜索)和 sparse 向量(关键词搜索)分别跑一次搜索,然后用 RRF(Reciprocal Rank Fusion)或加权排序把两路结果合并。

具体到代码层面,涉及的组件包括:

  1. AnnSearchRequest — 每一路搜索请求
  2. RRFRanker / WeightedRanker — 结果重排策略
  3. SPARSE_FLOAT_VECTOR — 稀疏向量字段

RRFRanker 的原理不复杂:对每路搜索结果按排名取倒数再求和,排名越靠前的文档得分越高。WeightedRanker 则是给每路搜索分配一个权重直接加权。Skill 里把这些细节都写清楚了,AI Agent 读到之后就能直接生成可用的混合搜索代码,不需要开发者自己去查论文。

全文搜索:BM25 + 自动文本转向量

另一个有意思的功能是全文搜索。Milvus 2.6+ 引入了内置 BM25 支持,配合 FunctionFunctionType.BM25,可以自动把文本转成稀疏向量,不需要额外接入 Embedding 模型。

这意味着什么?以前做全文搜索要自己搞分词、算 TF-IDF、生成稀疏向量。现在告诉 AI Agent 一句话,它就能帮你写出创建集合时自动配置 BM25 Function 的代码。整个流程从"手动搭管道"变成了"一句话配置"。

搜索迭代器:大数据集的分页方案

vector.md 里还提到了 search_iteratorquery_iterator,这是针对大数据集分页查询的设计。传统的 search 返回固定条数的结果,遇到百万级甚至千万级的数据集,一次拿不完。迭代器的思路是游标式分页,拿完一批再拿下一批,不会遗漏也不会重复。

Skill 里把这几个能力点拆得干净利落,AI Agent 按需读取对应的参考文件就能生成正确代码。

3. Zilliz Cloud Skill:让 AI 当你的云端 DBA

命令模式设计

Zilliz Cloud Skill 的操作模式和 Milvus Skill 完全不同。它不是让 AI 写 Python 代码,而是让 AI 拼命令行:

代码语言:markdown
复制
zilliz <resource> <action> --flag <value>

比如:

  • zilliz cluster list — 列出所有集群
  • zilliz collection create --name my_collection — 创建集合
  • zilliz backup create --name daily-backup — 创建备份

支持三种输出格式:json(机器可读)、table(人类友好)、text(纯文本)。AI Agent 可以根据场景自动选择合适的格式。

14 个参考文件:覆盖云端管理全生命周期

能力全景图:Zilliz Cloud Skill 14 个模块
能力全景图:Zilliz Cloud Skill 14 个模块

图 4:Zilliz Cloud Skill 能力全景——14 个模块按 5 大类别覆盖云端管理全生命周期

Zilliz Cloud Skill 的 references/ 目录比 Milvus Skill 多了一倍,有 14 个文件:

文件

覆盖内容

setup.md

安装、认证(OAuth/API Key/环境变量)、上下文设置

cluster.md

创建/列出/修改/挂起/恢复/删除集群

collection.md

集合 CRUD、Load/Release、别名

vector.md

向量操作(和 Milvus Skill 对应但走 CLI)

index.md

索引管理

database.md

数据库管理(仅 Dedicated 集群)

partition.md

分区管理

user-role.md

RBAC(仅 Dedicated 集群)

backup.md

备份创建/恢复/导出、备份策略

import.md

从云存储批量导入(Parquet/JSON/CSV)

billing.md

用量查询、发票、支付方式

monitoring.md

集群状态、统计、负载

project-region.md

项目和区域管理

job.md

异步任务追踪

从创建集群到配置备份策略,从导入数据到查账单,14 个模块基本覆盖了 Zilliz Cloud 控制台上的所有操作。

有个细节值得注意:database.mduser-role.md 明确标注了"仅 Dedicated 集群"。这意味着 Skill 对三种集群类型的能力差异有清晰的认知——Free 集群能做什么、Serverless 能做什么、Dedicated 能做什么,AI Agent 不会在不支持的集群类型上尝试不可用的操作。

安全设计:三条规则

Zilliz Cloud Skill 的安全设计比 Milvus Skill 多了好几层。翻 SKILL.md 可以看到三条核心规则:

  1. 确认破坏性操作 — 删除集群、清空集合这类操作,AI 必须先跟用户确认才能执行
  2. 敏感命令在用户终端执行 — 涉及凭证、密码的操作直接走用户的终端环境,不经 AI 中转
  3. 不暴露凭据 — AI 不会在日志或对话中输出 API Key 等敏感信息

这三条看起来简单,但实际影响很大。想象一下,如果你让 AI Agent "帮我清理一下测试环境的集群",没有确认机制的话,它可能会把生产集群也删了。Skill 层面就把这种风险堵住了。

前置条件检查:三步流程

Skill 里还设计了一个前置条件检查流程:

  1. 检查 zilliz-cli 是否安装 → 没装就先装
  2. 检查用户是否登录 → 没登录就引导认证
  3. 检查集群上下文是否设置 → 没设置就选择集群

这三步确保 AI Agent 在执行任何操作之前,环境是就绪的。比直接让 AI 去跑命令然后遇到报错再排查,要靠谱得多。

4. 为什么是 Skill 而不是 MCP?

说到这里,一个关键问题自然浮现:Zilliz 已经有 mcp-server-milvus(224 Star),为什么还要做 Skill?

Skill vs MCP 对比图:两种 AI Agent 集成范式
Skill vs MCP 对比图:两种 AI Agent 集成范式

图 5:Skill vs MCP——知识注入与工具调用两种范式的本质差异与互补关系

Skill 的本质:Prompt 加载器

Skill 的技术架构比很多人想象的要简单。一个 Skill 的最小结构就是一个文件夹加一个 SKILL.md 文件:

代码语言:markdown
复制
my-skill/
├── SKILL.md          # 指令 + 元数据
├── references/       # 参考文档(可选)
├── scripts/          # 可执行脚本(可选)
└── assets/           # 模板/资源(可选)

SKILL.md 的内容本质上就是一份说明书——告诉 AI Agent 遇到什么任务应该怎么做。它不包含任何可执行代码,只是把知识注入到 AI 的上下文里。

换句话说,Skill 的本质是 Prompt 加载器。它把领域知识打包成结构化的 Prompt,在 AI 需要的时候动态加载。

MCP 的本质:工具协议

MCP(Model Context Protocol)走的是完全不同的路线。它是一个标准化的通信协议,让 AI Agent 能通过统一的接口调用外部工具。mcp-server-milvus 就是一个 MCP 服务器,提供 milvus_text_searchmilvus_create_collection 等工具接口。

有人把 MCP 比作"AI Agent 的 USB-C 接口"——它解决的是工具接入的标准化问题。

两者的关系:互补而非替代

维度

Skill

MCP

本质

知识注入(Prompt)

工具调用(Protocol)

运行方式

修改 AI 的行为方式

提供新的能力接口

部署成本

零部署,放文件即生效

需要运行服务器进程

适合场景

教 AI 用已有工具

给 AI 添加新工具

依赖

AI Agent 支持 Skill 加载

AI Agent 支持 MCP 协议

关键区别在这里:Milvus Skill 教 AI 用 pymilvus SDK 写代码,pymilvus 本身已经存在了,Skill 只是让 AI 知道怎么正确使用它。MCP 则是提供一个新的调用通道。

打个比方:Skill 是给你一本操作手册,你自己去操作机器;MCP 是给你一个遥控器,你按按钮机器就动了。两者解决的问题不一样。

Zilliz 同时做了 MCP Server 和两个 Skill,说明它判断这两种范式各有适用场景——MCP 适合标准化的工具调用,Skill 适合复杂的操作逻辑和知识传递。

不过话说回来,Skill 生态目前的增长速度确实很猛。调研数据显示,全球 Agent Skill 生态已经达到 70 万+ 技能包的规模,ClawHub 官方市场有 5,700+ 技能,GitHub 上 2026 年 4 月一个技能包项目 5 天就拿了 6,600 Star。这个增长势头说明开发社区对 Skill 范式的接受度相当高。

你更看好 Skill 还是 MCP?欢迎在评论区聊聊你的看法。

5. 实战场景:开发者具体怎么用

场景一:搭建 RAG 应用

假设你要用 Claude Code 搭一个 RAG(检索增强生成)应用。装上 Milvus Skill 之后,你可以直接对 AI Agent 说:

帮我创建一个文档检索集合,768 维向量,支持 BM25 全文搜索,字段包括 title、content 和 embedding

AI Agent 会读取 collection.mdpatterns.md,生成类似这样的代码:

代码语言:python
复制
from pymilvus import MilvusClient, DataType, Function, FunctionType

client = MilvusClient("http://localhost:19530")

schema = client.create_schema()
schema.add_field("id", DataType.INT64, is_primary=True, auto_id=True)
schema.add_field("title", DataType.VARCHAR, max_length=256)
schema.add_field("content", DataType.VARCHAR, max_length=65535)
schema.add_field("embedding", DataType.FLOAT_VECTOR, dim=768)
schema.add_field("text_sparse", DataType.SPARSE_FLOAT_VECTOR)

# 配置 BM25 全文搜索
bm25_function = Function(
    name="text_bm25",
    input_field_names=["content"],
    output_field_names=["text_sparse"],
    function_type=FunctionType.BM25,
)
schema.add_function(bm25_function)

client.create_collection("documents", schema=schema)

不需要你自己翻文档去查 BM25 Function 怎么配置,Skill 里已经把这些细节写好了。

场景二:管理 Zilliz Cloud 集群

如果你用的是 Zilliz Cloud 托管服务,Zilliz Cloud Skill 能帮你做很多运维操作:

帮我在 us-east-1 创建一个 Serverless 集群,然后创建一个带 768 维向量的集合

AI Agent 会先检查环境,然后按顺序执行 CLI 命令。或者:

查看一下我所有集群的状态和资源使用情况

AI Agent 会执行 zilliz cluster listzilliz monitoring 系列命令,把结果整理好给你看。

场景三:数据迁移和备份

给生产集群配一个每天自动备份的策略,保留 7 天

Zilliz Cloud Skill 的 backup.md 里有完整的备份策略配置说明,AI Agent 能直接帮你设置。

把测试集群的 orders 集合数据导出到 S3

import.md 覆盖了从云存储导入导出的操作流程,包括支持的文件格式(Parquet、JSON、CSV)。

场景四:混合搜索优化

patterns.md 里有一个混合搜索模式,结合 dense 向量和 sparse 向量做 RRF 重排。如果你的搜索效果不理想,可以让 AI Agent 帮你升级到混合搜索方案:

把我的搜索升级成 dense + sparse 混合搜索,用 RRF 重排

AI Agent 会参考 vector.md 中关于 AnnSearchRequest 和 RRFRanker 的说明,帮你写出混合搜索的代码。整个过程你不需要自己研究 RRF 算法的参数,Skill 里已经有了。

6. 生态定位:不只是两个 Skill

Zilliz AI Agent 工具链全景
Zilliz AI Agent 工具链全景

图 6:Zilliz AI Agent 工具链全景——覆盖 MCP、Skill、Plugin 三种集成范式

Zilliz 围绕 AI Agent 生态的布局,远不止这两个 Skill。从调研来看,他们构建了一条完整的工具链:

项目

类型

核心能力

Stars

mcp-server-milvus

MCP Server

Milvus 数据库操作

224

claude-context

MCP Server

语义代码搜索

5,900

milvus-skill

Skill

pymilvus SDK 操作

-

zilliz-cloud-skill

Skill

Zilliz Cloud 管理

-

memsearch

Plugin

AI Agent 跨会话记忆

-

其中 claude-context 是这个工具链里的明星项目,5,900 Star,主打把整个代码库作为 AI 的上下文。它通过 BM25 + dense vector 混合搜索,将代码存储在向量数据库里,按需检索,官方数据显示能减少约 40% 的 token 消耗。

Zilliz CEO 星爵在 2025 年做过一个判断:传统 RAG 已死。他的核心观点是,随着推理模型的进步,人们对知识搜寻不再满足于一次性检索,而是希望对问题进行拆解、多轮精细搜寻。这个方向在他们的 DeepSearcher 项目里有所体现,一个月左右就在 GitHub 拿到了约 5,000 Star。

从 MCP Server 到 Skill,从代码搜索到长期记忆,Zilliz 的策略很清晰:不管 AI Agent 生态最终采用哪种范式(MCP、Skill、Plugin),向量数据库都要有对应的接入方案。这两个 Skill 本质上是 Skill 范式下的落子。

总结

翻完这两个 Skill 的完整源码,几个关键结论:

  1. 分工明确 — Milvus Skill 管 SDK 层编码,Zilliz Cloud Skill 管 CLI 层运维,两者不重叠,合在一起覆盖向量数据库的完整生命周期
  2. 模块化做得好 — 7 个和 14 个参考文件把知识域拆得很细,AI Agent 按需加载,不会浪费上下文空间
  3. 安全意识到位 — Zilliz Cloud Skill 的破坏性操作确认、凭据保护、前置条件检查,说明团队认真考虑过 AI Agent 操作数据库的风险
  4. 生态卡位准确 — Zilliz 同时布局 MCP 和 Skill 两种范式,不管 AI Agent 生态走向哪边都有覆盖

如果你正在用 AI Agent 做向量数据库相关的开发,这两个 Skill 值得装上试试。建议先收藏,下次搭 RAG 应用或者管理 Zilliz Cloud 集群的时候翻出来对照着用。

相关资源

Milvus Skill 源码:https://github.com/zilliztech/milvus-skill

Zilliz Cloud Skill 源码:https://github.com/zilliztech/zilliz-plugin

claude-context 项目:https://github.com/zilliztech/claude-context

mcp-server-milvus 项目:https://github.com/zilliztech/mcp-server-milvus

Milvus 官方文档:https://milvus.io/docs

Zilliz Cloud 官网:https://zilliz.com

好啦,谢谢你观看我的文章,如果喜欢可以点赞转发给需要的朋友,我们下一期再见!敬请期待!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 深度拆解 Zilliz 两款官方 Skill:7 个文件教 AI 写 pymilvus 代码,14 个文件教 AI 管云集群
    • 1. 两个 Skill,两种角色
    • 2. Milvus Skill:让 AI 写出靠谱的 pymilvus 代码
      • 模块化设计:7 个参考文件各有分工
      • 支持的数据类型:比想象中丰富
      • 混合搜索:Skill 里最值得关注的特性
      • 全文搜索:BM25 + 自动文本转向量
      • 搜索迭代器:大数据集的分页方案
    • 3. Zilliz Cloud Skill:让 AI 当你的云端 DBA
      • 命令模式设计
      • 14 个参考文件:覆盖云端管理全生命周期
      • 安全设计:三条规则
      • 前置条件检查:三步流程
    • 4. 为什么是 Skill 而不是 MCP?
      • Skill 的本质:Prompt 加载器
      • MCP 的本质:工具协议
      • 两者的关系:互补而非替代
    • 5. 实战场景:开发者具体怎么用
      • 场景一:搭建 RAG 应用
      • 场景二:管理 Zilliz Cloud 集群
      • 场景三:数据迁移和备份
      • 场景四:混合搜索优化
    • 6. 生态定位:不只是两个 Skill
    • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档