
🚩 2026 年「术哥无界」系列实战文档 X 篇原创计划 第 78 篇,Milvus最佳实战「2026」系列第 4 篇
大家好,欢迎来到 术哥无界 | ShugeX | 运维有术。
我是术哥,一名专注于 AI 编程、AI 智能体、Agent Skills、MCP、云原生、AIOps、Milvus 向量数据库的技术实践者与开源布道者!
Talk is cheap, let's explore。无界探索,有术而行。

图 1:Zilliz 官方 Skill 全景——7 个文件覆盖 pymilvus 编码,14 个文件覆盖云端运维
假设你正在用 Claude Code 开发一个 RAG 应用,需要频繁跟 Milvus 向量数据库打交道。创建集合、定义 schema、插入向量、跑混合搜索:每一步都得翻 pymilvus 文档,找到对应的 API,再拼代码。
更烦的是,如果你用的是 Zilliz Cloud 托管服务,还得切到浏览器登录控制台去管理集群、查看监控、配置备份。
开发环境和运维环境完全是两个世界。
Zilliz 近期发布的两个 Skill 正好瞄准了这个断裂点。Milvus Skill 教 AI Agent 用 Python SDK 操作向量数据库,Zilliz Cloud Skill 教 AI Agent 通过命令行管理云端一切。两个 Skill 各管一摊,合在一起就是一条完整的开发运维链路。
翻了一圈两个 Skill 的源码之后,我发现它们的设计思路和技术实现有不少值得聊的地方。这篇文章就来拆解一下。
先说一个容易搞混的点:这两个 Skill 不是同一个东西的两个版本,而是面向完全不同场景的两个独立工具。

图 2:两个 Skill 的架构定位——Milvus Skill 通过 pymilvus SDK 操作数据,Zilliz Cloud Skill 通过 CLI 管理云服务
Milvus Skill 的定位很明确:让 AI Agent 精通 pymilvus 这个 Python SDK。它教 AI 怎么写代码去连接 Milvus、创建集合、插入向量、执行搜索——本质上是一个编码助手。不管你用的是本地 Milvus Lite、自托管的 Standalone/Cluster,还是 Zilliz Cloud 托管服务,这个 Skill 都能覆盖。
Zilliz Cloud Skill 的定位完全不同:让 AI Agent 精通 zilliz-cli 这个命令行工具。它教 AI 怎么通过命令行去管理 Zilliz Cloud 上的集群、备份、监控、计费——本质上是一个DBA 助手。注意,它只适用于 Zilliz Cloud 托管服务,跟自托管的 Milvus 没关系。
用一句话区分:
两者互补,不重叠。下面这张表能看得更清楚:
维度 | Milvus Skill | Zilliz Cloud Skill |
|---|---|---|
操作方式 | Python 代码(pymilvus) | 命令行(zilliz-cli) |
核心角色 | 编码助手 | DBA 助手 |
适用范围 | Milvus 全系列 + Zilliz Cloud | 仅 Zilliz Cloud |
参考文件数 | 7 个 | 14 个 |
典型场景 | 建集合、插数据、跑搜索 | 管集群、配备份、查账单 |
Milvus Skill 的 references/ 目录下有 7 个文件,每个文件对应一块独立的能力域:
文件 | 覆盖内容 |
|---|---|
| 数据类型、字段定义、集合完整操作 |
| 向量 CRUD、混合搜索、全文搜索、迭代器 |
| 索引类型对比、度量类型、索引管理 |
| 分区管理 |
| 数据库管理 |
| RBAC 权限管理 |
| 常见模式(RAG、混合搜索等) |
这种拆法的好处是:AI Agent 在处理某个具体任务时,只需要加载相关的参考文件,不用把所有文档一股脑塞进上下文。collection.md 负责建表相关的知识,vector.md 负责数据操作相关的知识,各司其职。
说实话,这个分文件的思路比一整个大文档要聪明得多。上下文窗口是有限的,按需加载比全量灌入效率高。
翻 collection.md 的时候,我注意到 Milvus 支持的向量类型比很多人以为的要多:
标量类型:BOOL、INT8/16/32/64、FLOAT、DOUBLE、VARCHAR、JSON、ARRAY
向量类型:
FLOAT_VECTOR — 最常用的 32 位浮点向量FLOAT16_VECTOR — 半精度,省内存BFLOAT16_VECTOR — BF16 格式,深度学习常用BINARY_VECTOR — 二值向量SPARSE_FLOAT_VECTOR — 稀疏向量,全文搜索场景INT8_VECTOR — 量化向量,进一步压缩存储6 种向量类型对应不同场景。如果你只熟悉 FLOAT_VECTOR,那 SPARSE_FLOAT_VECTOR(稀疏向量)配合 BM25 全文搜索这个组合值得了解一下——后面会细说。

图 3:混合搜索流程——用户查询同时走语义搜索和关键词搜索两路,经 RRF 重排后合并结果
patterns.md 里记录了四种常见模式,其中混合搜索(Hybrid Search)的实现方式比较有技术含量。它的核心思路是:同时用 dense 向量(语义搜索)和 sparse 向量(关键词搜索)分别跑一次搜索,然后用 RRF(Reciprocal Rank Fusion)或加权排序把两路结果合并。
具体到代码层面,涉及的组件包括:
SPARSE_FLOAT_VECTOR — 稀疏向量字段RRFRanker 的原理不复杂:对每路搜索结果按排名取倒数再求和,排名越靠前的文档得分越高。WeightedRanker 则是给每路搜索分配一个权重直接加权。Skill 里把这些细节都写清楚了,AI Agent 读到之后就能直接生成可用的混合搜索代码,不需要开发者自己去查论文。
另一个有意思的功能是全文搜索。Milvus 2.6+ 引入了内置 BM25 支持,配合 Function 和 FunctionType.BM25,可以自动把文本转成稀疏向量,不需要额外接入 Embedding 模型。
这意味着什么?以前做全文搜索要自己搞分词、算 TF-IDF、生成稀疏向量。现在告诉 AI Agent 一句话,它就能帮你写出创建集合时自动配置 BM25 Function 的代码。整个流程从"手动搭管道"变成了"一句话配置"。
vector.md 里还提到了 search_iterator 和 query_iterator,这是针对大数据集分页查询的设计。传统的 search 返回固定条数的结果,遇到百万级甚至千万级的数据集,一次拿不完。迭代器的思路是游标式分页,拿完一批再拿下一批,不会遗漏也不会重复。
Skill 里把这几个能力点拆得干净利落,AI Agent 按需读取对应的参考文件就能生成正确代码。
Zilliz Cloud Skill 的操作模式和 Milvus Skill 完全不同。它不是让 AI 写 Python 代码,而是让 AI 拼命令行:
zilliz <resource> <action> --flag <value>比如:
zilliz cluster list — 列出所有集群zilliz collection create --name my_collection — 创建集合zilliz backup create --name daily-backup — 创建备份支持三种输出格式:json(机器可读)、table(人类友好)、text(纯文本)。AI Agent 可以根据场景自动选择合适的格式。

图 4:Zilliz Cloud Skill 能力全景——14 个模块按 5 大类别覆盖云端管理全生命周期
Zilliz Cloud Skill 的 references/ 目录比 Milvus Skill 多了一倍,有 14 个文件:
文件 | 覆盖内容 |
|---|---|
| 安装、认证(OAuth/API Key/环境变量)、上下文设置 |
| 创建/列出/修改/挂起/恢复/删除集群 |
| 集合 CRUD、Load/Release、别名 |
| 向量操作(和 Milvus Skill 对应但走 CLI) |
| 索引管理 |
| 数据库管理(仅 Dedicated 集群) |
| 分区管理 |
| RBAC(仅 Dedicated 集群) |
| 备份创建/恢复/导出、备份策略 |
| 从云存储批量导入(Parquet/JSON/CSV) |
| 用量查询、发票、支付方式 |
| 集群状态、统计、负载 |
| 项目和区域管理 |
| 异步任务追踪 |
从创建集群到配置备份策略,从导入数据到查账单,14 个模块基本覆盖了 Zilliz Cloud 控制台上的所有操作。
有个细节值得注意:database.md 和 user-role.md 明确标注了"仅 Dedicated 集群"。这意味着 Skill 对三种集群类型的能力差异有清晰的认知——Free 集群能做什么、Serverless 能做什么、Dedicated 能做什么,AI Agent 不会在不支持的集群类型上尝试不可用的操作。
Zilliz Cloud Skill 的安全设计比 Milvus Skill 多了好几层。翻 SKILL.md 可以看到三条核心规则:
这三条看起来简单,但实际影响很大。想象一下,如果你让 AI Agent "帮我清理一下测试环境的集群",没有确认机制的话,它可能会把生产集群也删了。Skill 层面就把这种风险堵住了。
Skill 里还设计了一个前置条件检查流程:
zilliz-cli 是否安装 → 没装就先装这三步确保 AI Agent 在执行任何操作之前,环境是就绪的。比直接让 AI 去跑命令然后遇到报错再排查,要靠谱得多。
说到这里,一个关键问题自然浮现:Zilliz 已经有 mcp-server-milvus(224 Star),为什么还要做 Skill?

图 5:Skill vs MCP——知识注入与工具调用两种范式的本质差异与互补关系
Skill 的技术架构比很多人想象的要简单。一个 Skill 的最小结构就是一个文件夹加一个 SKILL.md 文件:
my-skill/
├── SKILL.md # 指令 + 元数据
├── references/ # 参考文档(可选)
├── scripts/ # 可执行脚本(可选)
└── assets/ # 模板/资源(可选)SKILL.md 的内容本质上就是一份说明书——告诉 AI Agent 遇到什么任务应该怎么做。它不包含任何可执行代码,只是把知识注入到 AI 的上下文里。
换句话说,Skill 的本质是 Prompt 加载器。它把领域知识打包成结构化的 Prompt,在 AI 需要的时候动态加载。
MCP(Model Context Protocol)走的是完全不同的路线。它是一个标准化的通信协议,让 AI Agent 能通过统一的接口调用外部工具。mcp-server-milvus 就是一个 MCP 服务器,提供 milvus_text_search、milvus_create_collection 等工具接口。
有人把 MCP 比作"AI Agent 的 USB-C 接口"——它解决的是工具接入的标准化问题。
维度 | Skill | MCP |
|---|---|---|
本质 | 知识注入(Prompt) | 工具调用(Protocol) |
运行方式 | 修改 AI 的行为方式 | 提供新的能力接口 |
部署成本 | 零部署,放文件即生效 | 需要运行服务器进程 |
适合场景 | 教 AI 用已有工具 | 给 AI 添加新工具 |
依赖 | AI Agent 支持 Skill 加载 | AI Agent 支持 MCP 协议 |
关键区别在这里:Milvus Skill 教 AI 用 pymilvus SDK 写代码,pymilvus 本身已经存在了,Skill 只是让 AI 知道怎么正确使用它。MCP 则是提供一个新的调用通道。
打个比方:Skill 是给你一本操作手册,你自己去操作机器;MCP 是给你一个遥控器,你按按钮机器就动了。两者解决的问题不一样。
Zilliz 同时做了 MCP Server 和两个 Skill,说明它判断这两种范式各有适用场景——MCP 适合标准化的工具调用,Skill 适合复杂的操作逻辑和知识传递。
不过话说回来,Skill 生态目前的增长速度确实很猛。调研数据显示,全球 Agent Skill 生态已经达到 70 万+ 技能包的规模,ClawHub 官方市场有 5,700+ 技能,GitHub 上 2026 年 4 月一个技能包项目 5 天就拿了 6,600 Star。这个增长势头说明开发社区对 Skill 范式的接受度相当高。
你更看好 Skill 还是 MCP?欢迎在评论区聊聊你的看法。
假设你要用 Claude Code 搭一个 RAG(检索增强生成)应用。装上 Milvus Skill 之后,你可以直接对 AI Agent 说:
帮我创建一个文档检索集合,768 维向量,支持 BM25 全文搜索,字段包括 title、content 和 embedding
AI Agent 会读取 collection.md 和 patterns.md,生成类似这样的代码:
from pymilvus import MilvusClient, DataType, Function, FunctionType
client = MilvusClient("http://localhost:19530")
schema = client.create_schema()
schema.add_field("id", DataType.INT64, is_primary=True, auto_id=True)
schema.add_field("title", DataType.VARCHAR, max_length=256)
schema.add_field("content", DataType.VARCHAR, max_length=65535)
schema.add_field("embedding", DataType.FLOAT_VECTOR, dim=768)
schema.add_field("text_sparse", DataType.SPARSE_FLOAT_VECTOR)
# 配置 BM25 全文搜索
bm25_function = Function(
name="text_bm25",
input_field_names=["content"],
output_field_names=["text_sparse"],
function_type=FunctionType.BM25,
)
schema.add_function(bm25_function)
client.create_collection("documents", schema=schema)不需要你自己翻文档去查 BM25 Function 怎么配置,Skill 里已经把这些细节写好了。
如果你用的是 Zilliz Cloud 托管服务,Zilliz Cloud Skill 能帮你做很多运维操作:
帮我在 us-east-1 创建一个 Serverless 集群,然后创建一个带 768 维向量的集合
AI Agent 会先检查环境,然后按顺序执行 CLI 命令。或者:
查看一下我所有集群的状态和资源使用情况
AI Agent 会执行 zilliz cluster list 和 zilliz monitoring 系列命令,把结果整理好给你看。
给生产集群配一个每天自动备份的策略,保留 7 天
Zilliz Cloud Skill 的 backup.md 里有完整的备份策略配置说明,AI Agent 能直接帮你设置。
把测试集群的 orders 集合数据导出到 S3
import.md 覆盖了从云存储导入导出的操作流程,包括支持的文件格式(Parquet、JSON、CSV)。
patterns.md 里有一个混合搜索模式,结合 dense 向量和 sparse 向量做 RRF 重排。如果你的搜索效果不理想,可以让 AI Agent 帮你升级到混合搜索方案:
把我的搜索升级成 dense + sparse 混合搜索,用 RRF 重排
AI Agent 会参考 vector.md 中关于 AnnSearchRequest 和 RRFRanker 的说明,帮你写出混合搜索的代码。整个过程你不需要自己研究 RRF 算法的参数,Skill 里已经有了。

图 6:Zilliz AI Agent 工具链全景——覆盖 MCP、Skill、Plugin 三种集成范式
Zilliz 围绕 AI Agent 生态的布局,远不止这两个 Skill。从调研来看,他们构建了一条完整的工具链:
项目 | 类型 | 核心能力 | Stars |
|---|---|---|---|
| MCP Server | Milvus 数据库操作 | 224 |
| MCP Server | 语义代码搜索 | 5,900 |
| Skill | pymilvus SDK 操作 | - |
| Skill | Zilliz Cloud 管理 | - |
| Plugin | AI Agent 跨会话记忆 | - |
其中 claude-context 是这个工具链里的明星项目,5,900 Star,主打把整个代码库作为 AI 的上下文。它通过 BM25 + dense vector 混合搜索,将代码存储在向量数据库里,按需检索,官方数据显示能减少约 40% 的 token 消耗。
Zilliz CEO 星爵在 2025 年做过一个判断:传统 RAG 已死。他的核心观点是,随着推理模型的进步,人们对知识搜寻不再满足于一次性检索,而是希望对问题进行拆解、多轮精细搜寻。这个方向在他们的 DeepSearcher 项目里有所体现,一个月左右就在 GitHub 拿到了约 5,000 Star。
从 MCP Server 到 Skill,从代码搜索到长期记忆,Zilliz 的策略很清晰:不管 AI Agent 生态最终采用哪种范式(MCP、Skill、Plugin),向量数据库都要有对应的接入方案。这两个 Skill 本质上是 Skill 范式下的落子。
翻完这两个 Skill 的完整源码,几个关键结论:
如果你正在用 AI Agent 做向量数据库相关的开发,这两个 Skill 值得装上试试。建议先收藏,下次搭 RAG 应用或者管理 Zilliz Cloud 集群的时候翻出来对照着用。
相关资源
Milvus Skill 源码:https://github.com/zilliztech/milvus-skill
Zilliz Cloud Skill 源码:https://github.com/zilliztech/zilliz-plugin
claude-context 项目:https://github.com/zilliztech/claude-context
mcp-server-milvus 项目:https://github.com/zilliztech/mcp-server-milvus
Milvus 官方文档:https://milvus.io/docs
Zilliz Cloud 官网:https://zilliz.com
好啦,谢谢你观看我的文章,如果喜欢可以点赞转发给需要的朋友,我们下一期再见!敬请期待!
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。