

在上一篇中,我们介绍了 api-schema-parser —— 它是接口自动化测试的"入口技能",它能将各种格式的接口文档统一解析为标准化的 api_definitions.json。
但解析完接口定义后,下一个让人头疼的问题来了:测试数据怎么造?
传统模式下,测试工程师需要:
null、类型错误、超长超短、非法字符几十个接口下来,光是造数就要花掉好几天。
更致命的是,人工造数极易遗漏边界场景——"这个字段的最大长度测了吗?""枚举值外的非法值传了吗?""空数组和缺字段有什么区别?"——这些细节的不注意往往极易产生线上Bug。
今天这篇,我们聚焦 AI 赋能接口自动化的第二步:api-testdata-generator— 全场景测试数据智能构造Agent Skill。
用于解决接口测试"造数难、覆盖不全、效率低"的痛点,彻底告别人工造数的繁琐与遗漏。
很多人以为,接口自动化最难的是写脚本。但实际上,数据构造的质量直接决定了自动化测试的有效性、覆盖深度和缺陷发现能力。
但传统人工造数存在三大核心痛点:
人工造数时,下意识会优先构造"能跑通"的正向数据。但接口测试的核心价值,恰恰在于验证异常场景下系统的容错能力:
这些场景人工极易遗漏,但AI可以基于规则系统化、无遗漏地生成。
人工来构造多个接口的全维度测试数据,熟练工也需 1-2 天。
且不同的人构造的数据散落在各个脚本里,今天张三写了一套,明天李四又写了一套,格式不统一、命名不规范、复用性极差。一旦业务规则变更(如密码最小长度从6位改为8位),需要逐行修改所有脚本中的硬编码数据,维护成本极大。
通用造数工具生成的 “假数据”(如随机字符串)无法覆盖 “库存不足的商品 ID”、“重复添加的商品 SKU” 等业务场景。
且针对一些接口安全测试的场景,如SQL注入、XSS攻击、路径穿越、命令注入……这些安全测试数据需要专业的安全知识储备,普通测试工程师往往"不会写 payload"或"写了也不知道对不对"。
而基于 AI 驱动的Skill技能特性恰好能解决这些问题:
api-schema-parser输出的标准化接口定义,精准匹配参数约束;温馨提示:AI 造数并非 “替代人工”,而是将工程师从重复造数的体力活中解放,聚焦于数据规则设计、业务场景校验等核心工作。
很多新手容易踩的坑:想做一个"万能Skill",输入接口文档,直接输出完美脚本。
这里有一个非常重要的认知:千万不要寄希望于用一个 “万能 Skill” 解决所有问题。
一个技能包揽解析、造数、生成、优化、执行,会导致逻辑臃肿、维护困难、扩展受限,也违背了 Agent Skill 设计的核心思想。
正确的做法是按职责拆分,每个Skill只做一件事(如解析、生成、校验),避免功能耦合。
比如,可以这样来拆:
Skill | 核心职责 | 解决什么痛点 |
|---|---|---|
api-schema-parser | 接口定义结构化解析 | 人工读文档慢、易遗漏、格式不统一 |
api-testdata-generator | 测试数据智能生成 | 人工造数重复、边界场景覆盖不全 |
api-testscript-generator | 自动化脚本批量生成 | 人工编码慢、风格不统一、规范难落地 |
api-test-optimizer | 脚本质量检查与优化 | AI幻觉导致脚本有错、场景缺失、健壮性不足 |
api-test-executor(后续教程) | 脚本执行与结果复盘 | 人工执行繁琐、失败分析耗时 |
这5个Skill形成完整闭环:解析→造数→生成→优化→执行,既能串联使用,也能独立调用。
目前本系列主要是聚焦接口脚本生成阶段工作,在接口执行阶段还会根据执行阶段的工作特性,将其拆分成 5 个专业的Agent Skill来各司其职。
接口文档(Swagger/Postman/HAR 等)
│
▼
api-schema-parser ──→ 标准化接口数据 (api_definitions.json)
│
├──→ api-testdata-generator ──→ 全场景测试数据
│ │
│ ▼
│ api-testscript-generator ──→ 接口自动化脚本工程
│ │
│ ▼
│ api-test-optimizer ──→ 脚本质量检查与优化
│ │
│ ▼
│ api-test-tagger ──→ 智能标签化管理
│ │
│ ▼
│ api-test-executor ──→ 智能执行调度
│ │
│ ├──→ api-failure-diagnoser ──→ 失败诊断与自动修复
│ │
│ └──→ api-pipeline-scheduler ──→ 全链路流水线调度
│ │
│ ├── api-test-executor(执行测试)
│ ├── api-testdata-cleaner(清理数据)
│ └── api-report-generator(生成报告)
│
└──→ 也可直接进入 generator-testcase-xmind/excel 生成接口级测试用例可以这样说,掌握了这套Agent Skill技能组合,日常接口自动化测试工作零基础的同学也能轻松搞定。
目前这套AI测试赋能的Skill技能组合,「狂师 . AI进化社」的成员都在使用,很多同学都表示,接口自动化测试落地效率明显提升了数倍,代码基础薄弱的同学也能轻松落地自动化测试了。
做过接口自动化的同学都懂,人工构造测试数据有多 “折磨”:
api-testdata-generator是专门为接口自动化测试设计的测试数据智能生成 Skill,核心是 “基于规则、贴合业务、全场景覆盖”,其核心特性如下:

该 Skill 突破了 “仅依赖接口文档造数” 的局限,支持三种灵活的输入模式,适配不同测试场景:
输入模式 | 核心输入 | 输出格式 | 适用场景 |
|---|---|---|---|
传统模式(API 驱动) | api_definitions.json(接口解析结果) | YAML/JSON/Excel | 接口自动化测试(高频使用) |
规范模式(规则驱动) | 自定义字段规则文件(类型、长度、正则、枚举) | CSV/JSON/YAML/Excel | 团队有固定数据规范,多项目复用 |
自然语言模式(Faker 驱动) | 自然语言描述(如 “生成 10 条符合中国身份证规则的数据”) | CSV | 手工测试、性能测试、UI 自动化(无需接口文档) |
基于接口约束和业务规则,自动生成四类测试数据,无死角覆盖测试场景:
生成的测试数据并非 “零散文件”,而是按工程化规范组织:
虽然api-testdata-generator 技能支持三种模式的输入,但对于日常绝大多数的使用场景来说,使用最高频的还是传统模式(基于 api_definitions.json 接口定义)和自然语言模式(基于自然语言描述,Faker 驱动)。
我们接下来,就重点验证一下这两类模式下的效果:
1、传统模式(基于 api_definitions.json 接口定义)
第一步,在技能列表选择api-testdata-generator技能。

提供接口定义、字段规则文件或自然语言描述,比如这里我们传入上一步生成好的 api_definitions.json 接口定义,点击执行。

收到提示词后,api-testdata-generator技能会基于接口定义文件使用传统模式来生成测试数据,最终生成的数据汇总结果如下:共为59个接口生成了2032条数据,包括正向数据、边界值数据,异常数据,安全数据等不同维度。

并且生成好的数据,会按照模块进行保存:
output/test_data/
├── _config.yaml # 全局配置(鉴权、测试账号等)
├── _dependencies.yaml # 接口依赖链(order流程、product流程等)
├── summary.json # 汇总报告
├── auth/ # 认证管理(6文件,login/register/logout)
├── order/ # 订单管理(20文件,10接口×2格式)
├── admin/ # 管理后台(46文件,23接口×2格式)
├── address/ # 地址管理
├── cart/ # 购物车管理
├── captcha/ # 验证码管理
├── product/ # 商品管理
├── search/ # 商品搜索
├── banner/ # Banner轮播图
└── user/ # 用户管理
每条数据都精准匹配接口参数约束,例如购物车接口会自动生成 “库存不足的商品 ID”“重复添加的商品 SKU” 等业务相关异常数据,而非简单的随机字符串。

第二种:自然语言模式(基于Faker 驱动)
此类使用方式,无需依赖接口文档,通过自然语言描述所需要的测试数据即可:
下面我们简要演示一下操作:
选择api-testdata-generator技能,输入:帮我生成100条完整用户信息。

发送提示词,很快100条完整测试数据就生成好了

打开生成的csv文件,查看数据详细。
只需一句话,整整齐齐100条完整的用户信息就生成好了,以后妈妈再也不用担心我为构造测试数据发愁了😊

100条完整用户信息,一句话搞定。
api-testdata-generator并非孤立存在,而是接口自动化 AI 流水线的核心环节,其上下游联动逻辑如下:
┌─────────────────┐ ┌──────────────────┐ ┌──────────────────┐
│ api-schema- │ ──→ │ api-testdata- │ ──→ │ api-testscript- │
│ parser │ │ generator │ │ generator │
│ (接口解析) │ │ (数据生成) │ │ (脚本生成) │
└─────────────────┘ └──────────────────┘ └──────────────────┘api-schema-parser输出的标准化接口定义,确保数据与接口参数约束 100% 匹配;api-testscript-generator提供全维度测试数据,让生成的自动化脚本直接绑定有效数据,无需人工二次适配。项目完整实操教程、开发架构、设计思路(AI测试实战教程,平均每篇约3.5W字图文教程,非常详细,保姆级手把手喂饭教程,零基础也能快速上手)和项目源码(含30多个AI测试全场景Agent Skill),AI 知识库统一在「狂师 . AI 进化社」中。

目前「AI 进化社」中已经有非常多的AI 项目实战、AI测试实战保姆级教程(图文教程、视频教程)。
api-testdata-generator作为 AI 赋能接口自动化的核心 Skill 之一,解决了 “测试数据覆盖不全、构造效率低、业务贴合度差” 的行业痛点。
但需注意:AI 造数的核心价值是 “提效” 而非 “替代”,测试工程师仍需聚焦于 “数据规则设计、业务场景定义、数据有效性校验” 等核心工作。
下一篇,我们将聚焦api-testscript-generator,聊聊如何让 AI 批量生成规范、可运行、覆盖全场景的接口自动化脚本,彻底告别手工编码的繁琐与低效。
本文配套的
api-testdata-generatorSkill 源码、shop-lab 项目实战教程(保姆级图文 + 视频),可前往「狂师 . AI 进化社」获取,包含 30+AI 测试全场景 Agent Skill,助力零基础落地 AI 赋能的接口自动化测试。

如果这篇文章对你有帮助,不妨点个赞、转发、收藏三连支持! ❤️想第一时间收到推送,记得加个星标 ⭐