本指南旨在协助您完成腾讯云 Web 应用防火墙(WAF)大模型安全模块的业务接入与基础参数配置。完成本文档操作后,您的业务流量将经过WAF,并为其后的安全策略配置准备好必要的上下文信息(如用户会话、API路径、业务字段等)。
前提条件
大模型业务接入
目前大模型安全模块支持 SaaS 型 WAF 和 CLB 型 WAF 开启接入。
步骤1:大模型业务场景配置
若您的大模型使用 SSE 协议进行业务接入,WAF 将能对算力消耗、请求内容和响应内容进行安全检测。如果您的大模型未使用 SSE 协议,目前仅支持对算力消耗和请求内容进行安全检测。
步骤2:大模型业务参数配置
大模型业务接入后,您需要配置针对您的大模型业务参数,以便于 WAF 提取业务交互内容进行分析。
会话标识配置
1. 大模型业务拦截需要针对单个用户维度进行风险识别和拦截,实现在同一 IP 下区分不同用户的精准处置。因此需要配置会话标识(Session ID)。您可以前往 大模型安全页面,单击会话标识设置进行配置。

2. 在会话标识设置页面,单击新增,新增一个会话标识提取配置。

说明:
会话标识应为可持续记录的 token ID ,例如登录后的Set-Cookie 的值。
3. 在新增会话标识窗口中,配置相关参数,单击确定。

字段名称 | 说明 |
会话标识位置 | 指定识别特定位置(QUERY、BODY、COOKIE 或 HEADERS)的参数名作为会话标识,以该参数名对应的值作为会话 ID。 |
会话标识参数 | 取值标识,以.字符分隔各个层级的参数,示例如下: test:识别 JSON 字符串中 test 参数的值为会话 ID。 test1.test2:识别 JSON 字符串中 test1包含的 test2参数的值为会话 ID。 除了 HEADERS 以外,其余配置均需要区分字母大小写。 |
优先级 | 支持输入1-100的整数,数字越小优先级越高,优先匹配对应设置的会话标识。优先级相同时,更新时间越晚越优先。 |
设置默认 | 支持设置默认会话标识,设置默认后,则在创建安全策略时默认使用该会话标识配置进行提取。 |
大模型防护路径配置
1. 由于不同大模型的防护路径及其对应的 prompt 和 response 字段位置各不相同,需要明确 WAF 应从哪个路径和字段提取内容进行匹配。因此,您需要为接入的大模型业务定义具体的防护路径。可以前往 大模型安全页面,单击大模型防护路径设置进行配置。

2. 单击新增,您可以设置大模型防护路径。

3. 在新增大模型防护路径窗口中,配置相关参数,单击确定。

字段名称 | 说明 |
大模型类型 | 系统内置了部分标准的大模型路径参数,您可以根据自己的大模型后端服务类型选择填充,或者选择自定义填充。 |
大模型业务名称 | 限制 128 个字符,输入大模型业务名称,用于在规则配置页展示和选择。 |
请求路径 | 配置您的大模型业务的请求路径,例如/v1/chat。限制 128 个字符。 |
提示词位置 | 配置您的大模型业务的提示词字段,可使用参数名或数组形式。例如: 配置 prompt 表示提取 prompt 的参数值; 配置 content.0.prompt 表示提取 content 数组第一个元素的 prompt 参数值; 配置 content|@reverse|0.prompt 表示提取 content 数组最后一个元素的 prompt 参数值。 限制为 128 个字符。 说明: 未开启连续对话检测时,输入格式为 content.0.prompt(检测第一个)或 content|@reverse|0.prompt(检测最后一个)。 开启连续对话检测时,输入格式为 content.#.prompt(从第一个开始检测)或 content.#reverse.prompt(倒序,从最后一个开始检测)。 |
连续对话内容检测 | 开启后,WAF 将根据配置的提示词位置提取最新 N 轮的 prompt 内容,发送给 prompt 注入检测模型进行检测。任意一轮对话命中即视为攻击。默认关闭。 |
最大检测对话轮数 | 设置连续对话内容检测的最大轮数,范围 1-20,默认为 5。仅在连续对话内容检测开启后生效。 |
思考位置 | 如果您使用的大模型业务为思考大模型,请在此配置您的大模型业务的思考内容字段。支持参数名或数组形式,例如: 配置 thinking 则提取 thinking 参数值内容; 配置 content.0.thinking 则提取 content 数组第一个元素的 thinking 参数值内容; 配置 content|@reverse|0.thinking 则提取 content 数组最后一个元素的 thinking 参数值内容。 字符限制为 128 个。 |
响应位置 | 配置您的大模型业务的响应内容字段,支持参数名或数组形式。例如: 配置 response,提取 response 的参数值; 配置 content.0.response,提取 content 数组第一个元素的 response 参数值; 配置 content|@reverse|0.response,提取 content 数组最后一个元素的 response 参数值。 限制 128 个字符。 |
Token 用量位置 | 配置客户的大模型业务的 token 用量对应的字段,限制 128 个字符,您可以选择三种配置方式: 内置 token 算法:当您选择此方案时,调用 WAF 内置算法计算 token。 单字段:当您选择此方案时,读取每个请求中该字段的值并汇总计算总 token 量值。 多字段:当您选择此方案时,读取每个请求中的请求和响应两个字段的值,并加起来,作为单次请求的总 token 值。 |
优先级 | 配置优先级,优先级逻辑:请输入1-100的整数,数字越小,代表这条规则的执行优先级越高;相同优先级下,更新时间越晚,优先级越高。 |
自定义关键词库配置
大模型防护系统提供预置关键词库,可辅助内容安全引擎完成基础语义检查;若您的业务有特殊词汇需求(如垂直领域术语、动态风险词),可通过上传自定义内容,灵活构建专属关键词库,进一步提升拦截精准度。可以前往 大模型安全页面,单击自定义关键词库配置进行配置。

新建自定义关键词库
1. 在自定义关键词库设置页面,单击新建,您可以构建自定义关键词库。

2. 在新建自定义关键词库窗口中,配置相关参数,单击确定。

字段名称 | 说明 |
词库名称 | 自定义关键词库的名称。 |
描述 | 自定义关键词库的描述。 |
关键词 | 自定义关键词库的关键词。每行仅填写 1个关键词,单次配置最多支持 1000行。 |
导入自定义关键词库
1. 在自定义关键词库设置页面,单击导入数据。

2. 单击下载导入模板,按照模板内的提示配置关键词库相关参数。

字段名称 | 说明 |
词库名称 | 自定义关键词库的名称。 |
描述 | 自定义关键词库的描述。 |
关键词 | 自定义关键词库的关键词。每行仅填写 1个关键词,单次配置最多支持 1000行。 |
3. 单击上传或者将模板文件拖拽到中心区域,单击确定。

导出/删除自定义关键词库
1. 在自定义关键词库设置页面,勾选需要导出或删除的单个或多个关键词库条目。如需批量选择当前列表中的所有关键词库,可直接勾选标题栏的"全选"复选框。
说明:
已被规则引用的自定义关键词库无法进行删除操作。

2. 您可根据实际需求,直接单击批量导出或批量删除执行相应操作;若您有其他需求,也能在更多中选择全部导出或全部删除操作。
