内容理解策略配置

最近更新时间:2026-06-11 09:16:31

我的收藏
策略配置决定内容理解的精准度和有效性。本文档详细介绍各策略配置的含义和方法。

配置入口

1. 登录腾讯云 实时音视频 TRTC 控制台
2. 在左侧导航栏选择应用管理,选择需要配置的应用,单击其右侧操作栏配置,进入该应用的配置页面



3. 在功能配置页面的左侧导航栏,选择内容理解,点击开通内容理解功能,进入内容理解策略配置页



4. 请先确保您已 开启内容理解功能位开关 ,并打开内容理解配置开关。仅当内容理解功能位开关和内容理解配置开关同时打开时,内容理解功能为可用状态。




配置策略

每个应用(SDKAppID)下固定包含且仅包含两套内容理解策略:
1. 画面内容理解策略:对实时音视频场景下的画面进行识别与处置;
2. 音频内容理解策略:对实时音视频场景下的音频进行识别与处置。

说明:
每套策略对应一个 BizType,BizType 就是该套策略的唯一 ID,用户无法新增或删除;服务端 API 调用时,通过传入 BizType 指定本次任务命中画面策略还是音频策略,并使用对应的识别标签与关联词库。

画面内容理解策略

画面内容理解策略配置页面包括4部分内容:
1. 识别内容配置开关
画面文本及二维码识别:开启后可识别画面中的文本内容和二维码信息。
广告内容识别:开启后可识别画面中的广告内容。



2. 画面识别策略配置
包括画面图片识别策略配置和画面文本识别策略配置,覆盖性感、色情、暴恐、违法、广告、二维码等几大风险维度,每个大类下涵盖多个可识别内容,详见控制台画面理解策略配置页,点击展开详情查看。



3. 图片截帧间隔
支持设置1~60秒的图片截帧间隔(以秒为单位),可灵活平衡违规识别精度与调用成本。




音频内容理解策略

音频内容理解策略配置页面包括4部分内容:
1. 娇喘识别策略配置
支持低俗语音识别。



2. 音频文本识别策略配置
覆盖色情、暴恐、违法、辱骂、广告等六大风险维度,每个大类下涵盖多个可识别内容,详见控制台音频文本识别策略配置页,点击展开详情查看。



3. 音频切片时长
支持设置 5~60 秒的音频切片时长(以秒为单位),可灵活平衡违规识别精度与调用成本。




关联自定义库配置

自定义词库

内容理解支持自定义关键词词库,用于命中业务专属的敏感词、品牌禁用词、竞对名等。词库支持编辑与多词库管理,帮助您定义业务自己的内容理解规则。

编辑词库

支持自定义词库名称,可选择“违规”或“疑似”两种处理方式,匹配模式分为模糊匹配精准匹配两种,可按需选择。模糊匹配可检测拆分字、形似字、音似字、简繁体、大小写、大写数字等变体形式;精准匹配为1:1文本匹配,仅命中与词库内容完全一致的文本。




管理词库

支持“添加关键词”、“单条删除”和“批量删除”,可通过搜索框快速定位目标关键词。
点击“添加关键词”,会跳出配置弹窗,支持输入上传和文件上传两种关键词添加方式,具体信息见下表。
添加方式
输入上传
文件上传
操作方式
直接在文本框粘贴关键词,用换行分隔。
上传本地 .txt 文件(关键词以换行分隔)。
单次导入上限
最多 2000 个关键词。
最多 2000 个关键词(文件大小≤2MB)。
适用场景
快速添加少量 / 零散关键词,或临时修改词库。
大规模词库批量导入,一次性完成全量配置。
便捷性
无需准备文件,复制粘贴即可,适合快速调试。
需提前按格式整理文件,适合固定词库的批量配置。
格式要求
关键词间用换行分隔,单个词≤20 个汉字。
文件为 .txt 格式,关键词间用换行分隔,单个词≤20 个汉字。