实时音视频内容理解策略配置

策略配置决定内容理解的精准度和有效性。本文档详细介绍各策略配置的含义和方法。
配置入口
1. 登录腾讯云 实时音视频 TRTC 控制台。
2. 在左侧导航栏选择应用管理，选择需要配置的应用，单击其右侧操作栏配置，进入该应用的配置页面。
﻿
﻿
﻿
3. 在功能配置页面的左侧导航栏，选择内容理解，点击开通内容理解功能，进入内容理解策略配置页。
﻿
﻿
﻿
4. 请先确保您已 开启内容理解功能位开关 ，并打开内容理解配置开关。仅当内容理解功能位开关和内容理解配置开关同时打开时，内容理解功能为可用状态。
﻿
﻿
﻿
配置策略
每个应用（SDKAppID）下固定包含且仅包含两套内容理解策略：
1. 画面内容理解策略：对实时音视频场景下的画面进行识别与处置；
2. 音频内容理解策略：对实时音视频场景下的音频进行识别与处置。
﻿
说明：
每套策略对应一个 BizType，BizType 就是该套策略的唯一 ID，用户无法新增或删除；服务端 API 调用时，通过传入 BizType 指定本次任务命中画面策略还是音频策略，并使用对应的识别标签与关联词库。
画面内容理解策略
画面内容理解策略配置页面包括4部分内容：
1. 识别内容配置开关
画面文本及二维码识别：开启后可识别画面中的文本内容和二维码信息。
广告内容识别：开启后可识别画面中的广告内容。
﻿
﻿
﻿
2. 画面识别策略配置
包括画面图片识别策略配置和画面文本识别策略配置，覆盖性感、色情、暴恐、违法、广告、二维码等几大风险维度，每个大类下涵盖多个可识别内容，详见控制台画面理解策略配置页，点击展开详情查看。
﻿
﻿
﻿
3. 图片截帧间隔
支持设置1~60秒的图片截帧间隔（以秒为单位），可灵活平衡违规识别精度与调用成本。
﻿
﻿
﻿
4. ﻿关联自定义库配置﻿
音频内容理解策略
音频内容理解策略配置页面包括4部分内容：
1. 娇喘识别策略配置
支持低俗语音识别。
﻿
﻿
﻿
2. 音频文本识别策略配置
覆盖色情、暴恐、违法、辱骂、广告等六大风险维度，每个大类下涵盖多个可识别内容，详见控制台音频文本识别策略配置页，点击展开详情查看。
﻿
﻿
﻿
3. 音频切片时长
支持设置 5~60 秒的音频切片时长（以秒为单位），可灵活平衡违规识别精度与调用成本。
﻿
﻿
﻿
4. ﻿关联自定义库配置﻿
关联自定义库配置
自定义词库
内容理解支持自定义关键词词库，用于命中业务专属的敏感词、品牌禁用词、竞对名等。词库支持编辑与多词库管理，帮助您定义业务自己的内容理解规则。
编辑词库
支持自定义词库名称，可选择“违规”或“疑似”两种处理方式，匹配模式分为模糊匹配和精准匹配两种，可按需选择。模糊匹配可检测拆分字、形似字、音似字、简繁体、大小写、大写数字等变体形式；精准匹配为1:1文本匹配，仅命中与词库内容完全一致的文本。
﻿
﻿
﻿
管理词库
支持“添加关键词”、“单条删除”和“批量删除”，可通过搜索框快速定位目标关键词。
点击“添加关键词”，会跳出配置弹窗，支持输入上传和文件上传两种关键词添加方式，具体信息见下表。
 添加方式
输入上传
文件上传
操作方式
直接在文本框粘贴关键词，用换行分隔。
上传本地 .txt 文件（关键词以换行分隔）。
单次导入上限
最多 2000 个关键词。
最多 2000 个关键词（文件大小≤2MB）。
适用场景
快速添加少量 / 零散关键词，或临时修改词库。
大规模词库批量导入，一次性完成全量配置。
便捷性
无需准备文件，复制粘贴即可，适合快速调试。
需提前按格式整理文件，适合固定词库的批量配置。
格式要求
关键词间用换行分隔，单个词≤20 个汉字。
文件为 .txt 格式，关键词间用换行分隔，单个词≤20 个汉字。
﻿
﻿
﻿

添加方式	输入上传	文件上传
操作方式	直接在文本框粘贴关键词，用换行分隔。	上传本地 .txt 文件（关键词以换行分隔）。
单次导入上限	最多 2000 个关键词。	最多 2000 个关键词（文件大小≤2MB）。
适用场景	快速添加少量 / 零散关键词，或临时修改词库。	大规模词库批量导入，一次性完成全量配置。
便捷性	无需准备文件，复制粘贴即可，适合快速调试。	需提前按格式整理文件，适合固定词库的批量配置。
格式要求	关键词间用换行分隔，单个词≤20 个汉字。	文件为 .txt 格式，关键词间用换行分隔，单个词≤20 个汉字。

内容理解策略配置

本页目录：

配置入口

配置策略

画面内容理解策略

音频内容理解策略

关联自定义库配置

自定义词库

编辑词库

管理词库