可以直接调用文本内容检测(TextModeration)接口,对论坛评论区内容(例如购物网站评论、社区回帖、视频评论区等)进行识别。
说明:
请在调用前确保目前账号至少拥有文本内容安全服务的访问权限,有关权限配置的相关信息,敬请参阅 CAM 授权指引 文档。
若无法访问文本内容安全服务,则请开通服务/检查计费信息(主账号),或向管理员或主账号申请相应权限(子账号/协作者账号)。
步骤一:配置任务策略(可选)
建议您使用配置任务策略,可根据业务需求配置识别策略,用于个性化服务体验。
说明:
腾讯云内容安全服务已预设有默认策略,如使用默认策略,可略过此步骤。
默认策略为天御多行业模型沉淀的策略配置,适用于大部分的内容安全需求。
前提条件
已获取腾讯云主账号或子账号。
登录账号已拥有文本内容安全服务的读写权限。
登录账号已开通文本内容安全服务。
操作步骤
1. 登录 内容安全控制台,在概览页单击应用管理 > 新增应用,新增需要配置文本内容安全管理的应用。

2. 在应用管理页面,单击新增应用,输入应用名称,单击保存完成应用创建。

3. 在应用管理页面,选择刚创建的应用,单击场景管理。

4. 在场景管理页面,单击新建场景,输入场景名称、选择行业分类、选择文本内容安全,单击保存即可完成场景创建。

参数名称 | 描述 |
场景名称 | 场景的文字描述,可使用中文、英文、数字及下划线组合,长度不超过20个字符 |
行业分类 | 策略涉及的行业场景分类 |
关联审核服务 | 选择场景需要关联的审核服务 |
5. 场景创建完成,开始配置场景策略,单击配置 > 文本内容安全。

6. 在策略详情页面会显示当前系统默认策略,如需更改,单击编辑,即可修改当前策略。

参数名称 | 描述 |
识别策略配置 | 根据业务需求,选择是否需要识别不同类型的识别内容。 |
关联自定义库 |
7. 完成后单击确认,完成策略配置。
步骤二:配置自定义词库(可选)
自定义词库用于添加个性化的识别词库,识别图片上是否含有违规文本。
说明
如无需配置自定义词库,可略过此步骤。
前提条件
已获取腾讯云主账号或子账号。
登录账号已拥有文本内容安全服务的读写权限。
登录账号已开通文本内容安全服务。
操作步骤
1. 登录 内容安全控制台,在左侧导航栏中,选择名单管理 > 关键词名单 > 自定义名单。
2. 在自定义名单页面,单击新建词库,填写文本库名称。


参数名称 | 描述 |
文本库名称 | 词库的文字描述,可使用中文、英文、数字及下划线组合,长度不超过32个字符。 |
处理建议 | 可选择违规、疑似、放过。 违规:确认为不良信息。 疑似:可能为不良信息,需要人工识别。 放过:业务方认为的正常信息。 |
匹配模式 | 可选择精确匹配或模糊匹配。 精确匹配:对输入文本进行匹配,匹配对象需完全一致。 模糊匹配:可检测变体后的输入词,支持拆分字、形似字、音似字、简繁体、大小写、大写数字等形式的相似词进行匹配。 |
3. 单击确定,即可创建自定义词库。
4. 在自定义词库页面下方的列表中,将显示刚创建的词库。说明自定义词库的不同颜色代表不同的屏蔽逻辑,红色代表违规,橙色代表疑似。
说明
自定义词库的不同颜色代表不同的屏蔽逻辑,红色代表违规,橙色代表疑似,绿色代表通过。

5. 在自定义名单页面,选择需要批量导入关键词的词库,单击管理。

6. 在编辑词库页面,单击添加关键词,输入关键词,单击确定,即可保存关键词至当前词库。

参数名称 | 描述 |
处理建议 | 识别模型对应的违规类型。 |
关键词 | 单个关键词以换行来确定,长度在20个汉字或字母以内。 支持以复制粘贴的方式批量导入,单次最多添加关键词2000个,词与词之间用换行符分隔。 关键词添加个数上限为10000个。 如需添加组合词,选择关键词类型:组合词,使用&符号对两个或者多个词进行连接,添加格式为“关键词1&关键词2...”,其中关键词只支持纯中文,这些关键词同时出现时则会命中。 |
步骤三:创建任务及获取识别结果
在完成以上步骤后,可以调用文本内容检测(TextModeration)接口创建评论内容识别任务,具体方法如下:
确保您的待识别文本内容符合接口传入的 文件格式要求。
参考接口的 接口文档说明,填入相应的输入参数。
说明