敏感词识别

最近更新时间:2019-07-12 11:20:58

1. 接口描述

接口请求域名: nlp.tencentcloudapi.com 。

敏感词识别接口能够识别出文本中的所有敏感词,帮助用户及时、精准地防范违规风险,广泛用于各种高危涉敏场景(如资讯、评论、聊天室)的敏感信息过滤。

该功能基于10万级大规模敏感词库,结合多种文本对抗方法、政策权威指令等,高效识别敏感词及其各类变种。同时我们会根据大规模语料和实时反误杀系统,不断更新迭代,确保效果持续提升。

目前能够支持对政治、色情、辱骂/低俗、暴恐/毒品、广告/灌水、迷信/邪教、其他违法、综合等8大类敏感信息的识别。

默认接口请求频率限制:20次/秒。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:SensitiveWordsRecognition
Version String 公共参数,本接口取值:2019-04-08
Region String 公共参数,详见产品支持的 地域列表
Text String 待识别的文本(仅支持UTF-8格式,不超过2000字)

3. 输出参数

参数名称 类型 描述
SensitiveWords Array of String 敏感词数组
RequestId String 唯一请求 ID,每次请求都会返回。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 敏感词识别示例

输入示例

https://nlp.tencentcloudapi.com/?Action=SensitiveWordsRecognition
&Text="敏感词识别接口能够识别出文本中的高危敏感词,如:[敏感词A]、[敏感词B]"
&<公共请求参数>

输出示例

{
  "Response": {
    "RequestId": "8dd99adb-5144-43ca-8213-f6a929ce5075",
    "SensitiveWords": [
      "敏感词A",
      "敏感词B"
    ]
  }
}

5. 开发者资源

API Explorer

该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
InternalError.ExternalServiceError 外部服务调用失败
InvalidParameterValue.EmptyValueError 参数空值错误
InvalidParameterValue.TextEncodeError 文本编码错误,不符合utf-8
InvalidParameterValue.TextTooLong 输入文本超出长度限制
ResourceInsufficient.QuotaRunOut 额度用尽,请充值后重试