文本分类

最近更新时间:2019-07-25 20:37:17

1. 接口描述

接口请求域名: nlp.tencentcloudapi.com 。

文本分类接口能够对用户输入的文本进行自动分类,将其映射到具体的类目上,用户只需要提供待分类的文本,而无需关注具体实现。

该功能基于基于千亿级大规模互联网语料和LSTM、BERT等深度神经网络模型进行训练,并持续迭代更新,以保证效果不断提升。

目前已提供:

  • 通用领域分类体系,包括15个分类类目,分别是汽车、科技、健康、体育、旅行、教育、职业、文化、军事、房产、娱乐、女性、奥运、财经以及其他,适用于通用的场景。

  • 新闻领域分类体系,包括37个一级分类类目,285个二级分类,已应用于腾讯新闻的文章分类。

更多垂直领域的分类体系即将推出,敬请期待。

默认接口请求频率限制:20次/秒。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:TextClassification
Version String 公共参数,本接口取值:2019-04-08
Region String 公共参数,详见产品支持的 地域列表
Text String 待分类的文本(仅支持UTF-8格式,不超过2000字)
Flag Integer 领域分类体系(默认取1值):
1、通用领域
2、新闻领域

3. 输出参数

参数名称 类型 描述
Classes Array of ClassificationResult 文本分类结果(文本分类映射表请参见附录)
RequestId String 唯一请求 ID,每次请求都会返回。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 文本分类示例

输入示例

https://nlp.tencentcloudapi.com/?Action=TextClassification
&Text="为迎接下周的比赛,今日巴萨队又开始了集训。"
&Flag=2
&<公共请求参数>

输出示例

{
  "Response": {
    "RequestId": "8dd99adb-5144-43ca-8213-f6a929ce5075",
    "Classes": [
      {
        "FirstClassName": "体育",
        "FirstClassProbability": null,
        "SecondClassName": "西甲",
        "SecondClassProbability": null
      }
    ]
  }
}

5. 开发者资源

API Explorer

该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
InvalidParameterValue.EmptyValueError 参数空值错误
InvalidParameterValue.TextEncodeError 文本编码错误,不符合utf-8
InvalidParameterValue.TextTooLong 输入文本超出长度限制
InvalidParameterValue.ValueRangeError 参数取值范围错误
ResourceInsufficient.QuotaRunOut 额度用尽,请充值后重试