说话人认证

最近更新时间:2024-07-11 01:08:11

我的收藏

1. 接口描述

接口请求域名: asr.tencentcloudapi.com 。

本接口用于校验传入音频与已注册音频的匹配程度,通过指定说话人ID(VoicePrintId)和一段音频进行音频和说话人的匹配度判断

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:VoicePrintVerify。
Version String 公共参数,本接口取值:2019-06-14。
Region String 公共参数,此参数为可选参数。
VoiceFormat Integer 音频格式 0: pcm, 1: wav
示例值:0
SampleRate Integer 音频采样率,目前支持16000,单位:Hz,必填
示例值:16000
Data String 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
VoicePrintId String 说话人id, 说话人唯一标识
示例值:dasdagfdgddsdsada

3. 输出参数

参数名称 类型 描述
Data VoicePrintVerifyData 说话人验证数据
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 说话人验证

验证音频和说话人id是否一致

输入示例

POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: VoicePrintVerify
<公共请求参数>

{
    "VoiceFormat": 0,
    "SampleRate": 16000,
    "VoicePrintId": "KJHGUGKGGGFGYFVDA",
    "Data": "UklGRiRTBwBXQVZFZm10IBAA"
}

输出示例

{
    "Response": {
        "Data": {
            "VoicePrintId": "KJHGUGKGGGFGYFVDA",
            "Score": "60.0",
            "Decision": 1
        },
        "RequestId": "abc"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
FailedOperation.NotExistentVoicePrintId 不存在的说话人id
FailedOperation.UserHasNoFreeAmount 资源包耗尽,请开通后付费或者购买资源包
InternalError 内部错误。
InternalError.ErrorGetRoute 获取路由失败。
InternalError.ErrorRecognize 识别失败。
InternalError.FailAccessDatabase 访问数据库失败。
InternalError.FailedVoicePrintDecode 说话人音频解码失败
InternalError.FailedVoicePrintVerify 说话人验证接口失败
InternalError.VoicePrintAudioFailed 说话人音频处理失败
InternalError.VoicePrintDecodeFailed 传入音频解码失败
InternalError.VoicePrintEnrollFailed 说话人ID注册失败
InternalError.VoicePrintVerifyFailed 说话人验证失败
InvalidParameter 参数错误。
InvalidParameterValue 参数取值错误。
InvalidParameterValue.ErrorVoicedataTooLong 音频时长超过限制。
InvalidParameterValue.NoHumanVoice 音频内容没有人声或有效人声小于1秒