说话人验证1:N

最近更新时间:2024-06-25 01:07:57

我的收藏

1. 接口描述

接口请求域名: asr.tencentcloudapi.com 。

说话人验证1:N接口,可以通过传入一段说话人音频,并且指定已存在的groupId, 和返回topN, 接口返回groupId内所有声纹和传入音频声纹比对打分TopN的结果。

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:VoicePrintGroupVerify。
Version String 公共参数,本接口取值:2019-06-14。
Region String 公共参数,此参数为可选参数。
VoiceFormat Integer 音频格式 0: pcm, 1: wav
示例值:0
SampleRate Integer 音频采样率,目前支持16000,单位:Hz,必填
示例值:16000
Data String 音频数据, base64 编码, 音频时长不能超过30s,数据大小不超过2M
GroupId String 分组id, 支持数字,字母,下划线,长度不超过128
示例值:test_group
TopN Integer 返回打分结果降序排列topN, TopN大于0, 小于可创建声纹最大数量
示例值:1

3. 输出参数

参数名称 类型 描述
Data VerifyTopResult TopN 返回结果;系统建议打分70分以上为同一个人音色,评分也取决于音频质量、长度等其他原因影响,您可以按照业务需求适当提高或降低分数要求
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 说话人验证1:N

提供一段音频数据和提前注册的一组说话人数据进行比对, 返回topN

输入示例

POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: VoicePrintGroupVerify
<公共请求参数>

{
    "VoiceFormat": 1,
    "SampleRate": 16000,
    "Data": "UklGRsb7AQBXQVZFZm10IBAAAAAB",
    "GroupId": "test",
    "TopN": 2
}

输出示例

{
    "Response": {
        "Data": {
            "VerifyTops": [
                {
                    "Score": "100.0",
                    "SpeakerId": "张三",
                    "VoicePrintId": "03c7c4-34e1-4cc2-97d4-f031bc6538d0"
                },
                {
                    "Score": "89.0",
                    "SpeakerId": "李四",
                    "VoicePrintId": "16a936-c0c9-44b8-81e6-19515a9515ef"
                }
            ]
        },
        "RequestId": "affe4cc1-7158-ad-aefc-371fce09c092"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
FailedOperation.UserHasNoFreeAmount 资源包耗尽,请开通后付费或者购买资源包
InternalError 内部错误。
InternalError.FailAccessDatabase 访问数据库失败。
InternalError.FailedVoicePrintDecode 说话人音频解码失败
InternalError.FailedVoicePrintVerify 说话人验证接口失败
InternalError.VoicePrintAudioFailed 说话人音频处理失败
InternalError.VoicePrintDecodeFailed 传入音频解码失败
InternalError.VoicePrintVerifyFailed 说话人验证失败
InvalidParameter 参数错误。
InvalidParameter.FailedVoicePrintDecode 音频解码失败,请检查音频格式是否正确
InvalidParameter.InvalidParameter 参数错误。
InvalidParameterValue 参数取值错误。
InvalidParameterValue.ErrorVoicedataTooLong 音频时长超过限制。
InvalidParameterValue.NoHumanVoice 音频内容没有人声或有效人声小于1秒