说话人比对

最近更新时间:2024-03-12 01:09:37

我的收藏

1. 接口描述

接口请求域名: asr.tencentcloudapi.com 。

通过比对两段音频内说话人的声纹,得到一个打分,可通过打分判断两段音频声纹相似度, 打分区间[0 - 100]。 音频要求:16k采样率, 16bit位深,pcm或者wav格式, 单声道,总时长不超过30秒的音频,base64编码数据大小不超过2M,音频内容只有一个说话人声音,并且尽可能清晰,这样结果更加准确。

默认接口请求频率限制:20次/秒。

推荐使用 API Explorer
点击调试
API Explorer 提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力。您可查看每次调用的请求内容和返回结果以及自动生成 SDK 调用示例。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:VoicePrintCompare。
Version String 公共参数,本接口取值:2019-06-14。
Region String 公共参数,此参数为可选参数。
VoiceFormat Integer 音频格式 0: pcm, 1: wav;pcm和wav音频无损压缩,识别准确度更高
示例值:0
SampleRate Integer 音频采样率,目前仅支持16k,请填写16000
示例值:16000
SrcAudioData String 对比源音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M
DestAudioData String 对比目标音频数据, 音频要求:base64 编码,16k采样率, 16bit位深,pcm或者wav格式, 单声道,音频时长不超过30秒的音频,base64编码数据大小不超过2M

3. 输出参数

参数名称 类型 描述
Data VoicePrintCompareData 音频声纹比对结果,包含相似度打分
RequestId String 唯一请求 ID,由服务端生成,每次请求都会返回(若请求因其他原因未能抵达服务端,则该次请求不会获得 RequestId)。定位问题时需要提供该次请求的 RequestId。

4. 示例

示例1 音频声纹比对

比对两段音频的声纹相似度

输入示例

POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json
X-TC-Action: VoicePrintCompare
<公共请求参数>

{
    "VoiceFormat": 0,
    "SampleRate": 16000,
    "SrcAudioData": "AAAAADADAAAAA",
    "DestAudioData": "AAAAADADAAAAA"
}

输出示例

{
    "Response": {
        "Data": {
            "Score": "100.0",
            "Decision": "1"
        },
        "RequestId": "dsadasdasdasdasad"
    }
}

5. 开发者资源

腾讯云 API 平台

腾讯云 API 平台 是综合 API 文档、错误码、API Explorer 及 SDK 等资源的统一查询平台,方便您从同一入口查询及使用腾讯云提供的所有 API 服务。

API Inspector

用户可通过 API Inspector 查看控制台每一步操作关联的 API 调用情况,并自动生成各语言版本的 API 代码,也可前往 API Explorer 进行在线调试。

SDK

云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

命令行工具

6. 错误码

以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

错误码 描述
InternalError 内部错误。
InternalError.VoicePrintAudioFailed 说话人音频处理失败
InternalError.VoicePrintDecodeFailed 传入音频解码失败
InternalError.VoicePrintVerifyFailed 说话人验证失败
InvalidParameter 参数错误。
InvalidParameter.InvalidParameter 参数错误。
InvalidParameterValue.ErrorInvalidVoicedata 音频数据无效。
InvalidParameterValue.NoHumanVoice 音频内容没有人声或有效人声小于1秒