语音翻译

最近更新时间:2019-07-24 15:40:47

1. 接口描述

接口请求域名: tmt.tencentcloudapi.com 。

本接口提供音频内文字识别 + 翻译功能,目前开放中到英的语音翻译服务。 待识别和翻译的音频文件可以是 pcm、mp3、amr和speex 格式,音频内语音清晰,采用流式传输和翻译的方式。
提示:对于一般开发者,我们建议优先使用SDK接入简化开发。SDK使用介绍请直接查看 5. 开发者资源 部分。

默认接口请求频率限制:5次/秒。

注意:本接口支持金融区地域。由于金融区和非金融区是隔离不互通的,因此当公共参数 Region 为金融区地域(例如 ap-shanghai-fsi)时,需要同时指定带金融区地域的域名,最好和 Region 的地域保持一致,例如:tmt.ap-shanghai-fsi.tencentcloudapi.com。

2. 输入参数

以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见 公共请求参数

参数名称 必选 类型 描述
Action String 公共参数,本接口取值:SpeechTranslate
Version String 公共参数,本接口取值:2018-03-21
Region String 公共参数,详见产品支持的 地域列表
SessionUuid String 一段完整的语音对应一个SessionUuid
Source String 音频中的语言类型,支持语言列表
  • zh : 中文
  • en : 英文
  • Target String 翻译目标语⾔言类型 ,支持的语言列表
  • zh : 中文
  • en : 英文
  • AudioFormat Integer pcm : 146 amr : 33554432 mp3 : 83886080
    Seq Integer 语音分片的序号,从0开始
    IsEnd Integer 是否最后一片语音分片,0-否,1-是
    Data String 语音分片内容的base64字符串,音频内容应含有效并可识别的文本
    ProjectId Integer 项目ID,可以根据控制台-账号中心-项目管理中的配置填写,如无配置请填写默认项目ID:0
    Mode String 识别模式,该参数已废弃

    3. 输出参数

    参数名称 类型 描述
    SessionUuid String 请求的SessionUuid直接返回
    RecognizeStatus Integer 语音识别状态 1-进行中 0-完成
    SourceText String 识别出的源文
    TargetText String 翻译出的译文
    Seq Integer 第几个语音分片
    Source String 源语言
    Target String 目标语言
    VadSeq Integer 当请求的Mode参数填写bvad是,启动VadSeq。此时Seq会被设置为后台vad(静音检测)后的新序号,而VadSeq代表客户端原始Seq值
    RequestId String 唯一请求 ID,每次请求都会返回。定位问题时需要提供该次请求的 RequestId。

    4. 示例

    示例1 API调用

    输入示例

    https://tmt.tencentcloudapi.com/?Action=SpeechTranslate
    &ProjectId=0
    &SessionUuid=sid-1516105689129
    &Source=zh
    &Target=en
    &AudioFormat=83886080
    &Seq=0
    &IsEnd=1
    &Data==%2F%2FtQxAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
    ......
    MGCwUAU4UeWgJDOGmC2JgzouqHJQBsZiKUicVTU5UGTZ6mVJYlri5s9geZdCjBnExqtEsaw%2F5rtShQ6UOkolgkGSpWK
    &<公共请求参数>

    输出示例

    {
      "Response": {
        "RecognizeStatus": 0,
        "RequestId": "6e698139-615a-4d42-8dea-6bfada24e83c",
        "Seq": 0,
        "SessionUuid": "sid-1516105689129",
        "Source": "zh",
        "SourceText": "你好。",
        "Target": "en",
        "TargetText": "Hello."
      }
    }

    5. 开发者资源

    API Explorer

    该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用。

    SDK

    云 API 3.0 提供了配套的开发工具集(SDK),支持多种编程语言,能更方便的调用 API。

    命令行工具

    6. 错误码

    以下仅列出了接口业务逻辑相关的错误码,其他错误码详见 公共错误码

    错误码 描述
    FailedOperation.NoFreeAmount 本月免费额度已用完,如需继续使用您可以在机器翻译控制台升级为付费使用。
    FailedOperation.ServiceIsolate 账号因为欠费停止服务,请在腾讯云账户充值。
    FailedOperation.UserNotRegistered 服务未开通,请在腾讯云官网机器翻译控制台开通服务。
    InternalError 内部错误。
    InternalError.BackendTimeout 后台服务超时,请稍后重试。
    InternalError.ErrorUnknown 未知错误。
    InvalidParameter 参数错误。
    InvalidParameter.DuplicatedSessionIdAndSeq 重复的SessionUuid和Seq组合。
    InvalidParameter.SeqIntervalTooLarge Seq之间的间隙请不要大于2000。
    LimitExceeded 超过配额限制。
    MissingParameter 缺少参数错误。
    UnauthorizedOperation.ActionNotFound 请填写正确的Action字段名称。
    UnsupportedOperation 操作不支持。
    UnsupportedOperation.TextTooLong 单次请求text超过⻓长度限制,请保证单次请求⻓长度低于2000。
    UnsupportedOperation.UnSupportedTargetLanguage 不支持的目标语言,请参照语言列表。
    UnsupportedOperation.UnsupportedLanguage 不支持的语言,请参照语言列表。
    UnsupportedOperation.UnsupportedSourceLanguage 不支持的源语言,请参照语言列表。