有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

接口说明

对输入文本进行试听,需要试听的音色可以通过接口查询 VirtualmanKey 支持的音色查询,部分形象不支持更换音色。

调用协议

HTTPS + JSON
POST     /v2/ivh/videomaker/broadcastservice/tts
Header   Content-Type: application/json;charset=utf-8

请求参数

参数
类型
必须
说明
TimbreKey
string
音色key,当VirtualmanKey为空时TimbreKey不能为空
VirtualmanKey
string
定义播报的角色、服装、姿态、分辨率等信息,参数为枚举值,当TimbreKey为空时VirtualmanKey不能为空,默认选取匹配该形象的第一个音色制作音频。
InputSsml
string
需要播报的文本内容,支持ssml标签,上限2万字(字数按unicode字符数计算)
Speed
float
语速(1.0为正常语速,范围[0.5-1.5],值为0.5时播报语速最慢,值为1.5时播报语速最快)
AudioStorageS3Url
string
可传入含鉴权s3协议存储url,音频成品会上传至该url
SampleRate
int
采样率,支持24000(24k)和16000(16k),默认24000(24k)
Codec
string
音频格式,支持mp3和wav,默认mp3
SentenceMaxWords
int
分句的字数上限,字数范围 [0,999],传0或不传时默认值30
SentenceDisplayPunctuation
string
分句里需要展示的标点符号,其中,传入特殊字符"0"表示标点符号都不展示,特殊符号"1"(默认取值)表示标点符号全都展示,也可自定义传入需要展示的标点符号
SentenceSplitPunctuation
string
需要断句的标点符号,默认取值。;?!………!?
Volume
int
音量大小,范围[0,10],对应音量大小。默认为0,代表正常音量,值越大音量越高。
EmotionCategory
string
控制合成音频的情感,仅支持多情感音色使用,可选值参考个人资产管理API 4.5音色列表接口。
EmotionIntensity
int
控制合成音频情感程度,取值范围为 [50,200],只有 EmotionCategory 不为空时生效。

返回参数

参数
类型
必须
说明
TaskId
string
音频制作的任务 ID,携带 TaskId 访问<音视频制作进度查询接口>,可获得该视频的制作进度和下载地址。

请求示例

{
"Header": {},
"Payload": {
"VirtualmanKey": "123",
"InputSsml": "你好虚拟主播",
"Speed": 1
}
}

返回示例

{
"Header": {
"Code": 0,
"DialogID": "",
"Message": "",
"RequestID": "123"
},
"Payload": {
"TaskId": "123"
}
}