有奖捉虫:行业应用 & 管理与支持文档专题 HOT

AsyncRecognitionTaskInfo

音频流异步识别任务信息

被如下接口引用:DescribeAsyncRecognitionTasks。

名称 类型 描述
TaskId Integer 任务ID
Url String 音频流Url

AsyncRecognitionTasks

音频流异步识别任务列表

被如下接口引用:DescribeAsyncRecognitionTasks。

名称 类型 描述
Tasks Array of AsyncRecognitionTaskInfo 任务列表
注意:此字段可能返回 null,表示取不到有效值。

HotWord

热词的词和权重

被如下接口引用:CreateAsrVocab, GetAsrVocab, GetAsrVocabList, UpdateAsrVocab。

名称 类型 必选 描述
Word String 热词
注意:此字段可能返回 null,表示取不到有效值。
Weight Integer 权重
注意:此字段可能返回 null,表示取不到有效值。

Model

自学习模型信息

被如下接口引用:GetCustomizationList, GetModelInfo。

名称 类型 描述
ModelName String 模型名称
DictName String 模型文件名称
ModelId String 模型Id
ModelType String 模型类型,“8k”或者”16k“
ServiceType String 服务类型
ModelState Integer 模型状态:
-2:模型训练失败;
-1:已下线;
0:训练中;
1:已上线;
3:上线中;
4:下线中;
AtUpdated String 最后更新时间
TagInfos Array of String 标签信息
注意:此字段可能返回 null,表示取不到有效值。

SentenceDetail

单句的详细识别结果,包含单个词的时间偏移,一般用于生成字幕的场景。

被如下接口引用:DescribeTaskStatus。

名称 类型 描述
FinalSentence String 单句最终识别结果
注意:此字段可能返回 null,表示取不到有效值。
示例值:你好,测试
SliceSentence String 单句中间识别结果,使用空格拆分为多个词
注意:此字段可能返回 null,表示取不到有效值。
示例值:你好 测试
WrittenText String 口语转书面语结果,开启改功能才有值
注意:此字段可能返回 null,表示取不到有效值。
StartMs Integer 单句开始时间(毫秒)
注意:此字段可能返回 null,表示取不到有效值。
示例值:0
EndMs Integer 单句结束时间(毫秒)
注意:此字段可能返回 null,表示取不到有效值。
示例值:2000
WordsNum Integer 单句中词个数
注意:此字段可能返回 null,表示取不到有效值。
示例值:4
Words Array of SentenceWords 单句中词详情
注意:此字段可能返回 null,表示取不到有效值。
示例值:[{"OffsetStartMs": 120}]
SpeechSpeed Float 单句语速,单位:字数/秒
注意:此字段可能返回 null,表示取不到有效值。
示例值:5.9
SpeakerId Integer 声道或说话人 Id(请求中如果设置了 speaker_diarization或者ChannelNum为双声道,可区分说话人或声道)
注意:此字段可能返回 null,表示取不到有效值。
示例值:0
EmotionalEnergy Float 情绪能量值,取值为音量分贝值/10。取值范围:[1,10]。值越高情绪越强烈。
注意:此字段可能返回 null,表示取不到有效值。
示例值:0
SilenceTime Integer 本句与上一句之间的静音时长
注意:此字段可能返回 null,表示取不到有效值。
示例值:0
EmotionType Array of String 情绪类型(可能为空)
注意:此字段可能返回 null,表示取不到有效值。
示例值:happy

SentenceWord

一句话识别返回的词时间戳

被如下接口引用:SentenceRecognition。

名称 类型 描述
Word String 词结果
StartTime Integer 词在音频中的开始时间
EndTime Integer 词在音频中的结束时间

SentenceWords

识别结果中词文本,以及对应时间偏移

被如下接口引用:DescribeTaskStatus。

名称 类型 描述
Word String 词文本
注意:此字段可能返回 null,表示取不到有效值。
OffsetStartMs Integer 在句子中的开始时间偏移量
注意:此字段可能返回 null,表示取不到有效值。
OffsetEndMs Integer 在句子中的结束时间偏移量
注意:此字段可能返回 null,表示取不到有效值。

Task

录音文件识别实时语音异步识别请求的返回数据

被如下接口引用:CreateAsyncRecognitionTask, CreateRecTask。

名称 类型 描述
TaskId Integer 任务ID,可通过此ID在轮询接口获取识别状态与结果。注意:TaskId数据类型为uint64
示例值:400000000

TaskStatus

获取录音识别结果的返回参数

被如下接口引用:DescribeTaskStatus。

名称 类型 描述
TaskId Integer 任务标识。注意:TaskId数据类型为uint64。
示例值:123
Status Integer 任务状态码,0:任务等待,1:任务执行中,2:任务成功,3:任务失败。
示例值:0
StatusStr String 任务状态,waiting:任务等待,doing:任务执行中,success:任务成功,failed:任务失败。
示例值:waiting
Result String 识别结果。
ErrorMsg String 失败原因说明。
ResultDetail Array of SentenceDetail 识别结果详情,包含每个句子中的词时间偏移,一般用于生成字幕的场景。(录音识别请求中ResTextFormat=1时该字段不为空)
注意:此字段可能返回 null,表示取不到有效值。
AudioDuration Float 音频时长(秒)。
注意:此字段可能返回 null,表示取不到有效值。
示例值:1.2

Vocab

词表内容

被如下接口引用:GetAsrVocabList。

名称 类型 描述
Name String 热词表名称
Description String 热词表描述
VocabId String 热词表ID
WordWeights Array of HotWord 词权重列表
CreateTime Timestamp ISO8601 词表创建时间
UpdateTime Timestamp ISO8601 词表更新时间
State Integer 热词表状态,1为默认状态即在识别时默认加载该热词表进行识别,0为初始状态
TagInfos Array of String 标签数组
注意:此字段可能返回 null,表示取不到有效值。

VoicePrintBaseData

说话人基础数据,包括说话人id和说话人昵称

被如下接口引用:VoicePrintDelete, VoicePrintEnroll, VoicePrintUpdate。

名称 类型 描述
VoicePrintId String 说话人id
注意:此字段可能返回 null,表示取不到有效值。
SpeakerNick String 说话人昵称
注意:此字段可能返回 null,表示取不到有效值。

VoicePrintCompareData

音频声纹比对结果,包含比对分数

被如下接口引用:VoicePrintCompare。

名称 类型 描述
Score String 匹配度 取值范围(0.0 - 100.0)
注意:此字段可能返回 null,表示取不到有效值。
示例值:100.0
Decision Integer 验证结果 0: 未通过 1: 通过
注意:此字段可能返回 null,表示取不到有效值。
示例值:0

VoicePrintCountData

统计返回说话人注册数量

被如下接口引用:VoicePrintCount。

名称 类型 描述
Total Integer 总数
注意:此字段可能返回 null,表示取不到有效值。
示例值:0

VoicePrintVerifyData

说话人验证数据

被如下接口引用:VoicePrintVerify。

名称 类型 描述
VoicePrintId String 说话人id
注意:此字段可能返回 null,表示取不到有效值。
Score String 匹配度 取值范围(0.0 - 100.0)
注意:此字段可能返回 null,表示取不到有效值。
Decision Integer 验证结果 0: 未通过 1: 通过
注意:此字段可能返回 null,表示取不到有效值。