数据结构

最近更新时间:2024-11-13 02:01:44

我的收藏

Keyword

评测关键词

被如下接口引用:KeywordEvaluate。

名称 类型 必选 描述
RefText String 被评估语音对应的文本,句子模式下不超过 20个单词或者中文文字,段落模式不超过 120个单词或者中文文字,中文文字需使用 utf-8 编码,自由说模式RefText可以不填。如需要在单词模式和句子模式下使用自定义音素,可以通过设置 TextMode 使用音素标注
示例值:hello
EvalMode Integer 评估模式,0:词模式(中文评测模式下为文字模式),1:句子模式,2:段落模式,3:自由说模式,当为词模式评估时,能够提供每个音节的评估信息,当为句子模式时,能够提供完整度和流利度信息。
示例值:Null
ScoreCoeff Float 评价苛刻指数,取值为[1.0 - 4.0]范围内的浮点数,用于平滑不同年龄段的分数,1.0为小年龄段,4.0为最高年龄段
示例值:1
ServerType Integer 评估语言,0:英文,1:中文。
ServerType不填默认为0
示例值:0
TextMode Integer 输入文本模式,0: 普通文本,1:音素结构文本。
示例值:0

KeywordScore

关键词得分

被如下接口引用:KeywordEvaluate。

名称 类型 描述
Keyword String 关键词
示例值:word
PronAccuracy Float 发音精准度,取值范围[-1, 100],当取-1时指完全不匹配,当为句子模式时,是所有已识别单词准确度的加权平均值,在reftext中但未识别出来的词不计入分数中。当为流式模式且请求中IsEnd未置1时,取值无意义。
示例值:99.9
PronFluency Float 发音流利度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义
示例值:1.0
PronCompletion Float 发音完整度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义
示例值:1.0
Words Array of WordRsp 详细发音评估结果
注意:此字段可能返回 null,表示取不到有效值。
示例值:[]
SuggestedScore Float 建议评分,取值范围[0,100],评分方式为建议评分 = 准确度(PronAccuracy)× 完整度(PronCompletion)×(2 - 完整度(PronCompletion)),如若评分策略不符合请参考Words数组中的详细分数自定义评分逻辑。
示例值:99.9

PhoneInfo

单音节评价结果

被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。

名称 类型 描述
MemBeginTime Integer 当前音节语音起始时间点,单位为ms
示例值:1000
MemEndTime Integer 当前音节语音终止时间点,单位为ms
示例值:2000
PronAccuracy Float 音节发音准确度,取值范围[-1, 100],当取-1时指完全不匹配
示例值:99.52305
DetectedStress Boolean 当前音节是否检测为重音
示例值:false
Phone String 当前音节,当前评测识别的音素
示例值:hh
Stress Boolean 当前音节是否应为重音
示例值:false
ReferencePhone String 参考音素,在单词诊断模式下,代表标准音素
示例值:hh
MatchTag Integer 当前词与输入语句的匹配情况,0:匹配单词、1:新增单词、2:缺少单词、3:错读的词、4:未录入单词。
示例值:0
ReferenceLetter String 参考字符,在单词诊断模式下,代表音素对应的原始文本
示例值:wh_0

SentenceInfo

语音过程中断句的中间结果

被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。

名称 类型 描述
SentenceId Integer 句子序号,在段落、自由说模式下有效,表示断句序号,最后的综合结果的为-1.
示例值:1
Words Array of WordRsp 详细发音评估结果
示例值:word
PronAccuracy Float 发音精准度,取值范围[-1, 100],当取-1时指完全不匹配,当为句子模式时,是所有已识别单词准确度的加权平均值,在reftext中但未识别出来的词不计入分数中。
示例值:99.9
PronFluency Float 发音流利度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义
示例值:0.99
PronCompletion Float 发音完整度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义
示例值:0.99
SuggestedScore Float 建议评分,取值范围[0,100],评分方式为建议评分 = 准确度(PronAccuracyfloat)× 完整度(PronCompletionfloat)×(2 - 完整度(PronCompletionfloat)),如若评分策略不符合请参考Words数组中的详细分数自定义评分逻辑。
示例值:99
RefTextId Integer 匹配候选文本的序号,在句子多分支、情景对 话、段落模式下表示匹配到的文本序号
注意:此字段可能返回 null,表示取不到有效值。
示例值:1
KeyWordHits Array of Float 主题词命中标志,0表示没命中,1表示命中
注意:此字段可能返回 null,表示取不到有效值。
示例值:[0,1]
UnKeyWordHits Array of Float 负向主题词命中标志,0表示没命中,1表示命中
注意:此字段可能返回 null,表示取不到有效值。
示例值:[0,1]

Tone

中文声调检测结果

被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。

名称 类型 描述
Valid Boolean 检测结果是否有效
注意:此字段可能返回 null,表示取不到有效值。
示例值:true
RefTone Integer 文本标准声调,数值范围[-1,1,2,3,4]
注意:此字段可能返回 null,表示取不到有效值。
示例值:1
HypothesisTone Integer 实际发音声调,数值范围[-1,1,2,3,4]
注意:此字段可能返回 null,表示取不到有效值。
示例值:1

WordRsp

单词评分细则

被如下接口引用:KeywordEvaluate, TransmitOralProcess, TransmitOralProcessWithInit。

名称 类型 描述
MemBeginTime Integer 当前单词语音起始时间点,单位为ms,该字段段落模式下无意义。
示例值:100
MemEndTime Integer 当前单词语音终止时间点,单位为ms,该字段段落模式下无意义。
示例值:200
PronAccuracy Float 单词发音准确度,取值范围[-1, 100],当取-1时指完全不匹配
示例值:99
PronFluency Float 单词发音流利度,取值范围[0, 1]
示例值:0.8
Word String 当前词
示例值:word
MatchTag Integer 当前词与输入语句的匹配情况,0:匹配单词、1:新增单词、2:缺少单词、3:错读的词、4:未录入单词。
示例值:0
PhoneInfos Array of PhoneInfo 音节评估详情
示例值:phone
ReferenceWord String 参考词,目前为保留字段。
示例值:word
KeywordTag Integer 主题词命中标志,0表示没命中,1表示命中
注意:此字段可能返回 null,表示取不到有效值。
示例值:0
Tone Tone 声调检测结果
注意:此字段可能返回 null,表示取不到有效值。
示例值:tone