Keyword
评测关键词
被如下接口引用:KeywordEvaluate。
名称 | 类型 | 必选 | 描述 |
---|---|---|---|
RefText | String | 是 | 被评估语音对应的文本,句子模式下不超过 20个单词或者中文文字,段落模式不超过 120个单词或者中文文字,中文文字需使用 utf-8 编码,自由说模式RefText可以不填。如需要在单词模式和句子模式下使用自定义音素,可以通过设置 TextMode 使用音素标注。 示例值:hello |
EvalMode | Integer | 是 | 评估模式,0:词模式(中文评测模式下为文字模式),1:句子模式,2:段落模式,3:自由说模式,当为词模式评估时,能够提供每个音节的评估信息,当为句子模式时,能够提供完整度和流利度信息。 示例值:Null |
ScoreCoeff | Float | 是 | 评价苛刻指数,取值为[1.0 - 4.0]范围内的浮点数,用于平滑不同年龄段的分数,1.0为小年龄段,4.0为最高年龄段 示例值:1 |
ServerType | Integer | 否 | 评估语言,0:英文,1:中文。 ServerType不填默认为0 示例值:0 |
TextMode | Integer | 否 | 输入文本模式,0: 普通文本,1:音素结构文本。 示例值:0 |
KeywordScore
关键词得分
被如下接口引用:KeywordEvaluate。
名称 | 类型 | 描述 |
---|---|---|
Keyword | String | 关键词 示例值:word |
PronAccuracy | Float | 发音精准度,取值范围[-1, 100],当取-1时指完全不匹配,当为句子模式时,是所有已识别单词准确度的加权平均值,在reftext中但未识别出来的词不计入分数中。当为流式模式且请求中IsEnd未置1时,取值无意义。 示例值:99.9 |
PronFluency | Float | 发音流利度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义 示例值:1.0 |
PronCompletion | Float | 发音完整度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义 示例值:1.0 |
Words | Array of WordRsp | 详细发音评估结果 注意:此字段可能返回 null,表示取不到有效值。 示例值:[] |
SuggestedScore | Float | 建议评分,取值范围[0,100],评分方式为建议评分 = 准确度(PronAccuracy)× 完整度(PronCompletion)×(2 - 完整度(PronCompletion)),如若评分策略不符合请参考Words数组中的详细分数自定义评分逻辑。 示例值:99.9 |
PhoneInfo
单音节评价结果
被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。
名称 | 类型 | 描述 |
---|---|---|
MemBeginTime | Integer | 当前音节语音起始时间点,单位为ms 示例值:1000 |
MemEndTime | Integer | 当前音节语音终止时间点,单位为ms 示例值:2000 |
PronAccuracy | Float | 音节发音准确度,取值范围[-1, 100],当取-1时指完全不匹配 示例值:99.52305 |
DetectedStress | Boolean | 当前音节是否检测为重音 示例值:false |
Phone | String | 当前音节,当前评测识别的音素 示例值:hh |
Stress | Boolean | 当前音节是否应为重音 示例值:false |
ReferencePhone | String | 参考音素,在单词诊断模式下,代表标准音素 示例值:hh |
MatchTag | Integer | 当前词与输入语句的匹配情况,0:匹配单词、1:新增单词、2:缺少单词、3:错读的词、4:未录入单词。 示例值:0 |
ReferenceLetter | String | 参考字符,在单词诊断模式下,代表音素对应的原始文本 示例值:wh_0 |
SentenceInfo
语音过程中断句的中间结果
被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。
名称 | 类型 | 描述 |
---|---|---|
SentenceId | Integer | 句子序号,在段落、自由说模式下有效,表示断句序号,最后的综合结果的为-1. 示例值:1 |
Words | Array of WordRsp | 详细发音评估结果 示例值:word |
PronAccuracy | Float | 发音精准度,取值范围[-1, 100],当取-1时指完全不匹配,当为句子模式时,是所有已识别单词准确度的加权平均值,在reftext中但未识别出来的词不计入分数中。 示例值:99.9 |
PronFluency | Float | 发音流利度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义 示例值:0.99 |
PronCompletion | Float | 发音完整度,取值范围[0, 1],当为词模式时,取值无意义;当为流式模式且请求中IsEnd未置1时,取值无意义 示例值:0.99 |
SuggestedScore | Float | 建议评分,取值范围[0,100],评分方式为建议评分 = 准确度(PronAccuracyfloat)× 完整度(PronCompletionfloat)×(2 - 完整度(PronCompletionfloat)),如若评分策略不符合请参考Words数组中的详细分数自定义评分逻辑。 示例值:99 |
RefTextId | Integer | 匹配候选文本的序号,在句子多分支、情景对 话、段落模式下表示匹配到的文本序号 注意:此字段可能返回 null,表示取不到有效值。 示例值:1 |
KeyWordHits | Array of Float | 主题词命中标志,0表示没命中,1表示命中 注意:此字段可能返回 null,表示取不到有效值。 示例值:[0,1] |
UnKeyWordHits | Array of Float | 负向主题词命中标志,0表示没命中,1表示命中 注意:此字段可能返回 null,表示取不到有效值。 示例值:[0,1] |
Tone
中文声调检测结果
被如下接口引用:TransmitOralProcess, TransmitOralProcessWithInit。
名称 | 类型 | 描述 |
---|---|---|
Valid | Boolean | 检测结果是否有效 注意:此字段可能返回 null,表示取不到有效值。 示例值:true |
RefTone | Integer | 文本标准声调,数值范围[-1,1,2,3,4] 注意:此字段可能返回 null,表示取不到有效值。 示例值:1 |
HypothesisTone | Integer | 实际发音声调,数值范围[-1,1,2,3,4] 注意:此字段可能返回 null,表示取不到有效值。 示例值:1 |
WordRsp
单词评分细则
被如下接口引用:KeywordEvaluate, TransmitOralProcess, TransmitOralProcessWithInit。
名称 | 类型 | 描述 |
---|---|---|
MemBeginTime | Integer | 当前单词语音起始时间点,单位为ms,该字段段落模式下无意义。 示例值:100 |
MemEndTime | Integer | 当前单词语音终止时间点,单位为ms,该字段段落模式下无意义。 示例值:200 |
PronAccuracy | Float | 单词发音准确度,取值范围[-1, 100],当取-1时指完全不匹配 示例值:99 |
PronFluency | Float | 单词发音流利度,取值范围[0, 1] 示例值:0.8 |
Word | String | 当前词 示例值:word |
MatchTag | Integer | 当前词与输入语句的匹配情况,0:匹配单词、1:新增单词、2:缺少单词、3:错读的词、4:未录入单词。 示例值:0 |
PhoneInfos | Array of PhoneInfo | 音节评估详情 示例值:phone |
ReferenceWord | String | 参考词,目前为保留字段。 示例值:word |
KeywordTag | Integer | 主题词命中标志,0表示没命中,1表示命中 注意:此字段可能返回 null,表示取不到有效值。 示例值:0 |
Tone | Tone | 声调检测结果 注意:此字段可能返回 null,表示取不到有效值。 示例值:tone |