单词实时评测模式

最近更新时间:2025-08-15 15:42:12

我的收藏

评测模式描述

评测要求:支持多组单词,组合词评测。音频时长最长60秒。
评测维度:支持返回单词精准度,单词流利度;支持返回音素精准度。
评测功能:支持实时评测,多组文本 ,音素到字母映射,音素到国际音标转换,指定发音,指定国际音标。
是单词模式的超集,主要为支持了分支结构输入,支持流式展示中间结果。

请求参数

主要请求参数说明:
参数名称
类型
描述
ref_text
String
被评估文本。支持单词,组合词,缩写。使用| 划分多组分支
eval_mode
Integer
评估模式。7:单词评测模式
请求示例
# 参数示例为websocket连接URL展开, 如:soe.cloud.tencent.com/soe/api/1306***?eval_mode=0&voice_format=1&...
server_engine_type=16k_en
eval_mode=7
# 长音频推荐流式
rec_mode=0
# 流式展示中间结果
sentence_info_enabled=1
ref_text="bus |train | car"
score_coeff=1.000000
voice_format=1

返回结果

主要返回结果说明:
参数名称
类型
描述
SentenceInfoSet.Words.PronAccuracy
Float
单词精准度
SentenceInfoSet.Words.PronFluency
Float
单词流利度
SentenceInfoSet.Words.MatchTag
Integer
当前词的音频与文本的匹配情况
SentenceInfoSet.Words.PhoneInfos.PronAccuracy
Float
音素精准度
SentenceInfoSet.Words.PhoneInfos.MatchTag
Integer
当前音素的音频与文本的匹配情况
返回示例
{ "code": 0, "message": "d16d4c24-5637-43fe-8c10-8071ac368dd6_6", "voice_id": "d16d4c24-5637-43fe-8c10-8071ac368dd6", "result": { "SuggestedScore": 54.97087860107422, "PronAccuracy": 98.94757843017578, "PronFluency": 0.8808744549751282, "PronCompletion": 0.3333333432674408, "Words": [ { "MemBeginTime": 90, "MemEndTime": 560, "PronAccuracy": 98.94757843017578, "PronFluency": 0.8808744549751282, "ReferenceWord": "", "Word": "bus", "MatchTag": 0, "KeywordTag": 0, "PhoneInfos": [ { "MemBeginTime": 90, "MemEndTime": 220, "PronAccuracy": 98.33716583251953, "DetectedStress": false, "Phone": "b", "ReferencePhone": "", "ReferenceLetter": "", "Stress": false, "MatchTag": 0 }, { "MemBeginTime": 220, "MemEndTime": 480, "PronAccuracy": 99.08784484863281, "DetectedStress": false, "Phone": "ah", "ReferencePhone": "", "ReferenceLetter": "", "Stress": false, "MatchTag": 0 }, { "MemBeginTime": 480, "MemEndTime": 560, "PronAccuracy": 99.41773223876953, "DetectedStress": false, "Phone": "s", "ReferencePhone": "", "ReferenceLetter": "", "Stress": false, "MatchTag": 0 } ], "Tone": { "Valid": false, "RefTone": -1, "HypothesisTone": -1 } } ], "SentenceId": -1, "RefTextId": -1, "KeyWordHits": null, "UnKeyWordHits": null }, "final": 1 }

音素到字母映射

通过该功能,可以对音素映射字母进行标记。音素到字母映射结构:{::cmd{F_P2L=true}} + 评估文本。
功能示例可以参照 单词评测模式

音素到国际音标转换

返回音素默认为智聆音素,使用 {::cmd{F_IPA=true}} + 单词 开启⾳素到国际⾳标转换功能。
功能示例可以参照 单词评测模式

指定发音

使用 单词{::pron{p1,p2..},{p3,p4..}..} 指定发音,需要将国际音标通过音素映射表转换为智聆音素,参考音素映射表 > 智聆音素
功能示例可以参照 单词评测模式

指定国际音标

使用 单词{::ipapron{p1,p2..},{p3,p4..}..} 指定国际音标参考,音素映射表 > 国际音标
功能示例可以参照 单词评测模式