AgeDetectTask
年龄语音识别子任务
被如下接口引用:CreateAgeDetectTask。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| DataId | String | 是 | 数据唯一ID 示例值:abcd | 
| Url | String | 是 | 数据文件的url,为 urlencode 编码,音频文件格式支持的类型:.wav、.m4a、.amr、.mp3、.aac、.wma、.ogg 示例值:https://xxx.com/yy.wav | 
AgeDetectTaskResult
年龄语音任务结果
被如下接口引用:DescribeAgeDetectTask。
| 名称 | 类型 | 描述 | 
|---|---|---|
| DataId | String | 数据唯一ID 示例值:abcd | 
| Url | String | 数据文件的url 示例值:https://xxx.com/yyy.wav | 
| Status | Integer | 任务状态,0: 已创建,1:运行中,2:正常结束,3:异常结束,4:运行超时 示例值:2 | 
| Age | Integer | 任务结果:0: 成年,1:未成年,100:未知 示例值:1 | 
AgentConfig
机器人参数
被如下接口引用:StartAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| UserId | String | 是 | 机器人的UserId,用于进房发起任务。【注意】这个UserId不能与当前房间内的主播观众UserId重复。如果一个房间发起多个任务时,机器人的UserId也不能相互重复,否则会中断前一个任务。需要保证机器人UserId在房间内唯一。 示例值:user_124 | 
| UserSig | String | 是 | 机器人UserId对应的校验签名,即UserId和UserSig相当于机器人进房的登录密码。 示例值:ehbciOiJS | 
| TargetUserId | String | 是 | 机器人拉流的UserId, 填写后,机器人会拉取该UserId的流进行实时处理 示例值:user_124 | 
| MaxIdleTime | Integer | 否 | 房间内超过MaxIdleTime 没有推流,后台自动关闭任务,默认值是60s。 示例值:60 | 
| WelcomeMessage | String | 否 | 机器人的欢迎语 示例值:你好呀 | 
| InterruptMode | Integer | 否 | 智能打断模式,默认为0,0表示服务端自动打断,1表示服务端不打断,由端上发送打断信令进行打断 示例值:0 | 
| InterruptSpeechDuration | Integer | 否 | InterruptMode为0时使用,单位为毫秒,默认为500ms。表示服务端检测到持续InterruptSpeechDuration毫秒的人声则进行打断。 示例值:500 | 
| TurnDetectionMode | Integer | 否 | 控制新一轮对话的触发方式,默认为0。 - 0表示当服务端语音识别检测出的完整一句话后,自动触发一轮新的对话。 - 1表示客户端在收到字幕消息后,自行决定是否手动发送聊天信令触发一轮新的对话。 示例值:0 | 
| FilterOneWord | Boolean | 否 | 是否过滤掉用户只说了一个字的句子,true表示过滤,false表示不过滤,默认值为true 示例值:true | 
| WelcomeMessagePriority | Integer | 否 | 欢迎消息优先级,0默认,1高优,高优不能被打断。 示例值:0 | 
| FilterBracketsContent | Integer | 否 | 用于过滤LLM返回内容,不播放括号中的内容。 1:中文括号() 2:英文括号() 3:中文方括号【】 4:英文方括号[] 5:英文花括号{} 默认值为空,表示不进行过滤。 示例值:1 | 
| AmbientSound | AmbientSound | 否 | 环境音设置 | 
| VoicePrint | VoicePrint | 否 | 声纹配置 | 
| InitLLMMessage | String | 否 | 与WelcomeMessage参数互斥,当该参数有值时,WelcomeMessage将失效。\n在对话开始后把该消息送到大模型来获取欢迎语。 示例值:你好呀 | 
| TurnDetection | TurnDetection | 否 | 语义断句检测 | 
| SubtitleMode | Integer | 否 | 机器人字幕显示模式。 - 0表示尽快显示,不会和音频播放进行同步。此时字幕全量下发,后面的字幕会包含前面的字幕。 - 1表示句子级别的实时显示,会和音频播放进行同步,只有当前句子对应的音频播放完后,下一条字幕才会下发。此时字幕增量下发,端上需要把前后的字幕进行拼接才是完整字幕。 示例值:1 | 
AmbientSound
背景音设置,将在通话中添加环境音效,使体验更加逼真。目前支持以下选项:
coffee_shops: 咖啡店氛围,背景中有人聊天。
busy_office: 客服中心
street_traffic: 户外街道
evening_mountain: 户外山林
被如下接口引用:StartAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Scene | String | 是 | 环境场景选择 示例值:coffee_shops | 
| Volume | Float | 否 | 控制环境音的音量。取值的范围是 [0,2]。值越低,环境音越小;值越高,环境音越响亮。如果未设置,则使用默认值 1。 示例值:1.0 | 
AppStatisticsItem
应用用量统计数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| RealtimeSpeechStatisticsItem | RealTimeSpeechStatisticsItem | 实时语音统计数据 示例值:{"MainLandPcu":1,"OverseaDuration":1,"OverseaPcu":1,"OverseaDau":1,"MainLandDuration":1,"MainLandDau":1} | 
| VoiceMessageStatisticsItem | VoiceMessageStatisticsItem | 语音消息统计数据 示例值:{"Dau":1018} | 
| VoiceFilterStatisticsItem | VoiceFilterStatisticsItem | 语音过滤统计数据 示例值:{"Duration" : 18000} | 
| Date | Date | 统计时间 示例值:2022-10-01 | 
| AudioTextStatisticsItem | AudioTextStatisticsItem | 录音转文本用量统计数据 示例值:{"Data":0} | 
| StreamTextStatisticsItem | StreamTextStatisticsItem | 流式转文本用量数据 示例值:{"Data":0} | 
| OverseaTextStatisticsItem | OverseaTextStatisticsItem | 海外转文本用量数据 示例值:{"Data":0} | 
| RealtimeTextStatisticsItem | RealtimeTextStatisticsItem | 实时语音转文本用量数据 示例值:{"Data":0} | 
ApplicationDataStatistics
应用统计数据
被如下接口引用:DescribeApplicationData。
| 名称 | 类型 | 描述 | 
|---|---|---|
| BizId | Integer | 应用ID 示例值:1400000000 | 
| DauDataNum | Integer | Dau统计项数目 示例值:25 | 
| DauDataMainland | Array of StatisticsItem | 大陆地区Dau统计数据,单位人 | 
| DauDataOversea | Array of StatisticsItem | 海外地区Dau统计数据,单位人 | 
| DauDataSum | Array of StatisticsItem | 大陆和海外地区Dau统计数据汇总,单位人 | 
| DurationDataNum | Integer | 实时语音时长统计项数目 示例值:34 | 
| DurationDataMainland | Array of StatisticsItem | 大陆地区实时语音时长统计数据,单位分钟 | 
| DurationDataOversea | Array of StatisticsItem | 海外地区实时语音时长统计数据,单位分钟 | 
| DurationDataSum | Array of StatisticsItem | 大陆和海外地区实时语音时长统计数据汇总,单位分钟 | 
| PcuDataNum | Integer | Pcu统计项数目 示例值:38 | 
| PcuDataMainland | Array of StatisticsItem | 大陆地区Pcu统计数据,单位人 | 
| PcuDataOversea | Array of StatisticsItem | 海外地区Pcu统计数据,单位人 | 
| PcuDataSum | Array of StatisticsItem | 大陆和海外地区Pcu统计数据汇总,单位人 | 
| MiniGameDataNum | Integer | 小游戏时长统计项数目 | 
| MiniGameDataMainland | Array of StatisticsItem | 大陆地区小游戏时长统计数据,单位分钟 | 
| MiniGameDataOversea | Array of StatisticsItem | 海外地区小游戏时长统计数据,单位分钟 | 
| MiniGameDataSum | Array of StatisticsItem | 大陆和海外地区小游戏时长统计数据汇总,单位分钟 | 
ApplicationList
获取应用列表返回
被如下接口引用:DescribeApplicationList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| ServiceConf | ServiceStatus | 服务开关状态 | 
| BizId | Integer | 应用ID(AppID) 示例值:1400000000 | 
| AppName | String | 应用名称 示例值:app_test | 
| ProjectId | Integer | 项目ID,默认为0 示例值:1 | 
| AppStatus | Integer | 应用状态,返回0表示正常,1表示关闭,2表示欠费停服,3表示欠费回收 示例值:1 | 
| CreateTime | Integer | 创建时间,Unix时间戳格式 示例值:1736238797 | 
| AppType | Integer | 应用类型,无需关注此数值 示例值:1 | 
AsrConf
语音转文本配置数据
被如下接口引用:CreateApp。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Status | String | 否 | 语音转文本服务开关,取值:open/close 示例值:open | 
AudioTextStatisticsItem
录音转文本用量统计数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Data | Float | 统计值,单位:秒 示例值:1.23 | 
CreateAppResp
CreateApp的输出参数
被如下接口引用:CreateApp。
| 名称 | 类型 | 描述 | 
|---|---|---|
| BizId | Integer | 应用ID,由后台自动生成。 示例值:1400000000 | 
| AppName | String | 应用名称,透传输入参数的AppName 示例值:app_test1 | 
| ProjectId | Integer | 项目ID,透传输入的ProjectId 示例值:0 | 
| SecretKey | String | 应用密钥,GME SDK初始化时使用 示例值:sdsd | 
| CreateTime | Integer | 服务创建时间戳 示例值:1736238797 | 
| RealtimeSpeechConf | RealtimeSpeechConf | 实时语音服务配置数据 | 
| VoiceMessageConf | VoiceMessageConf | 语音消息服务配置数据 | 
| VoiceFilterConf | VoiceFilterConf | 语音分析服务配置数据 | 
| AsrConf | AsrConf | 语音转文本服务配置数据 | 
CustomizationConfigs
语音消息转文本热句模型配置
被如下接口引用:GetCustomizationList。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| BizId | Integer | 是 | 应用 ID,登录控制台创建应用得到的AppID 示例值:1400000000 | 
| ModelId | String | 是 | 模型ID 示例值:f440dfa77ae411eda5d3564a2eb5fd49 | 
| ModelState | Integer | 是 | 模型状态,-1下线状态,1上线状态, 0训练中, -2训练失败, 3上线中, 4下线中 示例值:1 | 
| ModelName | String | 否 | 模型名称 示例值:ModelName | 
| TextUrl | String | 否 | 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos 示例值:https://file.myqcloud.com/keywords_template.txt | 
| UpdateTime | Integer | 否 | 更新时间,11位时间戳 示例值:1736238797 | 
DeleteResult
剔除房间操作结果
被如下接口引用:DeleteRoomMember。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Code | Integer | 错误码,0-剔除成功 其他-剔除失败 示例值:1300000 | 
| ErrorMsg | String | 错误描述 示例值:room does not exist | 
DescribeAppStatisticsResp
获取应用用量统计数据输出参数
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| AppStatistics | Array of AppStatisticsItem | 应用用量统计数据 示例值:[] | 
DescribeScanResult
语音检测结果返回
被如下接口引用:DescribeScanResultList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Code | Integer | 业务返回码 示例值:0 | 
| DataId | String | 数据唯一 ID 示例值:1400000000_test_data_id | 
| ScanFinishTime | Integer | 检测完成的时间戳 示例值:1566720906 | 
| HitFlag | Boolean | 是否违规 示例值:false | 
| Live | Boolean | 是否为流 示例值:false | 
| Msg | String | 业务返回描述 示例值:Success | 
| ScanPiece | Array of ScanPiece | 检测结果,Code 为 0 时返回 | 
| ScanStartTime | Integer | 提交检测的时间戳 示例值:1574684231 | 
| Scenes | Array of String | 语音检测场景,对应请求时的 Scene 示例值:["default"] | 
| TaskId | String | 语音检测任务 ID,由后台分配 示例值:6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b | 
| Url | String | 文件或接流地址 示例值:http://xx.mp3 | 
| Status | String | 检测任务执行结果状态,分别为: 示例值:Success | 
| BizId | Integer | 提交检测的应用 ID 示例值:140011111 | 
Filter
查找过滤
被如下接口引用:DescribeApplicationList。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Name | String | 否 | 要过滤的字段名, 比如"AppName" 示例值:AppName | 
| Values | Array of String | 否 | 多个关键字 示例值:app_game | 
InOutTimeInfo
房间内的事件
被如下接口引用:DescribeUserInAndOutTime。
| 名称 | 类型 | 描述 | 
|---|---|---|
| StartTime | Integer | 进入房间时间 示例值:1606355700701 | 
| EndTime | Integer | 退出房间时间 示例值:1606355712545 | 
InvokeLLM
调用服务端主动发起请求到LLM
被如下接口引用:ControlAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Content | String | 否 | 请求LLM的内容 示例值:今天天气怎么样 | 
| Interrupt | Boolean | 否 | 是否允许该文本打断机器人说话 示例值:false | 
ModifyAppStatusResp
ModifyAppStatus接口输出参数
被如下接口引用:ModifyAppStatus。
| 名称 | 类型 | 描述 | 
|---|---|---|
| BizId | Integer | GME应用ID 示例值:1400000000 | 
| Status | String | 应用状态,取值:open/close 示例值:open | 
OverseaTextStatisticsItem
海外转文本用量数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Data | Float | 统计值,单位:秒 示例值:324.88 | 
RealTimeSpeechStatisticsItem
实时语音用量统计数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| MainLandDau | Integer | 大陆地区DAU 示例值:764 | 
| MainLandPcu | Integer | 大陆地区PCU 示例值:471 | 
| MainLandDuration | Integer | 大陆地区总使用时长,单位为min 示例值:98434 | 
| OverseaDau | Integer | 海外地区DAU 示例值:643 | 
| OverseaPcu | Integer | 海外地区PCU 示例值:848 | 
| OverseaDuration | Integer | 海外地区总使用时长,单位为min 示例值:2682 | 
RealtimeSpeechConf
实时语音配置数据
被如下接口引用:CreateApp。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Status | String | 否 | 实时语音服务开关,取值:open/close 示例值:open | 
| Quality | String | 否 | 实时语音音质类型,取值:high-高音质 ordinary-普通音质 示例值:high | 
RealtimeTextStatisticsItem
实时语音转文本用量数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Data | Float | 统计值,单位:秒 示例值:451.26 | 
RecordInfo
房间内录制信息。
注意:此字段可能返回 null,表示取不到有效值。
被如下接口引用:DescribeRecordInfo。
| 名称 | 类型 | 描述 | 
|---|---|---|
| UserId | String | 用户ID(当混流模式时,取值为0)。 示例值:6787 | 
| FileName | String | 录制文件名。 示例值:/3400352518_2314_447947346201176660_9081 | 
| RecordBeginTime | Integer | 录制开始时间(unix时间戳如:1234567868)。 示例值:1234567868 | 
| RecordStatus | Integer | 录制状态:2代表正在录制  10代表等待转码  11代表正在转码  12正在上传  13代表上传完成  14代表通知用户完成。 示例值:2 | 
RoomUser
房间内用户信息
被如下接口引用:DescribeRoomInfo。
| 名称 | 类型 | 描述 | 
|---|---|---|
| RoomId | Integer | 房间id 示例值:261974 | 
| Uins | Array of Integer | 房间里用户uin列表 示例值:[100261] | 
| StrRoomId | String | 字符串房间id 示例值:"261974" | 
| StrUins | Array of String | 房间里用户字符串uin列表 示例值:["100261"] | 
STTConfig
语音转文字参数
被如下接口引用:StartAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Language | String | 否 | 语音转文字支持识别的语言,默认是"zh" 中文 可通过购买「AI智能识别时长包」解锁或领取包月套餐体验版解锁不同语言. 语音转文本不同套餐版本支持的语言如下: 基础版: - "zh": 中文(简体) - "zh-TW": 中文(繁体) - "en": 英语 标准版: - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升. - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升. - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别). - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升. 高级版: - "zh-dialect": 中国方言 - "zh-yue": 中国粤语 - "vi": 越南语 - "ja": 日语 - "ko": 韩语 - "id": 印度尼西亚语 - "th": 泰语 - "pt": 葡萄牙语 - "tr": 土耳其语 - "ar": 阿拉伯语 - "es": 西班牙语 - "hi": 印地语 - "fr": 法语 - "ms": 马来语 - "fil": 菲律宾语 - "de": 德语 - "it": 意大利语 - "ru": 俄语 - "sv": 瑞典语 - "da": 丹麦语 - "no": 挪威语 注意: 如果缺少满足您需求的语言,请联系我们技术人员。 示例值:zh | 
| AlternativeLanguage | Array of String | 否 | 发起模糊识别为高级版能力,默认按照高级版收费,仅支持填写基础版和高级版语言. 注意:不支持填写"zh-dialect" 示例值:["AlternativeLanguage"] | 
| CustomParam | String | 否 | 自定义参数,联系后台使用 示例值:CustomParam | 
| VadSilenceTime | Integer | 否 | 语音识别vad的时间,范围为240-2000,默认为1000,单位为ms。更小的值会让语音识别分句更快。 示例值:1000 | 
| HotWordList | String | 否 | 热词表:该参数用于提升识别准确率。 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或 “ASR|11”; 热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”; 示例值:腾讯云|10,语音识别|5,ASR|11 | 
| VadLevel | Integer | 否 | vad的远场人声抑制能力(不会对asr识别效果造成影响),范围为[0, 3],默认为0。推荐设置为2,有较好的远场人声抑制能力。 示例值:1 | 
ScanDetail
语音检测详情
被如下接口引用:DescribeScanResultList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Label | String | 违规场景,参照Label定义 示例值:abuse | 
| Rate | String | 该场景下概率[0.00,100.00],分值越大违规概率越高 示例值:90.00 | 
| KeyWord | String | 违规关键字 示例值:违规字 | 
| StartTime | Integer | 关键字在音频的开始时间,从0开始的偏移量,单位为毫秒,Label=moan时有效 示例值:1736238797 | 
| EndTime | Integer | 关键字在音频的结束时间,从0开始的偏移量,,单位为毫秒,Label=moan时有效 示例值:1736249000 | 
ScanPiece
语音检测结果,Code 为 0 时返回
被如下接口引用:DescribeScanResultList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| DumpUrl | String | 流检测时返回,音频转存地址,保留30min 示例值:https://cos.xxx.com/tianyu-xxx-1200000000/w-audio-ZxxxI8xxxqGxxxxr/audio_0_1600000000.mp3?X-Amz-xxxxxxxxx= | 
| HitFlag | Boolean | 是否违规 示例值:false | 
| MainType | String | 违规主要类型 示例值:normal | 
| ScanDetail | Array of ScanDetail | 语音检测详情 | 
| RoomId | String | gme实时语音房间ID,透传任务传入时的RoomId 示例值:261974 | 
| OpenId | String | gme实时语音用户ID,透传任务传入时的OpenId 示例值:1001807 | 
| Info | String | 备注 示例值:现在开始第一段测试.... | 
| Offset | Integer | 流检测时分片在流中的偏移时间,单位毫秒 示例值:0 | 
| Duration | Integer | 流检测时分片时长 示例值:0 | 
| PieceStartTime | Integer | 分片开始检测时间 示例值:0 | 
ScanVoiceResult
语音检测返回结果
被如下接口引用:ScanVoice。
| 名称 | 类型 | 描述 | 
|---|---|---|
| DataId | String | 数据ID 示例值:1400000000_test_data_id | 
| TaskId | String | 任务ID 示例值:6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b | 
SceneInfo
SceneInfo场景信息
'RealTime','实时语音分析',
'VoiceMessage','语音消息',
'GMECloudApi':'GME云API接口'
被如下接口引用:CreateApp。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| SceneId | String | 是 | 'RealTime','实时语音分析', 'VoiceMessage','语音消息', 'GMECloudApi':'GME云API接口' 示例值:RealTime | 
| Status | Boolean | 是 | 开关状态,true开启/false关闭 示例值:false | 
| CallbackUrl | String | 否 | 用户回调地址 示例值:https://0.0.0.0/user_callback | 
ServerPushText
服务端控制AI对话机器人播报指定文本
被如下接口引用:ControlAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Text | String | 否 | 服务端推送播报文本 | 
| Interrupt | Boolean | 否 | 是否允许该文本打断机器人说话 | 
| StopAfterPlay | Boolean | 否 | 播报完文本后,是否自动关闭对话任务 | 
| Audio | String | 否 | 服务端推送播报音频 格式说明:音频必须为单声道,采样率必须跟对应TTS的采样率保持一致,编码为Base64字符串。 输入规则:当提供Audio字段时,将不接受Text字段的输入。系统将直接播放Audio字段中的音频内容。 | 
| DropMode | Integer | 否 | 默认为0,仅在Interrupt为false时有效 - 0表示当前有交互发生时,会丢弃Interrupt为false的消息 - 1表示当前有交互发生时,不会丢弃Interrupt为false的消息,而是缓存下来,等待当前交互结束后,再去处理 注意:DropMode为1时,允许缓存多个消息,如果后续出现了打断,缓存的消息会被清空 示例值:0 | 
| Priority | Integer | 否 | ServerPushText消息的优先级,0表示可被打断,1表示不会被打断。目前仅支持传入0,如果需要传入1,请提工单联系我们添加权限。 注意:在接收到Priority=1的消息后,后续其他任何消息都会被忽略(包括Priority=1的消息),直到Priority=1的消息处理结束。该字段可与Interrupt、DropMode字段配合使用。 例子: - Priority=1、Interrupt=true,会打断现有交互,立刻播报,播报过程中不会被打断 - Priority=1、Interrupt=false、DropMode=1,会等待当前交互结束,再进行播报,播报过程中不会被打断 示例值:0 | 
ServiceStatus
服务开关状态
被如下接口引用:DescribeApplicationList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| RealTimeSpeech | StatusInfo | 实时语音服务开关状态 示例值:1 | 
| VoiceMessage | StatusInfo | 语音消息服务开关状态 示例值:1 | 
| Porn | StatusInfo | 语音内容安全服务开关状态 示例值:1 | 
| Live | StatusInfo | 语音录制服务开关状态 示例值:1 | 
| RealTimeAsr | StatusInfo | 语音转文本服务开关状态 示例值:1 | 
| TextTranslate | StatusInfo | 文本翻译服务开关状态 示例值:1 | 
StatisticsItem
用量数据单元
被如下接口引用:DescribeApplicationData。
| 名称 | 类型 | 描述 | 
|---|---|---|
| StatDate | Date | 日期,格式为年-月-日,如2018-07-13 示例值:2020-09-22 | 
| Data | Integer | 统计值 示例值:1087 | 
StatusInfo
服务开关状态
被如下接口引用:DescribeApplicationList。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Status | Integer | 服务开关状态, 0-正常,1-关闭 示例值:0 | 
StreamTextStatisticsItem
流式转文本用量数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Data | Float | 统计值,单位:秒 示例值:825.31 | 
SubscribeRecordUserIds
指定订阅流白名单或者黑名单。
被如下接口引用:DescribeTaskInfo, ModifyRecordInfo, StartRecord。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| UnSubscribeUserIds | Array of String | 否 | 订阅音频流黑名单,指定不订阅哪几个UserId的音频流,例如["1", "2", "3"], 代表不订阅UserId 1,2,3的音频流。默认不填订阅房间内所有音频流,订阅列表用户数不超过20。 注意:只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数 示例值:7619 | 
| SubscribeUserIds | Array of String | 否 | 订阅音频流白名单,指定订阅哪几个UserId的音频流,例如["1", "2", "3"], 代表订阅UserId 1,2,3的音频流。默认不填订阅房间内所有音频流,订阅列表用户数不超过20。 注意:只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数。 示例值:3342 | 
Tag
标签列表
被如下接口引用:CreateApp, DescribeApplicationList。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| TagKey | String | 否 | 标签键 示例值:tag_key1 | 
| TagValue | String | 否 | 标签值 示例值:tag_value1 | 
Task
语音检测任务列表
被如下接口引用:ScanVoice。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| DataId | String | 是 | 数据的唯一ID 示例值:1400000000_test_data_id | 
| Url | String | 是 | 数据文件的url,为 urlencode 编码,流式则为拉流地址 示例值:http://xxxx/audio_store/xxxx.mp3 | 
| RoomId | String | 否 | gme实时语音房间ID,通过gme实时语音进行语音分析时输入 示例值:261974 | 
| OpenId | String | 否 | gme实时语音用户ID,通过gme实时语音进行语音分析时输入 示例值:100261 | 
TurnDetection
断句配置
被如下接口引用:StartAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| SemanticEagerness | String | 否 | TurnDetectionMode为3时生效,语义断句的灵敏程度 功能简介:根据用户所说的话来判断其已完成发言来分割音频 可选: "low" | "medium" | "high" | "auto" auto 是默认值,与 medium 相同。 low 将让用户有足够的时间说话。 high 将尽快对音频进行分块。 如果您希望模型在对话模式下更频繁地响应,可以将 SemanticEagerness 设置为 high 如果您希望在用户停顿时,AI能够等待片刻,可以将 SemanticEagerness 设置为 low 无论什么模式,最终都会分割送个大模型进行回复 示例值:auto | 
UserMicStatus
用户麦克风状态
被如下接口引用:ModifyUserMicStatus。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| EnableMic | Integer | 是 | 开麦状态。1表示关闭麦克风,2表示打开麦克风。 示例值:1 | 
| Uid | Integer | 否 | 客户端用于标识用户的Openid。(Uid、StrUid必须填一个,优先处理StrUid。) 示例值:9798 | 
| StrUid | String | 否 | 客户端用于标识字符串型用户的Openid。(Uid、StrUid必须填一个,优先处理StrUid。) 示例值:jelly | 
VoiceFilterConf
语音过滤服务配置数据
被如下接口引用:CreateApp。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Status | String | 否 | 语音过滤服务开关,取值:open/close 示例值:open | 
| SceneInfos | Array of SceneInfo | 否 | 场景配置信息,如开关状态,回调地址。 | 
VoiceFilterStatisticsItem
语音过滤用量统计数据
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Duration | Integer | 语音过滤总时长,单位为min 示例值:100 | 
VoiceMessageConf
离线语音服务配置数据
被如下接口引用:CreateApp。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Status | String | 否 | 离线语音服务开关,取值:open/close 示例值:open | 
| Language | String | 否 | 离线语音支持语种,取值: all-全部,cnen-中英文。默认为中英文 示例值:all | 
VoiceMessageStatisticsItem
语音消息用量统计信息
被如下接口引用:DescribeAppStatistics。
| 名称 | 类型 | 描述 | 
|---|---|---|
| Dau | Integer | 离线语音DAU 示例值:1807 | 
VoicePrint
声纹配置参数
被如下接口引用:StartAIConversation。
| 名称 | 类型 | 必选 | 描述 | 
|---|---|---|---|
| Mode | Integer | 否 | 默认为0,表示不启用声纹。1表示启用声纹,此时需要填写voiceprint id。 示例值:1 | 
| IdList | Array of String | 否 | VoicePrint Mode为1时需要填写,目前仅支持填写一个声纹id 示例值:["your-voiceprint-id"] | 
VoicePrintInfo
声纹查询数据
被如下接口引用:DescribeVoicePrint。
| 名称 | 类型 | 描述 | 
|---|---|---|
| VoicePrintId | String | 声纹ID 示例值:1300056123-fd91f128-52a6-4692-b94a-c0f9fd3c4287 | 
| AppId | Integer | 应用id 示例值:1300056123 | 
| VoicePrintMetaInfo | String | 和声纹绑定的MetaInfo 示例值:metainfo | 
| CreateTime | String | 创建时间 示例值:2025-05-21 19:23:54 | 
| UpdateTime | String | 更新时间 示例值:2025-05-21 19:23:54 | 
| AudioFormat | Integer | 音频格式,当前只有0(代表wav) 示例值:0 | 
| AudioName | String | 音频名称 示例值:jackson | 
| ReqTimestamp | Integer | 请求毫秒时间戳 示例值:1748249540000 |