游戏多媒体引擎数据结构

AgeDetectTask

年龄语音识别子任务

被如下接口引用：CreateAgeDetectTask。

名称	类型	必选	描述
DataId	String	是	数据唯一ID 示例值：abcd
Url	String	是	数据文件的url，为 urlencode 编码,音频文件格式支持的类型：.wav、.m4a、.amr、.mp3、.aac、.wma、.ogg 示例值：https://xxx.com/yy.wav

AgeDetectTaskResult

年龄语音任务结果

被如下接口引用：DescribeAgeDetectTask。

名称	类型	描述
DataId	String	数据唯一ID 示例值：abcd
Url	String	数据文件的url 示例值：https://xxx.com/yyy.wav
Status	Integer	任务状态，0: 已创建，1:运行中，2:正常结束，3:异常结束，4:运行超时示例值：2
Age	Integer	任务结果：0: 成年，1:未成年，100:未知示例值：1

AgentConfig

机器人参数

被如下接口引用：StartAIConversation。

名称	类型	必选	描述
UserId	String	是	机器人的UserId，用于进房发起任务。【注意】这个UserId不能与当前房间内的主播观众UserId重复。如果一个房间发起多个任务时，机器人的UserId也不能相互重复，否则会中断前一个任务。需要保证机器人UserId在房间内唯一。示例值：user_124
UserSig	String	是	机器人UserId对应的校验签名，即UserId和UserSig相当于机器人进房的登录密码。示例值：ehbciOiJS
TargetUserId	String	是	机器人拉流的UserId, 填写后，机器人会拉取该UserId的流进行实时处理示例值：user_124
MaxIdleTime	Integer	否	房间内超过MaxIdleTime 没有推流，后台自动关闭任务，默认值是60s。示例值：60
WelcomeMessage	String	否	机器人的欢迎语示例值：你好呀
InterruptMode	Integer	否	智能打断模式，默认为0，0表示服务端自动打断，1表示服务端不打断，由端上发送打断信令进行打断示例值：0
InterruptSpeechDuration	Integer	否	InterruptMode为0时使用，单位为毫秒，默认为500ms。表示服务端检测到持续InterruptSpeechDuration毫秒的人声则进行打断。示例值：500
TurnDetectionMode	Integer	否	控制新一轮对话的触发方式，默认为0。 - 0表示当服务端语音识别检测出的完整一句话后，自动触发一轮新的对话。 - 1表示客户端在收到字幕消息后，自行决定是否手动发送聊天信令触发一轮新的对话。示例值：0
FilterOneWord	Boolean	否	是否过滤掉用户只说了一个字的句子，true表示过滤，false表示不过滤，默认值为true 示例值：true
WelcomeMessagePriority	Integer	否	欢迎消息优先级，0默认，1高优，高优不能被打断。示例值：0
FilterBracketsContent	Integer	否	用于过滤LLM返回内容，不播放括号中的内容。 1：中文括号（） 2：英文括号() 3：中文方括号【】 4：英文方括号[] 5：英文花括号{} 默认值为空，表示不进行过滤。示例值：1
AmbientSound	AmbientSound	否	环境音设置
VoicePrint	VoicePrint	否	声纹配置
InitLLMMessage	String	否	与WelcomeMessage参数互斥，当该参数有值时，WelcomeMessage将失效。\n在对话开始后把该消息送到大模型来获取欢迎语。示例值：你好呀
TurnDetection	TurnDetection	否	语义断句检测
SubtitleMode	Integer	否	机器人字幕显示模式。 - 0表示尽快显示，不会和音频播放进行同步。此时字幕全量下发，后面的字幕会包含前面的字幕。 - 1表示句子级别的实时显示，会和音频播放进行同步，只有当前句子对应的音频播放完后，下一条字幕才会下发。此时字幕增量下发，端上需要把前后的字幕进行拼接才是完整字幕。示例值：1

AmbientSound

背景音设置，将在通话中添加环境音效，使体验更加逼真。目前支持以下选项：
coffee_shops: 咖啡店氛围，背景中有人聊天。
busy_office: 客服中心
street_traffic: 户外街道
evening_mountain: 户外山林

被如下接口引用：StartAIConversation。

名称	类型	必选	描述
Scene	String	是	环境场景选择示例值：coffee_shops
Volume	Float	否	控制环境音的音量。取值的范围是 [0,2]。值越低，环境音越小；值越高，环境音越响亮。如果未设置，则使用默认值 1。示例值：1.0

AppStatisticsItem

应用用量统计数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
RealtimeSpeechStatisticsItem	RealTimeSpeechStatisticsItem	实时语音统计数据示例值：{"MainLandPcu":1,"OverseaDuration":1,"OverseaPcu":1,"OverseaDau":1,"MainLandDuration":1,"MainLandDau":1}
VoiceMessageStatisticsItem	VoiceMessageStatisticsItem	语音消息统计数据示例值：{"Dau":1018}
VoiceFilterStatisticsItem	VoiceFilterStatisticsItem	语音过滤统计数据示例值：{"Duration" : 18000}
Date	Date	统计时间示例值：2022-10-01
AudioTextStatisticsItem	AudioTextStatisticsItem	录音转文本用量统计数据示例值：{"Data":0}
StreamTextStatisticsItem	StreamTextStatisticsItem	流式转文本用量数据示例值：{"Data":0}
OverseaTextStatisticsItem	OverseaTextStatisticsItem	海外转文本用量数据示例值：{"Data":0}
RealtimeTextStatisticsItem	RealtimeTextStatisticsItem	实时语音转文本用量数据示例值：{"Data":0}

ApplicationDataStatistics

应用统计数据

被如下接口引用：DescribeApplicationData。

名称	类型	描述
BizId	Integer	应用ID 示例值：1400000000
DauDataNum	Integer	Dau统计项数目示例值：25
DauDataMainland	Array of StatisticsItem	大陆地区Dau统计数据，单位人
DauDataOversea	Array of StatisticsItem	海外地区Dau统计数据，单位人
DauDataSum	Array of StatisticsItem	大陆和海外地区Dau统计数据汇总，单位人
DurationDataNum	Integer	实时语音时长统计项数目示例值：34
DurationDataMainland	Array of StatisticsItem	大陆地区实时语音时长统计数据，单位分钟
DurationDataOversea	Array of StatisticsItem	海外地区实时语音时长统计数据，单位分钟
DurationDataSum	Array of StatisticsItem	大陆和海外地区实时语音时长统计数据汇总，单位分钟
PcuDataNum	Integer	Pcu统计项数目示例值：38
PcuDataMainland	Array of StatisticsItem	大陆地区Pcu统计数据，单位人
PcuDataOversea	Array of StatisticsItem	海外地区Pcu统计数据，单位人
PcuDataSum	Array of StatisticsItem	大陆和海外地区Pcu统计数据汇总，单位人
MiniGameDataNum	Integer	小游戏时长统计项数目
MiniGameDataMainland	Array of StatisticsItem	大陆地区小游戏时长统计数据，单位分钟
MiniGameDataOversea	Array of StatisticsItem	海外地区小游戏时长统计数据，单位分钟
MiniGameDataSum	Array of StatisticsItem	大陆和海外地区小游戏时长统计数据汇总，单位分钟

ApplicationList

获取应用列表返回

被如下接口引用：DescribeApplicationList。

名称	类型	描述
ServiceConf	ServiceStatus	服务开关状态
BizId	Integer	应用ID(AppID) 示例值：1400000000
AppName	String	应用名称示例值：app_test
ProjectId	Integer	项目ID，默认为0 示例值：1
AppStatus	Integer	应用状态，返回0表示正常，1表示关闭，2表示欠费停服，3表示欠费回收示例值：1
CreateTime	Integer	创建时间，Unix时间戳格式示例值：1736238797
AppType	Integer	应用类型，无需关注此数值示例值：1

AsrConf

语音转文本配置数据

被如下接口引用：CreateApp。

名称	类型	必选	描述
Status	String	否	语音转文本服务开关，取值：open/close 示例值：open

AudioTextStatisticsItem

录音转文本用量统计数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Data	Float	统计值，单位：秒示例值：1.23

AuditResultDetailExternal

审核结果明细（对外）

被如下接口引用：DescribeAuditResultExternal。

名称	类型	必选	描述
TaskId	String	否	任务 ID 示例值：TASK90000000
RoomId	String	否	房间 ID 示例值：200
OpenId	String	否	UserID 示例值：10086
Label	String	否	标签示例值：Normal
Rate	Float	否	恶意分数示例值：10.0
CreateTime	Integer	否	创建时间示例值：1761224397
Url	String	否	音频 Url 示例值：https://test.cos.com/1.mp3
FileId	String	否	文件Id 示例值：1.mp3
Info	String	否	ASR结果示例值：嘻嘻哈哈

CreateAppResp

CreateApp的输出参数

被如下接口引用：CreateApp。

名称	类型	描述
BizId	Integer	应用ID，由后台自动生成。示例值：1400000000
AppName	String	应用名称，透传输入参数的AppName 示例值：app_test1
ProjectId	Integer	项目ID，透传输入的ProjectId 示例值：0
SecretKey	String	应用密钥，GME SDK初始化时使用示例值：sdsd
CreateTime	Integer	服务创建时间戳示例值：1736238797
RealtimeSpeechConf	RealtimeSpeechConf	实时语音服务配置数据
VoiceMessageConf	VoiceMessageConf	语音消息服务配置数据
VoiceFilterConf	VoiceFilterConf	语音分析服务配置数据
AsrConf	AsrConf	语音转文本服务配置数据

CustomizationConfigs

语音消息转文本热句模型配置

被如下接口引用：GetCustomizationList。

名称	类型	必选	描述
BizId	Integer	是	应用 ID，登录控制台创建应用得到的AppID 示例值：1400000000
ModelId	String	是	模型ID 示例值：f440dfa77ae411eda5d3564a2eb5fd49
ModelState	Integer	是	模型状态，-1下线状态，1上线状态, 0训练中, -2训练失败, 3上线中, 4下线中示例值：1
ModelName	String	否	模型名称示例值：ModelName
TextUrl	String	否	文本文件的下载地址，服务会从该地址下载文件，目前仅支持腾讯云cos 示例值：https://file.myqcloud.com/keywords_template.txt
UpdateTime	Integer	否	更新时间，11位时间戳示例值：1736238797

DeleteResult

剔除房间操作结果

被如下接口引用：DeleteRoomMember。

名称	类型	描述
Code	Integer	错误码，0-剔除成功其他-剔除失败示例值：1300000
ErrorMsg	String	错误描述示例值：room does not exist

DescribeAppStatisticsResp

获取应用用量统计数据输出参数

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
AppStatistics	Array of AppStatisticsItem	应用用量统计数据示例值：[]

DescribeScanResult

语音检测结果返回

被如下接口引用：DescribeScanResultList。

名称	类型	描述
Code	Integer	业务返回码示例值：0
DataId	String	数据唯一 ID 示例值：1400000000_test_data_id
ScanFinishTime	Integer	检测完成的时间戳示例值：1566720906
HitFlag	Boolean	是否违规示例值：false
Live	Boolean	是否为流示例值：false
Msg	String	业务返回描述示例值：Success
ScanPiece	Array of ScanPiece	检测结果，Code 为 0 时返回
ScanStartTime	Integer	提交检测的时间戳示例值：1574684231
Scenes	Array of String	语音检测场景，对应请求时的 Scene 示例值：["default"]
TaskId	String	语音检测任务 ID，由后台分配示例值：6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b
Url	String	文件或接流地址示例值：http://xx.mp3
Status	String	检测任务执行结果状态，分别为： Start: 任务开始 Success: 成功结束 Error: 异常示例值：Success
BizId	Integer	提交检测的应用 ID 示例值：140011111

Filter

查找过滤

被如下接口引用：DescribeApplicationList。

名称	类型	必选	描述
Name	String	否	要过滤的字段名, 比如"AppName" 示例值：AppName
Values	Array of String	否	多个关键字示例值：app_game

InOutTimeInfo

房间内的事件

被如下接口引用：DescribeUserInAndOutTime。

名称	类型	描述
StartTime	Integer	进入房间时间示例值：1606355700701
EndTime	Integer	退出房间时间示例值：1606355712545

InvokeLLM

调用服务端主动发起请求到LLM

被如下接口引用：ControlAIConversation。

名称	类型	必选	描述
Content	String	否	请求LLM的内容示例值：今天天气怎么样
Interrupt	Boolean	否	是否允许该文本打断机器人说话示例值：false

ModifyAppStatusResp

ModifyAppStatus接口输出参数

被如下接口引用：ModifyAppStatus。

名称	类型	描述
BizId	Integer	GME应用ID 示例值：1400000000
Status	String	应用状态，取值：open/close 示例值：open

OverseaTextStatisticsItem

海外转文本用量数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Data	Float	统计值，单位：秒示例值：324.88

RealTimeSpeechStatisticsItem

实时语音用量统计数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
MainLandDau	Integer	大陆地区DAU 示例值：764
MainLandPcu	Integer	大陆地区PCU 示例值：471
MainLandDuration	Integer	大陆地区总使用时长，单位为min 示例值：98434
OverseaDau	Integer	海外地区DAU 示例值：643
OverseaPcu	Integer	海外地区PCU 示例值：848
OverseaDuration	Integer	海外地区总使用时长，单位为min 示例值：2682

RealtimeSpeechConf

实时语音配置数据

被如下接口引用：CreateApp。

名称	类型	必选	描述
Status	String	否	实时语音服务开关，取值：open/close 示例值：open
Quality	String	否	实时语音音质类型，取值：high-高音质 ordinary-普通音质示例值：high

RealtimeTextStatisticsItem

实时语音转文本用量数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Data	Float	统计值，单位：秒示例值：451.26

RecordInfo

房间内录制信息。
注意：此字段可能返回 null，表示取不到有效值。

被如下接口引用：DescribeRecordInfo。

名称	类型	描述
UserId	String	用户ID（当混流模式时，取值为0）。示例值：6787
FileName	String	录制文件名。示例值：/3400352518_2314_447947346201176660_9081
RecordBeginTime	Integer	录制开始时间（unix时间戳如：1234567868）。示例值：1234567868
RecordStatus	Integer	录制状态：2代表正在录制 10代表等待转码 11代表正在转码 12正在上传 13代表上传完成 14代表通知用户完成。示例值：2

RoomUser

房间内用户信息

被如下接口引用：DescribeRoomInfo。

名称	类型	描述
RoomId	Integer	房间id 示例值：261974
Uins	Array of Integer	房间里用户uin列表示例值：[100261]
StrRoomId	String	字符串房间id 示例值："261974"
StrUins	Array of String	房间里用户字符串uin列表示例值：["100261"]

STTConfig

语音转文字参数

被如下接口引用：StartAIConversation。

名称	类型	必选	描述
Language	String	否	语音转文字支持识别的语言，默认是"zh" 中文可通过购买「AI智能识别时长包」解锁或领取包月套餐体验版解锁不同语言. 语音转文本不同套餐版本支持的语言如下：基础版： - "zh": 中文（简体） - "zh-TW": 中文（繁体） - "en": 英语标准版： - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别，模型参数量极大，语言模型性能增强，针对电话音频中各类场景、各类中文方言的识别准确率极大提升. - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升. - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别，可实现15个语种的自动识别(句子/段落级别). - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别，模型参数量极大，语言模型性能增强，针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升. 高级版： - "zh-dialect": 中国方言 - "zh-yue": 中国粤语 - "vi": 越南语 - "ja": 日语 - "ko": 韩语 - "id": 印度尼西亚语 - "th": 泰语 - "pt": 葡萄牙语 - "tr": 土耳其语 - "ar": 阿拉伯语 - "es": 西班牙语 - "hi": 印地语 - "fr": 法语 - "ms": 马来语 - "fil": 菲律宾语 - "de": 德语 - "it": 意大利语 - "ru": 俄语 - "sv": 瑞典语 - "da": 丹麦语 - "no": 挪威语注意：如果缺少满足您需求的语言，请联系我们技术人员。示例值：zh
AlternativeLanguage	Array of String	否	发起模糊识别为高级版能力,默认按照高级版收费,仅支持填写基础版和高级版语言. 注意：不支持填写"zh-dialect" 示例值：["AlternativeLanguage"]
CustomParam	String	否	自定义参数，联系后台使用示例值：CustomParam
VadSilenceTime	Integer	否	语音识别vad的时间，范围为240-2000，默认为1000，单位为ms。更小的值会让语音识别分句更快。示例值：1000
HotWordList	String	否	热词表：该参数用于提升识别准确率。单个热词限制："热词\|权重"，单个热词不超过30个字符（最多10个汉字），权重[1-11]或者100，如：“腾讯云\|5” 或 “ASR\|11”；热词表限制：多个热词用英文逗号分割，最多支持128个热词，如：“腾讯云\|10,语音识别\|5,ASR\|11”；示例值：腾讯云\|10,语音识别\|5,ASR\|11
VadLevel	Integer	否	vad的远场人声抑制能力（不会对asr识别效果造成影响），范围为[0, 3]，默认为0。推荐设置为2，有较好的远场人声抑制能力。示例值：1

ScanDetail

语音检测详情

被如下接口引用：DescribeScanResultList。

名称	类型	描述
Label	String	违规场景，参照Label定义示例值：abuse
Rate	String	该场景下概率[0.00,100.00],分值越大违规概率越高示例值：90.00
KeyWord	String	违规关键字示例值：违规字
StartTime	Integer	关键字在音频的开始时间，从0开始的偏移量，单位为毫秒，Label=moan时有效示例值：1736238797
EndTime	Integer	关键字在音频的结束时间，从0开始的偏移量,，单位为毫秒，Label=moan时有效示例值：1736249000

ScanPiece

语音检测结果，Code 为 0 时返回

被如下接口引用：DescribeScanResultList。

名称	类型	描述
DumpUrl	String	流检测时返回，音频转存地址，保留30min 示例值：https://cos.xxx.com/tianyu-xxx-1200000000/w-audio-ZxxxI8xxxqGxxxxr/audio_0_1600000000.mp3?X-Amz-xxxxxxxxx=
HitFlag	Boolean	是否违规示例值：false
MainType	String	违规主要类型示例值：normal
ScanDetail	Array of ScanDetail	语音检测详情
RoomId	String	gme实时语音房间ID，透传任务传入时的RoomId 示例值：261974
OpenId	String	gme实时语音用户ID，透传任务传入时的OpenId 示例值：1001807
Info	String	备注示例值：现在开始第一段测试....
Offset	Integer	流检测时分片在流中的偏移时间，单位毫秒示例值：0
Duration	Integer	流检测时分片时长示例值：0
PieceStartTime	Integer	分片开始检测时间示例值：0

ScanVoiceResult

语音检测返回结果

被如下接口引用：ScanVoice。

名称	类型	描述
DataId	String	数据ID 示例值：1400000000_test_data_id
TaskId	String	任务ID 示例值：6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b

SceneInfo

SceneInfo场景信息
'RealTime','实时语音分析',
'VoiceMessage','语音消息',
'GMECloudApi':'GME云API接口'

被如下接口引用：CreateApp。

名称	类型	必选	描述
SceneId	String	是	'RealTime','实时语音分析', 'VoiceMessage','语音消息', 'GMECloudApi':'GME云API接口' 示例值：RealTime
Status	Boolean	是	开关状态，true开启/false关闭示例值：false
CallbackUrl	String	否	用户回调地址示例值：https://0.0.0.0/user_callback

ServerPushText

服务端控制AI对话机器人播报指定文本

被如下接口引用：ControlAIConversation。

名称	类型	必选	描述
Text	String	否	服务端推送播报文本
Interrupt	Boolean	否	是否允许该文本打断机器人说话
StopAfterPlay	Boolean	否	播报完文本后，是否自动关闭对话任务
Audio	String	否	服务端推送播报音频格式说明：音频必须为单声道，采样率必须跟对应TTS的采样率保持一致，编码为Base64字符串。输入规则：当提供Audio字段时，将不接受Text字段的输入。系统将直接播放Audio字段中的音频内容。
DropMode	Integer	否	默认为0，仅在Interrupt为false时有效 - 0表示当前有交互发生时，会丢弃Interrupt为false的消息 - 1表示当前有交互发生时，不会丢弃Interrupt为false的消息，而是缓存下来，等待当前交互结束后，再去处理注意：DropMode为1时，允许缓存多个消息，如果后续出现了打断，缓存的消息会被清空示例值：0
Priority	Integer	否	ServerPushText消息的优先级，0表示可被打断，1表示不会被打断。目前仅支持传入0，如果需要传入1，请提工单联系我们添加权限。注意：在接收到Priority=1的消息后，后续其他任何消息都会被忽略（包括Priority=1的消息），直到Priority=1的消息处理结束。该字段可与Interrupt、DropMode字段配合使用。例子： - Priority=1、Interrupt=true，会打断现有交互，立刻播报，播报过程中不会被打断 - Priority=1、Interrupt=false、DropMode=1，会等待当前交互结束，再进行播报，播报过程中不会被打断示例值：0

ServiceStatus

服务开关状态

被如下接口引用：DescribeApplicationList。

名称	类型	描述
RealTimeSpeech	StatusInfo	实时语音服务开关状态示例值：1
VoiceMessage	StatusInfo	语音消息服务开关状态示例值：1
Porn	StatusInfo	语音内容安全服务开关状态示例值：1
Live	StatusInfo	语音录制服务开关状态示例值：1
RealTimeAsr	StatusInfo	语音转文本服务开关状态示例值：1
TextTranslate	StatusInfo	文本翻译服务开关状态示例值：1

StatisticsItem

用量数据单元

被如下接口引用：DescribeApplicationData。

名称	类型	描述
StatDate	Date	日期，格式为年-月-日，如2018-07-13 示例值：2020-09-22
Data	Integer	统计值示例值：1087

StatusInfo

服务开关状态

被如下接口引用：DescribeApplicationList。

名称	类型	描述
Status	Integer	服务开关状态， 0-正常，1-关闭示例值：0

StreamTextStatisticsItem

流式转文本用量数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Data	Float	统计值，单位：秒示例值：825.31

SubscribeRecordUserIds

指定订阅流白名单或者黑名单。

被如下接口引用：DescribeTaskInfo, ModifyRecordInfo, StartRecord。

名称	类型	必选	描述
UnSubscribeUserIds	Array of String	否	订阅音频流黑名单，指定不订阅哪几个UserId的音频流，例如["1", "2", "3"], 代表不订阅UserId 1，2，3的音频流。默认不填订阅房间内所有音频流，订阅列表用户数不超过20。注意：只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数示例值：7619
SubscribeUserIds	Array of String	否	订阅音频流白名单，指定订阅哪几个UserId的音频流，例如["1", "2", "3"], 代表订阅UserId 1，2，3的音频流。默认不填订阅房间内所有音频流，订阅列表用户数不超过20。注意：只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数。示例值：3342

Tag

标签列表

被如下接口引用：CreateApp, DescribeApplicationList。

名称	类型	必选	描述
TagKey	String	否	标签键示例值：tag_key1
TagValue	String	否	标签值示例值：tag_value1

Task

语音检测任务列表

被如下接口引用：ScanVoice。

名称	类型	必选	描述
DataId	String	是	数据的唯一ID 示例值：1400000000_test_data_id
Url	String	是	数据文件的url，为 urlencode 编码，流式则为拉流地址示例值：http://xxxx/audio_store/xxxx.mp3
RoomId	String	否	gme实时语音房间ID，通过gme实时语音进行语音分析时输入示例值：261974
OpenId	String	否	gme实时语音用户ID，通过gme实时语音进行语音分析时输入示例值：100261

TurnDetection

断句配置

被如下接口引用：StartAIConversation。

名称	类型	必选	描述
SemanticEagerness	String	否	TurnDetectionMode为3时生效，语义断句的灵敏程度功能简介：根据用户所说的话来判断其已完成发言来分割音频可选: "low" \| "medium" \| "high" \| "auto" auto 是默认值，与 medium 相同。 low 将让用户有足够的时间说话。 high 将尽快对音频进行分块。如果您希望模型在对话模式下更频繁地响应，可以将 SemanticEagerness 设置为 high 如果您希望在用户停顿时，AI能够等待片刻，可以将 SemanticEagerness 设置为 low 无论什么模式，最终都会分割送个大模型进行回复示例值：auto

UserMicStatus

用户麦克风状态

被如下接口引用：ModifyUserMicStatus。

名称	类型	必选	描述
EnableMic	Integer	是	开麦状态。1表示关闭麦克风，2表示打开麦克风。示例值：1
Uid	Integer	否	客户端用于标识用户的Openid。（Uid、StrUid必须填一个，优先处理StrUid。）示例值：9798
StrUid	String	否	客户端用于标识字符串型用户的Openid。（Uid、StrUid必须填一个，优先处理StrUid。）示例值：jelly

VoiceFilterConf

语音过滤服务配置数据

被如下接口引用：CreateApp。

名称	类型	必选	描述
Status	String	否	语音过滤服务开关，取值：open/close 示例值：open
SceneInfos	Array of SceneInfo	否	场景配置信息，如开关状态，回调地址。

VoiceFilterStatisticsItem

语音过滤用量统计数据

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Duration	Integer	语音过滤总时长，单位为min 示例值：100

VoiceMessageConf

离线语音服务配置数据

被如下接口引用：CreateApp。

名称	类型	必选	描述
Status	String	否	离线语音服务开关，取值：open/close 示例值：open
Language	String	否	离线语音支持语种，取值： all-全部，cnen-中英文。默认为中英文示例值：all

VoiceMessageStatisticsItem

语音消息用量统计信息

被如下接口引用：DescribeAppStatistics。

名称	类型	描述
Dau	Integer	离线语音DAU 示例值：1807

VoicePrint

声纹配置参数

被如下接口引用：StartAIConversation。

名称	类型	必选	描述
Mode	Integer	否	默认为0，表示不启用声纹。1表示启用声纹，此时需要填写voiceprint id。示例值：1
IdList	Array of String	否	VoicePrint Mode为1时需要填写，目前仅支持填写一个声纹id 示例值：["your-voiceprint-id"]

VoicePrintInfo

声纹查询数据

被如下接口引用：DescribeVoicePrint。

名称	类型	描述
VoicePrintId	String	声纹ID 示例值：1300056123-fd91f128-52a6-4692-b94a-c0f9fd3c4287
AppId	Integer	应用id 示例值：1300056123
VoicePrintMetaInfo	String	和声纹绑定的MetaInfo 示例值：metainfo
CreateTime	String	创建时间示例值：2025-05-21 19:23:54
UpdateTime	String	更新时间示例值：2025-05-21 19:23:54
AudioFormat	Integer	音频格式,当前只有0(代表wav) 示例值：0
AudioName	String	音频名称示例值：jackson
ReqTimestamp	Integer	请求毫秒时间戳示例值：1748249540000

数据结构

本页目录：

AgeDetectTask

AgeDetectTaskResult

AgentConfig

AmbientSound

AppStatisticsItem

ApplicationDataStatistics

ApplicationList

AsrConf

AudioTextStatisticsItem

AuditResultDetailExternal

CreateAppResp

CustomizationConfigs

DeleteResult

DescribeAppStatisticsResp

DescribeScanResult

Filter

InOutTimeInfo

InvokeLLM

ModifyAppStatusResp

OverseaTextStatisticsItem

RealTimeSpeechStatisticsItem

RealtimeSpeechConf

RealtimeTextStatisticsItem

RecordInfo

RoomUser

STTConfig

ScanDetail

ScanPiece

ScanVoiceResult

SceneInfo

ServerPushText

ServiceStatus

StatisticsItem

StatusInfo

StreamTextStatisticsItem

SubscribeRecordUserIds

Tag

Task

TurnDetection

UserMicStatus

VoiceFilterConf

VoiceFilterStatisticsItem

VoiceMessageConf

VoiceMessageStatisticsItem

VoicePrint

VoicePrintInfo