为方便开发者快速接入 GME 语音内容安全服务,本文向您介绍 GME 语音内容安全服务在语音消息审核场景的接入流程。
适用场景
适用于已接入 GME SDK 并开通语音消息服务,需要对语音消息进行审核的场景。在使用 GME 语音消息 服务的基础上,自动审核识别出语音消息音频中的敏感违规内容,即可识别出呻吟/娇喘/违规歌曲等敏感音频,也可基于音频中的文本进行涉黄/广告/谩骂等内容进行关键词识别。GME 将识别出的语音消息敏感违规内容通过客户端或服务端回调的形式通知业务,由业务自行进行合规处理。GME 语音消息审核服务仅支持以 AppID 为维度 全量开启/关闭,不支持指定送审的用户 ID 或房间 ID。
说明:
语音内容安全服务 目前仅支持中文/英文音频(呻吟声不区分语种)。
前提条件
已完成 GME 应用创建,并获取 SDK AppID 和 Key。详情请参见 服务开通指引。
已开通 GME 语音消息服务。详情请参见 服务开通指引 。
已完成 GME SDK 接入。详情请参见 SDK 快速接入。
已接入 GME 2.8.4 以上版本 SDK。
接入流程
语音消息审核功能,需要业务接收审核结果并自行处理。可通过两种路径进行接收和处理:客户端处理、游戏后台处理。
客户端处理,相当于在游戏的客户端下载语音文件的时候,或者转文本的时候,GME会将审核结果返回给游戏客户端,游戏客户端根据审核结果决定是否播放该语音或者展示该语音识别出来的文字。
游戏后台处理,即游戏客户端发送语音消息后,游戏后台收到该语音内容的审核结果回调。游戏后台需要根据审核结果判断是否将当前语音内容转发到接收端。
场景描述
发送端录制语音消息并上传语音文件,接收端下载语音文件音频或为语音文件请求转文本。常用于接收端需要默认接收音频消息,并请求进行转文本展示的场景。
涉及接口
业务流程
1. 在上传语音文件阶段,如果游戏服务端接收到审核结果,可以根据审核结果判断是否转发语音 fileid 到接收端。
2. 在下载语音文件以及请求转文本阶段,在收到审核结果后,客户端决定是否下载或者在业务层展示语音文件及文本。
注意
语音消息的审核耗时取决于音频文件的长短,一般一段长度为5s的音频,审核耗时约为2秒。如果请求下载音频文件或请求转文本时,GME 尚未完成音频文件审核,回调的审核状态将表现为“审核中”。此时业务可根据需要,自行决定是否允许音频播放或文本展示;建议业务接收端在获取到审核完成的音频前,每隔1秒轮询请求下载语音文件或转文本接口,短时间内的轮询请求转文本接口不会重复计算费用。
场景描述
发送端使用语音消息流式转文本服务,接收端下载语音文件音频或为语音文件请求转文本。常用于接收端需要默认接收音频消息并默认展示转文本结果的场景。
涉及接口
业务流程
1. 在流式语音识别阶段,如果游戏服务端接收到审核结果,可以根据审核结果判断是否转发语音 fileid 到接收端。
2. 在下载语音文件以及请求转文本阶段,在收到审核结果后,客户端决定是否下载或者在业务层展示语音文件及文本。
场景描述
发送端流式语音识别,通过外部信令通道传输识别文本结果。接收端不向 GME 发起请求。常用于接收端不需要播放音频的场景。
涉及接口
业务流程
注意
此场景下,GME 无法将审核结果通知业务客户端,需要业务在游戏服务端自行处置审核结果。若业务本身已接入第三方文本审核能力,建议关闭 GME 语音消息审核服务。
接入步骤
步骤1:服务开通与服务配置
注意
步骤2:使用语音消息服务以及语音消息转文本服务
在完成服务配置后,当您发送语音消息或请求将语音消息转文本时,GME 会自动将消息内容送检。GME SDK 的调用和接入请参见 Native SDK 快速接入、 Unity SDK 快速接入、 Unreal SDK 快速接入。
步骤3:在游戏客户端增加审核结果处置逻辑
可在游戏客户端增加下述逻辑:
基于 label 判断是否禁止当前音频文件播放。
基于命中的违规关键词对转文本结果进行内容替换或屏蔽。
对于“审核中”的回调结果增加轮询请求逻辑,直至审核状态变更为“审核完成”。轮询间隔不小于1秒。
步骤4:在游戏服务端增加审核结果处置逻辑(建议)
可在游戏服务端增加下述逻辑:基于 label 和命中的违规关键词,对玩家进行分级警告或处罚,净化游戏文明环境。