什么样的主播水平,可以担当新华社「两会」新闻播报重任?
这个AI合成主播就可以——坐姿、站姿零失误播报是基操,而且还是3D,360度取景也hold得住。
她叫“新小微”,是全球第一个 3D+AI 合成主播,在两会召开之际上线,为全国观众带来了最新的两会新闻资讯报道。
话不多说,先来看下她的业务能力。
举止端庄,神情自然,近距离镜头前大方得体。
360°多角度取景,无死角完美呈现。
走路进场,站姿报道轻松拿下。
这就是搜狗分身最新的技术进展——基于AI算法实现实时驱动,打造高逼真、高灵活、高可控的3D AI合成主播。
“新小微”的诞生过程
我们先近距离观察一下新小微的细节。
可以看到,在超近镜头下,新小微的发丝、睫毛,甚至是毛孔都是清晰可见。
如此“高清”效果,又是如何打造的呢?
首先,是基于真人原型采集海量数据。
新小微的真人原型,是新华社记者赵琬微。
赵琬微戴着数据采集头盔,几百个摄像头对其身体各个部位,360度全方位“打点”扫描。
这样做的目的,是采集每一处细节信息,并对其多种形态的表情和动作,进行细致入微地捕捉记录。
采集完数据过后,便是生成高逼真度的3D 数字人模型。
最后,通过搜狗分身的端到端多模态生成算法,对3D数字人模型进行实时文本驱动,也就是说,只要给到一个文本,就能输出一个视频或者视频流。
在讲话过程中,3D AI合成主播的头动、肩膀、眼神、眨眼等等都非常自然。
其实,早在2018年开始,便采用搜狗分身技术,联合新华社发布全球首个AI合成主播。
真人?AI?傻傻分不清。
众所周知,自2016年以来,搜狗就确定了以语言为核心的自然交互+知识计算路线,而AI分身类产品,核心发展目标就是打造像人一样的自然交互,并且拥有强大的知识计算能力。
2D和3D的AI合成主播,正在从“表达式”向“交互式”发展,这背后要基于强大的知识理解和计算能力。
这也是全球目前及下一阶段最前沿的“数字人”的核心技术竞争力所在。
相比三星在CES上的Demo展出,搜狗已将AI合成主播实现了重要场合、重要岗位和重要任务场景上的商用。
这既是产品成熟度的自信,也是背后的技术自信。
或许要不了多久,真正的“数字人”,将不再局限于数字世界。
你期待吗?
领取专属 10元无门槛券
私享最新 技术干货