首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

“搜狗分身”再突破,AI主播站起来了!

在过去的2018年,人工智能成为了最火热的技术之一,AI技术不断发展,让越来越多的人开始担心,未来自己的工作会不会被机器人所代替,这种担忧看似很遥远,但是对于一些职业,变革已经悄然来临……

新华社联合搜狗公司开发的AI主播再次升级,新闻主播已经开始和人工智能竞争了。

就在昨天,新华社同搜狗公司召开了战略合作签署仪式,双方共同推动媒体行业的创新发展,在仪式上,双方共同发布了全新的站立式AI主播——“新小浩”全球首个AI女主播——“新小萌”

升级后的AI主播仍以新华社主播邱浩为原型,之前发布的AI主播只能保持坐姿,表情相对僵硬,神态与播报内容结合不够贴切。而本次升级之后,“新小浩”不仅可以坐着播报,更能站起来,加入更多的肢体动作,带着各种手势及姿态,声情并茂的播报新闻,看起来更加真实,更加智能。

本次升级也实现了技术上的重大突破,在声音模型图像模型方面,成果显著,并且对“搜狗分身”技术有了巨大的提升与完善。

针对文字与声音的转换,以及对声音的模拟,都是基于声音模型完成的,本次升级采用了领先的波形建模技术生成音频,通过直接为音频信号的原始波形建模,一次为一种音频样本建模,来改变这种范式。

与听起来更为自然的语音相同,使用原始波形意味着其能够为任意类型的音频建模。经过这一技术合成的声音,更富有情感,表现力得到极大提升。

图像方面,本次升级在肢体动作方面下足了功夫,使用了海量手势数据,为其肢体动作模型进行学习,实现了“新小浩”丰富的肢体动作,并且根据主播原型邱浩的播报行为习惯进行数据分析,归纳手部动作的习惯,让动作和播报内容相结合,不再“尬舞”。

关键点标记顺序

除了肢体动作,在唇部动作方面,也对唇形合成模型进行优化,对于唇部动作的关键点标记有了新的方案,唇部共计标注20个关键点,外唇12个内唇8个,提高了动作捕获的准确性。经过一系列优化,AI主播的声音和口型配合将更加自然,更加流畅。

除了站立式AI主播,本次的另一个亮点是首个AI女主播,基于AI男主播的开发经验,AI合成女主播“新小萌”的定制周期大幅度缩短,播报效果和稳定性极大提升,AI女主播将于今年的全国两会报道上正式亮相,加入新闻报道队伍。此外合成AI女主播标志着“搜狗分身”技术的更加成熟,为更广泛的“复制”奠定了基础

截止目前,AI主播已发稿3400余条,累计时长达10000多分钟,参与了如第五届世界互联网大会首届进博会2019春运农历猪年春节等重要报道,不久的将来可实现量产。

将视野放宽,其实虚拟人物生成技术可应用领域较为广泛,AI主播只是其中最初级的尝试。在技术成熟,并且可以实现低成本复制之后,将应用于娱乐医疗健康教育法律金融等多个领域,通过提供个性化的行业解决方案。

人工智能的发展,正在让我们的生活变得更加美好,但是与此同时,又会让多少人失去工作?和人工智能比起来,我们该如何凸显核心竞争力,这一问题值得深思。

我们的服务

我们为他们服务

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190220A11AZE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券