学习
实践
活动
专区
工具
TVP
写文章

全球首个AI主播在新华社上岗!主播们会失业吗?

第五届世界互联网大会在浙江乌镇拉开帷幕。

而在开幕当天,有这样一场发布会,让发布会的主持人邱浩倍感压力和“虐心”。这是一场跨界产品发布会,搜狗与新华社合作开发、全球第一个“AI合成主播”正式亮相。

更戏剧化的是,这个AI合成主播原型就是作为现场主持人的邱浩。

“一个真实的主播,站在现在这个地方来主持一个虚拟主播的发布会,而且还要向世人去宣告,这样一个虚拟主播有多么的强大,简直虐心啊!我觉得这需要非常强大的勇气!”

——著名主持人邱浩

C位出道的主播如何工作?

只要输入一句既有的新闻文本,屏幕上的TA,就可以用和真人一样的声音进行播报,连唇形、面部表情也能完全吻合。

“AI合成主播”是通过提取真人主播新闻播报视频中的声音、唇形、表情动作等特征,运用语音、唇形、表情合成以及深度学习等技术联合建模训练而成。用户只需要输入新闻文本,AI合成主播就能用和真人一样的声音进行播报,而在播报的过程中唇形、面部表情等也能与真人主播完全吻合,效果惟妙惟肖。

“AI合成主播”不仅有中文“AI合成主播”,同时还有以“联接中外、沟通世界”为使命的英文“AI合成主播”。

现在,“AI合成主播”正式成为新华社报道队伍中一员,TA将同其他主播一起,为你带来权威、及时、准确的中英文新闻资讯。

对比真人主播,“AI合成主播”就是一个开“外挂”般的存在!真人主播一天工作8小时,一周还得固定休息,但“AI合成主播”能够不知疲倦地工作7天24小时。

虽然在语音和表情的自然程度上,“AI合成主播”其实还是有很大改进空间的(尤其是讲英文的嘴形不是很像)。但即便如此,从效率的角度出发,可以全天候待命的 AI 主播还是有非常大优势的。

什么是“搜狗分身”技术?

随着“AI合成主播”的亮相,搜狗人工智能的核心技术“搜狗分身”终于浮出水面,同时也是第五届世界互联网大会开幕日的最大亮点之一。

据了解,“搜狗分身”技术可以让机器以更逼真自然的形象呈现在用户面前,而不是冷冰冰的“机器人”

以“AI合成主播”为例,TA创造性地使用新华社中、英文主播的真人形象,配合“搜狗分身”的语音、合成等技术模拟真人播报画面,使大众享受到逼真度极高的图像效果。

“搜狗分身”技术能仅靠少量用户真实音视频数据,即可快速定制出高逼真度的分身模型,显著降低了个性化定制成本,进而帮助人类提高信息表达和传递的效率。

据搜狗公司智能语音事业部总经理王砚峰介绍,“搜狗分身”技术是搜狗人工智能的核心技术之一,诞生于搜狗“自然交互+知识计算”这一人工智能理念之下。

该技术依托“搜狗分身”技术创新的信息传播形式,利用搜狗的AI能力,从图像表情,声音语言习惯,逻辑思维等层面对AI进行拟人化训练,克隆制造人类的AI分身,进而帮助人类提高信息表达和传递的效率。

在“搜狗分身”技术的支持下,用户通过文字键入、语音输入、机器翻译等多种方式输入文本后,将获得实时的播报视频。这种操作方式将极大减少新闻媒体在后期制作的各项成本,让新闻视频的制作效率有了极大的提高。

早在2012 年,搜狗就开始了对语音技术研究的探索,并逐步发展为中国最大的语音识别引擎,目前,搜狗日均语音请求达5亿次,经过多年的技术沉淀和数据积累,已具备多语种、多音色的语音合成能力,并能实现个性化语音合成和情感迁移。

制作AI合成主播的技术团队,曾多次在机器视觉国际顶级赛事IEEE CVPR WAD、Pascal VOC、Mega Face以及语音合成领域最具权威性的Blizzard Challenge赛事上斩获冠军。

据搜狗介绍,AI主播只是“搜狗分身”技术的应用场景之一,未来他们还有计划将技术运用到娱乐、医疗、健康、教育、法律等更多的领域。

而这次的“AI合成主播”,不仅在全球AI合成领域实现了技术创新和突破,更是在新闻领域开创了实时音视频与AI真人形象合成的先河。

*除特别注明外,本公众号所有文章均为硅谷RAVV原创,如需转载,请联系小编

JOIN US

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181109G1GIA000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券