前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >搜狗分身技术再进化,让AI合成主播“动”起来

搜狗分身技术再进化,让AI合成主播“动”起来

作者头像
AI科技大本营
发布2019-03-08 11:01:25
5870
发布2019-03-08 11:01:25
举报

整理 | 一一

出品 | AI科技大本营

去年 11 月的互联网大会期间,搜狗与新华社联合发布全球首个AI合成主播一经亮相,引起了人们对“AI+媒体”的广泛讨论。如今,搜狗 AI 合成主播不断更新迭代。

2 月 19 日,在新华社新媒体中心与搜狗公司战略合作签约仪式上,搜狗公司与新华社新媒体中心联合发布了站立式 AI 合成主播,这次新的 AI 合成主播从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”,标志着“搜狗分身”技术再次取得突破。

据了解,初代 AI 合成主播由“搜狗分身”技术打造,这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,创造出人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。

那此次发布的站立式 AI 合成主播又开拓了哪些“技能”?据搜狗方面介绍,新版的 AI 合成主播采用了“搜狗分身”的 WaveRNN 波形建模技术,可以实现逼真的语音合成效果,让 AI 的声音更具有真实情感和表现力。而在图像生成方面,新版的 AI 合成主播实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力,而且还让 AI 合成主播“动”了起来,这提升了合成主播的表现力。

什么是“搜狗分身”技术?它诞生于搜狗“自然交互+知识计算”的人工智能理念之下,能够利用搜狗的 AI 能力,从图像表情,声音语言习惯,逻辑思维等层面对 AI 进行拟人化训练,然后克隆制造人类的 AI 分身,进而帮助人类提高信息表达和传递的效率。

搜狗方面表示,随着“搜狗分身”技术能力的不断提高,AI 合成主播的定制周期也大为降低,合成效果和稳定性也有着显著提升。值得一提的是,此次发布会同时发布了首个 AI 合成女主播,这是“搜狗分身”技术持续复制不同类型、不同特点 AI 合成主播能力的一个体现。目前,仅靠少量用户真实音视频数据,搜狗即可快速定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。

搜狗 CEO 王小川介绍,作为 AI 合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同职业赋能,提升整个社会的信息生产力。

据悉,目前首批入职新华社的一中一英两位 AI 合成主播,已生产 3400 余条新闻报道,累计时长达 10000 多分钟,参与了包括第五届世界互联网大会、首届进博会、2019 春运、春节等报道,成为中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。

而最新推出的站立式 AI 合成主播将参与 2019 年全国两会的报道,并将在搜狗搜索、输入法等资讯平台上与用户见面。

(本文为 AI科技大本营整理文章,转载请微信联系 1092722531)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档