前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >这家AI创业公司说,听完1分钟音频就能合成出你的声音

这家AI创业公司说,听完1分钟音频就能合成出你的声音

作者头像
量子位
发布2018-03-30 16:56:52
1.7K0
发布2018-03-30 16:56:52
举报
文章被收录于专栏:量子位量子位
安妮 编译整理 量子位 出品 | 公众号 QbitAI

如果以后智能家居产品用Angelababy的声音叫你起床,电子词典用川普的声音教你学英语,你可千万不要太惊异。目前,人工智能技术已经将语音变得可以像像素一样可复制和扩展了。这个语音合成领域的大突破还得从Lyrebird说起。

昨天,一家名为Lyrebird的加拿大AI初创公司推出了它第一款产品,他们宣布,这个产品拥有的算法可以通过倾听一分钟的音频样本记住发音人的声色,并模仿他的声音合成各种语句。

我们先来听听Lyrebird的产品合成的特朗普、奥巴马和希拉里的声音:

讲真,Lyrebird的产品功能也不算是行业首创。早先Google旗下的DeepMind曾经公布了一个用AI合成人声的研究成果:WaveNet,它与人类的发音非常相似,不仔细听可能都会骗过你的耳朵。无独有偶,Adobe也发布过一款叫Project VoCo的原型软件,用Project VoCo来编辑语音,就如同用Photoshop来编辑图像。

在人们纠结于Project VoCo需要倾听20分钟的音频样本才可以模仿时,Lyrebird出现了。它将音频样品输入时间缩短至60秒——虽然目前它输出的声音和真人声还有区别,但无疑它的技术也在不断进步嘛。

仅仅合成特定人声不不够的,Lyrebird的算法还可以合成“有感情”的声音——可以模仿你的愤怒、同情甚至压力山大下的语调。这款产品可以被大范围应用在很多地方,比如用名人的声音阅读有声读物,比如将它连接到其他智能设备,比如为残疾人合成语音,当然,也可以被应用在制作动画电影和视频游戏上。

不过,也有不少人担心,这些语音合成软件的应用可能会带来很多麻烦。

之前伯明翰阿拉巴马大学的一项调查表明,语音合成的声音可以欺骗人和核实身份的机器。如果给予AI的的信息足够多,它甚至可以生成任何人以假乱真的图片或者视频。比如UAB报道的一则新闻,使用者可以使用3D映射将自己的表情实时转移到乔治·布什或普京的脸上(可以有链接)。

如果这项技术结合了Lyrebird的语音合成器,你可以轻松的在Facebook上发布一条“唐纳德·川普声称将使用生化武器进攻朝鲜”的新闻。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-04-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档