人工智能变声器,“川普”的声音你也可以有?

学习的发展很快就能让我们拥有变声功能,换成不同年龄、性别,甚至是其他人的音色都不是梦。女性音色其实是由一家叫做Modulate.ai的公司创造的,这家位于马萨诸塞州剑桥市的公司非常厉害,能用机器学习技术复制、建模、操纵语音属性。

该技术远远超出了简单的语音滤波器,可以让你听起来像星球大战中的 Kylo Ren。这种技术可以实时假设任何想要的年龄,性别和语气,或直接把用户的声音变成名人的声音。

Modulate的总部,这家公司的技术和远大雄心,谈论了使用人工智能模仿他人声音的伦理意义。而且他们公司的隔音展台上,试用了几款语音皮肤。

Modulate 的语音建模技术也不完美,创造出的新声音都有点别扭。但这是一个非常好的开端,在更多的语音数据的训练下,这种算法还能不断完善。它显示了机器学习的进步对数字现实的迅速改变。Modulate 利用生成对抗网络(GANs)来捕获和建模语音信号的音频属性。

GANs让两个神经网络相互对抗,从而真正地捕捉和再现声音数据集的属性。

随着机器学习的快速发展,两个正在视频的人“互换面孔”已能实现,所需软件从网上就能免费下载。人工智能研究人员正在使用 GAN 和其他技术来操纵视觉、听觉场景,甚至创造出完全虚假的人脸。

Modulate 在其网站上展示了美国前总统奥巴马的演示语音,联合创始人兼首席执行官迈克•帕帕斯表示,如果有足够的训练数据,任何人的“真声”都能生成。但他补充说,未经所有者许可,该公司不会提供名人变声器,声音欺骗不是开发该软件的初衷。

“开发这个软件,并不是为了模仿人类,而是为了给人带来新的机遇。”帕帕斯说。

他们的目标是在 Fornite 或 Call of Duty 等在线游戏中嵌入程序,玩家可以通过麦克风,变声与陌生人聊天。这虽然可以增强游戏体验,但却也为言语侮辱和骚扰提供了可趁之机。

帕帕斯说:“想来一段体验深刻的网聊,声音的作用至关重要。”但有些人不愿意暴露自己的原声,可能是因为觉得匿名更好,或是担心声音会透露出年龄或性别,招来无端骚扰。

纽约大学信息传播的教授查尔斯塞弗表示,这项技术似乎比其他语音修改技术更先进。他说, AI 现在操纵视频和音频的方式,有可能从根本上改变媒体的未来形态。“我们必须开始思考,到底是什么构成了现实,”塞弗表示。

Modulate公司也意识到,他们的技术可能会被滥用。该公司表示,他们一定会想办法确保,任何用户在复制他人声音前都必须得到本人同意。他们还开发了一种音频水印技术,可以用来检测听到的声音究竟是原声还是复制品。比如说,如果有人利用伪造人声打电话,这个软件就会立刻发出警告。

Modulate或许会对技术的滥用加以管制,但市面上还会有其他公司独立开发出这项技术,滥用之风可能难以彻底压制。问题是,这种变声技术的误用能有多广泛?公众对待这项技术又能有多理智呢?帕帕斯乐观地认为,人工智能造假的潜力往往被夸大了。他表示:“AI造假虽然是每个人都在关注的问题,但这并不意味着它会动摇社会发展的方方面面,我们会有办法解决的。”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190328A0QVPO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券