人工智能变声器，“川普”的声音你也可以有？

文章来源：企鹅号 - 北旗辉邵

学习的发展很快就能让我们拥有变声功能，换成不同年龄、性别，甚至是其他人的音色都不是梦。女性音色其实是由一家叫做Modulate.ai的公司创造的，这家位于马萨诸塞州剑桥市的公司非常厉害，能用机器学习技术复制、建模、操纵语音属性。

该技术远远超出了简单的语音滤波器，可以让你听起来像星球大战中的 Kylo Ren。这种技术可以实时假设任何想要的年龄，性别和语气，或直接把用户的声音变成名人的声音。

Modulate的总部，这家公司的技术和远大雄心，谈论了使用人工智能模仿他人声音的伦理意义。而且他们公司的隔音展台上，试用了几款语音皮肤。

Modulate 的语音建模技术也不完美，创造出的新声音都有点别扭。但这是一个非常好的开端，在更多的语音数据的训练下，这种算法还能不断完善。它显示了机器学习的进步对数字现实的迅速改变。Modulate 利用生成对抗网络（GANs）来捕获和建模语音信号的音频属性。

GANs让两个神经网络相互对抗，从而真正地捕捉和再现声音数据集的属性。

随着机器学习的快速发展，两个正在视频的人“互换面孔”已能实现，所需软件从网上就能免费下载。人工智能研究人员正在使用 GAN 和其他技术来操纵视觉、听觉场景，甚至创造出完全虚假的人脸。

Modulate 在其网站上展示了美国前总统奥巴马的演示语音，联合创始人兼首席执行官迈克•帕帕斯表示，如果有足够的训练数据，任何人的“真声”都能生成。但他补充说，未经所有者许可，该公司不会提供名人变声器，声音欺骗不是开发该软件的初衷。

“开发这个软件，并不是为了模仿人类，而是为了给人带来新的机遇。”帕帕斯说。

他们的目标是在 Fornite 或 Call of Duty 等在线游戏中嵌入程序，玩家可以通过麦克风，变声与陌生人聊天。这虽然可以增强游戏体验，但却也为言语侮辱和骚扰提供了可趁之机。

帕帕斯说：“想来一段体验深刻的网聊，声音的作用至关重要。”但有些人不愿意暴露自己的原声，可能是因为觉得匿名更好，或是担心声音会透露出年龄或性别，招来无端骚扰。

纽约大学信息传播的教授查尔斯塞弗表示，这项技术似乎比其他语音修改技术更先进。他说， AI 现在操纵视频和音频的方式，有可能从根本上改变媒体的未来形态。“我们必须开始思考，到底是什么构成了现实，”塞弗表示。

Modulate公司也意识到，他们的技术可能会被滥用。该公司表示，他们一定会想办法确保，任何用户在复制他人声音前都必须得到本人同意。他们还开发了一种音频水印技术，可以用来检测听到的声音究竟是原声还是复制品。比如说，如果有人利用伪造人声打电话，这个软件就会立刻发出警告。

Modulate或许会对技术的滥用加以管制，但市面上还会有其他公司独立开发出这项技术，滥用之风可能难以彻底压制。问题是，这种变声技术的误用能有多广泛？公众对待这项技术又能有多理智呢？帕帕斯乐观地认为，人工智能造假的潜力往往被夸大了。他表示:“AI造假虽然是每个人都在关注的问题，但这并不意味着它会动摇社会发展的方方面面，我们会有办法解决的。”

发表于: 2019-03-282019-03-28 20:42:54
原文链接：https://kuaibao.qq.com/s/20190328A0QVPO00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

人工智能变声器，“川普”的声音你也可以有？

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐