OpenAI语音引擎只需 15 秒音频，AI 就能克隆声音以假乱真！

文章来源：企鹅号 - 思途文成

OpenAI 开发的语音克隆技术非常出色，一定会让你又惊又喜。但目前，OpenAI 仅向选定的合作伙伴发布该系统。

该技术名为 "语音引擎"（Voice Engine），只需听一段 15 秒的语音频，就能克隆出你的声音。

此外，复制的声音还能传达情感和人类说话的自然语调，让人工智能生成的对话听起来更逼真。

OpenAI 表示，该模型自 2022 年底以来一直在开发，为 ChatGPT 的文本到语音功能提供支持。

但OpenAI 并没有向公众发布语音引擎，而是认为现在时期还不成熟。

由于合成语音有可能被滥用，OpenAI 正在采取谨慎和知情的态度来进行更广泛的发布。

正如你所听到的，人工智能可以创造出的语音听起来和真人说的几乎一模一样。

很明显，如果这项技术被坏人用来干坏事，比如编造假新闻，误导公众。不过，尽管有被滥用的可能，OpenAI 仍表示语音引擎对我们来说是有益的。

从去年年末开始，OpenAI就跟一些值得信赖的合作伙伴开始测试他们的语音技术。

测试结果表明，这种技术能够模仿声音，对孩子们朗读书籍有很大帮助。不仅如此，它还能像个翻译官一样，用同一个人的声音讲出好几种不同的语言。

还有一个用途就是帮助那些失去说话能力的人通过克隆他们自己的声音来交流，类似于苹果公司正在做的事情。

因此，OpenAI 决定先向一些合作伙伴发布语音引擎，但前提是这些伙伴得承诺，决不会用这技术去做一些未经允许的欺诈行为。

OpenAI表示：合作伙伴还必须向受众明确披露，他们听到的声音是人工智能生成的。OpenAI 还添加了一个水印系统，以帮助检测 Voice Engine 中任何人工智能生成的音频。

不过，OpenAI 并不保证会广泛发布语音克隆技术。该公司表示，这在很大程度上取决于社会如何应对人工智能的兴起，因为人工智能已经在模糊虚构与现实之间的界限。

OpenAI 需要探讨如何更安全地推出合成语音技术，以及社会该如何接纳这样的新技术。

他们计划通过这些讨论和一些小范围的测试来收集信息，帮助他们更好地决定是否、以及如何在更大的范围内推广这项技术。

相关快讯