首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Spotify的DJ 之声 Xavier ‘X’ Jernigan 解释了成为 AI 的感觉

3 月,Spotify推出了其首个人工智能功能,推出了人工智能 DJ——一种具有令人信服的逼真声音的智能音频指南。事实证明,这个 AI 角色实际上是基于一个真实的人——Spotify 的文化合作伙伴关系负责人 Xavier “X” Jernigan,他有幸成为该 AI 功能的第一个语音模型。

TechCrunch 采访了 Jernigan,详细了解了人工智能的训练过程以及 Spotify 未来的人工智能 DJ 计划。

新的 AI DJ 为听众提供个性化的音乐聆听体验,根据他们的兴趣精选音乐。它还对每首歌进行口头评论——就像真正的电台主持人一样。

除了 Jernigan 在 Spotify 的主要角色外,他还是各种 Spotify 播客的主持人,包括“The Window”、“Showstopper”以及现已停播的播客“The Get Up”。所以,他已经习惯了让数百万听众听到他的声音。尽管如此,将他的声音作为人工智能来纪念仍然是一种独特的体验。

Spotify 选择 Jernigan 作为第一个声音模型,因为他的“声音和个性已经引起了我们很多听众的共鸣,”Jernigan 告诉 TechCrunch。“[公司] 相当有信心我也会以这种方式引起共鸣。”

Spotify 的早间节目“The Get Up”吸引了近 600 万听众,并且在 2022 年突然结束之前是 Spotify 上排名前 10 的播客,这证明了 Jernigan 的影响力。

尽管如此,作为 DJ 的配音模特一开始还是很难接受,播客主持人承认。

“我决定成为 DJ 的配音模特,当有人向我解释时,我大吃一惊,”杰尼根告诉我们。“想象一下,如果你是第一次听到这个,你没有任何东西可看,我就像,'等等,什么?它会是我,但它不是我,它是文字和声音,但它听起来像我,它是人工智能?”

“对我来说,以这种方式与 AI 合作是一种全新的体验。我简直被震惊了,”他补充道。

Spotify 表示其 AI DJ 是使用 Sonantic 和 OpenAI 技术构建的。

Sonantic 是 Spotify去年收购的一家人工智能初创公司。该公司的技术负责构建基于 AI 的逼真声音,包括用于“壮志凌云:特立独行”中 Val Kilmer 声音的声音。

Jernigan 指出,在收购之前,Spotify 花了几年时间研究人工智能技术,并“在一些迭代中”致力于 DJ 功能。他拒绝透露这个过程究竟花了多长时间,但表示整合 Sonantic 技术“确实让它进入了高速档”。

Jernigan 解释了训练 AI 的过程,包括进入演播室、朗读剧本并以不同的节奏和语调说话以传达不同的情绪。他向 AI 提供了一些只有他才能使用的词,让它感觉尽可能真实。

“我们使用我说的话……我不会说歌曲的‘曲调’。那不是我说话的方式,”他说。“我说的是‘热门歌曲’或‘热门歌曲’。” 所以,你会听到 DJ 说那些话,”杰尼根继续说道。“我们甚至做了一个完整的过程,比如,我怎么说‘嘿’,我怎么说‘你好’。” 我随身带着一个笔记本,我会写下我会说的这些不同的短语。”

他补充说,Spotify 团队确保保持他自然的停顿和呼吸,这样人工智能的声音听起来才真正像人类。

甚至 Jernigan 的妈妈也对结果表示认可。

“[DJ] 通过了妈妈测试。在它出来之前我给她播放了它,向她解释,我试图让她全神贯注,”他说。“她听了我所有的播客,所以她以前听过我录制和播放的声音,她说‘这听起来和你一模一样。’” 我妈妈说这听起来像我,所以我知道这是正确的。”

尽管逼真的 AI 声音已经存在,但我们认为 Spotify 的 DJ 与我们所听过的其他 DJ 相比是最平静、最冷酷的声音。尽管 Google 的Duplex 技术听起来很真实,但当您尝试在夏季果酱播放列表中播放音乐时,它不一定是一种好听的声音。

“对我来说,从配音的角度进行表演,我的目标是与人建立联系,与人交谈并思考一个人。所以,当我训练人工智能时,我只是想象一个人在工作室里与他们交谈并成为他们的朋友,”他补充道。

除了让 AI 语音听起来对听众友好之外,DJ 本身的设计也让人感觉平易近人。

用户在收听 DJ 时看到的动画绿色圆圈是对 Spotify 标志的点头,在 AI 说话时像嘴一样移动。

Spotify 个性化产品设计负责人 Emily Galloway 表示:“在设计时,我们考虑了整个体验——它的工作原理、声音、外观以及如何为每个用户打造个性化的体验。”技术危机。“在视觉方面的早期,我们探索了一些感觉更具技术性的选项(想象声波之类的东西)。然而,这感觉不对,因为我们想让人工智能人性化……”

“我们想让它看起来和感觉起来都独一无二。事实上,它是如此独特,以至于它获得了设计专利,”加洛韦补充道。

除了录音之外,Jernigan 还通过其他方式为 DJ 做出了贡献。

为了让 AI 提供有关音乐的专家评论,Spotify 组建了一个由策展人、文化专家和音乐专家组成的作家室。

杰尼根在音乐方面有着广泛的背景,因此他也是编剧室的参与者。他之前曾为 Diddy、Amy Winehouse 和 2 Chainz 等顶级艺术家工作。

虽然 Jernigan 是 DJ 的第一个声音模型,但未来听众有可能听到更多声音。

TechCrunch 询问 Jernigan 公司是否有任何计划雇用会说其他语言的语音模型。

“敬请期待,”他暗示道。

AI DJ 目前仅对美国和加拿大的 Premium 订阅者提供英语版本。截至2 月,DJ 功能仍处于 Beta 测试阶段。

“我们全面推出了一大堆非常酷的新功能,”杰尼根说。“我们得到了非常棒的东西。”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230425A01TR100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券