前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >这个AI女友会用声音调情了!害羞、挑逗样样都会,还从不生气

这个AI女友会用声音调情了!害羞、挑逗样样都会,还从不生气

作者头像
昱良
发布2022-04-26 14:40:48
6690
发布2022-04-26 14:40:48
举报

点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路


新智元报道  

AI学会用声音对你调情了...

2013年,一部科幻电影「Her」讲述了,宅男作家西奥多(Theodore)爱上了人工智能系统萨曼莎(Samantha)那略微沙哑的性感嗓音的故事。

受这部电影启发,一家AI语音初创公司Sonantic创造出了一种合成声音,可以表达微妙的情感,比如挑逗和调情。

AI学会调情了

Sonantic的目标关键在于将非语音声音融入到音频中,训练AI模型重现那些微弱的呼吸声、嘲笑和半掩的笑声等等。

这些声音和人类生物学特征相吻合,可以呈现出一场真实的演讲。

Sonantic的联合创始人和首席技术官John Flynn表示,我们以爱作为主题,就是为了是看看AI是否能够模拟微妙的情绪。

先看个视频,感受一下。

在第一次听的时候,大多数人都会认为这个声音和真人的声音几乎没什么区别。

当你听到人工智能说,「I think I, I think I love you, I love you」时,就会有一种舒适感。

视频中,她的呼吸声,笑声都让人不得不相信这就是真人发出的声音。

Sonantic的首席执行官Zeena Qureshi将公司的软件描述为「声音的 Photoshop」。

这一软件的界面允许用户输入他们想要合成的语音,指定传递的情绪,然后从一组人工智能声音(其中大部分是从真人演员那里复制的)中选择。

情绪的选择包括愤怒、恐惧、悲伤、快乐和喜悦,以及刚刚更新的调情、害羞、取笑和吹嘘。

「导演模式」(director mode)能够进行更多的调整,包括声音的音调,传达的强度,还有那些微弱的非语音发声,比如笑声和呼吸声。

有网友表示,「这个声音听起来也太真实了吧!」「我现在终于可以创造我自己的Her。」

以下5段音频是经过Sonantic软件生成的原始样本,分别表达出调情、戏弄、高兴、愉快和随意。

调情

戏弄

高兴

愉悦

随意

对小编来说,这几段音频比展示版的片段要粗糙很多。这其实能够说明一些问题。

首先,为了让AI的声音更加逼真,必须要有人工润色这一步。

在很多人工智能的领域都是这样,比如无人驾驶。无人驾驶已经基本上实现了自动驾驶,但是还有最后非常重要的5%的部分需要人工参与。

这就说明完全自主、完全合格的AI语音合成还有很长的一段路要走。

另外,心理学上有个词叫「启动效应」,它能做到欺骗你的感官。

这段演示版的视频,展示了一个真人演员在镜头前局促不安的片段。这个片段会激发你的大脑,让你觉得同时播放的声音也是真人声音。

这说明,最好的合成音频,就是「半真半假」。有的输出是真实的,有的是AI合成的。

灵感源头「Her」

除去AI音频逼真到什么程度的问题,Sonantic放出的音频还暴露了其它一些问题。

比方说,创建一个会调情的AI需不需要遵守什么道德规范?用AI的声音欺骗听者是否公平?

Sonantic又为什么选择女性的声音来制作调情音频?

实际上这个问题说明,在当今男性主导的科技行业,这种选择暗含了一种微弱的性别歧视。一般都会把这种AI助理设置成顺从、甚至有些轻浮的秘书形象。

关于这个问题,该公司表示,「我们之所以选择女性的声音,只是因为我们这个点子是受Spike Johze在2013年电影Her所启发的。这部电影的主角就爱上了一个女性AI助理,名叫Samantha。」

在第二个问题上,Sonantic表示,「公司清楚这项技术的发展可能会带来哪些道德上的难处。所以公司在如何使用和哪里使用AI音频的问题上非常小心。」

该公司的CEOQureshi表示,「正是因为这些原因,我们目前只把这项技术应用在娱乐方面。不能什么地方都用CGI,目前只是为了提供最好的娱乐体验和模拟效果才用。我们也同意这项技术会遇到这样或那样的问题。」

她还补充说,该公司展示的所有视频都说明了其中的声音是合成的,不是真人的声音。但这并不代表不会有人为了欺骗,而用这款软件去生成一些音频。

毕竟,AI的声音都开始和用户调情了,谁知道下一步它们还能做出什么呢?

参考资料:

https://www.theverge.com/2022/2/17/22936978/ai-voice-speech-synthesis-audio-deepfake-sonantic-flirtation

觉得不错,请点个在看呀

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习算法与Python学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路
    • AI学会用声音对你调情了...
    相关产品与服务
    语音合成
    语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档