首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏成员
9145
文章
6878323
阅读量
281
订阅数
微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归
文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。在大模型(LLM)时代下,语音合成技术能够扩展大模型的语音交互能力,更是受到了广泛的关注。
机器之心
2024-03-26
5350
微软NaturalSpeech 2来了,基于扩散模型的语音合成
文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。多年来,微软亚洲研究院机器学习组和微软 Azure 语音团队持续关注语音合成领域的研究与相关产品的研发。为了合成既自然又高质量的人类语音,NaturalSpeech 研究项目(https://aka.ms/speechresearch)应运而生。 NaturalSpeech 的研究分为以下几个阶段: 1)第一阶段,在单个说话人上取得媲美人类的语音质量。为此,
机器之心
2023-05-16
1.2K0
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(二)
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 2 期进行连载,共介绍 19 个在语音合成任务上曾取得 SOTA 的经典模型。 第 1 期:BLSTM-RNN、WaveNet、SampleRNN、Char2Wav
机器之心
2023-03-29
3K0
下一个「洛天依」的打造任务,交给你了
机器之心原创 作者:张倩 虚拟歌手越来越出圈的今天,自己开发一个 APP 合成歌声已经不是什么难事了。 对于虚拟歌手洛天依的粉丝来说,2022 年 7 月 12 日是一个大日子。这一天,他们聚集在世界各地的屏幕前,陪自己的偶像度过了诞生十周年纪念日。这场历时 3 个多小时的直播演唱会人气直破千万。 图源:https://b23.tv/v290sOn 历时十年经久不衰,这是很多人类歌手都很难做到的事情,但虚拟偶像洛天依做到了。与此同时,很多新生代虚拟歌手也在陆续出道,征服着越来越多二次元以外的人。 很多粉丝
机器之心
2022-08-25
3510
“柯南领结”变成现实,字节跳动智创语音团队SAMI发布新一代实时AI变声方案
机器之心报道 机器之心编辑部 这项技术未来在虚拟人、短视频玩法、客服服务、直播互动玩法上有着很大的落地空间。 字节跳动智能创作语音团队 SAMI(Speech, Audio and Music Intelligence)近日发布了新一代的低延迟、超拟人的实时 AI 变声技术。不同于传统的变声,AI 变声是基于深度学习的声音转换(Voice Conversion)技术来实现的,可以实现任意发音人的音色定制,极大程度保留原始音色的特点。 该方案的亮点如下: 在 CPU 单核上就能做到极低延迟的实时输入实时变声,
机器之心
2022-08-25
7230
番茄小说AI的演技登上全网热搜,让火山语音出了名
机器之心报道 作者:泽南 研究员大战「硬演 AI」的故事。 AI 整的活,永远出乎人类的预料。最近,一个网络小说阅读 APP 因为有 bug 登上了热搜,b 站上也出现了不少搞笑视频,一些还有百万播放量。 引发人们广泛讨论的「番茄小说」是抖音旗下的阅读 APP,和其他很多同类应用一样带有听书功能,AI 算法生成的语音可以让你直接去听任何文字版小说,同时去做别的事。 番茄小说的不同之处在于——相对大多数 APP,它的语音合成 AI 「更聪明一点」:能够把文字读出不同音色和语气,如果文字是「哈哈哈……」,AI
机器之心
2022-06-02
1.3K0
伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文,ACL2022奖项公布
机器之心报道 编辑:陈萍、杜伟 刚刚,NLP 领域国际顶会 ACL2022 公布获奖论文信息,其中加州大学伯克利分校的增量句法表示研究被评为最佳论文。此外,最佳主题论文、杰出论文也揭晓。 ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 60 届,将于 5 月 22-5 月 27 在爱尔兰都柏林举办。 2 月 24 日,ACL 2022 录用结果
机器之心
2022-05-17
5240
高保真音色媲美真人,StyleTTS为QQ浏览器「听书」语音注入情感
今年 4 月,QQ 浏览器宣布 「小说频道」正式变更为 「免费小说」频道,这意味着阅文平台旗下的万千小说将免费供用户阅读。网络文学已浮浮沉沉二十余载,其阅读方式也随之几经改变。
机器之心
2021-10-26
1.7K0
一上台就紧张?这个模型帮你生成演讲「替身」,肢体语言比总统候选人还丰富
基于语音生成上半身动作甚至全身姿势,并实现速度、对称度等高级的姿势控制,瑞典皇家理工学院的一项研究做到了。
机器之心
2020-07-14
4950
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
昨日,百度语音能力引擎论坛在北京召开。在论坛上,百度展示了其在语音技术上的最新成果,并公开了语音专用终端芯片——百度鸿鹄的落地情况。此外,机器之心也采访了百度语音首席架构师贾磊。百度通过本次发布说明,深度学习端到端技术依然大有发展空间,软件驱动专用芯片设计成 AI 落地新打法。
机器之心
2019-12-06
7110
情感计算:让机器更加智能
在人们的认知中,机器与人的分界线是机器是否具有情感。举个例子,如果一对情侣吵架,而有一方显得过于冷漠,那么另一方很有可能向对方说出类似于「你是一个没有情感的机器」的话。因此,机器是否具有情感是机器人性化程度高低的关键因素之一。
机器之心
2019-10-12
1.7K0
用AI打个电话骗走22万欧元,克隆你的语音只需5秒录音
AI 技术的应用门槛正在不断降低,换脸、换声音、生成各种不存在的人像都变得非常容易,但与此同时,犯罪的门槛也降低了。
机器之心
2019-09-09
1.1K0
将文本转语音速度提高38倍,这个FastSpeech真的很fast
作者:Yi Ren、Yangjun Ruan、Xu Tan、Tao Qin、Sheng Zhao、Zhou Zhao、Tie-Yan Liu
机器之心
2019-06-05
1.2K0
语音版deepfake出现:从文本到逼真人声,被模仿者高呼真得可怕
加拿大创业公司 Dessa 近日发布了一项新研究:利用其最新开发的 RealTalk 系统,仅利用文本输入即可生成完美逼近真人的声音。其 demo 中展示了美国著名脱口秀喜剧演员、主持人 Joe Rogan 的声音(Joe Rogan 就是那个让马斯克在节目中嗨了的主持人)。
机器之心
2019-05-22
1.5K0
重建「巴别塔」:谷歌推出全新端到端语音翻译系统
可能是职业习惯,《流浪地球》中有一幕让小编印象非常深刻:刘培强戴着耳机和俄罗斯宇航员交流,两人各自说着母语,然后被实时同步翻译,毫无障碍不说,甚至拉家常开玩笑都没问题。这种黑科技,太好用了叭!
机器之心
2019-05-17
7290
解码大脑信号直接合成语音,Nature新研究拯救失语者
许多失去说话能力的人需要利用某种技术进行交流,这项技术要求他们做出微小的动作来控制屏幕上的光标,进而选择单词或字母。最著名的例子就是霍金,他使用的是一种利用脸颊肌肉激活的发声装置。但是由于使用者必须逐个字母打出自己要说的话,这种装置通常速度很慢,每分钟最多生成十个单词,而正常说话者每分钟平均要说 150 个词,而这主要归功于人类的声道。
机器之心
2019-05-10
7620
每天打电话提醒你拿快递的,也许是这个AI语音助手……
新年刚过,身在老家的我就接到了这样一个电话。电话对方明显是一个对话机器人,我们在用时不到一分钟的时间里完成了下面这几轮对话:
机器之心
2019-04-30
9680
想要出专辑、开个唱?试一下 Facebook「歌手变声器」
去年 6 月份,机器之心报道过,谷歌发布了从声纹识别到多重声线语音合成的迁移学习,利用该技术能够从任意一段参考音频中提取出说话者的声纹信息,并生成与其相似度极高的合成语音(参考:学界 | 现实版柯南「蝴蝶结变声器」:谷歌发布从声纹识别到多重声线语音合成的迁移学习)。这不禁让人想起《黑镜》中利用逝者音频合成语音继续陪伴生者的精彩脑洞。
机器之心
2019-04-29
8940
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档