首页
学习
活动
专区
工具
TVP
发布

量子位

专栏作者
8591
文章
4919037
阅读量
138
订阅数
脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源
这次是用神经信号进行语音合成,帮助因神经系统缺陷导致失语的人群重新获得交流的能力。
量子位
2024-04-18
840
科大讯飞高建清:「底座+能力+应用」是科大讯飞AIGC整体布局的三层架构
明敏 整理自 凹非寺 量子位 | 公众号 QbitAI ChatGPT掀起AIGC浪潮后,关于它的影响,成为了行业内外最为热议的话题之一。 宏观的观点已不胜枚举:改变世界、AI的iPhone时刻…… 但如果回归到技术本质,它到底会带来哪些变革? 我们认为,它会改变信息分发获取的模式。革新内容生产模式,变革人机交互模式,同时也会促进多个产业的升级。 这是科大讯飞AI研究院常务副院长高建清,在首届中国AIGC产业峰会上给出的答案。 作为国产AI的中坚力量,在这股最新趋势下,科大讯飞始终被寄予厚望。 尤其在2月
量子位
2023-05-06
5960
在网易有道做语音算法工程师是一种怎样的体验?
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛能拿下怎样的成绩? 时限是,10天。 近日,全球语音顶会INTERSPEECH 2020「口音英语语音识别挑战赛」结果公布,一支名叫「大耳朵图图喵喵喵」的团队摘下了两大赛道的第二名和第三名。 参赛选手是这位: △大耳朵图图本喵 啊不,其实来自他们当中。 说起网易有道与AI语音技术相关的产品,大家或许都不陌生,比如丁磊多次安利、上市都带着的有道词典笔…… 相比在市场上取得的认可,许多人
量子位
2023-03-10
6150
1024,点亮人间烟火
杨净 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 20年前,安徽合肥一群来自中科大的探路者押注AI,成立科大讯飞。现在合肥被称为中国“最敢赌”、最牛的风险投资机构。 10年前,科大讯飞人工智能开放平台发布。 现在这个平台上的开发者,从十几个团队,成长到超过150万家;应用终端数从不到10万,增长到超过20亿;而这个平台能提供的能力,从当年的语音合成和识别两个,大幅提升到如今的334种复杂AI技能。 在讯飞之上已经成长出一套成熟的生态系统。今天,已经创下史上最佳业绩的科大讯飞,要向着新十年
量子位
2023-03-10
4010
使用英伟达NeMo让你的文字会说话,零基础即可实现自然语音生成任务 | 附代码
语音合成技术可以将文字信息转换成标准流畅的语音且进行朗读,在公共服务、智慧交通、泛娱乐、智能硬件等领域具有广泛应用。 在第3期英伟达x量子位NLP公开课上,英伟达开发者社区经理分享了【使用NeMo让你的文字会说话】,介绍了语音合成技术的理论知识,并通过代码演示讲解了如何使用NeMo快速完成自然语音生成任务。 以下为分享内容整理,文末附直播回放、课程PPT&代码、往期课程内容整理。 ---- 大家好,我是来自NVIDIA企业级开发者社区的李奕澎。今天直播的主题是使用对话式AI工具库—Nemo让你的文字会说话。
量子位
2023-03-10
4850
MSRA第五任院长周礼栋上任!出身复旦,加盟微软19年,是大规模分布式系统专家
丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI “AI黄埔军校”换校长,微软亚洲研究院(MSRA)迎来第五任院长! 今日,微软官方宣布新任命: 微软杰出首席科学家、原微软亚洲研究院常务副院长周礼栋博士,升任微软亚洲研究院院长。 他将接替上一任院长洪小文博士,全面负责微软亚洲研究院在北京和上海的研究工作,以及与中国及亚太地区学术界和产业界的合作。 而洪小文博士则继续作为微软全球资深副总裁和微软亚太研发集团主席,负责推动微软在亚太地区的整体研发战略布局和创新生态系统的构建。 微软亚洲研究院的
量子位
2023-03-10
9300
3页论文被引用17915次!88岁物理学泰斗温伯格去世,霍金《时间简史》受他启发
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这周末,整个物理学界都在哀恸! 世界上最伟大物理学家之一,粒子物理集大成者——Steven Weinberg (史蒂芬·温伯格)去世,享年88岁。 他建立了弱相互作用和电磁相互作用的统一理论,成为粒子物理标准模型的创立者之一,1979年获诺贝尔物理学奖。 除了物理学家这一身份外,他还化身科学大使,热衷于科学传播。 他所撰写《引力与宇宙学》、《最初三分钟》、《终极理论之梦》为各个领域的科学家、世界各地的科学爱好者产生了深远的影响。霍金也曾受他启发撰
量子位
2023-03-10
2420
高保真换脸让沈腾重回颜值巅峰!重建人脸3D信息,浙大、厦大、腾讯优图联合出品
明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 能让沈腾减肥成功、重回颜值巅峰: 让安妮·海瑟薇变身帅气小哥: 还能让Yoshua Bengio奔驰在绿茵草地上: 你没猜错,这又是换脸的“魔法”。 而且这效果也太自然了吧! 即便是不同性别、不同脸型,换脸后也毫不违和。 除了脸型以外,面部的线条感也能被自然复现。 把赫敏换脸成卷福,看起来都没什么违和感。 甚至脸上有遮挡也没关系,马斯克摇身一变成为异域女郎: 不止是图片,在视频里的效果也非常自然: 用3D信息重塑面部结构 以上这些效果
量子位
2023-03-10
5020
巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍
梦晨 边策 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 98.5%的人类蛋白质结构被AlphaFold2预测出来了! 而且还做成了数据集,全部免费开放! 在开源AlphaFold2仅一周后,DeepMind震撼发布AlphaFold数据集,再次引爆科研圈! 数据集中预测的所有氨基酸残基中,有58%达到可信水平,其中更有35.7%达到高置信度。 而在这之前科学家们数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基。 除了人类蛋白质组,数据集中还包括大肠杆菌、果蝇、小鼠等20个具有科研常
量子位
2023-03-10
2990
使用NeMo让你的文字会说话-深度学习在语音合成任务中的应用 | 英伟达NLP公开课
语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。 英伟达NeMo是一个用于构建先进的对话式AI模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS)的模型及方法,方便调用先进的预训练模型、快速完成对话式AI中各类子任务。 我们可以通过NeMo快速、方便地实现文字与语音之间的转换,让我们的文字会说话! 7月28日,第3期英伟达x量子位NL
量子位
2023-03-10
5050
只要5秒就能“克隆”本人语音!美玉学姐不再查寝,而是吃起了桃桃丨开源
博雯 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,AI已经能克隆任意人的声音了! 比如,前一秒的美玉学姐还在宿舍查寝: 后一秒就打算吃个桃桃: 简直就是鬼畜区的福利啊! (像我们后面就试着白学了一下华强买瓜 ) 此外,还有正经的方言版,比如台湾腔就完全冇问题: 这就是GitHub博主Vega最新的语音克隆项目MockingBird,能够在5秒之内克隆任意中文语音,并用这一音色合成新的说话内容。 这一模型短短2个月就狂揽7.6k星,更是一度登上GitHub趋势榜第一: 社区里
量子位
2023-03-01
1.3K0
英伟达用AI给自家纪录片配音,情绪节奏稳稳拿捏,不说根本听不出来
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 先来听一小段音乐: 你能听出,这其实是AI唱的吗? 虽然日常和你对话的siri声音机械,还常常胡乱断句,但实际上,最新的技术进展显示,AI的语音合成能力已经可以说得上是以假乱真。 比如英伟达,最近就发布了一个更懂节奏、更具感情的语音合成AI。 在英伟达的纪录片中,她是这样自我介绍的: 口齿清晰自不必说,这气息顿挫、情绪把控,播音员范儿够正不? 帧级控制合成语音 英伟达将在9月3日的语音技术顶会Interspeech 2021上展示该项目的最新成果。
量子位
2023-03-01
3300
12张PPT看懂中国虚拟数字人产业现状:应用不止于虚拟偶像,2030年市场达2700亿|量子位智库(附下载)
荣伟 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这位小姐姐,真不是人。 仅仅出道一年,已经拍了VogueMe杂志,上了央视综艺,还接了特斯拉的代言。 (卑微的打工人看着她的履历,流下了委屈的眼泪。) 这么飒的小姐姐,这么强的打工人,到底是何方神圣呢? 其实,她真不是人。她是来自Metaverse的虚拟数字人。 这位小姐姐叫翎Ling,是由Xmov魔珐科技与次世文化共同打造的虚拟偶像。 但都2021年了,如果你以为虚拟数字人还只能当个虚拟偶像唱唱跳跳,再偶尔接个广告,那可真就OUT了。 替代真
量子位
2023-03-01
5850
3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 只需3秒钟,一个根本没听过你说话的AI,就能完美模仿出你的声音。 例如这是你的一小句聊天语音: 这是AI根据它模仿你说话的音色: 是不是细思极恐? 这是微软最新AI成果——语音合成模型VALL·E,只需3秒语音,就能随意复制任何人的声音。 它脱胎于DALL·E,但专攻音频领域,语音合成效果在网上放出后火了: 有网友表示,要是将VALL·E和ChatGPT结合起来,效果简直爆炸: 看来与GPT-4在Zoom里聊天的日子不远了。 还有网友调侃,(继AI搞
量子位
2023-02-28
3610
都要2023年了,造机器人还能搞出什么新花活?
以AI知名的科技公司科大讯飞,2022全球1024开发者节上官宣最新技术成果和进展。
量子位
2022-12-09
6790
游戏NPC不再是站桩工具人,AI凭对话内容生成3D动作,真实度超越人类|网易新研究
不仅能按角色的性别、说话的习惯和姿态,合成不同风格的动作,还可自由替换或指定待定动作。
量子位
2022-12-09
5590
靠AI六小时开发出游戏Demo,剧本绘画配音一条龙,网友:新概念3“A”大作
这款文字冒险游戏Demo《未来地狱绘图》,由拔丝柠檬制作组开发,游戏里的剧本、立绘、场景、配音甚至是BGM都由AI包揽。
量子位
2022-12-08
3910
两分钟录音就可秒变语言通!火山语音音色复刻技术如何修炼而成?
先来欣赏一段音视频,或许你会有惊喜发现呢? 没错,这就是动漫海绵的配音模仿者的声音呈现。 不同的是,这位即将奔四的美国喜剧动画主角,如今在模仿者的演绎下一改往日的单一语言以及固定风格,居然一股脑儿说出了译制腔、TVB腔、粤语甚至上海话。 更重要的一点,所有风格以及语言,都是基于一段仅仅两分钟时长的纯中文音频训练而成。 话说两分钟时长的音频究竟可以包含多少内容? 经过语音方向的专业人士估算,基本等同于人们正常语速说出的20句话的内容量。 而这样既能保留本尊音色,又能实现多风格多语种无缝切换的“神奇语音”,还要
量子位
2022-08-26
8360
国内首次!这家中国企业的语言AI实力被公认全球No.2!仅次于谷歌
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI成精,“逼疯”程序员;AI做高数,成绩超过博士;AI写代码,成功调教智能体…… 看多了这种故事,你是不是也觉得,AI太卷了,要上天了。 今天回归本源,讲点不那么玄幻的。AI为什么会进化?底层其实没有秘密,无非是语言、视觉等几大基本功。 其中,语言能力对AI的智能水平有决定性影响。视觉研究怎么“看”,语言研究“听”、“说”和“理解”。 对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。 最近,咨询机构Gartner发布《
量子位
2022-07-07
3390
科研团队如何探索商业化落地?这家语音AI公司用十年科学试验打了样
白交 发自 凹非寺 量子位 | 公众号 QbitAI 现在,大家都在谈硬科技创新、产学研转化。 AI作为最引人注目的赛道之一,通常有两种发展模式: 互联网及传统行业巨头,利用自身业务与资源优势,通过AI降本增效、拓展新应用。 科学家创业,从零探索实验室技术的商业化路径,打造全新的产品、方案及商业模式。 AI虽然前景广阔,但技术和市场却是一个逐渐发展成熟的过程。 不可否认的是,在深度学习驱动的第三轮AI浪潮之初,有一些科研人员从实验室冒险出走,先后成立了旷视、云知声、商汤、云从、地平线、寒武纪等,陆续发展成
量子位
2022-03-04
3150
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档