腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
量子位
专栏作者
举报
8591
文章
4919037
阅读量
138
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
https(999+)
网络安全(999+)
神经网络(999+)
深度学习(999+)
其他(808)
机器学习(775)
编程算法(771)
模型(694)
自动驾驶(550)
开源(543)
无人驾驶(453)
机器人(438)
数据(371)
硬件开发(369)
github(365)
游戏(352)
NLP 服务(283)
安全(235)
图像处理(224)
git(219)
论文(200)
ios(178)
访问管理(165)
腾讯云测试服务(159)
python(155)
iphone(149)
企业(149)
大数据(148)
汽车(148)
gpt(147)
html(144)
chatgpt(143)
视频(141)
测试(131)
强化学习(123)
云计算(123)
产品(112)
工作(109)
tensorflow(108)
微信(104)
云直播(103)
网站(100)
工具(97)
行业(96)
科技(93)
tcp/ip(91)
人脸识别(90)
pytorch(90)
系统(90)
linux(89)
自动化(87)
图像识别(79)
性能(79)
api(76)
黑客(75)
语音识别(74)
数据库(74)
http(73)
android(72)
openai(72)
数学(69)
设计(67)
windows(65)
公众号(65)
基础(64)
存储(63)
开发(62)
ide(60)
数据分析(59)
区块链(58)
arm(58)
优化(56)
javascript(53)
渲染(53)
物联网(53)
医疗(51)
算法(51)
监督学习(50)
创业(50)
苹果(50)
开发者(47)
5g(46)
aigc(45)
芯片(45)
搜索引擎(44)
架构(44)
搜索(44)
go(43)
sql(43)
服务(38)
研发(38)
腾讯云开发者社区(37)
卷积神经网络(36)
网络(36)
手机(35)
缓存(34)
框架(34)
文件存储(31)
语音合成(31)
腾讯(31)
c++(30)
机器翻译(29)
分布式(29)
语音(29)
百度(28)
函数(27)
keras(26)
工程师(26)
教育(25)
meta(25)
电商(24)
内存(24)
短视频(23)
对象(23)
知识图谱(22)
高性能计算(22)
小程序(22)
编程(22)
编码(22)
软件(22)
程序(21)
华为(21)
mac os(20)
单片机(20)
硬件(20)
java(19)
批量计算(19)
金融(19)
插件(19)
事件(19)
效率(19)
音频(19)
费用中心(18)
出行(18)
爬虫(18)
数据处理(18)
fpga(18)
vr(18)
迁移学习(17)
gpu(17)
token(17)
部署(17)
计算机(17)
数据挖掘(16)
app(16)
互联网(16)
腾讯会议(15)
容器(14)
推荐系统(14)
动画(14)
bash(13)
打包(13)
数据安全(13)
unity(13)
翻译(13)
服务器(13)
教程(13)
原理(13)
php(12)
容器镜像服务(12)
联邦学习(12)
隐私计算(12)
adobe(12)
google(12)
程序员(12)
量化(12)
文字识别(11)
运维(11)
markdown(11)
迁移(11)
学习方法(11)
com(11)
ps(11)
计算机科学(11)
隐私(11)
元宇宙(11)
css(10)
numpy(10)
数据结构(10)
nat(10)
facebook(10)
操作系统(10)
连接(10)
比特币(9)
数字货币(9)
swift(9)
node.js(9)
oracle(9)
apache(9)
DevOps 解决方案(9)
智能硬件(9)
npm(9)
安全漏洞(9)
编程语言(9)
管理(9)
解决方案(9)
漏洞(9)
统计(9)
通信(9)
c 语言(8)
unix(8)
bash 指令(8)
云游戏(8)
博客(8)
终端(8)
.net(7)
嵌入式(7)
matlab(7)
无监督学习(7)
数据可视化(7)
rust(7)
智能制造(7)
腾讯云(7)
amd(7)
bug(7)
布局(7)
地图(7)
技巧(7)
配置(7)
摄像头(7)
压缩(7)
重构(7)
LLM(7)
r 语言(6)
windows server(6)
spring(6)
智能交通(6)
opencv(6)
sdk(6)
agent(6)
na(6)
nlp(6)
store(6)
youtube(6)
笔记(6)
表格(6)
流量(6)
对象存储(5)
ajax(5)
serverless(5)
kubernetes(5)
决策树(5)
ddos(5)
信息流(5)
性能测试(5)
智能推荐平台(5)
智能家居(5)
cpu(5)
max(5)
登录(5)
二维码(5)
集合(5)
脚本(5)
量子计算(5)
面试(5)
内核(5)
排序(5)
数据中心(5)
异常(5)
音视频(5)
lua(4)
react(4)
ubuntu(4)
数据加密服务(4)
腾讯git代码托管(工蜂)(4)
视频处理(4)
智慧物流(4)
生物基因(4)
互联网金融(4)
压力测试(4)
erp(4)
flash(4)
rpc(4)
scikit-learn(4)
虚拟化(4)
ascii(4)
ghost(4)
验证码(4)
手势识别(4)
智能客服机器人(4)
数据湖(4)
code(4)
gps(4)
model(4)
twitter(4)
编辑器(4)
变量(4)
反射(4)
集群(4)
计算机视觉(4)
可视化(4)
浏览器(4)
软件工程(4)
数据科学(4)
图表(4)
协议(4)
游戏引擎(4)
云服务(4)
AI绘画(4)
脑机接口(4)
解释器(4)
云点播(3)
云镜(主机安全)(3)
ruby(3)
json(3)
typescript(3)
sqlite(3)
mapreduce(3)
内容理解(3)
svg(3)
云市场(3)
shell(3)
spark(3)
ssh(3)
正则表达式(3)
线性回归(3)
asp(3)
cdn(3)
模式识别(3)
powershell(3)
系统架构(3)
微服务(3)
sas(3)
webgl(3)
智能教育(3)
jupyter notebook(3)
raft(3)
es(3)
智能创作(3)
bit(3)
cto(3)
excel(3)
jupyter(3)
mac(3)
panel(3)
video(3)
wifi(3)
编译(3)
队列(3)
阿里巴巴(3)
工作流(3)
接口(3)
进程(3)
路由(3)
模块化(3)
软件开发(3)
上传图片(3)
特效(3)
移动端(3)
游戏开发(3)
源码(3)
Midjourney(3)
云硬盘(2)
官方文档(2)
erlang(2)
actionscript(2)
xml(2)
opengl(2)
mvc(2)
django(2)
jar(2)
中文分词(2)
apt-get(2)
GPU 云服务器(2)
日志服务(2)
实时音视频(2)
移动直播(2)
全站加速网络(2)
检测工具(2)
腾讯云小微(2)
短信(2)
混合云解决方案(2)
在线旅游(2)
ar 云服务(2)
工业物联(2)
gui(2)
自动化测试(2)
单元测试(2)
kernel(2)
lamp(2)
nest(2)
视频分析(2)
对话机器人(2)
云开发(2)
聚类算法(2)
unicode(2)
dart(2)
无线技术(2)
腾讯广告算法大赛(2)
媒体处理(2)
代码托管(2)
apple(2)
chat(2)
db(2)
ddl(2)
edge(2)
glm(2)
gmail(2)
image(2)
io(2)
it(2)
lstm(2)
nvidia(2)
overflow(2)
pdf(2)
photoshop(2)
pixel(2)
prompt(2)
show(2)
space(2)
tcl(2)
text(2)
uber(2)
zero(2)
遍历(2)
播客(2)
加密(2)
监控(2)
排序算法(2)
全栈(2)
实践(2)
思维导图(2)
同步(2)
推荐算法(2)
拖拽(2)
线程(2)
域名(2)
远程办公(2)
原型(2)
云平台(2)
量子计算机(2)
向量数据库(2)
LoRa(2)
腾讯混元大模型(2)
云服务器(1)
私有网络(1)
数据万象(1)
负载均衡(1)
开发者实验室(1)
创业扶持(1)
免费套餐(1)
腾讯云gme(1)
xcode(1)
perl(1)
scala(1)
bootstrap(1)
regex(1)
angularjs(1)
vue.js(1)
jquery ui(1)
jquery(1)
qt(1)
汇编语言(1)
symfony(1)
composer(1)
云数据库 SQL Server(1)
云数据库 Redis(1)
postgresql(1)
access(1)
flask(1)
ruby on rails(1)
vba(1)
maven(1)
负载均衡缓存(1)
nginx(1)
黑石物理服务器(1)
云函数(1)
云数据迁移(1)
腾讯云可观测平台(1)
命令行工具(1)
NAT 网关(1)
VPN 连接(1)
SSL 证书(1)
人脸核身(1)
云推荐引擎(1)
双螺旋(1)
金融风控(1)
政务云专区(1)
智慧零售(1)
腾讯位置服务(1)
消费物联(1)
智能货柜(1)
微信生态上云方案(1)
微信小程序音视频(1)
electron(1)
express(1)
云联网(1)
babel.js(1)
devops(1)
html5(1)
wordpress(1)
面向对象编程(1)
dns(1)
openstack(1)
seo(1)
kotlin(1)
二叉树(1)
aop(1)
udp(1)
敏捷开发(1)
gcc(1)
iis(1)
anaconda(1)
架构设计(1)
网站建设(1)
hbase(1)
processing(1)
云数据库 postgresql(1)
任务调度(1)
机器学习平台(1)
angel(1)
分类算法(1)
供应链金融(1)
ipv6(1)
接口测试(1)
flink(1)
自动化助手(1)
图片处理(1)
腾讯云图数据可视化(1)
数据脱敏(1)
数据集成(1)
图像标签(1)
可信计算(1)
智能音乐(1)
基础教育(1)
智能家电(1)
智能穿戴(1)
小程序·云开发(1)
高性能计算集群(1)
alexa(1)
amazon(1)
anchor(1)
area(1)
asm(1)
average(1)
azure(1)
boolean(1)
break(1)
camera(1)
clickhouse(1)
convolution(1)
cs50(1)
cuda(1)
detection(1)
device(1)
dp(1)
dt(1)
effects(1)
emoji(1)
eos(1)
figure(1)
form(1)
function(1)
gan(1)
gitlab(1)
glide(1)
gnome(1)
identifier(1)
instagram(1)
interface(1)
iot(1)
julia(1)
lan(1)
latex(1)
layer(1)
leetcode(1)
less(1)
line(1)
local(1)
macbook(1)
map(1)
mask(1)
math(1)
maya(1)
mdm(1)
medium(1)
metrics(1)
mobile(1)
mocha(1)
models(1)
mozilla(1)
next(1)
nft(1)
object(1)
oceanbase(1)
ocr(1)
office(1)
p2p(1)
partition(1)
pascal(1)
perfect(1)
pip(1)
pipeline(1)
precision(1)
probability(1)
profile(1)
random(1)
salesforce(1)
scale(1)
session(1)
simd(1)
skype(1)
snapchat(1)
spotify(1)
stack(1)
stackoverflow(1)
steam(1)
subset(1)
super(1)
svm(1)
sympy(1)
tensor(1)
tensorboard(1)
title(1)
touch(1)
transactions(1)
transfer(1)
ui(1)
view(1)
vim(1)
vimeo(1)
watch(1)
web开发(1)
whatsapp(1)
wiki(1)
word(1)
word2vec(1)
worker(1)
编译器(1)
边缘计算(1)
代理(1)
代码质量(1)
递归(1)
二进制(1)
黑客马拉松(1)
后端(1)
后台(1)
继承(1)
计算机图形学(1)
兼容性(1)
开发工具(1)
开源框架(1)
客户端(1)
快捷键(1)
蓝牙(1)
流媒体(1)
逆向工程(1)
前端(1)
权限(1)
入门(1)
视频直播(1)
数据存储(1)
数据类型(1)
树莓派(1)
树形结构(1)
数组(1)
推送(1)
微信小程序(1)
文件上传(1)
文件系统(1)
小游戏(1)
语法(1)
云存储(1)
在线教育(1)
重定向(1)
主机(1)
注解(1)
数据标注(1)
OLTP(1)
AI生图(1)
图像分割(1)
零知识证明(1)
游戏AI(1)
搜索文章
搜索
搜索
关闭
脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源
语音合成
开源
模型
数据
语音
这次是用神经信号进行语音合成,帮助因神经系统缺陷导致失语的人群重新获得交流的能力。
量子位
2024-04-18
84
0
科大讯飞高建清:「底座+能力+应用」是科大讯飞AIGC整体布局的三层架构
语音合成
aigc
布局
架构
模型
明敏 整理自 凹非寺 量子位 | 公众号 QbitAI ChatGPT掀起AIGC浪潮后,关于它的影响,成为了行业内外最为热议的话题之一。 宏观的观点已不胜枚举:改变世界、AI的iPhone时刻…… 但如果回归到技术本质,它到底会带来哪些变革? 我们认为,它会改变信息分发获取的模式。革新内容生产模式,变革人机交互模式,同时也会促进多个产业的升级。 这是科大讯飞AI研究院常务副院长高建清,在首届中国AIGC产业峰会上给出的答案。 作为国产AI的中坚力量,在这股最新趋势下,科大讯飞始终被寄予厚望。 尤其在2月
量子位
2023-05-06
596
0
在网易有道做语音算法工程师是一种怎样的体验?
语音合成
语音识别
腾讯云测试服务
编程算法
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛能拿下怎样的成绩? 时限是,10天。 近日,全球语音顶会INTERSPEECH 2020「口音英语语音识别挑战赛」结果公布,一支名叫「大耳朵图图喵喵喵」的团队摘下了两大赛道的第二名和第三名。 参赛选手是这位: △大耳朵图图本喵 啊不,其实来自他们当中。 说起网易有道与AI语音技术相关的产品,大家或许都不陌生,比如丁磊多次安利、上市都带着的有道词典笔…… 相比在市场上取得的认可,许多人
量子位
2023-03-10
615
0
1024,点亮人间烟火
语音识别
语音合成
企业
人工智能
神经网络
杨净 晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 20年前,安徽合肥一群来自中科大的探路者押注AI,成立科大讯飞。现在合肥被称为中国“最敢赌”、最牛的风险投资机构。 10年前,科大讯飞人工智能开放平台发布。 现在这个平台上的开发者,从十几个团队,成长到超过150万家;应用终端数从不到10万,增长到超过20亿;而这个平台能提供的能力,从当年的语音合成和识别两个,大幅提升到如今的334种复杂AI技能。 在讯飞之上已经成长出一套成熟的生态系统。今天,已经创下史上最佳业绩的科大讯飞,要向着新十年
量子位
2023-03-10
401
0
使用英伟达NeMo让你的文字会说话,零基础即可实现自然语音生成任务 | 附代码
语音合成
深度学习
云直播
NLP 服务
语音合成技术可以将文字信息转换成标准流畅的语音且进行朗读,在公共服务、智慧交通、泛娱乐、智能硬件等领域具有广泛应用。 在第3期英伟达x量子位NLP公开课上,英伟达开发者社区经理分享了【使用NeMo让你的文字会说话】,介绍了语音合成技术的理论知识,并通过代码演示讲解了如何使用NeMo快速完成自然语音生成任务。 以下为分享内容整理,文末附直播回放、课程PPT&代码、往期课程内容整理。 ---- 大家好,我是来自NVIDIA企业级开发者社区的李奕澎。今天直播的主题是使用对话式AI工具库—Nemo让你的文字会说话。
量子位
2023-03-10
485
0
MSRA第五任院长周礼栋上任!出身复旦,加盟微软19年,是大规模分布式系统专家
语音合成
分布式
丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI “AI黄埔军校”换校长,微软亚洲研究院(MSRA)迎来第五任院长! 今日,微软官方宣布新任命: 微软杰出首席科学家、原微软亚洲研究院常务副院长周礼栋博士,升任微软亚洲研究院院长。 他将接替上一任院长洪小文博士,全面负责微软亚洲研究院在北京和上海的研究工作,以及与中国及亚太地区学术界和产业界的合作。 而洪小文博士则继续作为微软全球资深副总裁和微软亚太研发集团主席,负责推动微软在亚太地区的整体研发战略布局和创新生态系统的构建。 微软亚洲研究院的
量子位
2023-03-10
930
0
3页论文被引用17915次!88岁物理学泰斗温伯格去世,霍金《时间简史》受他启发
https
网络安全
访问管理
语音合成
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这周末,整个物理学界都在哀恸! 世界上最伟大物理学家之一,粒子物理集大成者——Steven Weinberg (史蒂芬·温伯格)去世,享年88岁。 他建立了弱相互作用和电磁相互作用的统一理论,成为粒子物理标准模型的创立者之一,1979年获诺贝尔物理学奖。 除了物理学家这一身份外,他还化身科学大使,热衷于科学传播。 他所撰写《引力与宇宙学》、《最初三分钟》、《终极理论之梦》为各个领域的科学家、世界各地的科学爱好者产生了深远的影响。霍金也曾受他启发撰
量子位
2023-03-10
242
0
高保真换脸让沈腾重回颜值巅峰!重建人脸3D信息,浙大、厦大、腾讯优图联合出品
https
网络安全
访问管理
语音合成
明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 能让沈腾减肥成功、重回颜值巅峰: 让安妮·海瑟薇变身帅气小哥: 还能让Yoshua Bengio奔驰在绿茵草地上: 你没猜错,这又是换脸的“魔法”。 而且这效果也太自然了吧! 即便是不同性别、不同脸型,换脸后也毫不违和。 除了脸型以外,面部的线条感也能被自然复现。 把赫敏换脸成卷福,看起来都没什么违和感。 甚至脸上有遮挡也没关系,马斯克摇身一变成为异域女郎: 不止是图片,在视频里的效果也非常自然: 用3D信息重塑面部结构 以上这些效果
量子位
2023-03-10
502
0
巨大冲击!AlphaFold2再登Nature,从业者都懵了:人类98.5%的蛋白质,全都被预测了一遍
https
网络安全
数据库
sql
语音合成
梦晨 边策 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 98.5%的人类蛋白质结构被AlphaFold2预测出来了! 而且还做成了数据集,全部免费开放! 在开源AlphaFold2仅一周后,DeepMind震撼发布AlphaFold数据集,再次引爆科研圈! 数据集中预测的所有氨基酸残基中,有58%达到可信水平,其中更有35.7%达到高置信度。 而在这之前科学家们数十年的努力,只覆盖了人类蛋白质序列中17%的氨基酸残基。 除了人类蛋白质组,数据集中还包括大肠杆菌、果蝇、小鼠等20个具有科研常
量子位
2023-03-10
299
0
使用NeMo让你的文字会说话-深度学习在语音合成任务中的应用 | 英伟达NLP公开课
语音识别
云直播
NLP 服务
语音合成
语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。 英伟达NeMo是一个用于构建先进的对话式AI模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS)的模型及方法,方便调用先进的预训练模型、快速完成对话式AI中各类子任务。 我们可以通过NeMo快速、方便地实现文字与语音之间的转换,让我们的文字会说话! 7月28日,第3期英伟达x量子位NL
量子位
2023-03-10
505
0
只要5秒就能“克隆”本人语音!美玉学姐不再查寝,而是吃起了桃桃丨开源
语音合成
https
网络安全
博雯 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,AI已经能克隆任意人的声音了! 比如,前一秒的美玉学姐还在宿舍查寝: 后一秒就打算吃个桃桃: 简直就是鬼畜区的福利啊! (像我们后面就试着白学了一下华强买瓜 ) 此外,还有正经的方言版,比如台湾腔就完全冇问题: 这就是GitHub博主Vega最新的语音克隆项目MockingBird,能够在5秒之内克隆任意中文语音,并用这一音色合成新的说话内容。 这一模型短短2个月就狂揽7.6k星,更是一度登上GitHub趋势榜第一: 社区里
量子位
2023-03-01
1.3K
0
英伟达用AI给自家纪录片配音,情绪节奏稳稳拿捏,不说根本听不出来
语音合成
https
网络安全
访问管理
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 先来听一小段音乐: 你能听出,这其实是AI唱的吗? 虽然日常和你对话的siri声音机械,还常常胡乱断句,但实际上,最新的技术进展显示,AI的语音合成能力已经可以说得上是以假乱真。 比如英伟达,最近就发布了一个更懂节奏、更具感情的语音合成AI。 在英伟达的纪录片中,她是这样自我介绍的: 口齿清晰自不必说,这气息顿挫、情绪把控,播音员范儿够正不? 帧级控制合成语音 英伟达将在9月3日的语音技术顶会Interspeech 2021上展示该项目的最新成果。
量子位
2023-03-01
330
0
12张PPT看懂中国虚拟数字人产业现状:应用不止于虚拟偶像,2030年市场达2700亿|量子位智库(附下载)
虚拟化
tcp/ip
深度学习
语音合成
云直播
荣伟 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这位小姐姐,真不是人。 仅仅出道一年,已经拍了VogueMe杂志,上了央视综艺,还接了特斯拉的代言。 (卑微的打工人看着她的履历,流下了委屈的眼泪。) 这么飒的小姐姐,这么强的打工人,到底是何方神圣呢? 其实,她真不是人。她是来自Metaverse的虚拟数字人。 这位小姐姐叫翎Ling,是由Xmov魔珐科技与次世文化共同打造的虚拟偶像。 但都2021年了,如果你以为虚拟数字人还只能当个虚拟偶像唱唱跳跳,再偶尔接个广告,那可真就OUT了。 替代真
量子位
2023-03-01
585
0
3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿
语音合成
https
网络安全
NLP 服务
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 只需3秒钟,一个根本没听过你说话的AI,就能完美模仿出你的声音。 例如这是你的一小句聊天语音: 这是AI根据它模仿你说话的音色: 是不是细思极恐? 这是微软最新AI成果——语音合成模型VALL·E,只需3秒语音,就能随意复制任何人的声音。 它脱胎于DALL·E,但专攻音频领域,语音合成效果在网上放出后火了: 有网友表示,要是将VALL·E和ChatGPT结合起来,效果简直爆炸: 看来与GPT-4在Zoom里聊天的日子不远了。 还有网友调侃,(继AI搞
量子位
2023-02-28
361
0
都要2023年了,造机器人还能搞出什么新花活?
机器人
语音合成
编程算法
语音识别
神经网络
以AI知名的科技公司科大讯飞,2022全球1024开发者节上官宣最新技术成果和进展。
量子位
2022-12-09
679
0
游戏NPC不再是站桩工具人,AI凭对话内容生成3D动作,真实度超越人类|网易新研究
语音合成
数据库
sql
不仅能按角色的性别、说话的习惯和姿态,合成不同风格的动作,还可自由替换或指定待定动作。
量子位
2022-12-09
559
0
靠AI六小时开发出游戏Demo,剧本绘画配音一条龙,网友:新概念3“A”大作
游戏
https
网络安全
语音合成
NLP 服务
这款文字冒险游戏Demo《未来地狱绘图》,由拔丝柠檬制作组开发,游戏里的剧本、立绘、场景、配音甚至是BGM都由AI包揽。
量子位
2022-12-08
391
0
两分钟录音就可秒变语言通!火山语音音色复刻技术如何修炼而成?
sdk
ide
语音合成
先来欣赏一段音视频,或许你会有惊喜发现呢? 没错,这就是动漫海绵的配音模仿者的声音呈现。 不同的是,这位即将奔四的美国喜剧动画主角,如今在模仿者的演绎下一改往日的单一语言以及固定风格,居然一股脑儿说出了译制腔、TVB腔、粤语甚至上海话。 更重要的一点,所有风格以及语言,都是基于一段仅仅两分钟时长的纯中文音频训练而成。 话说两分钟时长的音频究竟可以包含多少内容? 经过语音方向的专业人士估算,基本等同于人们正常语速说出的20句话的内容量。 而这样既能保留本尊音色,又能实现多风格多语种无缝切换的“神奇语音”,还要
量子位
2022-08-26
836
0
国内首次!这家中国企业的语言AI实力被公认全球No.2!仅次于谷歌
语音识别
语音合成
NLP 服务
神经网络
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI成精,“逼疯”程序员;AI做高数,成绩超过博士;AI写代码,成功调教智能体…… 看多了这种故事,你是不是也觉得,AI太卷了,要上天了。 今天回归本源,讲点不那么玄幻的。AI为什么会进化?底层其实没有秘密,无非是语言、视觉等几大基本功。 其中,语言能力对AI的智能水平有决定性影响。视觉研究怎么“看”,语言研究“听”、“说”和“理解”。 对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。 最近,咨询机构Gartner发布《
量子位
2022-07-07
339
0
科研团队如何探索商业化落地?这家语音AI公司用十年科学试验打了样
硬件开发
语音识别
语音合成
深度学习
医疗
白交 发自 凹非寺 量子位 | 公众号 QbitAI 现在,大家都在谈硬科技创新、产学研转化。 AI作为最引人注目的赛道之一,通常有两种发展模式: 互联网及传统行业巨头,利用自身业务与资源优势,通过AI降本增效、拓展新应用。 科学家创业,从零探索实验室技术的商业化路径,打造全新的产品、方案及商业模式。 AI虽然前景广阔,但技术和市场却是一个逐渐发展成熟的过程。 不可否认的是,在深度学习驱动的第三轮AI浪潮之初,有一些科研人员从实验室冒险出走,先后成立了旷视、云知声、商汤、云从、地平线、寒武纪等,陆续发展成
量子位
2022-03-04
315
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档