腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器之心
专栏成员
举报
9145
文章
6878323
阅读量
281
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
模型(999+)
深度学习(999+)
神经网络(999+)
机器学习(999+)
https(999+)
数据(999+)
其他(999+)
网络安全(999+)
编程算法(963)
论文(709)
开源(633)
NLP 服务(538)
性能(419)
机器人(417)
系统(352)
视频(326)
强化学习(321)
图像处理(307)
工作(304)
算法(300)
python(281)
github(259)
测试(233)
自动驾驶(228)
游戏(224)
设计(222)
网络(219)
gpt(218)
框架(210)
优化(207)
安全(202)
科技(194)
架构(190)
硬件开发(187)
chatgpt(181)
pytorch(177)
tensorflow(174)
产品(154)
监督学习(149)
工具(142)
git(140)
函数(140)
基础(138)
图像识别(133)
开发(129)
卷积神经网络(128)
开发者(126)
芯片(126)
企业(124)
数学(122)
腾讯云测试服务(120)
行业(117)
无人驾驶(116)
openai(116)
语音识别(111)
api(110)
搜索(108)
汽车(107)
分布式(96)
数据库(92)
服务(90)
内存(90)
数据分析(88)
渲染(85)
linux(84)
http(84)
大数据(82)
ide(78)
tcp/ip(78)
声纹识别(76)
网站(75)
效率(75)
存储(72)
自动化(70)
云计算(70)
学习方法(68)
编码(68)
html(66)
研发(65)
sql(64)
keras(64)
人脸识别(63)
数据结构(63)
语音(61)
迁移学习(60)
苹果(60)
计算机(59)
腾讯(57)
隐私计算(56)
手机(55)
机器翻译(54)
缓存(51)
gpu(51)
meta(51)
计算机科学(51)
无监督学习(49)
token(49)
文件存储(48)
对象(48)
LLM(48)
nat(47)
编程(47)
华为(47)
音频(47)
推荐系统(45)
解决方案(44)
工程师(43)
搜索引擎(42)
知识图谱(42)
css(41)
软件(41)
部署(40)
百度(38)
压缩(38)
java(37)
打包(37)
连接(37)
医疗(36)
windows(36)
量化(36)
javascript(35)
公众号(35)
计算机视觉(35)
硬件(35)
数据挖掘(34)
微信(34)
c++(33)
腾讯云开发者社区(33)
迁移(33)
翻译(33)
ios(32)
黑客(31)
创业(31)
arm(30)
批量计算(29)
联邦学习(29)
iphone(28)
numpy(28)
go(27)
云直播(27)
变量(27)
事件(25)
决策树(24)
数据处理(24)
教育(24)
实践(24)
程序(23)
区块链(22)
短视频(22)
nlp(22)
动画(22)
服务器(22)
物联网(21)
fpga(21)
com(21)
编程语言(21)
统计(21)
原理(21)
apache(19)
prompt(19)
插件(19)
语音合成(18)
kernel(18)
5g(18)
互联网(18)
可视化(18)
隐私(18)
程序员(17)
内核(17)
文字识别(16)
markdown(16)
aigc(16)
管理(16)
接口(16)
摄像头(16)
mac os(15)
嵌入式(15)
金融(15)
acl(15)
gan(15)
集合(15)
量子计算(15)
排序(15)
图表(15)
重构(15)
android(14)
opencv(14)
数据可视化(14)
cpu(14)
表格(14)
通信(14)
博客(13)
漏洞(13)
.net(12)
高性能计算(12)
电商(12)
数据安全(12)
爬虫(12)
架构设计(12)
app(12)
编译(12)
地图(12)
数据中心(12)
bash(11)
matlab(11)
访问管理(11)
gui(11)
agent(11)
facebook(11)
脚本(11)
原型(11)
r 语言(10)
node.js(10)
ajax(10)
容器(10)
运维(10)
面向对象编程(10)
线性回归(10)
flash(10)
code(10)
工作流(10)
技巧(10)
教程(10)
面试(10)
配置(10)
数据科学(10)
单片机(9)
容器镜像服务(9)
模式识别(9)
系统架构(9)
lstm(9)
video(9)
操作系统(9)
代理(9)
阿里巴巴(9)
高性能(9)
模块化(9)
索引(9)
协议(9)
异常(9)
元宇宙(9)
php(8)
spring(8)
正则表达式(8)
小程序(8)
腾讯云(8)
acm(8)
bug(8)
scaling(8)
编译器(8)
布局(8)
反射(8)
集群(8)
开源框架(8)
浏览器(8)
入门(8)
软件工程(8)
树莓派(8)
特效(8)
erp(7)
scikit-learn(7)
processing(7)
虚拟化(7)
jupyter notebook(7)
智能创作(7)
adobe(7)
bit(7)
image(7)
ocr(7)
vr(7)
供应链(7)
同步(7)
终端(7)
LoRa(7)
Midjourney(7)
swift(6)
c 语言(6)
json(6)
bash 指令(6)
单元测试(6)
智能客服机器人(6)
graph(6)
patch(6)
pdf(6)
客户端(6)
路由(6)
密码学(6)
日志(6)
移动端(6)
语法(6)
oracle(5)
中文分词(5)
SSL 证书(5)
人脸核身(5)
内容理解(5)
视频处理(5)
express(5)
serverless(5)
devops(5)
spark(5)
ssh(5)
unity(5)
安全漏洞(5)
视频分析(5)
cuda(5)
google(5)
max(5)
models(5)
office(5)
ps(5)
text(5)
递归(5)
后端(5)
计算机图形学(5)
进程(5)
逆向工程(5)
软件开发(5)
图形学(5)
音视频(5)
字符串(5)
脑机接口(5)
比特币(4)
xcode(4)
scala(4)
ubuntu(4)
全站加速网络(4)
DevOps 解决方案(4)
智慧物流(4)
二叉树(4)
rpc(4)
特征工程(4)
sdk(4)
rust(4)
模型测试(4)
视频理解(4)
智慧交通(4)
智能制造(4)
cto(4)
debug(4)
macbook(4)
self(4)
youtube(4)
笔记(4)
二维码(4)
加密(4)
兼容性(4)
流量(4)
拖拽(4)
解释器(4)
费用中心(3)
云服务器(3)
数据万象(3)
数字货币(3)
ruby(3)
access(3)
unix(3)
nginx(3)
apt-get(3)
mapreduce(3)
日志服务(3)
TDSQL MySQL 版(3)
NAT 网关(3)
腾讯云小微(3)
kubernetes(3)
shell(3)
dns(3)
asp(3)
cdn(3)
微服务(3)
canvas(3)
机器学习平台(3)
性能测试(3)
腾讯广告算法大赛(3)
云游戏(3)
流计算 Oceanus(3)
alpha(3)
amd(3)
cs(3)
detection(3)
epoch(3)
excel(3)
glm(3)
instance(3)
intel(3)
interpreter(3)
it(3)
jupyter(3)
keynote(3)
layer(3)
map(3)
mask(3)
mobile(3)
nvidia(3)
object(3)
overflow(3)
pipeline(3)
reddit(3)
robotics(3)
ssm(3)
uber(3)
登录(3)
二进制(3)
跨域(3)
敏捷(3)
排序算法(3)
前端(3)
全栈(3)
调试(3)
异步(3)
云服务(3)
智慧城市(3)
对象存储(2)
perl(2)
c#(2)
lua(2)
react(2)
jquery ui(2)
xml(2)
jquery(2)
qt(2)
云数据库 Redis(2)
django(2)
windows server(2)
黑石物理服务器(2)
命令行工具(2)
检测工具(2)
短信(2)
双螺旋(2)
生物基因(2)
智能交通(2)
出行(2)
智能硬件(2)
svg(2)
互联网金融(2)
html5(2)
hadoop(2)
jvm(2)
yum(2)
selenium(2)
聚类算法(2)
angel(2)
腾讯会议(2)
dart(2)
raft(2)
内容识别(2)
智能推荐平台(2)
手势识别(2)
智能音乐(2)
adapter(2)
bi(2)
block(2)
class(2)
dataset(2)
dsl(2)
e2e(2)
el(2)
embedding(2)
eval(2)
free(2)
gaussian(2)
gif(2)
ipa(2)
kaggle(2)
key(2)
knn(2)
latex(2)
local(2)
mesh(2)
midi(2)
min(2)
module(2)
na(2)
nas(2)
network(2)
next(2)
null(2)
pascal(2)
point(2)
powerpoint(2)
ram(2)
rpa(2)
salesforce(2)
set(2)
similarity(2)
size(2)
stack(2)
state(2)
system(2)
ui(2)
vi(2)
wifi(2)
word(2)
word2vec(2)
yolo(2)
zero(2)
百度飞桨(2)
编辑器(2)
边缘计算(2)
并发(2)
产品经理(2)
动态规划(2)
公有云(2)
黑客马拉松(2)
后台(2)
继承(2)
开源软件(2)
命令行(2)
设计模式(2)
视频编码(2)
数组(2)
图数据库(2)
推荐算法(2)
线程(2)
虚拟机(2)
虚拟现实(2)
用户体验(2)
游戏开发(2)
游戏引擎(2)
远程办公(2)
增强现实(2)
最佳实践(2)
自然语言处理(2)
深度学习框架(2)
向量数据库(2)
云+校园(1)
云点播(1)
云镜(主机安全)(1)
官方文档(1)
认证考试(1)
objective-c(1)
cocoa(1)
actionscript(1)
bootstrap(1)
regex(1)
vue.js(1)
typescript(1)
ecmascript(1)
opengl(1)
汇编语言(1)
composer(1)
云数据库 SQL Server(1)
postgresql(1)
flask(1)
vba(1)
jar(1)
maven(1)
全文检索(1)
云数据迁移(1)
实时音视频(1)
音视频点播加速(1)
智能鉴黄(1)
es 2(1)
专有云(1)
金融风控(1)
智慧零售(1)
工业物联(1)
electron(1)
云联网(1)
babel.js(1)
压力测试(1)
wordpress(1)
hive(1)
sql server(1)
spring boot(1)
npm(1)
seo(1)
kotlin(1)
敏捷开发(1)
socket编程(1)
uml(1)
lamp(1)
ntp(1)
anaconda(1)
sas(1)
haskell(1)
nest(1)
智能外呼机器人(1)
信息流(1)
mqtt(1)
flutter(1)
对话机器人(1)
ddos 攻击(1)
内容安全(1)
云开发(1)
分类算法(1)
接口测试(1)
测试策略(1)
etcd(1)
flink(1)
ghost(1)
媒体处理(1)
智能编辑(1)
数据脱敏(1)
验证码(1)
视频内容安全(1)
应用安全开发(1)
Elasticsearch Service(1)
数据集成(1)
图像标签(1)
图像分析(1)
测试服务(1)
数据湖(1)
自由视角(1)
设计云(1)
腾讯天籁 inside(1)
智慧停车(1)
基础教育(1)
智能家居(1)
小程序·云开发(1)
代码托管(1)
action(1)
ada(1)
alexa(1)
amp(1)
animation(1)
apollo(1)
apple(1)
assertion(1)
atomic(1)
automation(1)
aws(1)
backbone(1)
background(1)
bat(1)
cad(1)
cell(1)
chat(1)
classification(1)
composition(1)
config(1)
connect(1)
container(1)
controller(1)
cookies(1)
copy(1)
cut(1)
data(1)
database(1)
db(1)
diff(1)
difference(1)
direct3d(1)
distance(1)
distribution(1)
drawing(1)
element(1)
email(1)
embed(1)
encoding(1)
entity(1)
equation(1)
error(1)
extract(1)
factory(1)
feed(1)
figure(1)
final(1)
focus(1)
formula(1)
frame(1)
fs(1)
gin(1)
global(1)
gps(1)
gradient(1)
gzip(1)
hierarchy(1)
history(1)
hugo(1)
identifier(1)
ipad(1)
jpeg(1)
julia(1)
label(1)
lambda(1)
list(1)
lm(1)
logic(1)
ls(1)
mac(1)
match(1)
matching(1)
math(1)
matplotlib(1)
matrix(1)
mean(1)
media(1)
medium(1)
memory(1)
microsoft(1)
mips(1)
mnist(1)
modeling(1)
mvp(1)
nft(1)
nio(1)
oceanbase(1)
ode(1)
offline(1)
offset(1)
optimization(1)
output(1)
owl(1)
photo(1)
photoshop(1)
physics(1)
pixel(1)
position(1)
prediction(1)
presto(1)
project(1)
publish(1)
pyramid(1)
random(1)
reduce(1)
reference(1)
relation(1)
rest(1)
rgb(1)
rss(1)
scale(1)
sensors(1)
sh(1)
shift(1)
signature(1)
sketch(1)
slice(1)
slide(1)
smoothing(1)
space(1)
split(1)
src(1)
ssl(1)
store(1)
sum(1)
summary(1)
svm(1)
t4(1)
target(1)
time(1)
tm(1)
torch(1)
tree(1)
twitter(1)
var(1)
verification(1)
vim(1)
web(1)
web3(1)
webp(1)
wix(1)
worker(1)
workspace(1)
z3(1)
zip(1)
备份(1)
遍历(1)
表单(1)
播客(1)
产品设计(1)
队列(1)
多线程(1)
工具类(1)
规范化(1)
混合云(1)
架构师(1)
监控(1)
交换机(1)
局域网(1)
开发工具(1)
开发环境(1)
快捷键(1)
路由器(1)
乱码(1)
求职(1)
权限(1)
上传图片(1)
生命周期(1)
数据采集(1)
数据存储(1)
数据管理(1)
系统设计(1)
小游戏(1)
性能优化(1)
远程工作(1)
云平台(1)
指针(1)
重定向(1)
主机(1)
城市交通(1)
时序预测(1)
梯度下降算法(1)
量子算法(1)
混合现实(1)
深度强化学习(1)
图像分割(1)
3D建模(1)
腾讯混元大模型(1)
幻兽帕鲁(1)
搜索文章
搜索
搜索
关闭
微软NaturalSpeech语音合成推出第三代,网友惊呼:超自然!实至名归
语音合成
模型
数据
系统
语音
文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。在大模型(LLM)时代下,语音合成技术能够扩展大模型的语音交互能力,更是受到了广泛的关注。
机器之心
2024-03-26
535
0
微软NaturalSpeech 2来了,基于扩散模型的语音合成
语音合成
模型
数据
系统
语音
文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。多年来,微软亚洲研究院机器学习组和微软 Azure 语音团队持续关注语音合成领域的研究与相关产品的研发。为了合成既自然又高质量的人类语音,NaturalSpeech 研究项目(https://aka.ms/speechresearch)应运而生。 NaturalSpeech 的研究分为以下几个阶段: 1)第一阶段,在单个说话人上取得媲美人类的语音质量。为此,
机器之心
2023-05-16
1.2K
0
Tacotron2、GST、Glow-TTS、Flow-TTS…你都掌握了吗?一文总结语音合成必备经典模型(二)
语音合成
模型
网络
音频
语音
机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 2 期进行连载,共介绍 19 个在语音合成任务上曾取得 SOTA 的经典模型。 第 1 期:BLSTM-RNN、WaveNet、SampleRNN、Char2Wav
机器之心
2023-03-29
3K
0
下一个「洛天依」的打造任务,交给你了
https
网络安全
深度学习
图像处理
语音合成
机器之心原创 作者:张倩 虚拟歌手越来越出圈的今天,自己开发一个 APP 合成歌声已经不是什么难事了。 对于虚拟歌手洛天依的粉丝来说,2022 年 7 月 12 日是一个大日子。这一天,他们聚集在世界各地的屏幕前,陪自己的偶像度过了诞生十周年纪念日。这场历时 3 个多小时的直播演唱会人气直破千万。 图源:https://b23.tv/v290sOn 历时十年经久不衰,这是很多人类歌手都很难做到的事情,但虚拟偶像洛天依做到了。与此同时,很多新生代虚拟歌手也在陆续出道,征服着越来越多二次元以外的人。 很多粉丝
机器之心
2022-08-25
351
0
“柯南领结”变成现实,字节跳动智创语音团队SAMI发布新一代实时AI变声方案
语音合成
云直播
机器之心报道 机器之心编辑部 这项技术未来在虚拟人、短视频玩法、客服服务、直播互动玩法上有着很大的落地空间。 字节跳动智能创作语音团队 SAMI(Speech, Audio and Music Intelligence)近日发布了新一代的低延迟、超拟人的实时 AI 变声技术。不同于传统的变声,AI 变声是基于深度学习的声音转换(Voice Conversion)技术来实现的,可以实现任意发音人的音色定制,极大程度保留原始音色的特点。 该方案的亮点如下: 在 CPU 单核上就能做到极低延迟的实时输入实时变声,
机器之心
2022-08-25
723
0
番茄小说AI的演技登上全网热搜,让火山语音出了名
语音合成
编程算法
机器之心报道 作者:泽南 研究员大战「硬演 AI」的故事。 AI 整的活,永远出乎人类的预料。最近,一个网络小说阅读 APP 因为有 bug 登上了热搜,b 站上也出现了不少搞笑视频,一些还有百万播放量。 引发人们广泛讨论的「番茄小说」是抖音旗下的阅读 APP,和其他很多同类应用一样带有听书功能,AI 算法生成的语音可以让你直接去听任何文字版小说,同时去做别的事。 番茄小说的不同之处在于——相对大多数 APP,它的语音合成 AI 「更聪明一点」:能够把文字读出不同音色和语气,如果文字是「哈哈哈……」,AI
机器之心
2022-06-02
1.3K
0
伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文,ACL2022奖项公布
https
网络安全
NLP 服务
语音合成
机器之心报道 编辑:陈萍、杜伟 刚刚,NLP 领域国际顶会 ACL2022 公布获奖论文信息,其中加州大学伯克利分校的增量句法表示研究被评为最佳论文。此外,最佳主题论文、杰出论文也揭晓。 ACL 是计算语言学和自然语言处理领域的顶级国际会议,由国际计算语言学协会组织,每年举办一次。一直以来,ACL 在 NLP 领域的学术影响力都位列第一,它也是 CCF-A 类推荐会议。今年的 ACL 大会已是第 60 届,将于 5 月 22-5 月 27 在爱尔兰都柏林举办。 2 月 24 日,ACL 2022 录用结果
机器之心
2022-05-17
524
0
高保真音色媲美真人,StyleTTS为QQ浏览器「听书」语音注入情感
语音合成
今年 4 月,QQ 浏览器宣布 「小说频道」正式变更为 「免费小说」频道,这意味着阅文平台旗下的万千小说将免费供用户阅读。网络文学已浮浮沉沉二十余载,其阅读方式也随之几经改变。
机器之心
2021-10-26
1.7K
0
一上台就紧张?这个模型帮你生成演讲「替身」,肢体语言比总统候选人还丰富
语音合成
https
网络安全
基于语音生成上半身动作甚至全身姿势,并实现速度、对称度等高级的姿势控制,瑞典皇家理工学院的一项研究做到了。
机器之心
2020-07-14
495
0
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
硬件开发
编程算法
语音合成
深度学习
机器学习
昨日,百度语音能力引擎论坛在北京召开。在论坛上,百度展示了其在语音技术上的最新成果,并公开了语音专用终端芯片——百度鸿鹄的落地情况。此外,机器之心也采访了百度语音首席架构师贾磊。百度通过本次发布说明,深度学习端到端技术依然大有发展空间,软件驱动专用芯片设计成 AI 落地新打法。
机器之心
2019-12-06
711
0
情感计算:让机器更加智能
https
网络安全
语音合成
强化学习
机器人
在人们的认知中,机器与人的分界线是机器是否具有情感。举个例子,如果一对情侣吵架,而有一方显得过于冷漠,那么另一方很有可能向对方说出类似于「你是一个没有情感的机器」的话。因此,机器是否具有情感是机器人性化程度高低的关键因素之一。
机器之心
2019-10-12
1.7K
0
用AI打个电话骗走22万欧元,克隆你的语音只需5秒录音
语音合成
编程算法
机器学习
神经网络
深度学习
AI 技术的应用门槛正在不断降低,换脸、换声音、生成各种不存在的人像都变得非常容易,但与此同时,犯罪的门槛也降低了。
机器之心
2019-09-09
1.1K
0
将文本转语音速度提高38倍,这个FastSpeech真的很fast
语音合成
作者:Yi Ren、Yangjun Ruan、Xu Tan、Tao Qin、Sheng Zhao、Zhou Zhao、Tie-Yan Liu
机器之心
2019-06-05
1.2K
0
语音版deepfake出现:从文本到逼真人声,被模仿者高呼真得可怕
语音合成
https
网络安全
机器学习
神经网络
加拿大创业公司 Dessa 近日发布了一项新研究:利用其最新开发的 RealTalk 系统,仅利用文本输入即可生成完美逼近真人的声音。其 demo 中展示了美国著名脱口秀喜剧演员、主持人 Joe Rogan 的声音(Joe Rogan 就是那个让马斯克在节目中嗨了的主持人)。
机器之心
2019-05-22
1.5K
0
重建「巴别塔」:谷歌推出全新端到端语音翻译系统
语音识别
语音合成
https
网络安全
可能是职业习惯,《流浪地球》中有一幕让小编印象非常深刻:刘培强戴着耳机和俄罗斯宇航员交流,两人各自说着母语,然后被实时同步翻译,毫无障碍不说,甚至拉家常开玩笑都没问题。这种黑科技,太好用了叭!
机器之心
2019-05-17
729
0
解码大脑信号直接合成语音,Nature新研究拯救失语者
语音合成
神经网络
许多失去说话能力的人需要利用某种技术进行交流,这项技术要求他们做出微小的动作来控制屏幕上的光标,进而选择单词或字母。最著名的例子就是霍金,他使用的是一种利用脸颊肌肉激活的发声装置。但是由于使用者必须逐个字母打出自己要说的话,这种装置通常速度很慢,每分钟最多生成十个单词,而正常说话者每分钟平均要说 150 个词,而这主要归功于人类的声道。
机器之心
2019-05-10
762
0
每天打电话提醒你拿快递的,也许是这个AI语音助手……
NLP 服务
机器人
语音合成
语音识别
新年刚过,身在老家的我就接到了这样一个电话。电话对方明显是一个对话机器人,我们在用时不到一分钟的时间里完成了下面这几轮对话:
机器之心
2019-04-30
968
0
想要出专辑、开个唱?试一下 Facebook「歌手变声器」
语音合成
去年 6 月份,机器之心报道过,谷歌发布了从声纹识别到多重声线语音合成的迁移学习,利用该技术能够从任意一段参考音频中提取出说话者的声纹信息,并生成与其相似度极高的合成语音(参考:学界 | 现实版柯南「蝴蝶结变声器」:谷歌发布从声纹识别到多重声线语音合成的迁移学习)。这不禁让人想起《黑镜》中利用逝者音频合成语音继续陪伴生者的精彩脑洞。
机器之心
2019-04-29
894
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档