腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
AI科技评论
专栏作者
举报
4092
文章
3384764
阅读量
184
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
深度学习(999+)
神经网络(999+)
机器学习(832)
编程算法(564)
https(511)
其他(495)
网络安全(461)
NLP 服务(398)
模型(219)
图像处理(177)
机器人(174)
强化学习(165)
开源(142)
科技(142)
数据(137)
大数据(110)
监督学习(100)
卷积神经网络(88)
安全(88)
论文(80)
游戏(75)
机器翻译(73)
企业(69)
自动驾驶(68)
数据库(68)
图像识别(68)
腾讯云测试服务(67)
数据分析(64)
github(63)
学习方法(62)
人脸识别(58)
tensorflow(58)
git(58)
产品(58)
http(51)
数据挖掘(49)
工作(45)
迁移学习(42)
系统(42)
python(41)
sql(40)
自动化(39)
算法(39)
行业(38)
无人驾驶(37)
视频(37)
数据结构(36)
硬件开发(35)
知识图谱(35)
云计算(33)
linux(32)
分布式(32)
腾讯云开发者社区(32)
tcp/ip(31)
api(30)
html(28)
pytorch(28)
基础(28)
语音识别(26)
文件存储(26)
推荐系统(26)
存储(24)
微信(24)
物联网(23)
ide(22)
网站(22)
设计(22)
性能(22)
网络(21)
优化(20)
fpga(18)
nat(18)
gpt(18)
测试(18)
计算机(18)
数学(18)
研发(18)
无监督学习(17)
数据处理(17)
go(16)
架构(16)
区块链(15)
联邦学习(14)
汽车(14)
创业(14)
模式识别(13)
chatgpt(13)
搜索引擎(12)
批量计算(12)
医疗(12)
缓存(12)
百度(12)
服务(12)
开发(12)
android(11)
计算机视觉(11)
推送(11)
javascript(10)
高性能计算(10)
aigc(10)
工具(10)
公众号(10)
计算机科学(10)
语音(10)
教育(9)
开发者(9)
手机(9)
效率(9)
java(8)
r 语言(8)
matlab(8)
语音合成(8)
决策树(8)
keras(8)
阿里巴巴(8)
互联网(8)
框架(8)
搜索(8)
数据万象(7)
c++(7)
css(7)
apache(7)
spring(7)
访问管理(7)
金融(7)
渲染(7)
智能交通(7)
架构设计(7)
隐私计算(7)
live(7)
nlp(7)
元宇宙(7)
ios(6)
iphone(6)
jquery ui(6)
打包(6)
kernel(6)
windows(6)
5g(6)
迁移(6)
acm(6)
map(6)
network(6)
函数(6)
事件(6)
对象存储(5)
swift(5)
node.js(5)
嵌入式(5)
云直播(5)
爬虫(5)
数据可视化(5)
processing(5)
mask(5)
meta(5)
变量(5)
程序(5)
翻译(5)
管理(5)
软件(5)
腾讯(5)
芯片(5)
.net(4)
scala(4)
json(4)
单片机(4)
arm(4)
容器镜像服务(4)
短视频(4)
NAT 网关(4)
SSL 证书(4)
内容理解(4)
容器(4)
spark(4)
正则表达式(4)
gui(4)
面向对象编程(4)
opencv(4)
rpc(4)
视频分析(4)
智能教育(4)
figure(4)
google(4)
token(4)
表格(4)
二维码(4)
图形学(4)
微信公众号(4)
音频(4)
隐私(4)
oracle(3)
视频处理(3)
vr 视频解决方案(3)
数据安全(3)
serverless(3)
黑客(3)
数据迁移(3)
线性回归(3)
系统架构(3)
信息流(3)
对话机器人(3)
聚类算法(3)
智能推荐平台(3)
腾讯云(3)
agent(3)
cto(3)
gpu(3)
image(3)
module(3)
pdf(3)
prompt(3)
transactions(3)
zero(3)
编码(3)
程序员(3)
对象(3)
高性能(3)
华为(3)
解决方案(3)
可视化(3)
连接(3)
量化(3)
摄像头(3)
数据科学(3)
图表(3)
原型(3)
向量数据库(3)
数字货币(2)
react(2)
opengl(2)
mvc(2)
中文分词(2)
文字识别(2)
腾讯云 TI 平台(2)
腾讯专有云 PaaS 平台(2)
svg(2)
运维(2)
压力测试(2)
erp(2)
单元测试(2)
uml(2)
sas(2)
分类算法(2)
raft(2)
智能创作(2)
可信计算(2)
数据湖(2)
智能家居(2)
bi(2)
call(2)
chat(2)
com(2)
data(2)
embedding(2)
evaluation(2)
field(2)
label(2)
lstm(2)
nas(2)
object(2)
openai(2)
patch(2)
search(2)
vr(2)
web(2)
yolo(2)
编程(2)
边缘计算(2)
布局(2)
地图(2)
工程师(2)
集群(2)
量子计算(2)
内存(2)
排序(2)
苹果(2)
实践(2)
同步(2)
通信(2)
硬件(2)
原理(2)
云服务(2)
LLM(2)
费用中心(1)
云点播(1)
负载均衡(1)
腾讯云gme(1)
mac os(1)
xcode(1)
php(1)
perl(1)
c#(1)
lua(1)
bash(1)
qt(1)
云数据库 SQL Server(1)
nosql(1)
ruby on rails(1)
maven(1)
sphinx(1)
unix(1)
ubuntu(1)
windows server(1)
负载均衡缓存(1)
apt-get(1)
云数据迁移(1)
日志服务(1)
命令行工具(1)
数据加密服务(1)
腾讯git代码托管(工蜂)(1)
腾讯企点(1)
人脸核身(1)
声纹识别(1)
腾讯云小微(1)
短信(1)
数字营销(1)
DevOps 解决方案(1)
政务云专区(1)
生物基因(1)
智慧零售(1)
出行(1)
智能货柜(1)
express(1)
sass(1)
xslt & xpath(1)
kubernetes(1)
互联网金融(1)
html5(1)
ssh(1)
unity(1)
asp(1)
ftp(1)
seo(1)
二叉树(1)
aop(1)
flash(1)
ddos(1)
敏捷开发(1)
gcc(1)
iis(1)
scikit-learn(1)
powershell(1)
小程序(1)
微服务(1)
虚拟化(1)
机器学习平台(1)
特征工程(1)
angel(1)
jupyter notebook(1)
tdsql-c(1)
模型测试(1)
es(1)
数据脱敏(1)
数据集成(1)
图像搜索(1)
图像分析(1)
智能客服机器人(1)
智能音乐(1)
智慧交通(1)
智能制造(1)
虚拟直播(1)
abstract(1)
acl(1)
action(1)
alpha(1)
anchor(1)
app(1)
architecture(1)
automation(1)
average(1)
aws(1)
babel(1)
bdd(1)
block(1)
case(1)
channel(1)
character(1)
class(1)
convolution(1)
cpu(1)
crm(1)
crop(1)
dataset(1)
date(1)
detection(1)
discord(1)
distance(1)
distribution(1)
document(1)
double(1)
dynamic(1)
edge(1)
editor(1)
embedded(1)
epoch(1)
error(1)
event(1)
expression(1)
gan(1)
gaussian(1)
gps(1)
gradient(1)
graph(1)
gwt(1)
highlight(1)
iot(1)
jackson(1)
jersey(1)
kinect(1)
lan(1)
memory(1)
metrics(1)
minecraft(1)
mips(1)
model(1)
nvidia(1)
pascal(1)
permutation(1)
photo(1)
pipeline(1)
pixel(1)
precision(1)
prediction(1)
ps(1)
random(1)
ref(1)
relation(1)
saas(1)
salesforce(1)
sample(1)
self(1)
set(1)
sha(1)
size(1)
slack(1)
spaces(1)
table(1)
target(1)
tensor(1)
tm(1)
twitter(1)
ui(1)
vi(1)
video(1)
vpn(1)
wikipedia(1)
window(1)
word(1)
worker(1)
youtube(1)
播客(1)
博客(1)
部署(1)
操作系统(1)
代理(1)
登录(1)
递归(1)
动画(1)
规范化(1)
后端(1)
集合(1)
技巧(1)
计算机图形学(1)
接口(1)
跨域(1)
流量(1)
模块化(1)
软件工程(1)
统计(1)
序列化(1)
压缩(1)
移动端(1)
音视频(1)
用户体验(1)
终端(1)
重构(1)
Midjourney(1)
搜索文章
搜索
搜索
关闭
语音 AI 之路:约翰霍普金斯大学 CLSP 群英谱
机器翻译
语音识别
工作
模型
语音
“吴军、徐鹏、李志飞、陈果果、姚旭晨……这是一个有志青年从约翰霍普金斯大学离开之后,用 AI 改变世界的故事。”
AI科技评论
2023-10-24
210
0
OpenAI 发布新语音系统「Whisper 」,英文识别能力可接近人类水平
语音识别
作者 | 黄楠 编辑 | 陈彩娴 9月21日,OpenAI 发布了一个名为「Whisper 」的神经网络,声称其在英语语音识别方面已接近人类水平的鲁棒性和准确性。 「Whisper 」式一个自动语音识别(ASR)系统,研究团队通过使用从网络上收集的68万个小时多语音和多任务监督数据,来对其进行训练。 训练过程中研究团队发现,使用如此庞大且多样化的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。 此前有不同研究表明,虽然无监督预训练可以显著提高音频编码器的质量,但由于缺乏同等高质量的预训练解码器,以及特定于
AI科技评论
2022-09-22
1.9K
0
ICASSP 2022丨字节跳动最新音乐检索系统ByteCover2,检索速度提高八倍
语音识别
智能音乐
学习方法
监督学习
nat
翻唱识别(CSI)是音乐信息检索(MIR)领域的一项重要任务,在歌曲搜索,音乐分发,曲库整理,智能推荐等场景下有着重要作用,被誉为下一代音乐识别技术。 近期,字节跳动火山语音团队的最新音乐检索系统ByteCover2入选了ICASSP 2022。这一系统主要面向翻唱识别(CSI)这一音乐信息检索(MIR)领域的一项重要任务,通过表征学习方法让其具备提取音乐核心特征的能力,并且该特征能够对种类繁多的音乐重演绎具有良好的鲁棒性,检索速度提高8倍。经Da-Tacos数据集上的评估,准确率远超其他方案的SoTA性能
AI科技评论
2022-05-27
815
0
前微软首席 AI 科学家邓力再易东家,加入梵蒂冈投资
机器学习
神经网络
人工智能
语音识别
作者 | 王玥 编辑 | 陈彩娴 量化投资管理公司 Vatic Investments(梵蒂冈投资)近日宣布任命邓力博士为首席人工智能官兼机器学习全球负责人,该决定自 2022 年 5 月 9 日起生效。 图注:邓力博士 集加拿大工程院院士、IEEE Fellow、ASA(美国声学学会)Fellow以及ISCA Fellow等多种荣誉于一身,邓力博士一直被公认为是人工智能和机器学习领域世界领先的专家。邓力博士的研究方向主要为应用于大数据、语音、文本、图像和多模态处理的深度学习和机器智能方法,以及人工智能和
AI科技评论
2022-05-16
701
0
清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来
人工智能
语音识别
深度学习
学习方法
NLP 服务
近日,清华大学人工智能研究院常务副院长孙茂松教授亲手执笔,对自然语言处理的贡献、当前境界与未来挑战进行了深入的探讨。AI科技评论编辑组深有同感,认为此文十分值得一读,故分享之。 作者 | 孙茂松 来源 | 中国人工智能学会 人类语言(即自然语言)的重要性无论怎么讲都不为过。社会生物学之父爱德华·威尔逊曾说过:“语言是继真核细胞之后最伟大的进化成就。”科普畅销书《信息简史》的作者詹姆斯·格雷克也深刻地指出:“语言本身就是人类有史以来最大的技术发明。”这些断言带有科学哲学的意味,反映了现代人类对语言本质理解的不
AI科技评论
2022-03-14
302
0
160 亿美元!微软拟收购语音巨头 Nuance,史上第二大收购
语音识别
早在 2014 年,苹果语音助手 Siri 技术提供商、全球最大语音识别公司 Nuance Communications 和数家潜在巨头买家洽谈收购事宜的消息就频频见诸报端。
AI科技评论
2021-04-16
300
0
一颗芯片解决所有语音交互,百度做了一项改变行业的技术革新
硬件开发
语音识别
深度学习
4月20日,百度旗下人工智能品牌小度发布了新款无屏智能音箱——小度智能音箱 2 红外版。据百度官方介绍,该音箱搭载了百度首款针对远场语音交互研发的鸿鹄芯片,性能上有三大提升:1)在语音识别上错误率平均降低30%;2)高噪声下首次唤醒率提升10%以上,且达到家居场合使用的超低误报要求;3)平均工作功耗仅100mw左右,待机功耗下降90%。
AI科技评论
2020-04-23
768
0
今日 Paper | 联合抽取;流式语音识别;差异学习;Skip-Thought向量等
https
网络安全
语音识别
将混合CTC/Attention方法嵌入到Transformer结构中实现在线端到端的流式语音识别架构
AI科技评论
2020-04-20
333
0
数据之战:NLP迈向实用阶段的核心所在
NLP 服务
数据库
sql
语音识别
神经网络
随着人工智能技术越来越多的应用到我们的工作和日常生活中,人们对与计算机交互提出了更高的要求。人们显然已不满足于只是简单的人机对话,而是畅想可以达到人与人交流那样的酣畅淋漓,就像科幻片像人们所展现的那样。
AI科技评论
2020-03-12
544
0
CIF:基于神经元整合发放的语音识别新机制
语音识别
论文题目:CIF: Continuous Integrate-and-Fire for End-to-End Speech Recognition
AI科技评论
2020-03-05
1.6K
0
今日 Paper | 蚊子叫声数据集;提高语音识别准确率;对偶注意力推荐系统等
https
网络安全
语音识别
卷积神经网络
论文名称:Improved Robust ASR for Social Robots in Public Spaces
AI科技评论
2020-02-13
828
0
Interspeech 2019 | 基于多模态对齐的语音情感识别
语音识别
机器学习
神经网络
深度学习
人工智能
语音领域顶级学术会议 Interspeech于2019年9月15-19日在奥地利格拉茨举行。
AI科技评论
2019-09-25
3K
0
依图科技声纹识别权威竞赛夺冠,智能语音再下一城
编程算法
声纹识别
语音识别
神经网络
深度学习
在奥地利召开的机器语音国际顶会 InterSpeech 2019 上,国际声纹识别权威竞赛 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新结果,依图科技大幅领先海内外多支强队获得冠军,再次展示了世界级人工智能算法实力。
AI科技评论
2019-09-12
1.1K
0
专访俞栋:多模态是迈向通用人工智能的重要方向
语音识别
神经网络
人工智能
深度学习
语音合成
随着语音识别、自然语言处理、计算机视觉等人工智能技术日益成熟,并逐渐落地到实际场景中,如何实现大规模应用落地或者说如何通往通用人工智能,越来越成为这些领域的研究者探索和思考的命题。
AI科技评论
2019-09-12
1.6K
0
「LSTM之父」 Jürgen Schmidhuber访谈:畅想人类和 AI 共处的世界 | WAIC 2019
机器人
语音识别
机器学习
神经网络
2019 年 8 月 29 日,世界人工智能大会 WAIC 2019 在上海世博中心举行。瑞士 USI 和 SUPSI 教授,NNAISENSE 联合创始人兼首席科学家,「LSTM 网络之父」 Jürgen Schmidhuber 也受邀出席大会。
AI科技评论
2019-09-10
731
0
动态 | 序列转换模型三合一!谷歌提出首个端到端的直接语音翻译模型
语音识别
https
网络安全
神经网络
深度学习
AI 科技评论按:不同语言之间的语音到语音转换早已不是什么新鲜事了,任务拆分简单直接,只需要把「源语言的语音识别模型(语音转文本)」、「文本到文本翻译模型」、「目标语言的语音生成模型(文本转语音)」这三个模型串联使用就可以。由于这三类模型的发展都各自比较成熟,现在市面上如谷歌翻译这样的软件产品、如科大讯飞翻译机这样的专用硬件设备都能达到很好的多语互译效果,准确率和延时都让人比较满意。
AI科技评论
2019-05-20
629
0
对话微软黄学东:语音语言技术是镶在 AI 皇冠上的明珠
语音识别
机器翻译
神经网络
深度学习
AI 科技评论按:上一次你和你的电脑进行有意义的对话,并感受到它能真正地理解你,是什么时候?如果微软技术研究员、微软的语言语音小组组长黄学东博士做到了的话,那么你也将可以做到。并且,如果他以往的研究真的达到了他所说的水平的话,这一天的到来可能要比你想的还要快。
AI科技评论
2019-05-20
528
0
业界 | 谷歌用新的语音数据扩增技术大幅提升语音识别准确率
语音识别
NLP 服务
AI 科技评论按:把一段输入音频转换为一段文本的任务「自动语音识别(ASR)」,是深度神经网络的流行带来了极大变革的人工智能任务之一。如今常用的手机语音输入、YouTube 自动字幕生成、智能家电的语音控制都受益于自动语音识别技术的发展。不过,开发基于深度学习的语音识别系统还不是一个已经完善解决的问题,其中一方面的难点在于,含有大量参数的语音识别系统很容易过拟合到训练数据上,当训练不够充分时就无法很好地泛化到从未见过的数据。
AI科技评论
2019-05-08
1.1K
0
观点 | 关于 AI 的应用与实践,腾讯 AI 研究员做了以下思考
人脸核身
智慧零售
编程算法
语音识别
图像处理
AI 科技评论按:由腾讯优图主办,腾讯云、腾讯 Ai Lab 和极客邦协办,主题为「智变未来-浅谈人工智能技术应用与实践」的技术沙龙活动 3 月 23 日在北京举办,沙龙上来自腾讯、intel 的五位嘉宾就技术、产品、实践和应用等 Ai 话题展开分享。
AI科技评论
2019-05-08
756
0
动态 | Facebook 开源首个全卷积语音识别工具包 wav2letter++
卷积神经网络
语音识别
AI 科技评论按:近日,Facebook 人工智能研究院 ( FAIR ) 宣布开源首个全卷积语音识别工具包 wav2letter++。系统基于全卷积方法进行语音识别,训练语音识别端到端神经网络的速度是其他框架的 2 倍多。他们在博客中对此次开源进行了详细介绍。
AI科技评论
2018-12-29
801
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档