首页
学习
活动
专区
工具
TVP
发布

AI科技大本营的专栏

专栏作者
3088
文章
3143460
阅读量
201
订阅数
着眼用户需求,vivo 致力于用 AI 实现“1001 个便利”
当前信息技术已经进入人机物融合、万物智能互联的阶段,人工智能作为引领新一轮科技革命和产业变革的重要战略性技术,成为各行业数字化重构的神兵利器。与我们生活息息相关的诸如智能家居、智能汽车、智慧手机等等终端设备的“智”化发展都离不开 AI 技术的支撑。
AI科技大本营
2022-12-10
6600
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。
AI科技大本营
2022-02-10
6960
元宇宙中可跨语种交流!Meta 发布新语音模型,支持128种语言无障碍对话
语言交流是人类互动一种自然的方式,随着语音技术的发展,我们可以与设备以及未来的虚拟世界进行互动,由此虚拟体验将于我们的现实世界融为一体。
AI科技大本营
2021-11-25
5790
微软重资押注医疗 AI , 或将 160 亿美元收购 Nuance
外媒 4月12日消息,微软正在进行关于收购全球最大语音识别技术公司 Nuance Communications 的谈判。
AI科技大本营
2021-04-21
3610
2021全球最具影响力 AI 学者榜单: 中国占比11.1%,位列第二
2021 年 4 月 8 日,2021 年人工智能全球最具影响力学者——AI 2000 榜单重磅揭晓。
AI科技大本营
2021-04-21
8080
用 Python 训练自己的语音识别系统,这波操作稳了!
近几年来语音识别技术得到了迅速发展,从手机中的Siri语音智能助手、微软的小娜以及各种平台的智能音箱等等,各种语音识别的项目得到了广泛应用。
AI科技大本营
2020-06-24
2.2K0
利用 AssemblyAI 在 PyTorch 中建立端到端的语音识别模型
这篇文章是由AssemblyAI的机器学习研究工程师Michael Nguyen撰写的。AssemblyAI使用Comet记录、可视化和了解模型开发流程。
AI科技大本营
2020-06-16
1.4K0
干货:NIST评测(SRE19)获胜团队声纹识别技术分析 | CSDN博文精选
近日,NIST说话人识别技术评测 (Speaker Recognition Evaluation,SRE)正式公布榜单,芯片初创公司清微智能和清华大学等机构组成的联队,在Conversational Telephone Speech (CTS)和Multimedia两个任务上均取得全球前十,亚洲地区第一的好成绩。
AI科技大本营
2020-02-12
1.2K0
爱奇艺HomeAI智能语音交互系统的技术实践
本期爱奇艺技术沙龙《语音和语言技术在自然交互中的实践》主题中,邀请了来自爱奇艺、小米等的嘉宾为大家分享了关于语音技术方面的创新以及该技术在应用方面的实践,本期沙龙的干货分享我们会陆续发布,首先跟大家分享的是爱奇艺HomeAI智能语音交互系统及在语音交互系统的相关实践,以下为演讲实录。
AI科技大本营
2020-02-12
1.9K0
GitHub标星近10万:只需5秒音源,这个网络就能实时“克隆”你的声音
本文中,Google 团队提出了一种文本语音合成(text to speech)神经系统,能通过少量样本学习到多个不同说话者(speaker)的语音特征,并合成他们的讲话音频。此外,对于训练时网络没有接触过的说话者,也能在不重新训练的情况下,仅通过未知说话者数秒的音频来合成其讲话音频,即网络具有零样本学习能力。
AI科技大本营
2019-11-14
11.6K0
微软语音AI技术与微软听听文档小程序实践 | AI ProCon 2019
【导语】9 月 7 日,在CSDN主办的「AI ProCon 2019」上,微软(亚洲)互联网工程院人工智能语音团队首席研发总监赵晟、微软(亚洲)互联网工程院 Office 365资深产品经理,Office 小程序负责人张鹏共同发表《微软语音AI与微软听听小程序实践》的主题演讲,分享微软人工智能语音的技术以及微软听听小程序的落地实践。
AI科技大本营
2019-10-08
1.8K0
从不温不火到炙手可热:语音识别技术简史
【导读】语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状,并分析一些未来趋势,希望能帮助更多年轻技术人员了解语音行业,并能产生兴趣投身于这个行业。
AI科技大本营
2019-08-23
1.5K0
从音视频技术看AI的机会和挑战
我关注AI完全是被动的,直到两件事改变了我对AI的看法。第一件发生在2017年5月,AlphaGo以3比0战胜柯洁。我的一个朋友当时在乌镇现场感受了这场人机大战,她向我描述了柯洁被逼到走投无路的无奈与绝望表情。另一件事在2018年初,现场聆听了蒋涛关于AI的分享,其中介绍了在Google内部,AI已经在大部分产品上应用,包括Youtube。由于工作关系,Youtube在AI方面的应用自然引起了我的注意,比如通过AI理解视频内容,自动截取最能表现视频内容的关键帧,可用于生成视频封面。
AI科技大本营
2019-08-16
5790
史上最强最贵Mac Pro诞生,iPadOS和iOS分家!WWDC19全面总结
一年一度的WWDC终于来了!43岁的苹果,产品经验位居世界前列。一个迈入中年的公司,该如何持续做出让人惊艳的产品呢?答案就在WWDC 2019!
AI科技大本营
2019-06-14
1.4K0
微软提出极低资源下语音合成与识别新方法,小语种不怕没数据!| ICML 2019
编者按:目前,人类使用的语言种类有近7000种,然而由于缺乏足够的语音-文本监督数据,绝大多数语言并没有对应的语音合成与识别功能。为此,微软亚洲研究院机器学习组联合微软(亚洲)互联网工程院语音团队在ICML 2019上提出了极低资源下的语音合成与识别新方法,帮助所有人都可以享受到最新语音技术带来的便捷。
AI科技大本营
2019-05-22
1.5K0
苹果春季发布会:绝不玩别人玩剩下的
库克是个大忙人,上一条新闻还是参观故宫,下一条新闻就是出现在苹果总部的史蒂夫·乔布斯剧院——开苹果春季发布会了。
AI科技大本营
2019-05-06
4970
Google又逆天:语音输入离线实时输出文字,仅占80MB!然而……
这次出手的,又是谷歌 AI 团队。刚刚,他们为旗下的一款手机输入法 Gboard (不要跟谷歌拼音输入法搞混了啊~)上线了新功能:离线语音识别。目前这一新功能,只能在其自家的产品 Pixel 系列手机上使用。
AI科技大本营
2019-03-19
2.4K0
1400小时开源语音数据集,你想要都在这儿
3 月 1 日,由 Mozilla 基金会发起的 Common Voice 项目,发布新版语音识别数据集,包括来自 42000 名贡献者,超过 1400 小时的语音样本数据,涵盖包括英语、法语、德语、荷兰语、汉语在内的 18 种语言。
AI科技大本营
2019-03-12
2.2K0
叫你一声“孙悟空”,敢答应么?
随着自然语言理解等技术的发展,对话机器人如今盛行,而基于此的智能音箱产品的发展也异常火热。
AI科技大本营
2019-03-08
1.2K0
快手如何通过算法和算力支撑用户的增长
如今,短视频成了人们的新宠,闲暇时大家总是习惯性地拿出手机“刷刷刷”。而在众多短视频应用中,坚持“记录生活,记录你”的快手一直颇受大家青睐。
AI科技大本营
2018-12-21
7960
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档