首页
学习
活动
专区
工具
TVP
发布

量子位

专栏作者
8591
文章
4917171
阅读量
138
订阅数
英伟达AI游戏引擎炸场CES!NPC与玩家实时交互,对话动作流畅似真人
在CES 2024的活动上,英伟达展示了利用Avatar Cloud Engine (ACE)技术打造的最新成果。
量子位
2024-01-11
1330
用活人脑细胞造AI系统!语音识别已成功,可无监督学习|Nature子刊
但这种思想下设计的“传统”类脑芯片大多数都是直接基于数字电子原理,完全模仿大脑功能的能力着实有限。
量子位
2023-12-12
1890
用BigDL-LLM 即刻加速百亿级参数LLM推理 | 最“in”大模型
我们正迈入一个由大语言模型(Large Language Model, LLM)驱动的 AI 新时代,LLM在诸如客户服务、虚拟助理、内容创作、编程辅助等各类应用中正发挥着越来越重要的作用。
量子位
2023-09-08
4080
PyTorch 1.7发布:支持CUDA 11、Windows分布式训练
木易 发自 凹非寺  量子位 报道 | 公众号 QbitAI 自从7月份CUDA 11发布以来,就陆陆续续听到了网友类似的吐槽: 这正说着,10月27日,PyTorch团队发布了PyTorch 1.7,终于能支持CUDA 11了,可喜可贺(狗头)。 除此之外,这次1.7的版本,也带来了许多功能的更新和稳定。 在更新上,有了许多新的应用编程接口,如支持与NumPy兼容的快速傅立叶变换的操作及性能分析工具。 此外,分布式数据并行(DDP)和基于远程过程调用(RPC)的分布式训练也有了重大的更新,在Window
量子位
2023-03-10
6440
在网易有道做语音算法工程师是一种怎样的体验?
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛能拿下怎样的成绩? 时限是,10天。 近日,全球语音顶会INTERSPEECH 2020「口音英语语音识别挑战赛」结果公布,一支名叫「大耳朵图图喵喵喵」的团队摘下了两大赛道的第二名和第三名。 参赛选手是这位: △大耳朵图图本喵 啊不,其实来自他们当中。 说起网易有道与AI语音技术相关的产品,大家或许都不陌生,比如丁磊多次安利、上市都带着的有道词典笔…… 相比在市场上取得的认可,许多人
量子位
2023-03-10
6140
小鹏发布会上硬刚特斯拉AutoPilot:有视频有真相,特斯拉不懂中国路况
贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 国产智能汽车硬刚特斯拉,现在小鹏汽车冲在最前线。 注意,是全栈硬刚。 在小鹏汽车1024智能日现场,亮绝活、打擂台、立“军令状”…… 甚至公开放出了自研自动驾驶方案与特斯拉Autopilot的横评对比。 小鹏汽车试图用“有视频有真相”说明,生于中国长于中国的Xpilot 3.0,真的要比特斯拉更懂中国路况。 How? 小鹏PK特斯拉,选择正面比技术 面对特斯拉Model 3国产这一「大杀器」,自主品牌八仙过海,各显神通。 拼服务、拼性价比、增
量子位
2023-03-10
4510
1024,点亮人间烟火
杨净 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 20年前,安徽合肥一群来自中科大的探路者押注AI,成立科大讯飞。现在合肥被称为中国“最敢赌”、最牛的风险投资机构。 10年前,科大讯飞人工智能开放平台发布。 现在这个平台上的开发者,从十几个团队,成长到超过150万家;应用终端数从不到10万,增长到超过20亿;而这个平台能提供的能力,从当年的语音合成和识别两个,大幅提升到如今的334种复杂AI技能。 在讯飞之上已经成长出一套成熟的生态系统。今天,已经创下史上最佳业绩的科大讯飞,要向着新十年
量子位
2023-03-10
4010
上市13年,AI平台收入还能暴增131%,这家老牌AI公司正在“反杀”
晓查 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上市13年,这家巨头依旧能保持高增速,AI开放平台营收同比增长131.7%,智慧汽车增长74.31%,即便教育赛道内,产品服务增长也有31.48%。 这是科大讯飞刚刚给市场和投资者交出的2021年上半年答卷。 从上市之初到去年AI落地元年,从被指市盈率过高到质疑商业化能力,这家公司无论在资本市场还是消费领域一直饱受争议。 看行业内,AI技术日趋成熟,但是如今面临百度、阿里等传统云服务厂商也在蚕食语音AI市场,科大讯飞如何与互联网行业巨头竞争
量子位
2023-03-10
4370
使用NeMo让你的文字会说话-深度学习在语音合成任务中的应用 | 英伟达NLP公开课
语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。 英伟达NeMo是一个用于构建先进的对话式AI模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS)的模型及方法,方便调用先进的预训练模型、快速完成对话式AI中各类子任务。 我们可以通过NeMo快速、方便地实现文字与语音之间的转换,让我们的文字会说话! 7月28日,第3期英伟达x量子位NL
量子位
2023-03-10
5050
我在亦庄见了说中文的爱因斯坦,会比心的熊猫,还有一场意念打字大赛
梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你根本想象不到,现在机器人为了能被人类社会接纳有多努力。 像Siri和扫地机器人一样成为人类日常生活的一部分,是机器人们共同的愿望。 每年在北京亦庄举办的世界机器人大会,成了它们每年展示自己、接受检验、倾听人类意见的考场。 这次在大会场馆担任讲解员的,是一台神似爱因斯坦的仿生机器人。 凑近了仔细看,仿生硅胶材质的皮肤上不但有皱纹和血管,甚至连老年斑都模仿出来了。 这款仿生机器人全身有68个可动关节,说话时的嘴形和面部表情可以根据音频进行匹配。 为
量子位
2023-03-01
3590
阿里「杀手锏」级语音识别模型来了!推理效率较传统模型提升10倍,已开源
丰色 发自 凹非寺 量子位 | 公众号 QbitAI 阿里达摩院,又搞事儿了。 这两天,它们发布了一个全新的语音识别模型: Paraformer。 开发人员直言不讳:这是我们“杀手锏”级的作品。 ——不仅识别准确率“屠榜”几大权威数据集,一路SOTA,推理效率上相比传统模型,也最高可提升10倍。 值得一提的是,Paraformer刚宣布就已经开源了。 语音输入法、智能客服、车载导航、会议纪要等场景,它都可以hold住。 怎么做到的? Paraformer:从自回归到非自回归 我们知道语音一直是人机交互重
量子位
2023-02-28
5670
特斯拉本周暴涨33%/ 阿里辟谣新加坡建全球总部/ 马斯克因特斯拉虚假宣传被调查…今日更多新鲜事在此
日报君 发自 凹非寺 量子位 | 公众号 QbitAI 七天春节假期清零,接下来要准备好与七天工作日作斗争了。 今天科技圈都有哪些新鲜事儿?一起来和日报君康康~ GitHub活跃用户达到1亿 近日,GitHub发布博客宣布:平台的活跃用户已经达到1亿! 这意味着GitHub提前两年完成了2019年设定的1亿用户的目标。 要知道3个月前,GitHub公布的用户数为9000万,短短几个月,用户数量增长了1000万。5年前被微软收购时对外公布的用户数量仅为2800万,时间再往前推点,10年前它还只拥有300万用
量子位
2023-02-28
2330
ChatGPT接入Siri指南来了/必应下载量进前五/ 特斯拉被曝监控员工致不敢上厕所…今日更多新鲜事在此
日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大家好,今天是2月15日星期三。 情人节过了,仍然祝你快乐~ 科技圈其他新鲜事儿,来咯。 必应下载量激增,与谷歌差距缩小 必应搜索在引入ChatGPT之后,用户量增长多少? 据Apptopia数据统计,就在新必应上线两天之后,该应用在苹果iOS端的排名就从原来的第142位(2月7日)上升到了第4位(2月9日)。 其下载量则在当天跃升至102952次,远高于前一周平均每天约12000次的数量。 这一数字已经和谷歌缩小了差距——同期谷歌应用程序下载量稳定
量子位
2023-02-23
6160
欧阳晔李佳朱军入选IEEE Fellow,新晋名单华人占比1/4!还有一位小米大牛
如李飞飞高徒李佳、语音识别大牛Daniel Povey、清华大学朱军、腾讯AI Lab计算机视觉中心总监刘威、亚信科技CTO欧阳晔……
量子位
2022-12-09
4770
都要2023年了,造机器人还能搞出什么新花活?
以AI知名的科技公司科大讯飞,2022全球1024开发者节上官宣最新技术成果和进展。
量子位
2022-12-09
6790
Siri算数字人吗?清华人大教授、初创公司CTO、 产业专家与快手工程师一起说|CCF C³
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI Hey Siri,请你告诉我,Siri算虚拟数字人吗? Siri如何回答,取决于它对“虚拟数字人”如何定义。 虚拟数字人并非新鲜事物,虚拟偶像如洛天依等,在亚文化圈风靡已久。 近一两年间,伴随元宇宙概念兴起,虚拟数字人,这批元宇宙的原住民,愈发朝着智能化、精细化、多样化发展。 向前推进发展,虚拟数字人技术有哪些新趋势?这一元宇宙热度加持下的商业化应用,又有哪些落地挑战? 在CCF C³第十五次活动中,专家学者和行业大咖来到快手总部,就这些问题展开了深入讨
量子位
2022-10-08
4450
能听懂口音的开源语音系统来了:OpenAI出品,支持99种语言,英文识别能力直逼人类
羿阁 发自 凹非寺 量子位 | 公众号 QbitAI 逼近人类水平的语音识别系统来了? 没错,OpenAI新开源了一个名为「Whisper」的新语音识别系统,据称在英文语音识别方面拥有接近人类水平的鲁棒性和准确性! 不仅如此,对于不同口音、专业术语的识别效果也是杠杠的! 一经发布就在推特上收获4800+点赞,1000+转发。 网友们纷纷对它意料之外的强大功能表示惊讶。 不仅是英文,有人用法国诗人波德莱尔的《恶之花》进行了语音测试,得到的文本几乎与原文一致。 OpenAI联合创始人&首席科学家Ilya S
量子位
2022-09-27
1.2K0
总忍不住想接话?原来是你的大脑在疯狂“脑补”下个词丨PNAS
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 聊天、读书或听讲时,你有意识到自己正在疯狂“脑补”吗? 其实,你的大脑就像一个自动补全机一样,每时每刻都在猜别人要说什么。 不仅如此,大脑还会不断地将我们从外界获取的信息(图像、声音和文本等)与脑内的预测进行比较。 基于这一理论,研究人员搞出了不少NLP模型,包括语音识别、自动补全等,但他们却发现,人的“脑补”能力还是比这些AI更优秀。 所以,究竟是不是人的大脑和AI“脑补”的方法不一样? 现在,一群来自马普所和奈梅亨大学(Radboud Univer
量子位
2022-08-26
3490
如何让董宇辉不下班?
鱼羊 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI “还有46分钟,董老师休假就结束了。” 这是董宇辉最新视频下点赞过百的一条留言。 他在东方甄选直播间消失的日子里,粉丝们涌入他的个人号,调侃“这个男人只要一放假休息,几十万人都得跟着失恋”。 然而对于头部主播来说,再怎么爱岗敬业,也总有下播的时候。 毕竟连着几个小时不断说话,还得是妙语连珠的那种,既耗费脑力,对体力也是个不小的挑战。 在这种情况之下,不仅“24小时直播”不大可能,连不轮班的长时间唠嗑也不是人人能顶得住的。 不过话说回来,如果有机器
量子位
2022-08-26
4300
国内首次!这家中国企业的语言AI实力被公认全球No.2!仅次于谷歌
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI成精,“逼疯”程序员;AI做高数,成绩超过博士;AI写代码,成功调教智能体…… 看多了这种故事,你是不是也觉得,AI太卷了,要上天了。 今天回归本源,讲点不那么玄幻的。AI为什么会进化?底层其实没有秘密,无非是语言、视觉等几大基本功。 其中,语言能力对AI的智能水平有决定性影响。视觉研究怎么“看”,语言研究“听”、“说”和“理解”。 对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。 最近,咨询机构Gartner发布《
量子位
2022-07-07
3390
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档