首页
学习
活动
专区
工具
TVP
发布

新智元

专栏作者
8286
文章
5750886
阅读量
203
订阅数
黄学东 | 从清华学子到微软AI全球首席技术官,与人工智能赛跑40年
---- 新智元报道   来源:清华大学计算机系校友会 作者:张超、李静 【新智元导读】他是微软全球人工智能认知服务首席技术官,长期从事人工智能领域的研究工作,曾率领团队实现了AI超越人类水平的多项里程碑式的技术突破,是微软首位华人“全球技术院士”。他是黄学东。 19岁那年,当黄学东还是一个“长沙伢子”的时候,他就从家乡“远走高飞”来到了清华,那时的他大概没有预想到多年后自己会成为世界顶尖科技公司——微软的全球人工智能认知服务首席技术官。 “很多人看到的可能是我在微软取得的一系列荣誉,但是我却永远感恩
新智元
2023-05-22
6370
无监督学习站起来了!Facebook第三代语音识别wav2vec-U,匹敌监督模型,Lecun看了都说好
---- 新智元报道   来源:Facebook AI 编辑:LRS 【新智元导读】Facebook在语音识别上又出重磅新作,继wav2vec, wav2vec 2.0以来,又出完全不需要监督数据的wav2vec-U,小众语言也能用语音识别啦! 相比显示器、鼠标、键盘这些传统的人机交互方式以外,随着语音识别技术的逐渐成熟,和电子产品进行「对话」也逐渐成为一种稀松平常的人机交互。 无论是给计算机或其他设备下达指示,还是回答用户的问题,语音识别在各个方面让电子产品的使用变得更加容易,无需学习,想要干什么只
新智元
2023-05-22
4500
一段JavaScript让ChatGPT开口说话?网友开源自制浏览器插件
---- 新智元报道   编辑:Aeneas 好困 【新智元导读】用一个Chrome扩展程序,让ChatGPT开口说话! 现在,ChatGPT可以和我们语音聊天了! 只需在浏览器上安装一个「Talk-to-ChatGPT」扩展就可以。 如何安装 Talk-to-ChatGPT扩展程序可以从此处的Chrome在线商店下载:https://chrome.google.com/webstore/detail/talk-to-chatgpt/hodadfhfagpiemkeoliaelelfbboamlk
新智元
2023-03-29
1.4K0
只需3秒就能偷走你的声音!微软发布语音合成模型VALL-E:网友惊呼「电话诈骗」门槛又拉低了
---- 新智元报道   编辑:LRS 【新智元导读】微软新模型VALL-E实现地表最强zero-shot语音合成,刚开口声音就被偷了? 让ChatGPT帮你写剧本,Stable Diffusion生成插图,做视频就差个配音演员了?它来了! 最近来自微软的研究人员发布了一个全新的文本到语音(text-to-speech, TTS)模型VALL-E,只需要提供三秒的音频样本即可模拟输入人声,并根据输入文本合成出对应的音频,而且还可以保持说话者的情感基调。 论文链接:https://arxiv.org
新智元
2023-02-24
8450
苹果狂整花活:嘿,Siri!给我做一个AR应用
---- 新智元报道   编辑:好困 Aeneas 【新智元导读】苹果正在玩个大的,让开发者用Siri做出AR应用,几句话变出虚拟场景! 苹果要在AR中整合进Siri了。 是那个经常犯蠢、搞砸用户请求的Siri吗? 没错,根据The Information报道,苹果正在开发软件,让用户用Siri为头显制作程序。 嗯,就是那个传闻中的xrOS苹果混合现实头显。 Siri整进AR,苹果在玩个大的 苹果希望,即使是不懂代码的人,也能用Siri让头显创建一个完整的AR应用。 并且,这个应用还能放在Ap
新智元
2023-02-24
3900
笑死,B站英文鬼畜「宝娟,我的嗓子」!听AI大佬采访,看电竞解说,追明星直播,全靠它了
激动的小编一边听着英文新闻,一边打开了讯飞听见的APP,手机上立刻同时就出现了语音识别的悬浮字幕。
新智元
2023-01-09
1.1K0
昨夜,这个梅西球迷痛哭整晚,幸好还有「她」安慰
AI早已不是传说中那个高大上的科技词汇,而是真正成为了每个人的水和电——没有AI,生活中就会寸步难行。
新智元
2023-01-08
3200
遛机器狗,虚拟人小姐姐当导游!我在讯飞1024看到了元宇宙的未来
2014年巴西世界杯上,28岁的截瘫青年朱利亚诺·平托身穿基于脑机接口的「机械战甲」为比赛开球。
新智元
2023-01-07
5320
小扎亲自演示首个「闽南语」翻译系统!主攻3000种无文字的语言
到目前为止,虽然机器翻译无法完全做到「信、达、雅」,但翻译结果的准确性对于一般应用场景来说已经足够。
新智元
2023-01-07
9720
秋招算法岗卷上天?大厂技术岗缩减70%!
---- 新智元报道   编辑:拉燕 Aeneas 桃子 【新智元导读】2023年秋招已经陆续展开,AI就业形势再次引发了网友热议。有人说,2023年秋招技术岗哀鸿遍野。那么,真实情况如何? 年年秋招年年难,又是一年秋招季。 随着各大厂纷纷发布了2023届的秋季校园招聘信息,毕业生都开始忙活起来了。 互联网大裁员的当下,不得不说,今年是真难啊。 算法岗太卷? 对于计算机专业的毕业生而言,算法岗基本上就是「高薪」的代名词。 然而,由于这几年AI方向异常火爆,算法岗似乎也已经承载不下了。 知乎上的
新智元
2022-08-26
2900
Meta再放大招!VR新模型登CVPR Oral:像人一样「读」懂语音
---- 新智元报道   编辑:David Joey 如願 【新智元导读】畅游元宇宙,连音画不匹配那还算VR?Meta最近就盯上了这个问题。|人工智能企业在找落地场景?——智能技术企业科技信用评级共识体系发布会7月2日给你解答! 一提到AR、VR体验,声音体验都是最重要的一环。 无论是在元宇宙的party上狂欢,还是戴着增强现实 (AR) 眼镜在客厅看家庭电影,声效对用户的沉浸式体验都至关重要。 这不,Meta AI与Meta Reality Lab的音频专家联手,并与德克萨斯大学奥斯汀分校的研究人员
新智元
2022-07-01
2970
奶奶又能跟我说话了!亚马逊Alexa让挚爱声音永生
---- 新智元报道   编辑:桃子 Joey 【新智元导读】最近,亚马逊在其年度会议 Re:MARS上展示了Alexa模仿逝去亲人声音的功能,是个好消息,但似乎听起来有点毛骨悚然。 最怕的不是逝去,而是永远的消亡... 还记得「超验骇客」中的一幕: 女主将即将逝去的丈夫的意识数据上传到智能电脑中。 幸运的是,男主奇迹般地在虚拟世界中复生。 或许电影中超现实一幕还离我们非常遥远,但是将人的语音保留下来还是没有问题的。 这不,亚马逊称,自家的语音助手Alexa能够模仿逝去亲人的声音。 现场,亚马逊演
新智元
2022-06-27
7330
10岁是个分水岭!根治英语头疼病,这支笔了解一下
---- 新智元报道   编辑:David 好困 【新智元导读】大热天的,别整天抱着单词本不放了,找个新朋友陪读陪聊陪作业,它不香么? 大家先来猜猜,这个「赛马场巨头」是什么? 没错,是「The Lord of the Rings」指环王。 显然,「赛马场巨头」主要是错误地理解了「Ring」的含义。其实,稍有常识的人都知道,Ring是指拳击台,所以「正确」的译名是:拳皇。(开个玩笑) 不过讲道理,你不太能苛求一个上世纪90年代的翻译。 但是在互联网发达的现在……烧烤「丈夫」就不太合适了吧。 以及,
新智元
2022-06-27
7.9K0
大厂留不住技术大牛了?阿里金榕、京东于建强、字节梅晓等纷纷离职
---- 新智元报道   编辑:编辑部 【新智元导读】在这个互联网打工人纷纷「毕业」的年景,阿里、京东、字节的AI负责人相继被曝离职。 5月19日,据Tech星球报道,阿里巴巴副总裁、达摩院副院长金榕已于近期离职。  至此,达摩院曾经的十三位扫地僧中,已有漆远、王刚、金榕三人先后离开了阿里。 此外,京东副总裁、技术决策委员会委员于建强,字节跳动AI-Lab智能语音部门的负责人梅晓,也已离职。 阿里金榕:学术11年,产业又7年 金榕1993年本科毕业于天津大学工程系,1996年硕士毕业于北京大学物理系
新智元
2022-05-20
6520
谷歌I/O大会首秀AR眼镜!最贫的搞笑AI机器人亮相
---- 新智元报道   编辑:编辑部 【新智元导读】时隔2年,谷歌I/O开发者大会回归线下。 北京时间今天凌晨,谷歌2022年度全球开发者大会正式开幕! 首先我们有请谷歌CEO,桑达尔·皮查伊。 (此处应有掌声) 言归正传,本次大会谷歌可谓是「批发式」更新。 硬件方面,从对拼Meta的AR眼镜、到对打苹果的首款智能手表,从高端耳机Pixel Buds Pro,到平价版的新款Pixel手机,还有造型一言难尽的首款平板电脑Pixel Tablet,都在大会上亮相。 软件方面,Android 13操作系
新智元
2022-05-12
7260
连夺4项第一!AI常识推理和人类又近了3%
---- 新智元报道   编辑:好困 桃子 【新智元导读】让机器像人一样思考又迈进了一步? 最近,第十六届国际语义评测大赛(SemEval 2022)落下帷幕。 科大讯飞认知智能国家重点实验室率队杀出重围,连夺3个主要竞赛项目的冠军。 就在几天之前,实验室还以76.06%的准确率,刷新了常识推理挑战赛CommonsenseQA 2.0的世界纪录,比第二名领先了近3个百分点。 那么,这些所谓的挑战,到底难度如何呢? 刷新常识推理世界纪录 故名思义,常识推理就是利用自身了解的知识,比如科学事实、社会惯例
新智元
2022-04-28
4770
不出声,也能聊Siri!康奈尔华人团队打造「无声」智能项链,中英文两用
现有的语音识别技术可以让用户和Siri直接对话,问问明天的天气,或者让Alexa放首歌什么的。
新智元
2022-02-24
4050
2021年AI Labs报告发布!创办17年,这家「不专心」做语音的研究院入选
然而,创业并非易事。更重要的是,他们选择以一项在当时不被看好的技术——语音合成起家。
新智元
2022-02-24
5120
乔布斯逝世十周年,他的Siri还好吗?
今天,是苹果前CEO乔布斯逝世10周年。为了纪念他,前苹果设计大师乔纳森·伊夫在《华尔街日报》上发表了一篇文章,回忆了他与乔布斯在一起的最后日子。
新智元
2021-10-12
5950
MIT发布《人工智能加速器》2021年度综述论文,详解80+类AI芯片性能优劣
在过去的几年里,每个月都会发布新的机器学习加速器,用于语音识别、视频对象检测、辅助驾驶和许多数据中心应用。
新智元
2021-10-12
8440
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档