谁人能拦英伟达?音频详解AI芯片三国杀

昨天,Q1的财报发布后几小时,英伟达的股价就暴涨14%。

今天,老黄的Keynote还没讲完,英伟达市值就被推高20%,突破700亿美元。

华尔街疯狂的背后,是人工智能的大潮,与推动这一大潮的全新技术。

英伟达最新的GPU芯片——Tesla V100及其Tensor Core,必将让这科技的大潮又起一层浪。

眼看着英伟达在这人工智能的浪潮中一骑绝尘,它的技术到底能有多厉害?难道其他芯片巨头就真的在吃干饭吗?

今天,我们特意邀请到两位芯片领域的专家,专门来聊聊英伟达的新技术,以及这场 AI 芯片大战的关键看点。

英伟达领先多少

昨天以前,英伟达在深度学习芯片领域已经非常领先了,但是还不是遥不可及。

但今天一口气发布的7个产品和计划,特别是其中的Tesla V100,确实震撼。可以说,大大拉开了它与竞争对手的距离。

这不由得让人想起90年代,思科成为互联网第一波红利的最大获益者。现在 AI 时代的到来,尽管我们还不知道它这一轮到底能冲多高,但大家都还在摩拳擦掌、买枪买炮。

而英伟达却第一时间成为一家独大的军火商,肯定是 AI 第一波红利的最大获益者。

英伟达在GTC大会推出的全新GPU,确实在技术上划了时代,吊打所有对手。

通用的GPU单元,专门的Tensor加速器,矩阵运算绝对性能爆炸,同时还兼顾其他算法。不愧是英伟达凭借多年在深度学习领域的积累、对需求深刻洞察之后推出的心血大作,比上一代强大十倍的性能,既适合训练又适合部署。

就此,老黄已直接对绝大多数做深度学习芯片的创业项目宣判了死刑。

为什么GPU就适合AI?

我们来科普一下。深度学习是机器学习的一种技术,基于深度神经网络,这一轮 AI 主要就是深度学习技术突破引领的。

而深度学习里面绝大多数的运算都是矩阵运算,矩阵运算天生就容易并行,而 GPU 最擅长的就是做并行数学计算,所以特别适合做深度学习。

2012年的时候,Geoffrey Hinton 的学生 Alex Krizhevsky 用 GPU 来做深度学习,并且取得了 ImageNet 大赛冠军。经过他们的评测,用 GPU 比 CPU 快60倍。

人工智能研究者一找上GPU,英伟达立马抓住机会,短时间内动用数千工程师、投入20亿美元,研发出第一台专门为深度学习优化的Pascal GPU。所以,在深度学习大行其道的今天,英伟达就成了大赢家了。而深度学习中GPU的应用,有这两个场景:一个是训练,一个是部署。所谓训练,就是AI的构建过程,研究员在线下通过喂给AI算法大量的数据,产生出一个模型。而部署,就是把训练好的这个模型拿到应用现场去用,去做推断。

比如说,谷歌的无人车在美国开了几十万公里,通过训练练出一个自动驾驶的AI模型。这个模型训练出来之后,未来可以部署到每一台量产的谷歌无人车,实现自动驾驶。在自动驾驶中,这个AI模型就必须实时进行推断。

训练阶段,我们主要关心的是大规模的计算吞吐率,而到了部署中,更强调的是绝对的计算能力、低延迟、高性能功耗比、高稳定性。

现在在AI界,训练模型普遍采用英伟达的GPU,但是到了部署领域呢,有人用GPU,有人用谷歌的TPU,有人用英特尔,还有一大批嵌入式芯片开发商正在开发专用的前端深度学习芯片。

但是,刚刚发布的V100,既适合做训练,又适合做推断,除了功耗较大以外,在能力方面实现了左右通杀,所以确实厉害。

另外,英伟达还有一个专门用来部署的运行时环境叫 TeslaRT。所以英伟达在AI芯片领域真有点一骑绝尘的架势了。

难道无人能挡英伟达?

AI 芯片这么大的一块蛋糕,总得多有几个人来分才热闹,就算英伟达现在的优势不容置疑,那接下来的疑问就是,它的优势究竟能持续多久?

  • 谷歌 TPU

几天前,在谷歌TPU团队出走半数后,计算机体系架构的宗师 David Patterson 宣布他要加入谷歌,正式参与TPU项目。

上个月,谷歌关于TPU性能的论文披露说,TPU运行速度是英伟达和英特尔相关处理器的15-30倍,能效高出30-80倍。

谷歌的 TPU 适用于部署,能跟谷歌自家的 TensorFlow 紧密结合。可惜它是闭源的,谷歌视它为核心竞争力,应该不会开放给别人用。

TPU的第一版很惊艳,不过缺点也很多。现在从谷歌的论文来看,这个架构有点过时,实践当中也会有很大局限性。虽说这次David Patterson加入谷歌TPU团队的动静很大,但我们还是应当保持冷静、继续观察。

  • 英特尔

另一个能跟英伟达叫板的,就是老牌芯片巨头英特尔,但它的CPU擅长高速处理数字,却不擅长处理音视频等非结构化数据。

于是在去年,英特尔耗资4亿美元收购深度学习初创企业Nervana,试图通过Nervana Systems在硅层实现机器学习。今年3月,这家土豪又怒砸153亿美元收购一家以色列芯片公司Mobileye,土豪要用自己家的高性能计算和网络连接能力,结合Mobileye的计算机视觉专业技术,打造从云端直达每辆汽车的无人驾驶解决方案,深化它在自动驾驶领域的布局。

收购Nervana,是英特尔非常厉害的一招。因为,这家公司前几年一直在帮英伟达优化GPU平台。他们是一群顶级黑客团队,hack了GPU的native指令集,写出了比当时的cudnn(NVIDIA自己的深度学习数学库)还要快若干倍的数学库。他们的成果都开源给了社区,cudnn后面的进步很大程度是因为吸收了这些成果。这家公司被英特尔收购后,就断了继续为英伟达提供服务的可能,同时也极大增强了英特尔的实力。

英特尔现在是all in AI,它的几大产品线,都会重点针对深度学习进行专门定制,比如之前作为HPC平台的Xeon Phi加速计算卡,收购的Altera FPGA,包括Nervana System,都是各自独立的深度学习产品线。其他还包括IoT部门,还有收购的Movidius公司,这些是提供嵌入式和端的解决方案。

小编听完,真是眼界大开。

这样来看,在深度学习芯片上,英伟达一马当先,英特尔黄雀在后,而谷歌的TPU,还真是任重而道远啊。

版权申明:该文章版权归AI100所有,如需转载、摘编、复制等,请后台留言征得同意。若有直接抄袭,AI100将追究其责任。

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-05-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏DT数据侠

顾客这种上帝长啥样,老司机用大数据告诉你 | DT Labo Online

不久前,DT君请来了第一财经商业数据中心(CBNData)资深数据分析师徐劲亚(人称老司机),为大家送上了一场关于“大数据人群洞察”的线上分享。消费者这种上帝般...

13200
来自专栏新智元

英特尔研发神经元芯片,模拟人脑自学习能效提升1000倍

【新智元导读】英特尔正在研发被称为 Intel Loihi 神经元芯片,整个芯片上共有超过13 万个神经元和1.3 亿个突触连接,能够根据环境变化即时编程,进行...

24350
来自专栏区块链入门

重磅推荐:AI芯片产业生态梳理

AI芯片作为产业核心,也是技术要求和附加值最高的环节,在AI产业链中的产业价值和战略地位远远大于应用层创新。腾讯发布的《中美两国人工智能产业发展全面解读》报告显...

23140
来自专栏DT数据侠

用2600条文本数据,为你揭秘TED受欢迎的真正原因!

为什么不超过18分钟的TED演讲,平均点击率却超过百万次,最高的甚至超过5000万次?为什么连比尔•盖茨、史蒂芬•霍金、阿尔•戈尔这样的商界、学界与政界精英都竞...

12900
来自专栏新智元

初创企业 Neurala宣布深度学习取得重大进展: 不需要云服务器,边缘学习(吴恩达评价)

【新智元导读】 今年初完成1400万美元融资的人工智能初创企业 Neurala,昨日宣布在深度学习软件方面取得重大进展,其待决专利软件 Lifelong-DNN...

39660
来自专栏大数据文摘

吴恩达导师Michael I. Jordan刚去清华手写版书讲了三天课,这有一份他的课程笔记

27050
来自专栏ATYUN订阅号

研究者使用AI识别野生动物,准确度高达96.6%

人工智能不仅仅应用于语音助手和自动驾驶汽车。奥本大学,哈佛大学,牛津大学,明尼苏达大学和怀俄明大学的研究人员开发了一种机器学习算法,可以以96.6%的准确度识别...

29220
来自专栏新智元

资源 | 人工智能、深度学习、机器学习有什么区别?DL 应用案例全解析(下载)

【新智元导读】对于希望从战略层面洞察人工智能这一领域的企业领袖来说,insideBIGDATA Guide to Deep Learning & Artific...

46650
来自专栏企鹅号快讯

李飞飞高徒新项目,一眼看穿你下届总统会选谁!

翻译 | AI科技科技大本营 参与 | 刘畅 编辑 | Donna 和很多人一样,我们会通过一个人的外表和穿着来判断其经济能力,也会通过字迹来判断其品性。但这篇...

22570
来自专栏AI科技评论

SMP 2018 落下帷幕,看计算+司法、计算+历史擦出新火花

由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办的第七届全国社会媒体处理大会(SMP 2018)于 2018 年 8 月 2 日- 4 日在哈尔滨召...

12630

扫码关注云+社区

领取腾讯云代金券