前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >微软押注FPGA与谷歌TPU对擂,AI会议室秒杀同传+速记

微软押注FPGA与谷歌TPU对擂,AI会议室秒杀同传+速记

作者头像
新智元
发布2018-05-29 16:29:28
6560
发布2018-05-29 16:29:28
举报
文章被收录于专栏:新智元

新智元报道

来源:TechCrunch、微软

编辑:克雷格、肖琴

【新智元导读】昨晚,微软Build2018大会开幕,发布Project Brainwave预览版,并且称延迟比TPU低5倍,正面与谷歌交锋。现在,谷歌等公司都押注在专用定制芯片(ASIC)上,微软坚持投注于用FPGA加速机器学习模型,到底谁更胜一筹?

昨晚午夜,微软Build 2018大会开幕,微软CEO萨提亚·纳德拉(Satya Nadella)重点介绍几个方面的进展:

  • Project Brainwave预览版
  • Azure IoT Edge开源
  • Kinect回归
  • AI语音工具和未来会议室

其中最令人关注的是Brainwave预览版,在这个平台上,能够用FPGA在Azure云和边缘设备上实时运行深度学习模型。

Project Brainwave使用英特尔的FPGA,纳德拉说,大家不要只看到谷歌的TPU,还有我们微软的Brainwave嘛。

Brainwave到底有多厉害?

Project Brainwave:实时硬件AI能力延迟比TPU低5倍

目前,微软的一些竞争对手,包括谷歌,都押注在专用定制芯片(ASIC),但微软坚持投注于用FPGA加速机器学习模型,Brainwave也不例外。

微软认为FPGA比设计定制芯片更灵活,并且标准Intel Stratix FPGA的性能至少可以与定制芯片相媲美。在大会上,微软认为Project Brainwave的实时AI能力延迟比TPU低5倍。

微软称,利用Project Brainwave的客户可以使用标准的图像识别模型处理100万张图片,而单个图像只需要在1.8毫秒内就能处理,这比现在的任何竞争对手的云服务都要好。

Brainwave首次亮相是在去年8月的Hot Chips大会上,当时公开的信息显示,Brainwave由三个不同的层组成:

  • 一个高性能分布式架构;
  • 已经整合在FPGA上一个硬件深度神经网络引擎;
  • 用于部署预训练的模型的编译器和运行时。

用于Project Brainwave的硬件示例

微软正在将FPGA整合到其整个数据中心网络,成为一种硬件微服务。这样做的好处是高吞吐量和大幅减少延迟,因为该架构允许微软绕过传统服务器的CPU直接与FPGA进行通信。

BrainWave最初发布时,支持微软CNTK和谷歌TensorFlow框架。

Project Brainwave为传统AI带来了两个重要的区别

首先,它使用的FPGA可以经常更新升级,以对最新算法提供加速,并且它可以快速处理AI任务,适合用于对响应时间要求很高的实时任务。

其次,客户将能够在他们自己的网站上运行使用微软硬件的AI任务,而不用通过接入微软的数据中心,这又加快了速度。

不过,FPGA在云计算中并没有被广泛使用,因此大多数公司都没有必要的专业知识来编程,微软做出了大胆的一步。微软表示,其云服务可以将客户的软件应用于FPGA。

另一方面的谷歌TPU势头正猛。

上个月,谷歌的AI负责人Jeff Dean 表示,他们在 ImageNet 图像分类上发布了新的 DAWNBench 结果,新型 AmoebaNet-D 网络在 TPU 上实现了最低的训练时间和最少的训练成本。

明天,谷歌的I/O大会将开幕,预计也会在TPU上大做文章,好戏还在后面。

Azure IoT Edge开源和Kinect“回归”

纳德拉说,预计到2020年,智能设备总数将超过200亿台。接着他公布了微软Build 2018的另一个进展:智能边缘计算与智能云,并宣布Azure IoT Edge Runtime开源。

Azure IoT Edge Runtime开源能让用户修改、调试边缘应用,透明度和控制能力也更高。不够,现在认知服务目前只有视觉,将来会有更多的服务出来。

Azure IoT Edge目前已经和高通、大疆进行合作。

另外,微软还发布了Project Kinect for Azure,Kinect以前是用于Xbox的体感设备,这次相当于是回归。

Project Kinect for Azure能完成动作追踪等任务,背后是Azure IoT Edge Runtime技术。

黄学东:微软的麦克风阵列让语音识别再上一个台阶

还有一个值得关注的领域是微软Build大会上展示的未来会议室。

会议室使用的是360度相机和麦克风阵列,可以检测会议室中的任何人说话。摄像头能够把各个画面拼成一个全景画面,还可以进行人脸识别,以确保参会者的身份,此外,还能把会议室预约系统做进去,真是强大。

更强大的是,这个未来会议室还有基于语义分析的会议纪要功能,能够实时同传+速记。

多年来,微软一直致力于Skype的翻译功能,未来的会议室也包括这项技术。会后,微软全球技术院士黄学东表示,视频中展示的未来会议室使用了他们刚刚宣布的Microsoft Speech Device SDK,“微软公司极其优秀的麦克风阵列可以让语音识别再上一个台阶。”

黄学东还提到,中国的AI公司ROOBO和微软合作开发认知服务开发套件。

微软提供Speech Service开发平台,ROOBO完成Microsoft Speech Device SDK在音频、声学及硬件的设计与实现,由开发者使用的硬件也是由ROOBO提供。

此外,微软还宣布“人工智能无障碍计划(AI for Accessibility)”,未来五年内将投入2500万美元,用于研发能够增强人类能力的人工智能技术。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档