前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >666元!英伟达史上最便宜AI硬件发布:可运行所有AI模型,算力472 GFLOPS,功耗5瓦

666元!英伟达史上最便宜AI硬件发布:可运行所有AI模型,算力472 GFLOPS,功耗5瓦

作者头像
量子位
发布2019-04-23 11:16:08
7870
发布2019-04-23 11:16:08
举报
文章被收录于专栏:量子位
李根 乾明 郭一璞 发自 圣何塞 量子位 报道 | 公众号 QbitAI

中国古语有言:否极泰来。

AI芯片巨头英伟达的2018,再糟糕不过,所以2019年GTC大会,也比以往更受关注。

而且颇有意思的是,教主黄仁勋把这次的主题演讲地点选在了圣何塞州立大学礼堂。

这所公立大学在硅谷小有名气,且在计算机领域,最有名的校友莫过于原Intel董事长高登·摩尔——“摩尔定律”就是以他之名命名。

而老黄就是那个全世界最热衷宣扬“摩尔定律已经失效”的人。

但这一次,老黄一句“摩尔定律”都没提,默默扔出99美元AI开发套件Jetson Nano。

具体情况怎么样,我们完整回顾下今年GTC发布情况。

CUDA-X:50倍提速

首先,直接看核心重头戏:CUDA-X。

按照英伟达的说法,这是全球唯一的一个,端到端的数据科学加速库。帮助从事数据分析、机器学习、深度学习的数据科学家们,更快完成工作。

CUDA-X由十几个专用加速库组成。整个系统中,包含几个部分:用cuDF加速数据分析,用cuDNN深度学习原语,用cuML进行机器学习算法,和DALI等数据处理。

简单来说,所有英伟达的库,都被整合成一个库:CUDA-X。

包括TensorFlow、PyTorch和MXNet在内的所有深度学习训练框架,随着CUDA-X的发布也会自动为英伟达Tensor Core GPU进行优化。

英伟达表示,CUDA-X解锁了Tensor Core GPU的灵活性,能够将机器学习和数据科学工作负载加速多达50倍。CUDA-X可以加速典型AI工作流程的每一步,无论是用深度学习训练语音和图像识别系统,还是数据分析评估抵押贷款组合的风险。

而且据说,“只需要点击几下”。

微软的Azure Machine Learning(AML)是第一个集成RAPIDS的云服务,RAPIDS是CUDA-X的关键组件。通过访问RAPIDS开源库,数据科学家可以让AML上的英伟达GPU以“前所未有”的速度进行预测分析。

英伟达官方披露的数据称,在AML上使用RAPIDS,可以帮助企业把训练AI模型所需的时间,减少多达20倍,训练时间可以从数天减少到数小时,或者从数小时减少到几分钟。

此外,CUDA-X还会部署在几大主流的云平台,包括亚马逊AWS、谷歌云等。目前PayPal、沃尔玛等公司已经在使用相关服务。

值得一提的是,在介绍CUDA-X的时候,老黄还皮了一下。他说:每次演讲,我都想让你们记住一个关键词,今天的关键词是:

PRADA。

还让现场跟着一起念。看来接下来要发布的东西,可能还挺贵。

PRADA其实是四个单词的强行缩写,它也带代表对CUDA-X介绍的几个方面:PRogrammable(可编程)、Acceleration(加速)、Domains(域)、Architecture(架构)。

史上最便宜AI硬件

老黄两个多小时讲完后,最让网友们念念不忘的,是一款出场非常晚、时间非常短的硬件产品:

Jetson Nano。

它是体积小巧、性能并不弱的小电脑,老黄称之为“全新的机器人计算机”,共有两个版本。

一是99美元(约合人民币666元)的开发者套件,面向个人用户,比如创客、学生、技术爱好者;另一个版本129美元,可以部署到生产环境,面向的是想要构建边缘系统的企业。

历次发布会都让人深感贫穷的英伟达,终于也价格厚道了。在PRADA的衬托下,更是感动人心。

不少外媒纷纷打call,因为Jetson Nano的价格让业余爱好者、学生之类的大众群体,可以打造自己的自动化设备。

当场,老黄也拿出了一个基于Jetson Nano的无人车Kaya。

价格厚道,性能如何呢?Jetson Nano能提供472 GFLOPS的计算性能,而耗电量只有5瓦

不久前Google发布的千元TPU开发板,单精度和半精度浮点运算性能分别是32和64 GFLOPs;英特尔神经计算棒的性能是100 GFLOPs。

Jetson Nano搭载了4核的ARM A57 CPU和128核基于英伟达Maxwell架构的GPU,4GB内存,使用MIPI CSI-2 DPHY通道摄像头。

它也支持今天发布的CUDA-X,也就是说有支持很多常见的人工智能框架,装有面向Tegra的Linux操作系统,实现了开箱即用。

英伟达会后还展示了Jetson Nano运行ResNet、Inception、YOLO等各种神经网络模型,在目标检测、姿势估计等各类任务上进行推断的实际性能:

此外,它还支持高分辨率传感器,而且可以并行处理多个传感器,并在每个传感器流上都运行多个神经网络。

英伟达称,Jetson Nano能够运行所有AI模型,可以创建数百万个智能系统。

GTC刚结束的时候,就有人在HackerNews上表示,自己想要DIY了。

很快就有“同道中人”回复他,你可以自己做无人驾驶小车、能跟踪猫的无人机、可以自动识别鸟的摄像机等等。

自动驾驶

最后,自动驾驶,老黄说这是最重要的自动化机器的落地场景。

也是三方面。

首先,推出全新DRIVE Constellation自动驾驶汽车仿真平台。

基于该平台,在云端就能虚拟仿真各种自动驾驶场景——不用再路测数百万公里了。

老黄说,从常规驾驶,到各种罕见的危机情况,都能在仿真中实现,要风得风,求雨得雨。会比现实世界中实现的效率高出不知多少倍,而且成本低、安全性高。

数据中心方案则去年就有过官宣。包括两个并排服务器:

第一台服务器——DRIVE Constellation Simulator,从虚拟汽车生成传感器输出。

第二台服务器——DRIVE Constellation Vehicle,包含DRIVE AGX Pegasus AI车载电脑。

DRIVE AGX Pegasus接收传感器数据,做出决定,然后将车辆控制命令发送回模拟器。

老黄还强调,该过程完全闭环,而且定位精准、定时精确,测试环境也能随心所欲——不用怨天求神。

其次,该平台完全开放,提供编程接口,允许DRIVE Sim生态系统合作伙伴集成他们的环境模型、车辆模型、传感器模型和交通场景。

同时也通过整合合作伙伴的场景,让平台可以生成全面,多样化和复杂的测试环境。

换而言之,玩法有点像虚拟仿真领域的Apollo。

英伟达也在这个“开放生态”里,集合了产业链上下游玩家。

第三,英伟达还宣布了基于仿真平台的最新合作。

并且合作方来头不小,是全球第一大车厂——丰田。

老黄的意思也再明确不过,像丰田这样的大厂都当了首个客户,开放平台DRIVE Constellation的品质肯定值得信赖。

此外,还是在GTC大会上,老黄还宣布推出新自动驾驶软件套件,该软件的主要组成部分是Safety Force Field(SFF),通过加强规划和控制,实现更安全、舒适的驾驶体验,而且其算法策略主打车辆保护、乘客和其他车辆安全。

在高级辅助驾驶领域,这会最先发挥作用。

老传统:视觉渲染新突破

当然,英伟达的GTC,不炫下最新渲染成绩怎么行?

今年新亮相的图像渲染引擎,让图片的渲染更快、更真实。

NVIDIA Omniverse,3D创作渲染协同工具,即使团队成员身处不同的时区,也能一起为同一个3D场景的创作出力。

另外,现场还展示了一段视频:

是不是很有大片感?

同时,英伟达宣布Adobe、Autodesk、Epic、Unity等16家厂商也将得到RTX技术支持,帮助他们在复杂的场景中完成光线跟踪照明,用更快的速度进行图像渲染,这一技术支持在今年内将会服务900万创作者。

另外,对于游戏玩家,英伟达推出了GeForce NOW云游戏服务,游戏在云端的电脑上运行,而玩家只要打开任何一台PC或者MAC,就能让云端的游戏显示在自己的电脑上,无需下载、安装、升级、更新、装补丁,也不用担心自己的电脑配置不够了。

显然,老黄也最爱这部分的Demo展示。

不断播放视频,不断收获掌声,他还不断告诉大家:鼓掌太早了,好戏还在后面。

甚至到后来,教主直接扔核弹语录:

我常说,买得越多,省得越多,现在我觉得我错了……RTX Sever根本就是免费的!省下的电费就能买一台服务器了!

老黄の诚意

不过今年GTC,新品确实便宜得不像英伟达。

会后,大家最主要的评价都集中在Jetson Nano上。

更直接说是99美元售价上。

虽然TheVerge也报道称,这种低价的AI开发套件,英伟达并非独一家。

比如英特尔的Neural Compute Stick只需要79美元,谷歌在Coral下最近也推出了两款设备,分别是150美元的开发者套件和79美元USB加速设备。

但不可否认的是,英伟达正在进入一个有潜力的市场,AI驱动的创新正在增长。

而且,对于今年GTC主题演讲关键词是PRADA的英伟达来说。

99美元,折合人民币666元。老黄的诚意,看得见。

你觉得呢?

作者系网易新闻·网易号“各有态度”签约作者

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • CUDA-X:50倍提速
  • 史上最便宜AI硬件
  • 自动驾驶
  • 老传统:视觉渲染新突破
  • 老黄の诚意
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于生成式AI,自动驾驶,深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档