【GPU陷入价格战】谷歌云可抢占GPU降价40%,P100每小时不到3块钱

来源:Google

作者:文强

【新智元导读】还愁用不起GPU?今天谷歌宣布云端可抢占GPU大幅降价,P100的价格每小时0.43美元,换算成人民币只需2.77元。

不是每个人工作的时候都需要GPU,但对于那些需要的人来说,GPU是必不可少,越多越好。

但是,GPU很贵啊。此前谷歌、Facebook等巨头开展了不少令人印象深刻的工作,其中不乏使用成百乃至上千GPU的例子,让人望尘莫及。

不过,就像很多研究者预测的那样,硬件的价格会不断降低。今天,谷歌就宣布,他们整个GPU产品组合的可抢占价格大幅降低,比连接到按需GPU的降低了70%。

今年早些时候,谷歌云平台宣布,可以将你的GPU连接到谷歌云计引擎(Google Compute Engine)和Google Kubernetes Engine上的可抢占虚拟机(Preemptible VMs)上——谷歌云端抢占式虚拟机的每小时的固定费用只要0.015美元,将GPU的使用价格降低了50%。今天,这个价格再往下走了40%

谷歌表示,抢占式GPU(Preemptible GPUs)非常适合短期、容错和批处理工作负载,比如机器学习(ML)和高性能计算(HPC)的客户。使用抢占式GPU,你可以访问大规模GPU基础架构,只需支付可预测的低价格,无需对容量竞标。

连接到可抢占虚拟机的GPU跟按需GPU基本相同,但有两点重要的不同:因为是可抢占的,计算引擎可能会停止服务,停止服务前30秒会提前给你发送警告;你最多可以使用它们24小时。

任何连接到可抢占虚拟机实例的GPU都将被视为是可抢占的,并将以较低的价格进行计费。

现在,谷歌云平台提供3种GPU,可以根据你的需要选择使用。

GPU价格为每小时费率,每个连接到虚拟机的GPU都按秒计费。列出的价格适用于美国地区。其他地区的价格可能会有不同。额外的持续使用折扣(最高30%)仅适用于不可抢占GPU。

谷歌打起价格战?

很多网友纷纷表示,谷歌这一大降价的背后,是对亚马逊AWS的冲击。

有人推测是因为谷歌推出了TPU 3.0,替换下来一大批不用的GPU。

也有人推测,是谷歌有一个新的产品要出现,降低旧产品市场的利润率将使其他公司无法足够盈利去投资研发并赶上自己。

总之,无论如何,这对于广大群众来说,是件好事。

如何使用云端可抢占GPU

结合自定义机器类型,具有可抢占GPU的抢占式虚拟机,让你可以根据自己需要的资源构建计算堆栈,而不再需要其他资源。将可抢占GPU连接到自定义可抢占虚拟机(VM)中,你可以减少GPU VM的虚拟CPU或主机内存量。此外,你还可以使用可抢占本地SSD与谷歌的可抢占GPU进行低成本、高性能存储选择。

可抢占GPU的情况

进行机器学习研究的创新者、研究人员和学者,对硬件加速基础设施的需求非常高,可抢占GPU具有可预测的低价格,因此两者得到了很好的结合。

斯坦福大学助理教授Kayvon Fatahalian表示:“可抢占GPU有助于我们的研究小组使用我们的Scanner开源平台大规模处理大型视频集合。可预测的低成本使得单个研究生可以重复部署数百个GPU来处理基于机器学习的100,000小时电视新闻视频分析。这个价格的下降使我们能够以相同的预算执行两倍的处理量。”

机器学习训练和可抢占式GPU

训练ML workloads非常适合使用带有GPU的可抢占虚拟机。谷歌Kubernetes引擎和计算引擎的受管实例组(managed instance groups)让你能为大型计算作业创建动态可扩展的带GPU的可抢占虚拟机群集。你可以使用Tensorflow的检查点功能(checkpointing)保存和恢复工作进度。

开始使用

要开始使用Google Compute Engine中的可抢占GPU,只需在gcloud中添加--preemptible到你的实例创建命令中,在REST API中指定scheduling.preemptible为true,或在Google Cloud Platform Console中将抢占性设置为“On”,然后像平时一样添加GPU就行了。

你可以使用普通的GPU配额启动可抢占GPU,或者,你可以申请特殊的可抢占GPU配额(https://cloud.google.com/compute/quotas),这个配额仅适用于与可抢占虚拟机相连的GPU。

了解更多信息:

https://cloud.google.com/compute/docs/gpus/#preemptible_with_gpu

Kubernetes引擎GPU文档:

https://cloud.google.com/kubernetes-engine/docs/concepts/gpus


原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT技术精选文摘

浅谈开发实时视频直播平台的技术要点

1242
来自专栏java一日一条

如果程序员是士兵,编程语言是武器,那么每种语言都是什么武器?

PHP 3是电锯。是面向致力于web app的士兵的第一批武器之一(甚至在“web spp”这个名词变得流行之前)。可以完成工作,但看起来很杂乱,幸运的是现在有...

543
来自专栏FreeBuf

研究人员公开新CPU漏洞Spectre 1.1和Spectre 1.2

近日,两位安全研究人员又披露了两个新的“幽灵级”(Specter-class)安全漏洞,并将这些漏洞命名为“Spectre 1.1”和“Spectre 1.2”...

734
来自专栏机器人网

干货:高水平自动化工程师的成长进阶之路

写在前面:进阶没有绝招,但好学和热爱绝对是必杀技。 【能力特点】 1、能用计算机进行PLC控制编程与调试。 2、能用计算机进行CAD电气原理图纸的绘制。 3、...

34911
来自专栏飞总聊IT

大数据那些事(19):有干爹的Cloudera

英文有个说法叫Sugar Daddy。翻译成中文还是干爹比较合适。大家都知道文字在发展,近年来尤其在加速发展。同志,小姐都赋予了新的含义,随着长城的上演,干爹的...

29510
来自专栏VRPinea

VR科普丨想要玩爽VR,你需要什么样的配置?

26010
来自专栏SDNLAB

5G应用的两大愿景:超大规模连接和大规模物联网

5G的标准还没有明确5G的需求,但各大组织现在都在分析2020年或以后5G网络部署的可能性。关于这一点,国际电联IMT-2020已经定义了5G的技术要求,3GP...

3596
来自专栏SDNLAB

Big Switch推出下一代监控和数据中心交换架构 加速SDN网络转型

SANTA CLARA,CA(2016年6月22日)- Big Switch Networks®,给全球带来超大设计灵感的网络数据中心领导者,今天宣布其基于SD...

2839
来自专栏镁客网

量子计算机的突破,加州理工大学研发纳米级速度光量子芯片 | 黑科技

1140
来自专栏机器之心

业界 | 有图有真相:深度拆解谷歌TPU3.0,新一代AI协同处理器

1313

扫码关注云+社区