【GPU陷入价格战】谷歌云可抢占GPU降价40%,P100每小时不到3块钱

来源:Google

作者:文强

【新智元导读】还愁用不起GPU?今天谷歌宣布云端可抢占GPU大幅降价,P100的价格每小时0.43美元,换算成人民币只需2.77元。

不是每个人工作的时候都需要GPU,但对于那些需要的人来说,GPU是必不可少,越多越好。

但是,GPU很贵啊。此前谷歌、Facebook等巨头开展了不少令人印象深刻的工作,其中不乏使用成百乃至上千GPU的例子,让人望尘莫及。

不过,就像很多研究者预测的那样,硬件的价格会不断降低。今天,谷歌就宣布,他们整个GPU产品组合的可抢占价格大幅降低,比连接到按需GPU的降低了70%。

今年早些时候,谷歌云平台宣布,可以将你的GPU连接到谷歌云计引擎(Google Compute Engine)和Google Kubernetes Engine上的可抢占虚拟机(Preemptible VMs)上——谷歌云端抢占式虚拟机的每小时的固定费用只要0.015美元,将GPU的使用价格降低了50%。今天,这个价格再往下走了40%

谷歌表示,抢占式GPU(Preemptible GPUs)非常适合短期、容错和批处理工作负载,比如机器学习(ML)和高性能计算(HPC)的客户。使用抢占式GPU,你可以访问大规模GPU基础架构,只需支付可预测的低价格,无需对容量竞标。

连接到可抢占虚拟机的GPU跟按需GPU基本相同,但有两点重要的不同:因为是可抢占的,计算引擎可能会停止服务,停止服务前30秒会提前给你发送警告;你最多可以使用它们24小时。

任何连接到可抢占虚拟机实例的GPU都将被视为是可抢占的,并将以较低的价格进行计费。

现在,谷歌云平台提供3种GPU,可以根据你的需要选择使用。

GPU价格为每小时费率,每个连接到虚拟机的GPU都按秒计费。列出的价格适用于美国地区。其他地区的价格可能会有不同。额外的持续使用折扣(最高30%)仅适用于不可抢占GPU。

谷歌打起价格战?

很多网友纷纷表示,谷歌这一大降价的背后,是对亚马逊AWS的冲击。

有人推测是因为谷歌推出了TPU 3.0,替换下来一大批不用的GPU。

也有人推测,是谷歌有一个新的产品要出现,降低旧产品市场的利润率将使其他公司无法足够盈利去投资研发并赶上自己。

总之,无论如何,这对于广大群众来说,是件好事。

如何使用云端可抢占GPU

结合自定义机器类型,具有可抢占GPU的抢占式虚拟机,让你可以根据自己需要的资源构建计算堆栈,而不再需要其他资源。将可抢占GPU连接到自定义可抢占虚拟机(VM)中,你可以减少GPU VM的虚拟CPU或主机内存量。此外,你还可以使用可抢占本地SSD与谷歌的可抢占GPU进行低成本、高性能存储选择。

可抢占GPU的情况

进行机器学习研究的创新者、研究人员和学者,对硬件加速基础设施的需求非常高,可抢占GPU具有可预测的低价格,因此两者得到了很好的结合。

斯坦福大学助理教授Kayvon Fatahalian表示:“可抢占GPU有助于我们的研究小组使用我们的Scanner开源平台大规模处理大型视频集合。可预测的低成本使得单个研究生可以重复部署数百个GPU来处理基于机器学习的100,000小时电视新闻视频分析。这个价格的下降使我们能够以相同的预算执行两倍的处理量。”

机器学习训练和可抢占式GPU

训练ML workloads非常适合使用带有GPU的可抢占虚拟机。谷歌Kubernetes引擎和计算引擎的受管实例组(managed instance groups)让你能为大型计算作业创建动态可扩展的带GPU的可抢占虚拟机群集。你可以使用Tensorflow的检查点功能(checkpointing)保存和恢复工作进度。

开始使用

要开始使用Google Compute Engine中的可抢占GPU,只需在gcloud中添加--preemptible到你的实例创建命令中,在REST API中指定scheduling.preemptible为true,或在Google Cloud Platform Console中将抢占性设置为“On”,然后像平时一样添加GPU就行了。

你可以使用普通的GPU配额启动可抢占GPU,或者,你可以申请特殊的可抢占GPU配额(https://cloud.google.com/compute/quotas),这个配额仅适用于与可抢占虚拟机相连的GPU。

了解更多信息:

https://cloud.google.com/compute/docs/gpus/#preemptible_with_gpu

Kubernetes引擎GPU文档:

https://cloud.google.com/kubernetes-engine/docs/concepts/gpus


原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏携程技术中心

个性化推荐沙龙 | 腾讯云推荐引擎实践

吕慧伟,腾讯云布道师,腾讯社交网络运营部高级工程师,腾讯通用推荐系统神盾开发负责人,腾讯云推荐引擎架构师。中国科学院计算技术研究所博士,美国阿贡国家实验室博士后...

4664
来自专栏PPV课数据科学社区

关联分析案例:一套数据学会如何从数据到信息到决策

俗话说,忘记历史就是背叛自己,今天这篇用此做开场再合适不过。 这一篇将根据一个虚拟的故事,来介绍如何通过历史数据来帮助一个销售人员发现规律信息从而辅助他来做一些...

3854
来自专栏大数据文摘

推荐5个机器学习API

1678
来自专栏大数据文摘

深度 | 探索实物与VR间重量转换的方法

1184
来自专栏ThoughtWorks

小数据:理论和架构 | TW洞见

今日洞见 文章作者及图片来自ThoughtWorks:熊节。 本文所有内容,包括文字、图片和音视频资料,版权均属ThoughtWorks公司所有,任何媒体、网站...

3245
来自专栏量子位

亚马逊加入微软Facebook框架联盟,抱团挑战TensorFlow霸权?

安妮 编译整理 量子位 出品 | 公众号 QbitAI 今天,亚马逊AWS宣布加入微软和Facebook的“框架联盟”,ONNX开始支持Apache MXNet...

2966
来自专栏织云平台团队的专栏

智能运维机器人--AI运维的实践探索【二】

当越来越多的AI技术引入运维领域后,我们能憧憬,我们的征途,正驶向星辰大海吗?

1.3K6
来自专栏AI科技评论

动态丨Facebook 发布开源框架 PyTorch, Torch 终于被移植到 Python 生态圈

本周,Facebook 的 AI 研究团队发布了一个 Python 工具包,专门针对 GPU 加速的深度神经网络(DNN)编程。它有望辅助、或在一定程度上替代,...

2987
来自专栏BestSDK

【重磅!】Facebook 发布开源框架 PyTorch,兼容 Python

本周,Facebook 的 AI 研究团队发布了一个 Python 工具包,专门针对 GPU 加速的深度神经网络(DNN)编程。它有望辅助、或在一定程度上替代,...

3866
来自专栏MixLab科技+设计实验室

从低保真原型中生成前端代码

今天聊下《 技术 Mix 设计 》的话题。技术与设计两者的边界,越来越模糊,从用机器视觉判断平面设计作品的视觉焦点,到用深度学习指导用户体验设计,还有用深度学习...

3236

扫码关注云+社区