「GPU陷入价格战」谷歌云可抢占GPU降价40%,P100每小时不到3块钱

laagyzz 2018-06-19

「GPU陷入价格战」谷歌云可抢占GPU降价40%,P100每小时不到3块钱

谷歌云端可抢占GPU(最右边一列),普遍降价40%


新智元报道

来源:Google

作者:文强

【新智元导读】还愁用不起GPU?今天谷歌宣布云端可抢占GPU大幅降价,P100的价格每小时0.43美元,换算成人民币只需2.77元。

「GPU陷入价格战」谷歌云可抢占GPU降价40%,P100每小时不到3块钱

不是每个人工作的时候都需要GPU,但对于那些需要的人来说,GPU是必不可少,越多越好。

但是,GPU很贵啊。此前谷歌、Facebook等巨头开展了不少令人印象深刻的工作,其中不乏使用成百乃至上千GPU的例子,让人望尘莫及。

不过,就像很多研究者预测的那样,硬件的价格会不断降低。今天,谷歌就宣布,他们整个GPU产品组合的可抢占价格大幅降低,比连接到按需GPU的降低了70%。

今年早些时候,谷歌云平台宣布,可以将你的GPU连接到谷歌云计引擎(Google Compute Engine)和Google Kubernetes Engine上的可抢占虚拟机(Preemptible VMs)上——谷歌云端抢占式虚拟机的每小时的固定费用只要0.015美元,将GPU的使用价格降低了50%。今天,这个价格再往下走了40%

谷歌表示,抢占式GPU(Preemptible GPUs)非常适合短期、容错和批处理工作负载,比如机器学习(ML)和高性能计算(HPC)的客户。使用抢占式GPU,你可以访问大规模GPU基础架构,只需支付可预测的低价格,无需对容量竞标。

连接到可抢占虚拟机的GPU跟按需GPU基本相同,但有两点重要的不同:因为是可抢占的,计算引擎可能会停止服务,停止服务前30秒会提前给你发送警告;你最多可以使用它们24小时。

任何连接到可抢占虚拟机实例的GPU都将被视为是可抢占的,并将以较低的价格进行计费。

现在,谷歌云平台提供3种GPU,可以根据你的需要选择使用。

「GPU陷入价格战」谷歌云可抢占GPU降价40%,P100每小时不到3块钱

GPU价格为每小时费率,每个连接到虚拟机的GPU都按秒计费。列出的价格适用于美国地区。其他地区的价格可能会有不同。额外的持续使用折扣(最高30%)仅适用于不可抢占GPU。

谷歌打起价格战?

很多网友纷纷表示,谷歌这一大降价的背后,是对亚马逊AWS的冲击。

有人推测是因为谷歌推出了TPU 3.0,替换下来一大批不用的GPU。

也有人推测,是谷歌有一个新的产品要出现,降低旧产品市场的利润率将使其他公司无法足够盈利去投资研发并赶上自己。

总之,无论如何,这对于广大群众来说,是件好事。

如何使用云端可抢占GPU

结合自定义机器类型,具有可抢占GPU的抢占式虚拟机,让你可以根据自己需要的资源构建计算堆栈,而不再需要其他资源。将可抢占GPU连接到自定义可抢占虚拟机(VM)中,你可以减少GPU VM的虚拟CPU或主机内存量。此外,你还可以使用可抢占本地SSD与谷歌的可抢占GPU进行低成本、高性能存储选择。

可抢占GPU的情况

进行机器学习研究的创新者、研究人员和学者,对硬件加速基础设施的需求非常高,可抢占GPU具有可预测的低价格,因此两者得到了很好的结合。

斯坦福大学助理教授Kayvon Fatahalian表示:“可抢占GPU有助于我们的研究小组使用我们的Scanner开源平台大规模处理大型视频集合。可预测的低成本使得单个研究生可以重复部署数百个GPU来处理基于机器学习的100,000小时电视新闻视频分析。这个价格的下降使我们能够以相同的预算执行两倍的处理量。”

机器学习训练和可抢占式GPU

训练ML workloads非常适合使用带有GPU的可抢占虚拟机。谷歌Kubernetes引擎和计算引擎的受管实例组(managed instance groups)让你能为大型计算作业创建动态可扩展的带GPU的可抢占虚拟机群集。你可以使用Tensorflow的检查点功能(checkpointing)保存和恢复工作进度。

开始使用

要开始使用Google Compute Engine中的可抢占GPU,只需在gcloud中添加--preemptible到你的实例创建命令中,在REST API中指定scheduling.preemptible为true,或在Google Cloud Platform Console中将抢占性设置为“On”,然后像平时一样添加GPU就行了。

你可以使用普通的GPU配额启动可抢占GPU,或者,你可以申请特殊的可抢占GPU配额(https://cloud.google.com/compute/quotas),这个配额仅适用于与可抢占虚拟机相连的GPU。

了解更多信息:

https://cloud.google.com/compute/docs/gpus/#preemptible_with_gpu

Kubernetes引擎GPU文档:

https://cloud.google.com/kubernetes-engine/docs/concepts/gpus

相关推荐