MPS后端扩展了PyTorch框架,提供了在Mac上设置和运行操作的脚本和功能。MPS通过针对每个Metal GPU系列的独特特性进行微调的内核来优化计算性能。...新设备在MPS图形框架和MPS提供的调整内核上映射机器学习计算图形和基元。...因此此次新增的的device名字是mps,使用方式与cuda类似,例如:
import torch
foo = torch.rand(1, 3, 224, 224).to('mps')
device...此外发现,Pytorch已经支持下面这些device了,确实出乎意料:
cpu, cuda, ipu, xpu, mkldnn, opengl, opencl, ideep, hip, ve, ort,...我又在Nvidia P100 GPU服务器上进行了测试,CPU耗时34.2s,使用CUDA 耗时20.4s,加速比1.67倍,跟M1差不多,整体速度略低于M1。