我尝试使用WinML中关于python的tensorflow模型。我成功地将protobuf转换成onnx。取得了下列性能结果:
43s
对CPU的推断约为86s。
在性能工具上,与其他工具相比,WinML似乎没有正确地使用GPU。WinML似乎使用DirectML作为后端(我们在Nvidia GPU分析器上观察到DML前缀)。可以在WinML中使用Cuda推理机吗?有没有人观察到类似的结果,WinML在GPU上异常缓慢?
发布于 2020-04-15 05:22:59
我得到了一些关于WinML性能的答案。我的网络使用的是仅在Windows2004中由LeakyRelu支持的DirectML。在Windows早期版本中,此问题会禁用DirectML Metacommand的使用,从而导致性能下降。使用新的windows版本,我在WinML上获得了良好的性能。
https://stackoverflow.com/questions/60264844
复制相似问题