我正在尝试在安装了docker 18.09.5的服务器上运行支持gpu的容器。它是一个共享服务器,所以我不能只升级docker版本。
我有一个带有docker 19.03.12的私有服务器,下面的代码运行良好:
docker pull vistart/cuda
docker run --name somename --gpus all -it --shm-size=10g -v /dataloc:/mountedData vistart/cuda /bin/sh
nvidia-smi
收益率:预期的gpu统计信息
当我使用docker 18.09在服务器上尝试时:
docker pull vistart/cuda
docker run --name somename --gpus all -it --shm-size=10g -v /dataloc:/mountedData
收益率:
unknown flag: --gpus-all
See 'docker run --help'.
docker run --name somename -it --shm-size=10g -v /dataloc:/mountedData
工作,但是..nvidia-smi
收益率:
/bin/sh: 1: nvidia-smi: not found
有没有可以工作的v18.09版本的--gpus all
?
我试过使用nvidia-docker:
nvidia-docker run --name somename -it --shm-size=10g -v /dataloc:/mountedData
这就产生了:
docker: Error response from daemon: OCI runtime create failed: container_linux.go:345: starting container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running prestart hook 1 caused \\\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig --device=all --compute --utility --require=cuda>=11.0 brand=tesla,driver>=384,driver<385 brand=tesla,driver>=396,driver<397 brand=tesla,driver>=410,driver<411 brand=tesla,driver>=440,driver<441 brand=tesla,driver>=450,driver<451 --pid=3030 /local/var_local/nobackup/docker/overlay2/d096e63d0a34537f04cbafeb1b6c3315b4e6f0ff15e3e2cb30057f549dc75cb5/merged]\\\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\\\n\\\"\"": unknown.
看起来共享正在运行CUDA 10.1,所以它没有命中cuda>-11.0请求...
发布于 2020-10-08 00:35:41
从docker 19.03开始,您可以使用:
docker run --gpus all myimage
对于以前的版本,您可以像这样使用nvidia-docker:
nvidia-docker run myimage
https://stackoverflow.com/questions/64248396
复制相似问题