我试图发射一个射线集群,我使用诗歌作为我的软件包管理。
问题是当我运行poetry run ray up config.yaml
时
New status: setting-up
[4/7] Running initialization commands
Shared connection to XX.XX.XX.XX closed.
[5/7] Initalizing command runner
[6/7] No setup commands to run.
[7/7] Starting the Ray runtime
bash: ray: command not found
Shared connection to XX.XX.XX.XX closed.
New status: update-failed
!!!
SSH command failed.
!!!
Failed to setup head node.
然而,如果我安装完全相同版本的射线,使用pip作为用户包并运行ray up config.yaml
,一切都可以在安装程序中工作。问题是远程参与者不使用我在虚拟环境中的包版本(即使在运行调用ray.init()
的脚本时激活了我的虚拟环境)。
我尝试通过intialization_commands和setup_commands在config.yaml中激活虚拟环境,但没有结果。
是否有人知道如何使用指定的虚拟环境安装射线集群(ray安装在虚拟环境中,但不作为用户或全局包安装)。任何帮助都将不胜感激!
如果有任何不同的话,集群就是SLURM集群。每台机器共享其文件系统,因此虚拟环境在每台机器上。
发布于 2021-12-13 21:07:36
我似乎用一点技巧解决了这个问题。与其指定任何setup_commands,不如在.bashrc文件中获取虚拟环境。(有点烦人,因为如果我在一台不需要虚拟环境的机器上的shell中,我现在必须每次都禁用它)
https://stackoverflow.com/questions/70339798
复制相似问题