我在GKE上的Kubernetes集群中有一个pod,它在Azure上远程创建Kubernetes集群,我想从pod ssh到Azure集群的主VM,这样我就可以在上面远程运行一些命令。但是,每当我在pod中运行ssh / scp时都会遇到超时问题:
ssh: connect to host port 22: Connection timed out
我已经在pod中安装了OpenSSH-client/server。我确保VM具有公共IP地址,并且pod还可以访问VM的私钥。我在我的笔记本电脑上尝试了ssh到Azure主虚拟机中,它工作得很好。有什么想法吗?
我们在1.9.6-gke.1上使用Google Kubernetes引擎,并且有一个带有几个节点池的集群,我们为这些节点池启用了自动伸缩,因为其中的节点包含附加的GPU (p100s)。
有时我们通过Kubernetes Pod在由于触发的自动伸缩事件而启动的节点上通宵运行作业,许多小时后返回时发现pod已经消失,因为pod已经终止,处于某种未知状态,并且由于10分钟内没有其他pod调度到该节点,因此运行该pod的节点已被耗尽并移除。
也就是说,一旦节点消失,pod就会从Kubernetes日志和控制平面ie.running的角度消失,比如kubectl get pods和kubectl de
我将Python脚本作为Kubernetes作业运行。但我有下一个问题。我已经尝试过使用chmod -R 777 /home/vagrant/,但它不能使脚本成功运行。
Traceback (most recent call last):
File "app.py", line 39, in <module>
main()
File "app.py", line 28, in main
config.load_kube_config(config_file=kubeconfig)
File "/usr/local/