我决定测试Kubeflow,并决定在GCP上测试它。我开始使用Kubeflow官方网站(这里是https://www.kubeflow.org/docs/gke/)上的guiidline在GCP上部署kubeflow。我遇到了很多问题,很难解决。我开始寻找一种更好的方法,我注意到GCP AI platform现在只需几个简单的步骤就可以部署Kubeflow管道。在轻松设置之后,我几乎没
我在我的Kubeflow应用程序中遇到了与https://github.com/kubeflow/kubeflow/issues/6014相同的问题。修复非常简单(只是一个类型转换),然后我想自己修复它并重新部署Kubeflow。 问题是我在安装了Kubeflow bundle via Juju的本地计算机上运行k3s集群。使用Kubernetes部署Kubeflow之前,<
我希望在一个地方管理我所有的Google Cloud机器学习模型(例如AI平台/Kubeflow/AutoML)。但是,我不确定在哪里可以找到AutoML,特别是我已经部署的AutoML表和模型。此外,如果我想进行进一步的定制,我还可以将该模型引入Kubeflow,以进一步定制、版本化、管理和部署。 AI Platform、AutoML和Kubeflow的所有不同模型是如何管理和版本化的?
我在一台本地机器上运行Kubeflow,这台机器是我使用these steps部署的multipass,但当我尝试运行我的管道时,它被消息ContainerCreating卡住了。当我运行kubectl describe pod train-pipeline-msmwc-1648946763 -n kubeflow时,我在describe的Events部分找到了这个: Events)": timeout expired waiting for volumes to attach or mount for pod