有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

公有云平台上可以通过控制台在 TKE 集群上部署 GooseFS 服务。本文章主要用于介绍在 TKE 集群上部署的步骤。


前提条件

1. 已创建腾讯云 TKE 集群,节点数量必须在3个以上。TKE 集群的创建指引,可参见 快速创建一个 TKE 标准集群
2. 在 TKE 集群中已安装版本为 v1.18及以上 的 kubectl。
3. 已开通对象存储服务,可参见 对象存储控制台快速入门


安装步骤

1. 正式使用 GooseFS 服务之前,需要授权 GooseFS 服务管理 GPU 节点上的资源,请参见 GooseFS 控制台授权指引
2. 选择与 TKE 集群相同的可用区和 VPC,开通 GooseFS 服务。创建 GooseFS 集群的指引,请参见 创建 GooseFS 集群 文档。
创建过程中,请选择节点类型为 TKE 类型。
如果您的服务会在生产环境中部署,推荐启用高可用模式,GooseFS 将通过部署3个以上的 Master 节点确保集群在单节点故障时依然可用。


3. 创建 GooseFS 集群后,您可参见 配置管理指南AI 场景的推荐配置,修改集群配置,确保发挥 GooseFS 服务的最佳性能。
4. 通过 GooseFS-FUSE 客户端访问 GooseFS 服务,详情请参见 客户端管理
5. 在 GooseFS-FUSE 客户端中可通过 创建命名空间 的方式,将指定 COS 存储桶或者存储桶中的文件夹挂载到 TKE 集群中,进入 master pod 后创建 namespace,进入 Master pod 的命令如下:
kubectl exec -it goosefs-master-0 -c goosefs-master /bin/bash
6. 在 Master pod 容器中执行创建 namespace,用于挂载 COS 中存放模型数据的目录,执行命令如下:
./bin/goosefs ns create goosefs cosn://example-bucket/exampleData \\
--attribute fs.cosn.userinfo.appid=1250000000 \\
--attribute fs.cosn.bucket.region=ap-shanghai \\
--secret fs.cosn.userinfo.secretId=AKIDdn**** \\
--secret http://fs.cosn.userinfo.secretKey=mKdeLFvMa***
7. 以上过程执行完成后,会生成一个 goosefs-pvc,业务 pod 要访问 GooseFS 服务时,可以在业务 Pod 中使用 goosefs-pvc,如下图所示: