前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Lustre PCC 初探

Lustre PCC 初探

作者头像
用户4700054
发布2022-08-17 11:30:31
7980
发布2022-08-17 11:30:31
举报
文章被收录于专栏:存储内核技术交流

什么是Lustre PCC?

  • Lustre PCC 是Lustre Persistent Cache on Client技术,借助客户端的挂载节点提供的HDD或者SSD来根据策略来在SSD或者HDD 和lustre文本系统之间数据缓存的技术。
  • 目前Lustre在14版本支持这个功能
Lustre PCC 使用什么场景
  • 比如在AI训练场景中,AI训练计算在GPU节点,存储是挂载在AI计算节点的,每个计算节点读取本节点挂载的存储数据进行计算,这是一般AI训练的过程。每个计算节点都是通过网络请求去拉去后端存储的数据,如果这些计算数据可以缓存在计算节点的本地磁盘,同时这些数据可以实时异步同步到后端存储,那么计算节点就不需要请求网络去拉去后端存储的数据了,计算节点访问数据的IO协议栈相对简单,直接读取本地数据,同时可以缓解后端存储的IO压力,本地数据通过某种机制把数据sync到后端存储,这样可以提高AI存储IO效率和后端存储的数据一致性。
  • 基于这样的场景,Lustre PCC就可以派上用场,它的作用就是在计算节点使用一块磁盘然后初始化为某个文件系统,然后充当lustre 挂载客户端持久化缓存,至于本地磁盘缓存数据是听过lustre一个用户态工具同步到lustre后端的ost中。
Lustre PCC 架构是什么样的?
Lustre PCC 策略有那些?
  • RW-PCCM模式,读写模式访问本地lustre的缓存,缓存中的数据通过lhsmtool_posix来和后端的lustre进行数据同步。
  • RO-PCC模式,以只读方式访问本地lustre的缓存,消除了LDLM和RPC的开销。
Lustre 启用和配置
代码语言:javascript
复制
// 每个mdt节点启用,hsm_control=enabled
[root@dgdpl1915 ~]# lctl set_param mdt.lustrefs-MDT0000.hsm_control=enabled
mdt.lustrefs-MDT0000.hsm_control=enabled
[root@dgdpl1915 ~]# lctl get_param mdt.lustrefs-MDT0000.hsm_control       
mdt.lustrefs-MDT0000.hsm_control=enabled

//客户端节点
lhsmtool_posix --daemon --hsm-root /lustre/cache --archive=1 /mnt/lustre

//客户端节点
lctl pcc add /mnt/lustre  /lustre/cache  --param "uid=0 rwid=1 auto_attch=1"
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 存储内核技术交流 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 什么是Lustre PCC?
    • Lustre PCC 使用什么场景
      • Lustre PCC 架构是什么样的?
        • Lustre PCC 策略有那些?
          • Lustre 启用和配置
          相关产品与服务
          对象存储
          对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档