前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >纠删码集群需要关注的哪些

纠删码集群需要关注的哪些

作者头像
用户4700054
发布2022-08-17 12:33:13
4560
发布2022-08-17 12:33:13
举报
文章被收录于专栏:存储内核技术交流

纠删码存储方案

  • 按照存储单元单元连接方式,纠删码存储可以分为基于高速总线的磁盘阵列LAN方式的集群基于WAN/Internet方式的广域网存储系统。阵列码是一种特殊化的纠删码,采用高效率的异或运算 。国内大部分纠删码存储主要集中在磁盘阵列和阵列编码两个分支。纠删码存储集群的重要设计目标就是降低总体成本。
数据访问频度
  • 国外大公司通过分析很多应用的I/O特征发现,数据访问的频度随着时间递减,这与数据信息生命周期概念保持了一致,即在数据创建的时候,访问数据的频度很高,这些数据称为热数据;经过一段时间后,这些数据访问的频度下降,这些数据就成为温数据
纠删码存储集群关注关键点
  • 降级读:分布式存储系统出现故障可以分为临时性节点故障和永久性节点故障。其中永久性节点故障是指数据由于硬件损坏导致节点数据无法访问;如果节点是因为掉电这主要的原因短时间内不能访问,这就是临时性故障。研究表明,数据中心的数据失效事件中临时性数据失效在所有数据失效故障中占比最高。如果节点出现了临时性故障,用户的IO落到这个节点,系统需要从其他的存活的节点读取相关数据吗,通过解码操作计算出需要的数据,这个就是降级读。降级读需要花费比正常读取操作几倍的时间,这个对于存储系统的SLA有很大的影响,所以提升降级读的性能就非常有意义。Khan等提出一种算法可以最小化单节点失效情况下重构操作和降极读操作需要的数据。
  • 写更新:纠删码集群写更新有两种针对RMW更新优化的方法,第一种是由Aguilera等提出,如果数据块D1被更新为D2,计算出D2-D1并将其通知给集群里的所有节点,校验节点最终完成运算;第二种Hafner等为保证校验数据一致性提出一种校验更新的方法,数据节点完成就数据分块和新数据分块的差分块,并由数据节点将差分块发送给第一个校验节点,第一个校验节点在将查分块转发给第二个校验分块,依次转发。这两种更新优化都是通过RMW方式达到数据更新和校验更细的木库,其优化的想法在于将更新过程进行分解成多个步骤,由不同节点完成不同更新步骤,避免集中式计算校验分块。 -节点重构:当节点永久性失效时,纠删码存储系统需要进行数据重构过程以恢复失效数据,这个过程称为节点重构。节点重构从是否响应用户IO,可以分为在线重构和离线重构。针对重构加速失效节点数据问题,一般就可以采用降低用户IO、重构IO互补干扰、提供重构IO的并行度、优化解码操作、降低校验组大小(k+m整体变小)、减少数据重构过程中网络传输。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 存储内核技术交流 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 纠删码存储方案
    • 数据访问频度
      • 纠删码存储集群关注关键点
      相关产品与服务
      对象存储
      对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档