前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【问题修复】mds0: Metadata damage detected

【问题修复】mds0: Metadata damage detected

作者头像
Lucien168
发布2020-07-20 11:03:39
2K1
发布2020-07-20 11:03:39
举报
文章被收录于专栏:分布式存储分布式存储

1. 故障现场

  • 通过监控发现集群状态是HEALTH_ERR状态, 并且发现mds0: Metadata damage detected。 顾名思义,猜测应该是元信息损坏导致的。

2. 分析damage是啥原因导致

大概意思是:

  • 从元数据存储池读取时,遇到了元数据损坏或丢失的情况。这条消息表明损坏之处已经被妥善隔离了,以使 MDS 继续运作,如此一来,若有客户端访问损坏的子树就返回 IO 错误。关于损坏的细节信息可用 damage ls 管理套接字命令获取。只要一遇到受损元数据,此消息就会立即出现。

3. 查看damage ls

  • 通过指令查询到damage ls 显示的信息,可以发现里面有个ino编号。

4. 通过转换拿到十六进制ino

  • 通过ino:1099519182934 -> ino: 10000734856

5. 检查是否属于目录(10000734856)

  • 通过指令查找发现该ino确定是目录

6. 确定目录名

7. 该目录下面的所有文件

8. 查看fs挂载的目录是否匹配

代码语言:javascript
复制
ceph fs ls -f json-pretty

9. 修复这个目录元信息

代码语言:javascript
复制
ceph --admin-daemon /var/run/ceph/ceph-mds.00.asok  scrub_path /dir repair

10. 跟踪代码

参考文件:

11. 总结

11.1 问题过程回顾

  • 集群ERR
  • 发现mds0: Metadata damage detected
  • 查看damage ino
  • 根据ino定位跟踪目录
  • 根据目录名知道业务存储的数据
  • 修复问题

12. 修复方案

12.1方案一:删除ino对应的目录(生产环境实战演练过)

1.业务方备份迁移数据 2.查看damage ls

3.检查该ino确实没有对应的目录

4.删除damage rm信息

5.检查集群状态(集群状态从ERR恢复到WARN)

12.2 方案二:修复该目录元信息

1.通过指令修复目录

代码语言:javascript
复制
ceph --admin-daemon /var/run/ceph/ceph-mds.ceph-newpublic-osd02.py.asok scrub_path /dir/xxx repair
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 故障现场
  • 2. 分析damage是啥原因导致
  • 3. 查看damage ls
  • 4. 通过转换拿到十六进制ino
  • 5. 检查是否属于目录(10000734856)
  • 6. 确定目录名
  • 7. 该目录下面的所有文件
  • 8. 查看fs挂载的目录是否匹配
  • 9. 修复这个目录元信息
  • 10. 跟踪代码
  • 11. 总结
    • 11.1 问题过程回顾
    • 12. 修复方案
      • 12.1方案一:删除ino对应的目录(生产环境实战演练过)
        • 12.2 方案二:修复该目录元信息
        相关产品与服务
        数据保险箱
        数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档