大概意思是:
- 从元数据存储池读取时,遇到了元数据损坏或丢失的情况。这条消息表明损坏之处已经被妥善隔离了,以使 MDS 继续运作,如此一来,若有客户端访问损坏的子树就返回 IO 错误。关于损坏的细节信息可用 damage ls 管理套接字命令获取。只要一遇到受损元数据,此消息就会立即出现。
ceph fs ls -f json-pretty
ceph --admin-daemon /var/run/ceph/ceph-mds.00.asok scrub_path /dir repair
参考文件:
- https://github.com/ceph/ceph/blob/5cdf9c3380098f5d2b1d988ab623c74baad55ee3/src/mds/MDSRank.cc#L2245
- https://github.com/ceph/ceph/blob/5cdf9c3380098f5d2b1d988ab623c74baad55ee3/src/mds/MDCache.cc#L12197
- 集群ERR
- 发现mds0: Metadata damage detected
- 查看damage ino
- 根据ino定位跟踪目录
- 根据目录名知道业务存储的数据
- 修复问题
1.业务方备份迁移数据 2.查看damage ls 3.检查该ino确实没有对应的目录 4.删除damage rm信息
1.通过指令修复目录
ceph --admin-daemon /var/run/ceph/ceph-mds.ceph-newpublic-osd02.py.asok scrub_path /dir/xxx repair