当前Ceph 14.2.8,在openEuler 20.03 LTS SP1/CentOS 8.1/Ubuntu 18.04等环境中,可能会出现时钟回滚的现象,从而导致Ceph Monitor Down的情况。具体现象如图所示:
触发该错误的原因是由于kernel时钟bug,导致前后两次调用get_time得到的结果不是单调递增的:
从而触发了Monitor中的assert错误:
目前该bug已由作者修改并合入到主干Master分支上,但是还未合入N版本。
社区ISSUE:https://tracker.ceph.com/issues/43365
修改MR(Merge Request):https://github.com/ceph/ceph/pull/33699