Ceph. Недоступна часть узлов
Проблема
Часть узлов Ceph в кластере находится в состоянии down
, работа кластера нарушена.
Диагностика
- Проверить:
- работу автоматической синхронизации времени между серверами:
ceph
:вывод команды:sudo ceph -s
... clock skew detected on node02 ...
ntp
:sudo ntpq -c sysinfo
chrony
:sudo chronyc tracking
- работу автоматической синхронизации времени между серверами:
- лог-файлы
/var/log/ceph/ceph.log
с узлов в состоянииdown
:... mon.node02 (mon.0) 438945 : cluster [WRN] 2 clock skew 8.1533s > max 0.05s ...
- лог-файлы
Возможная причина: Между узлами кластера Ceph нарушена синхронизация времени. Перейти к решению.
- Проверить:
- работу автоматической синхронизации времени между серверами:
ceph
:вывод команды:sudo ceph -s
... clock skew detected on node02 ...
ntp
:sudo ntpq -c sysinfo
chrony
:sudo chronyc tracking
- работу автоматической синхронизации времени между серверами:
- лог-файлы
/var/log/ceph/ceph.log
с узлов в состоянииdown
:... mon.node02 (mon.0) 438945 : cluster [WRN] 2 clock skew 8.1533s > max 0.05s ...
- лог-файлы
Возможная причина: Нарушена синхронизация времени между узлами кластера Ceph. Перейти к решению.