Проблема

Фиксируется аварийное отключение серверных служб RuBackup.

Диагностика

  • СРК RuBackup развернут на двух узлах Primary+Secondary.
  • Служебная СУБД СРК развернута на трех узлах кластера Patroni.
  • Нарушение проявляется непостоянно при смене лидера кластера Patroni у служебной СУБД СРК в виде аварийного отключения сервиса rubackup_server на одном или двух серверных узлах СРК. Смена лидера кластера на узлах СУБД осуществляется двумя методами:
    • С помощью команды смены лидера кластера:
      patronictl -c /etc/patroni/config.yml switchover --force
      CODE
    • Последовательно отключая на текущем узле-лидере кластера сервис:
      sudo systemctl stop patroni
      CODE
      а после смены лидера кластера включая сервис:
      sudo systemctl start patroni
      CODE
  • Ручной запуск сервиса rubackup_server на узле сервера возвращает работоспособность узла СРК.

Возможная причина: Ошибка в коде: обращение к невалидной памяти и нарушение спецификатора. Перейти к решению.


Возможные причины