В случае ошибок при добавлении новых серверов front-end в зону, raftmanager при выполнении к примеру той же команды onezone show, может отваливаться с ошибкой Net::ReadTimeout.
Можно восстановить raft несколькими способами:
1) Остановить сервисы на всех серверах в зоне
#systemctl stop opennebula unicorn-opennebula
2) на сервере, который был на момент ошибки leader'ом, отредактировать файл /etc/one/oned.conf, закомментировать хуки raft, установить значение SERVER_ID=-1 в секции FEDERATION. Запустить на данном сервере сервисы(#systemctl start opennebula unicorn-opennebula)
3) с помощью команды onezone server-del удалить ошибочные записи
4) снова остановить сервисы, вернуть старое значение SERVER_ID, раскомментировать хуки raft
5) снять дамп с базы и разлить ее на остальные узлы зоны
6) запустить сервисы на всех серверах зоны
Вариант менее предпочтительный:
В случае, когда неизвестно, кто являлся лидером на момент появления ошибки, можно непосредственно отредактировать данные в бд. Все данные о зоне и серверах зоны, хранятся в таблице zone_pool, поле body. Значение представляет из себя xml строку, данные о каждом узле заключены между тегами <SERVER></SERVER>.
1) на всех серверах зоны остановить сервисы
2) подключиться к базе и проапдейтить значение поля body таблицы zone_pool, убрав записи о ненужных серверах
3) сделать дамп таблицы и разлить ее на другие сервера зоны
4) запустить сервисы на серверах зоны