Диагностика в DCImanager 6 используется для проверки состояния сервера и его подготовки к использованию новым клиентом. В ходе диагностики:

  • проверяются характеристики оборудования;
  • проводится анализ S.M.A.R.T. дисков на наличие ошибок;
  • проверяется скорость локального соединения, чтобы исключить ошибки работы сетевой карты;
  • при необходимости проводится настройка BMC и очистка жёстких дисков сервера.

Информация о результатах диагностики вносится в базу данных DCImanager 6.

Часть программного обеспечения (ПО) и сторонних сервисов, используемых для проведения диагностики, установлена на сервере с DCImanager 6, часть — на локации. Подробнее о локациях см. в статье Локации. Общая информация.

Процесс диагностики можно разделить на следующие этапы:

  1. Подготовка шаблона диагностики.

  2. Загрузка шаблона диагностики.

  3. Проведение диагностики.

  4. Завершение диагностики.

Диагностика проходит по шаблону Diag6 на основе ОС SystemRescueCD 6.

ПО загружается на сервер по TFTP и HTTP. HTTP и TFTP-сервер, с которых происходит загрузка, расположены на локации.

В процессе диагностики на сервер передаются сетевые настройки с DHCP-сервера локации и загружается операционная система SystemRescueCD. По окончании диагностики загруженное ПО будет удалено, сетевые настройки сервера будут восстановлены в исходное состояние.

Если у платформы настроена интеграция с биллинговой системой, то на время диагностики серверу будет выделен IP-адрес из пула для освобождения серверов.

Сетевые настройки с DHCP-сервера передаются на канальном уровне (L2), дальнейшее взаимодействие по протоколам TFTP и HTTP происходит на сетевом уровне (L3).

Максимальное время, выделяемое на проведение диагностики — 60 минут. Если в течение этого времени диагностика не закончится, DCImanager 6 принудительно завершит операцию диагностики.

Подготовка шаблона диагностики


На этом этапе DCImanager 6:

  1. Формирует значения параметров и макросов для шаблона диагностики.
  2. Настраивает конфигурационный файл DHCP-сервера.
  3. Подготавливает файлы для передачи по TFTP и HTTP.
  4. Генерирует новый пароль подключения к BMC, если вы включили опцию Настроить BMC.

Загрузка шаблона диагностики


На этом этапе:

  1. DCImanager 6 перезагружает диагностируемый сервер.
  2. DHCP-сервер передаёт на диагностируемый сервер сетевые настройки и пути к файлам для передачи по TFTP.
  3. Диагностируемый сервер скачивает по TFTP конфигурационный файл iPXE-загрузчика ipxe.conf.
  4. DHCP-сервер передаёт сетевые настройки для iPXE-загрузчика на диагностируемом сервере.
  5. iPXE-загрузчик скачивает по HTTP необходимые файлы для запуска диагностики и образ операционной системы SystemRescueCD. По окончании загружает SystemRescueCD в оперативную память.
  6. DHCP-сервер передаёт сетевые настройки на диагностируемый сервер для работы SystemRescueCD.

Проведение диагностики


После загрузки шаблона происходит запуск скрипта диагностики autorun. Скрипт autorun:

  1. Собирает информацию об оборудовании сервера и его производительности.
  2. Отправляет собранные данные на локацию.
  3. Производит очистку жёстких дисков при одном из условий:
    • если вы включили опцию Очистить SSD и HDD диски во время диагностики;
    • если в шаблон диагностики добавлен макрос $CLEAR_HDD или $FULL_HDD_CLEAR со значением "YES". Подробнее см. Макросы шаблонов.
  4. Производит конфигурацию BMC, если вы включили опцию Настроить BMC:
    1. Выделяет для BMC IP-адрес. Если подключение к BMC не настроено, IP-адрес будет выделен из пула, выбранного в настройках диагностики.
    2. Удаляет всех созданных пользователей BMC.
    3. Создаёт учётную запись администратора с заданным именем.
    4. Создаёт учётную запись оператора, если для неё задано имя. Владелец сервера сможет подключаться к BMC только под этим пользователем.

      Если диагностика завершилась с ошибкой, существующие пользователи не будут удалены, а новые не будут созданы.

  5. Перезагружает или выключает сервер в зависимости от выбранной опции при запуске диагностики.

Завершение диагностики


На этом этапе DCImanager 6:

  1. Получает с локации данные, собранные в процессе диагностики.
  2. Возвращает изменённые конфигурационные файлы в исходное состояние.
  3. Удаляет директории и файлы, созданные для операции диагностики.
  4. Сохраняет в базу данных конфигурацию сервера.
  5. В зависимости от настроек платформы перезагружает или выключает диагностируемый сервер.