Проблема

При установке подсистем ALD Pro возникают проблемы.

Диагностика

  • Определить в файле /var/log/salt/minion номер задания на установку из сообщений:

    Starting a new job 20220608092448477764 with PID 1661

    и выполнить запуск задания с этим номером для проверки статуса:

    salt-run jobs.lookup_jid 20220608092448477764

    Возможно отсутствие ошибок в лог-файле и статус задания "Успешно".

Возможная причина: Запуск сервиса salt-minion до запуска службы каталогов. Перейти к решению.


  • Форсировать установку на сервере подсистемы с выводом в файл:
    sudo kinit admin
    sudo aldpro-roles --iud --action install 2>&1 | tee -a sub-install-$HOSTNAME.log
    Проверить количество ошибок получения сертификата после завершения установки:
    grep "CRT not found" -i sub-install-$HOSTNAME.log | wc -l
    Если в выводе количество ошибок равняется 12, то подсистеме не удалось получить сертификат во время установки, и установка завершилась некорректно.
  • На всех КД проверить, что при выполнении следующей команды:
    sssd_offline_count=`grep "SSSD is offline" -i /var/log/aldpro-salt/minion | wc -l`;ldap_transport_count=`grep "local variable 'ldap_transport' referenced before assignment" -i /var/log/aldpro-salt/minion | wc -l`;printf "sssd_err: %d, ldap_err: %d\n" "$sssd_offline_count" "$ldap_transport_count"
    в выводе количество сообщений больше нуля и для sssd_err, и для ldap_err.

Возможная причина: Не выпускается сертификат из-за проблем с SSSD. Перейти к решению.


  • Проверить, что во время установки подсистемы на КД в журналах появляются ошибки доступа КД к LDAP-каталогу:
    • в файле /var/log/aldpro-salt/minion:
      2025-02-12 08:43:09,684 [salt.state       :2256][INFO    ][994955] Running state [aldpro_subsystems.send_crt_to_ldap] at time 08:43:09.684793
      2025-02-12 08:43:09,685 [salt.state       :2288][INFO    ][994955] Executing state module.run for [aldpro_subsystems.send_crt_to_ldap]
      2025-02-12 08:45:59,776 [salt.loaded.int.module.logmod:47  ][INFO    ][994955] {'desc': "Can't contact LDAP server", 'errno': 11, 'info': 'Resource temporarily unavailable'}
      2025-02-12 08:45:59,776 [salt.state       :323 ][ERROR   ][994955] {'ret': False}
      2025-02-12 08:45:59,776 [salt.state       :2455][INFO    ][994955] Completed state [aldpro_subsystems.send_crt_to_ldap] at time 08:45:59.776839 (duration_in_ms=170092.046)
    • в файле /var/log/error:
      Feb 20 13:45:19 <имя_КД> ldap_child[404219][404219]: Failed to initialize credentials using keytab [MEMORY:/etc/krb5.keytab]: Preauthentication failed. Unable to create GSSAPI-encrypted LDAP connection.
    • в файле /var/log/dirsrv/slapd-<ИМЯ>-<ДОМЕНА>/security
      { "date": "[12\/Feb\/2025:08:09:46.282163515 +0400] ", "utc_time": "1739333386.282163515", "event": "TCP_ERROR", "client_ip": "local", "server_ip": "\/run\/slapd-<ИМЯ>-<ДОМЕНА>.socket", "ldap_version": 3, "conn_id": 176339, "msg": "Bad Ber Tag or uncleanly closed connection - B1" }

Возможная причина: Некорректная версия KVNO в файле /etc/krb5.keytab на контроллере домена. Перейти к решению.


  • Проверить в лог-файле /var/log/salt/minion наличие сообщение вида:

    SSLCertificateFile: file '/etc/ssl/certs/<короткое_имя_сервера>.crt' does not exist or is empty
  • Выполнить команду:

    cat /etc/hosts

    и проверить порядок сопоставления FQDN сервера его короткому имени, например:

    192.168.1.3 server server.aldpro.test

Возможная причина: Некорректный порядок записи имен в файле /etc/hosts. Перейти к решению.


  • Проверить:

    • в лог-файле /var/log/salt/minion наличие сообщения вида:

      Error while bringing up minion for multi-master.
      Minion unable to successfully connect to a Salt Master.
    • версии пакетов SaltStack на КД и сервере:

      apt show salt-master | grep Version
      apt show salt-minion | grep Version

Возможная причина: Отличаются версии пакетов SaltStack. Перейти к решению.


  • Проверить:
    • в фале /var/log/salt/minion при установке подсистемы Сервер Репозиториев наличие сообщений вида:
      Traceback (most recent call last):  
        File "/opt/rbta/venvs/aldpro-common/lib/python3.7/site-packages/salt/utils/templates.py", line 216, in render_tmpl    
           output = render_str(tmplstr, context, tmplpath)  
        File "/opt/rbta/venvs/aldpro-common/lib/python3.7/site-packages/salt/utils/templates.py", line 475, in render_jinja_tmpl    
           raise SaltRenderError("Jinja variable {}{}".format(exc, out), line, tmplstr)
      salt.exceptions.SaltRenderError: Jinja variable list object has no element 0; line 19
      ---
      [...]
      manage_pg_hba_master:  
         file.append:    
             - name: /etc/postgresql/11/main/pg_hba.conf    
             - text:        
             - host  replication     repluser        {{ config.ip_by_fqdn }}/32   md5    <======================
      ---
      2024-09-06 10:26:10,619 [salt.state       :4148][CRITICAL][3398] Rendering SLS 'base:aldpro.subsystems.repo.master.postgres_replica' failed: Jinja variable list object has no element 0; line 19
      ---
    • наличие A-записи или ее корректность для будущего Сервера Репозиториев на контроллере домена.

Возможная причина: Отсутствует A-запись для сервера репозиториев. Перейти к решению.


  • При невозможности установить роль DHCP проверить наличие сообщений о неудовлетворенных зависимостях пакетов:
    • через Портал управления — Автоматизация — Задания автоматизации — Журнал заданий — Имя задания (например, dhcp-install);
    • содержимое файла /var/salt/minion.

Возможная причина: Отсутствует файл настроек приоритета apt. Перейти к решению.


  • Проверить при установке реплики ALD Pro в журнале портала управления статус задачи на установку. Возможен статус "Запущено" при условии успешного создания реплики.

Возможная причина: Ошибочный статус задания на установку реплики. Перейти к решению.


Возможные причины