| Секция | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Введение
В статье описано создание iSCSI-хранилища данных на основе двухузлового кластера Pacemaker. Главная цель кластера, чтобы iSCSI-хранилище всегда было доступно для клиентов.
...
Кластер используется для минимизации времени недоступности iSCSI-хранилища.
Архитектура кластера
Кластер состоит из двух узлов: pcmk-1 и pcmk-2двух узлов: ведущего и подчинённого. Роль ведущего может выполнять любой узел (на рисунке ниже ведущим является узел pcmk-1, а подчинённым – pcmk-2).
| Примечание |
|---|
Термины "ведущий узел кластера" и "подчинённый узел кластера" используются только в рамках описываемого кластера iSCSI-хранилища. Сам по себе кластер Pacemaker не делит узлы на ведущие и подчинённые, для него все узлы равноправны. |
На каждом узле:
- есть диск
/dev/vdb(на компьютере и в виртуальной машине VirtualBox это будет диск/dev/sdb); - поверх диска
/dev/vdbработает DRBD-устройство; - поверх DRBD-устройства работает iSCSI-сервер.
Кластер запускает и останавливает на узлах управляет: виртуальным IP-адресом, запуском и остановкой DRBD-устройства , и iSCSI-серверы, а также управляет виртуальным IP-адресом.
Один узел кластера является ведущим, второй – подчинённым.
сервера.
На ведущем узле: DRBD-устройство является ведущим, работает iSCSI-сервер. На подчинённом узле: DRBD-устройство является подчинённым, iSCSI-сервер остановлен.
iSCSI-клиенты подключаются к виртуальному IP-адресу кластера. Аутентификация iSCSI-клиентов не используется.
Рисунок 1. Архитектура iSCSI-хранилища на основе двухузлового кластера
...
| Название узла | IP-адрес | Назначение | ||
|---|---|---|---|---|
| 10.192.1.100/16 | Виртуальный IP-адрес кластера | |||
| pcmk-1 | 10.192.6.74/16 | Первый узел кластера | ||
| pcmk-2 | 10.192.6.75/16 | Второй узел кластера | 10.192.1.100/16 | Виртуальный IP-адрес кластера |
Предварительная настройка
...
Предварительная настройка
Разрешение имён
Задать имена узлов и настроить разрешение имён в соответствии со статьёй "Настройка разрешения имен и статических IP-адресов".
При тестовом создании кластера можно настроить разрешение имён с помощью файла /etc/hosts:
- На каждом узле –
...
- добавить в файл
/etc/hostsстроки:Блок кода 10.192.6.74 pcmk-1 10.192.6.75 pcmk-2 - На первом узле – установить
...
- имя узла pcmk-1:
Command sudo hostnamectl hostname pcmk-1 - На втором узле – установить
...
- имя узла pcmk-2:
Command sudo hostnamectl hostname pcmk-2
Сетевой экран
Если используется сетевой экран, то должно быть обеспечено прохождение пакетовПри использовании сетевого экрана должны быть открыты порты:
- 7789/TCP – для работы DRBD-устройства;
- 3260/TCP – для работы iSCSI-сервера;
- 5405/UDP, 2224/TCP – для работы кластера Pacemaker + Сorosync.
Двухузловой кластер Pacemaker
...
Настроить кластер в соответствии со статьёй "Развертывание двухузлового кластера pacemaker".
...
- Для установки DRBD-пакетов использовать командуиспользуется команда:
Command sudo apt install drbd-utils "drbd-$(uname -r)"
- DRBD-устройство настраивается на узлах pcmk-1 и pcmk-2 с IP-адресами, указанными в разделе "Архитектура кластера".
- Для создания DRBD-устройства используется блочное устройство
/dev/vdb. - Настраиваются глобальные настройки в файле
/etc/drbd.d/global_common.conf:Блок кода global { usage-count no; } - Настраивается Необходимо настроить ресурс "dvolume" , используя конфигурационный файл с помощью конфигурационного файла
/etc/drbd.d/dvolume.res:Блок кода resource "dvolume" { device minor 1; meta-disk internal; net { protocol C; fencing resource-only; } handlers { fence-peer "/usr/lib/drbd/crm-fence-peer.9.sh"; unfence-peer "/usr/lib/drbd/crm-unfence-peer.9.sh"; } on "pcmk-1" { node-id 0; disk "/dev/vdb"; } on "pcmk-2" { node-id 1; disk "/dev/vdb"; } connection { host "pcmk-1" address 10.192.6.74:7789; host "pcmk-2" address 10.192.6.75:7789; } } - Для запуска DRBD-устройства – вместо команды "
sudo /etc/init.d/drbd start" использовать командуиспользуется команда:Command sudo drbdadm up dvolume
- Для назначения ведущим DRBD-устройством на текущем узле – вместо команды "
sudo drbdadm -- --overwrite-data-of-peer primary all" использовать командуиспользуется команда:Command sudo drbdadm primary --force all
Предупреждение Не создавать файловую систему и не монтировать DRBD-устройство.
...
- iSCSI-сервер будет иметь имя "iqn.2025-08.iscsi.pcmk12" и принимать запросы на порту 3260 IP-адреса 10.192.1.100.
- Создать ресурсного агента "p_iSCSITarget" для управления iSCSI-сервером:
Command sudo pcs resource create "p_iSCSITarget" ocf:heartbeat:iSCSITarget \
iqn="iqn.2025-08.iscsi.pcmk12" portals="10.192.1.100:3260" \
op monitor interval="10s" - Настроить Создать ресурсного агента "p_iSCSI_lun1" для управления экспортируемым LUN- диском
/dev/drbd1:Command sudo pcs resource create "p_iSCSI_lun1" ocf:heartbeat:iSCSILogicalUnit \
target_iqn="iqn.2025-08.iscsi.pcmk12" lun="1" path="/dev/drbd1" \
op monitor interval="10s" - Проверить настройки ресурсного агента "p_iSCSITarget":
Вывод команды:Command sudo pcs resource status p_iSCSITarget
Проверить настройки ресурсного агента "p_iSCSI_lun1:Блок кода * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-2
Вывод команды:Command sudo pcs resource status p_iSCSI_lun1
Блок кода * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-2
...
На любом работающем узле кластера:
- Отключить (если уже не отключеноотключён) режим работы STONITH, которое используется для физического отключения (обесточивания) неисправного физического дискапри котором неисправное оборудование физически отключается (обесточивается):
Command sudo pcs property set stonith-enabled="false"
- Предотвратить перераспределение ресурсов между узлами при восстановлении нормального режима работы кластера после аварии:
Command sudo pcs resource defaults update resource-stickiness=100
...
- Задать ограничения на запуск ресурса "ClusterIP":
Command sudo pcs constraint colocation add "ClusterIP" with Promoted "p_DRBD-clone"
Command sudo pcs constraint order promote "p_DRBD-clone" then start "ClusterIP"
- Задать ограничения на запуск ресурса "p_iSCSITarget":
Command sudo pcs constraint colocation add "p_iSCSITarget" with "ClusterIP" INFINITY
Command sudo pcs constraint order "ClusterIP" then start "p_iSCSITarget"
- Задать ограничения на запуск ресурса "p_iSCSI_lun1":
Command sudo pcs constraint colocation add "p_iSCSI_lun1" with "p_iSCSITarget" INFINITY
Command sudo pcs constraint order "p_iSCSITarget" then "p_iSCSI_lun1"
- Проверить созданные ограничения:
Command sudo pcs constraint Раскрыть title Вывод команды... Блок кода Location Constraints: Ordering Constraints: promote p_DRBD-clone then start ClusterIP (kind:Mandatory) start ClusterIP then start p_iSCSITarget (kind:Mandatory) start p_iSCSITarget then start p_iSCSI_lun1 (kind:Mandatory) Colocation Constraints: ClusterIP with p_DRBD-clone (score:INFINITY) (rsc-role:Started) (with-rsc-role:Promoted) p_iSCSITarget with ClusterIP (score:INFINITY) p_iSCSI_lun1 with p_iSCSITarget (score:INFINITY) Ticket Constraints:
- Перезапустить кластер, чтобы ограничения вступили в силу:
Command sudo pcs cluster stop --all
Command sudo pcs cluster start --all
- Проверить, что все ресурсы запущены на каком-то одном узле кластера:
Command sudo pcs status
Раскрыть title Вывод команды... Блок кода Cluster name: astracluster Cluster Summary: * Stack: corosync (Pacemaker is running) * Current DC: pcmk-2 (version 3.0.0-3.0.0) - partition with quorum * Last updated: Sun Aug 24 19:37:05 2025 on pcmk-1 * Last change: Sun Aug 24 19:32:28 2025 by root via root on pcmk-1 * 2 nodes configured * 5 resource instances configured Node List: * Online: [ pcmk-1 pcmk-2 ] Full List of Resources: * ClusterIP (ocf:heartbeat:IPaddr2): Started pcmk-2 * Clone Set: p_DRBD-clone [p_DRBD] (promotable): * Promoted: [ pcmk-2 ] * Unpromoted: [ pcmk-1 ] * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-2 * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-2 Daemon Status: corosync: active/disabled pacemaker: active/disabled pcsd: active/enabled
Проверка работоспособности кластера при отказе одного из узлов
: active/disabled pcsd: active/enabled
Проверка работоспособности кластера при отказе ведущего узла
Все ресурсы кластера запускаются на каком-то одном узле – на ведущем узле кластера.
Когда отключается ведущий узел, ресурсы запускаются на втором узле. Второй узел становится ведущим узлом кластера. При восстановлении работы первого узла ресурсы остаются работать на втором узле.
Порядок проверки работоспособности кластера при отказе ведущего узлаПорядок проверки:
- Определить, на каком узле запущены ресурсы, т.е. какой узел кластера является ведущим:
Command sudo pcs status
Раскрыть title Вывод команды... Блок кода Cluster name: astracluster Cluster Summary: * Stack: corosync (Pacemaker is running) * Current DC: pcmk-1 (version 3.0.0-3.0.0) - partition with quorum * Last updated: Thu Aug 28 13:07:33 2025 on pcmk-2 * Last change: Thu Aug 28 10:21:57 2025 by root via root on pcmk-2 * 2 nodes configured * 5 resource instances configured Node List: * Online: [ pcmk-1 pcmk-2 ] Full List of Resources: * ClusterIP (ocf:heartbeat:IPaddr2): Started pcmk-1 * Clone Set: p_DRBD-clone [p_DRBD] (promotable): * Promoted: [ pcmk-1 ] * Unpromoted: [ pcmk-2 ] * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-1 * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-1 Daemon Status: corosync: active/disabled pacemaker: active/disabled pcsd: active/enabled - Пусть Рассмотрим случай, когда ведущим узлом будет является первый узел кластера pcmk-1.
- На любом узле – остановить ведущий узел кластера:
Command sudo pcs cluster stop pcmk-1
- На втором узле – проверить, что все ресурсы перемещены с первого узла на второй , т.е. ведущим стал второй узел pcmk-2:
Command sudo pcs status
Раскрыть title Вывод команды... Блок кода Cluster name: astracluster Cluster Summary: * Stack: corosync (Pacemaker is running) * Current DC: pcmk-2 (version 3.0.0-3.0.0) - partition with quorum * Last updated: Thu Aug 28 13:14:12 2025 on pcmk-2 * Last change: Thu Aug 28 13:13:07 2025 by root via root on pcmk-2 * 2 nodes configured * 5 resource instances configured Node List: * Online: [ pcmk-2 ] * OFFLINE: [ pcmk-1 ] Full List of Resources: * ClusterIP (ocf:heartbeat:IPaddr2): Started pcmk-2 * Clone Set: p_DRBD-clone [p_DRBD] (promotable): * Promoted: [ pcmk-2 ] * Stopped: [ pcmk-1 ] * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-2 * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-2 Daemon Status: corosync: active/disabled pacemaker: active/disabled pcsd: active/enabled - На любом узле – запустить обратно первый узел кластера:
Command sudo pcs cluster start pcmk-1
- На любом узле – проверить, что оба узла кластера работают , и ведущим остался второй узел кластераи все ресурсы остались на втором узле:
Command sudo pcs status
Раскрыть title Вывод команды... Блок кода Cluster name: astracluster Cluster Summary: * Stack: corosync (Pacemaker is running) * Current DC: pcmk-2 (version 3.0.0-3.0.0) - partition with quorum * Last updated: Thu Aug 28 13:40:50 2025 on pcmk-2 * Last change: Thu Aug 28 13:40:49 2025 by root via root on pcmk-2 * 2 nodes configured * 5 resource instances configured Node List: * Online: [ pcmk-1 pcmk-2 ] Full List of Resources: * ClusterIP (ocf:heartbeat:IPaddr2): Started pcmk-2 * Clone Set: p_DRBD-clone [p_DRBD] (promotable): * Promoted: [ pcmk-2 ] * Unpromoted: [ pcmk-1 ] * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-2 * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-2 Daemon Status: corosync: active/disabled pacemaker: active/disabled pcsd: active/enabled
...
- На каждом узле (на котором кластер не запущен) – запустить кластер:
На обоих узлах – дождаться Дождаться окончания запуска кластера, что может занять несколько десятков секунд.Command sudo pcs cluster start
- На любом узле – проверить, что все ресурсы запущены на каком-то одном узле кластера:
Command sudo pcs status
Раскрыть title Вывод команды... Блок кода Cluster name: astracluster Cluster Summary: * Stack: corosync (Pacemaker is running) * Current DC: pcmk-1 (version 3.0.0-3.0.0) - partition with quorum * Last updated: Wed Aug 20 12:38:55 2025 on pcmk-1 * Last change: Wed Aug 20 09:58:02 2025 by root via root on pcmk-1 * 2 nodes configured * 5 resource instances configured Node List: * Online: [ pcmk-1 pcmk-2 ] Full List of Resources: * ClusterIP (ocf:heartbeat:IPaddr2): Started pcmk-1 * Clone Set: p_DRBD-clone [p_DRBD] (promotable): * Promoted: [ pcmk-1 ] * Unpromoted: [ pcmk-2 ] * p_iSCSI_lun1 (ocf:heartbeat:iSCSILogicalUnit): Started pcmk-1 * p_iSCSITarget (ocf:heartbeat:iSCSITarget): Started pcmk-1 Daemon Status: corosync: active/disabled pacemaker: active/disabled pcsd: active/enabled - На любом узле – проверить состояние DRBD-устройства:
Command sudo drbdadm status
Раскрыть title Вывод команды на ведущем узле... Блок кода dvolume role:Primary disk:UpToDate pcmk-2 role:Secondary peer-disk:UpToDate
- На ведущем узле – проверить настройки iSCSI-хранилища:
Command sudo targetcli ls /
Раскрыть title Вывод команды на ведущем узле с пояснениями... Блок кода o- / ......................................................................................................................... [...] o- backstores .............................................................................................................. [...] | o- block .................................................................................................. [Storage Objects: 1] | | o- p_iSCSI_lun1 .................................................................. [/dev/drbd1 (20.0GiB) write-thru activated] | | o- alua ................................................................................................... [ALUA Groups: 1] | | o- default_tg_pt_gp ....................................................................... [ALUA state: Active/optimized] | o- fileio ................................................................................................. [Storage Objects: 0] | o- pscsi .................................................................................................. [Storage Objects: 0] | o- ramdisk ................................................................................................ [Storage Objects: 0] o- iscsi ............................................................................................................ [Targets: 1] | o- iqn.2025-08.iscsi.pcmk12 .......................................................................................... [TPGs: 1] | o- tpg1 .................................................................................................. [gen-acls, no-auth] | o- acls .......................................................................................................... [ACLs: 0] | o- luns .......................................................................................................... [LUNs: 1] | | o- lun1 ............................................................. [block/p_iSCSI_lun1 (/dev/drbd1) (default_tg_pt_gp)] | o- portals .................................................................................................... [Portals: 1] | o- 10.192.1.100:3260 ................................................................................................ [OK] o- loopback ......................................................................................................... [Targets: 0] o- vhost ............................................................................................................ [Targets: 0] o- xen-pvscsi ....................................................................................................... [Targets: 0]
Вывод команды показываетПроверить, что:
- объект хранения
/backstores/block/p_iSCSI_lun1привязан к DRBD-диску/dev/drbd1; - создана iSCSI-цель
/iscsi/iqn.2025-08.iscsi.pcmk12; - для группы
/iscsi/iqn.2025-08.iscsi.pcmk12/tpg1указаны настройки доступа[gen-acls, no-auth]; - логическая единица
/iscsi/iqn.2025-08.iscsi.pcmk12/tpg1/luns/lun1 привязана к объекту хранения block/p_iSCSI_lun1; - создан портал
/iscsi/iqn.2025-08.iscsi.pcmk12/tpg1/portals/10.192.1.100:3260.
- объект хранения
Разделение DRBD-устройства на части
При сетевых сбоях распределённое DRBD-устройство может разделиться на отдельные части, между которыми отсутствует синхронизация данныхне связанные между собой.
В этом случае в выводе команды "sudo drbdadm status" будет отображено, что соединение имеет статус с противоположным узлом находится в состоянии "StandAlone":
- на ведущемузле с ведущим DRBD-ресурсересурсом (pcmk-2):
Блок кода dvolume role:Primary disk:UpToDate pcmk-1 connection:StandAlone
- на подчинённом DRBD-ресурсе на узле с подчинённым DRBD-ресурсом (pcmk-1):
Блок кода dvolume role:Secondary disk:UpToDate pcmk-2 connection:StandAlone
...
Чтобы объединить отдельные части в одно DRBD-устройство, необходимо выполнить на каждом узле команду:
| Command |
|---|
sudo drbdadm connect dvolume |
Если произошла рассинхронизация данных на DRBD-устройствах, то тогда на узле с подчинённым DRBD-устройством выполнить команду:
| Command |
|---|
sudo drbdadm connect --discard-my-data dvolume |
