Проблема

Диски в системе хранения данных полностью нагружены.

Диагностика

  • Проверить вывод команд во время нагрузки (диски того пула, где LUN с проблемной ВМ):
    1. Из СХД:

      iostat -x -t -m 5
      
      Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
      sdd               1,49    12,10  577,37  112,22    69,79     4,96   222,01     9,02   13,08    1,33   73,56   0,60  41,06
      sde               0,00     6,01    0,18 1992,87     0,02    23,18    23,83     0,72    0,36    7,26    0,36   0,33  65,27

      Обратить внимание на параметр %util — % CPU, затраченный на передачу I/O запросов к диску ("пропускная способность” диска). Если значение параметра около 100 %, диск сильно загружен.

      atop
      
      DSK | sdd |  busy 100% |  |  read 54 | write 3195 |  | KiB/r 72 | KiB/w 8  |  | MBr/s 3.8  | MBw/s 25.4 |  | avq 13.99 | avio  0.29 ms|

      Параметр busy со значением около 100 % означает, что диск загружен.

    2. Из ВМ:

      free -h
                    total        used        free      shared  buff/cache   available
      Mem:            62G        3,5G        557M        8,9G         58G         49G
      Swap:          6,0G        108M        5,9G

      Команда free -h показывает общий и доступный объем ОП.

      sudo multipathd -k'show paths format  "%w %i %t %T %o %d %n %R %c"'
      uuid                                      hcil    dm_st chk_st dev_st  dev target WWNN host WWPN checker
      Samsung_SSD_860_EVO_500GB_S4FNNJ0MB39871H 1:0:0:0 undef undef  unknown sda ata-2.00    [undef]   (null) 

      Команда multipathd показывает сведения о дисках.

Возможная причина: Требуется ядро 5.10 для работы СХД и SSD. Перейти к решению.


Возможные причины