Проблема
Что означают сообщения об ошибке «Abort commanded nexus» в файле /var/log/messages?
Nov 21 07:08:58 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:3:33 -- 1 2002. Nov 21 07:08:58 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:1:33 -- 1 2002. Nov 21 07:08:59 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:1:68 -- 1 2002. Nov 21 07:08:59 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:2:16 -- 1 2002. Nov 21 07:09:00 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:0:16 -- 1 2002. Nov 21 07:09:00 kernel: qla2xxx [0000:49:00.0]-801c:4: Abort command issued nexus=4:0:16 -- 1 2002]
Решение
Эти ошибки указывают на то, что условие ошибки возвращается из SAN.
Это условие ошибки вызвано ошибкой связи с хранилищем.
Проверьте, есть ли какие-либо проблемы во всей инфраструктуре, включая коммутатор SAN, кабель коммутатора FC, зонирование или контроллер массива хранения.
При необходимости обратитесь к поставщику хранилища SAN для просмотра журналов.
Наличие этих записей в журнале указывает на серьезное ухудшение производительности ввода-вывода.
Сообщение об ошибке “qla2xxx [0000:49:00.0]-801c:1: Abort command issued nexus=4:1:33 — 1 2002” i разобрано ниже
qla2xxx | имя драйвера или модуля ядра |
[0000:49:00.0] | Информация шины PCI устройства |
801c | Hexadecimal ID, который однозначно идентифицирует часть кода драйвера, выдающего сообщение. |
4 | Номер хоста цели SCSI |
4:03:33 | Команда, адресованная цели SCSI 4: 3: 33 |
1 | Драйвер ожидающий завершения команды |
2002 | Команда SCSI была прервана, и HBA успешно сброшен. |
Заключение
Несколько основных проблем могут привести к прерываниям сообщений и медленной SAN.
Исходные области для исследования включают связанные с SAN компоненты, такие как переключатели или цели хранения. Командные прерывания почти всегда вызывают таймауты команд.
Первый курс действий – прервать его, чтобы убедиться, что любые ссылки на него удалены.
Тайм-аут команды может быть вызван множеством разных вещей: перегрузкой SAN, сломанной мишенью, плохим оборудованием где-то или перегруженной целью, которая могла бы отбрасывать команды.