ESXi ホストが「応答なし」状態になる
search cancel

ESXi ホストが「応答なし」状態になる

book

Article ID: 430693

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項: これは英文の記事 「Esxi hosts goes into not responding state」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • ランダムな ESXi ホストが突然応答しなくなったりフリーズします
  • 影響を受けるホスト上で実行されている仮想マシンには影響はありません
  • hostd サービスを再起動しても問題は解決しません
  • ホストを再起動すると、問題は一時的に解決します

Environment

VMware vSphere ESXi

Cause

HBA ドライバ (qlnativefc) はデフォルトで、ホストレベルとターゲットレベルの両方でフロー制御を有効にしています。ワークロードが特定のしきい値に達すると、HBA ドライバは自動的にファブリックポートに輻輳を設定し、複数のサービスで I/O が中断されます。

ESXi の /var/log/vmkernel.log には下記のようなメッセージが記録されます:

YYYY-MM-DDTHH:MM:SS cpu98:2098415)qlnativefc: vmhba0(27:0.0): SCMR: Set Congestion for Host WWN 51:40:2e:c0:1#:1#:0#:8#

YYYY-MM-DDTHH:MM:SS cpu23:2098915)NMP: nmp_ThrottleLogForDevice:3861: Cmd 0x28 (0x45bb4f28e480, 0) to dev "naa.60060e80087ade00##########" on path
"vmhba0:C0:T1:L127" Failed:
YYYY-MM-DDTHH:MM:SS cpu23:2098915)NMP: nmp_ThrottleLogForDevice:3869: H:0xc D:0x0 P:0x0 . Act:NONE. cmdId.initiator=0x430a99689a40 CmdSN 0x12cd466
YYYY-MM-DDTHH:MM:SS cpu23:2098915)ScsiDeviceIO: 4277: Cmd(0x45bb4f28e480) 0x28, CmdSN 0x12cd466 from world 0 to dev "naa.60060e80087ade###########" failed H:0xc D:0x0 P:0x0

Resolution

回避策

  • 以下のコマンドを実行して、HBA (qlnativefc) のフロー制御を無効にします。
     esxcfg-module -s "ql2x_scmr_flow_ctl_host=0, ql2x_scmr_flow_ctl_tgt=0" qlnativefc
  • 変更を有効にするには、ESXi を再起動してください。