アプリケーションメンテナンスの際にゲスト OS の一部のサービスの再起動が遅延する
search cancel

アプリケーションメンテナンスの際にゲスト OS の一部のサービスの再起動が遅延する

book

Article ID: 427198

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項:これは英文の記事「During application Maintenace some service restart inside guest OS is delayed」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。


症状:

  • 一部のアプリケーションサービスの起動に時間を要します。
  • この問題は特定のデータストアの仮想マシンに限定され、異なるデータストアへ仮想マシンが移行されると発生しません。

Environment

VMware vSphere ESXi 7.0.x

VMware vSphere ESXi 8.0.x

Cause

この問題は、ホストとストレージデバイス (LUN) 間の通信におけるエラーあるいはタイムアウトの結果として Fibre Channel HBA ドライバが I/O コマンドを中止する際に発生します。

  • ESXi の /var/log/vmkernel.log にて qlnativefc ドライバによって次の abort メッセージが記録されています。

YYYY-MM-DDThh:mm:ss.fff cpu94:9043914)qlnativefc: vmhba1(3a:0.1): qlnativefcEhAbort:2763:qlnativefcEhAbort: abortCommand mbx success.
YYYY-MM-DDThh:mm:ss.fff cpu74:9217137)qlnativefc: vmhba1(3a:0.1): qlnativefcStatusEntry:2077:C0:T25:L108 - FCP command status: 0x5-0x0 (0x8) portid=3e0fc1 oxid=0x31e cdb=8a0000 len=1024 rspInfo=0x0 resid=0x0 fwResid=0x0 host status = 0x8 device status $
YYYY-MM-DDThh:mm:ss.fff cpu85:2098576)NMP: nmp_ThrottleLogForDevice:3867: Cmd 0x8a (0x45ea8b350588, 9043873) to dev "naa.############################" on path "vmhba1:C0:T25:L108" Failed:
YYYY-MM-DDThh:mm:ss.fff cpu85:2098576)NMP: nmp_ThrottleLogForDevice:3875: H:0x8 D:0x0 P:0x0 . Act:EVAL. cmdId.initiator=0x430e9e74d6c0 CmdSN 0x800e0058
YYYY-MM-DDThh:mm:ss.fff cpu85:2098576)WARNING: NMP: nmp_DeviceRequestFastDeviceProbe:237: NMP device "naa.############################" state in doubt; requested fast path state update...
YYYY-MM-DDThh:mm:ss.fff cpu85:2098576)ScsiDeviceIO: 4115: Cmd(0x45ea8b350588) 0x8a, CmdSN 0x800e0058 from world 9043873 to dev "naa.############################" failed H:0x8 D:0x0 P:0x0

  • "qlnativefcEhAbort" は通常 ESXi 環境にて QLogic native Fibre Channel ドライバに関連します。この関数あるいは操作はホストとストレージデバイス間の通信におけるエラーあるいはタイムアウトにより I/O コマンドを中止する必要がある際に呼び出されます。
  • これは、特定の Fibre Channel (FC) パスあるいはデバイスで 1 つ以上の未処理の I/O コマンドの中止を試みていることを示しています。

Resolution

この問題を解決するためには、ホストとストレージデバイス間の潜在的なタイムアウトや通信の問題がないかをストレージベンダへ確認してください。