ホストのいずれかの LUN が全パス ダウン (APD) 状態になると仮想マシンが応答を停止する
search cancel

ホストのいずれかの LUN が全パス ダウン (APD) 状態になると仮想マシンが応答を停止する

book

Article ID: 328786

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

Symptoms:
免責事項:これは英文の記事 「Virtual machines stop responding when any LUN on the host is in an all-paths-down condition (APD) (1016626)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
この記事で扱う問題は、vCenter Server クラスタのいずれかの LUN が全パス ダウン状態のときに再スキャンが実行されると発生します。 したがって、vCenter Server クラスタ内の異なる LUN が全パス ダウン (APD) 状態であるため、ある LUN 上の仮想マシンが(一時的または永久的に)応答を停止します。

以下の症状は全パス ダウン状態が発生している可能性があることを示します。
  • 仮想マシンを ping 送信しようとすると、(6 回または 7 回の ping の成功に対して)断続的に Request timed out と表示される。
  • Raw デバイス マッピング (RDM) を備えた仮想マシンをパワーオンするときに、プログレス バーが 50% で停止し、仮想マシン コンソールが VMware のスプラッシュ/ロード/BIOS 画面で応答しなくなる。
  • vSphere 4.0 で仮想マシンがパケットを断続的にドロップする。
  • 仮想マシンが ping パケットをドロップする。
  • ネットワークが一時的に応答しなくなる。
  • vmkernel.log ファイルに次のようなエントリが表示される。

    NMP: nmp_DeviceAttemptFailover: Retry world failover device "naa._______________" - failed to issue command due to Not found (APD)
    NMP: nmp_DeviceUpdatePathStates: Activated path "NULL" for NMP device "naa.__________________".


全パス ダウン (APD) 状態

全パス ダウン状態とは、ストレージ デバイス (LUN) への作業パスが存在しない状態のことです。 次の状況では、LUN への全パス ダウン状態が発生する場合があります:
  • ハードウェア障害(永久的または一時的)
  • LUN の削除


再スキャン

この記事には、別の LUN 上の仮想マシンが応答しない原因となる再スキャンの種類に関する情報が記載されています。
  • VMFS(仮想マシン ファイル システム)を含むESXi/ESX 4.xの構成変更

    データストアの作成、削除、または増加を含む VMFS の構成によって自動化された再スキャンが実行される場合があります。vCenter Server は、ストレージの変更を検出するワークフローの中で vCenter Server 全体の再スキャンを実行します。 この再スキャンによって、自動検出ではクラスタ内のすべてのホストに対して一貫したストレージのビューが維持されます。 たとえば、ESX 4.0 の再スキャンを実行するには次のコマンドを実行します:

    esxcfg-rescan -d vmhba#

    vmhba 上で再スキャンを実行するコマンドは、RCLI、vMA および PowerCLI など使用する方法によって異なります。 適切なコマンドについては、ドキュメントを参照してください。

  • LUN の削除

    アレイベースの管理アクションによって LUN を削除した後、手動で再スキャンを実行すると、他の LUN 上の仮想マシンも応答しなくなる場合があります。


Environment

VMware vSphere ESXi 5.5
VMware ESXi 4.0.x Embedded
VMware ESX 4.1.x
VMware ESXi 4.0.x Installable
VMware vSphere ESXi 5.0
VMware ESX 4.0.x
VMware ESXi 4.1.x Embedded
VMware ESXi 4.1.x Installable
VMware vSphere ESXi 5.1

Resolution

この問題は、ESXi/ESX 4.1 Update 1 で解決されており、修正は ESXi 5.0 にも含まれています。

この問題は ESX 4.0 のパッチ リリースで修正されました。 詳細については、「VMware ESX 4.0, Patch ESX400-200912401-BG: Updates vmkernel, vmklinux, tools, CIM, and perftools (1016291)」を参照してください。



回避策

ESXi/ESX 4.x は、検出するすべての LUN およびそれらの LUN の状態をリストすることができます。 ストレージ デバイスへのパスがどれもアクティブ状態でない場合、ESXi/ESX はデバイスが全パス ダウンの状態であると判断します。 全パス ダウン状態が存在する場合、それが再スキャンが発生するときに一定期間または永久的に LUN が応答しない問題を引き起こしている可能性があります。 詳細については、「VMware ESX/ESXi を操作するときのディスクの識別 (2078761)」を参照してください。

仮想マシンが ESXi/ESX 4.0 ホスト上で応答しない場合は、次のコマンドを実行して全パス ダウン状態が存在するかどうかを判断します。
# esxcfg-mpath --list-paths --device device_naa | grep state

または

# esxcfg-mpath --list-paths --device device_mpx | grep state

ここでは、
  • device_naa はフル ストレージ デバイスに対するネットワーク アドレス権限 (NAA) の一意のアドレスです
  • device_mpx は NAA ID が利用可能でない場合の識別子です
: ESXi でコマンド ラインを使用する場合の詳細については、「緊急サポート用の Tech Support モード (2092655)」を参照してください。

ESXi/ESX 4.0 Update 1 以降、vCenter Server クラスタのすべてのホストで詳細構成オプションを設定することができます。それにより、スキャン時間を節約し、仮想マシンが応答しなくなるのを回避することができます。 このオプションは、デフォルトでは無効になっています。

警告: すべての全パス ダウン状態が永久的なわけではありません。 ネットワークの再構成中に短時間発生するような全パス ダウン状態は一時的なものです。 このオプションを有効にすると、一時的な全パス ダウン状態にあるデバイスが利用できなくなる場合があります。 再スキャンの操作が完了したら、このオプションを無効化することを推奨します。

このオプションを有効化するには、次のコマンドを実行します。
# esxcfg-advcfg -s 1 /VMFS3/FailVolumeOpenIfAPD

ダウンタイムを発生させずに無効化してデフォルト値にリセットするには、次のコマンドを実行します。
# esxcfg-advcfg -s 0 /VMFS3/FailVolumeOpenIfAPD

このオプションの値をチェックするには、次のコマンドを実行します。
# esxcfg-advcfg -g /VMFS3/FailVolumeOpenIfAPD

仮想マシンが応答しない時間を最小限にするには、次のパッチを適用します。
: これは ESXi/ESX 4.0 Update および 4.1 には適用されません。パッチはこれらのバージョンに統合されています。

ESX 4.1 Update 1 および ESX 4.0 Update 3 では、詳細設定に対する変更は必要ありません。 APD ボリュームに関連付けられていない仮想マシンは再スキャン時に応答しなくなることはありません。

詳細については、次を参照してください。


Additional Information

Identifying disks when working with VMware ESXi/ESX
VMware ESX 4.0, Patch ESX400-200912401-BG: Updates vmkernel, vmklinux, tools, CIM, and perftools
VMware ESXi 4.0, Patch ESXi400-200912401-BG: Updates Firmware
Virtual machines stop responding when any LUN on the host is in an all-paths-down (APD) condition
Removing a LUN containing a datastore from VMware ESXi/ESX 4.0 and 4.1
Les machines virtuelles ne répondent plus quand aucun LUN sur l'hôte est en état all-paths-down (APD)