vCenter Server 上での ESXi のホストの接続性低下の警告
search cancel

vCenter Server 上での ESXi のホストの接続性低下の警告

book

Article ID: 320840

calendar_today

Updated On:

Products

VMware vCenter Server VMware vSphere ESXi

Issue/Introduction

免責事項: これは英文の記事 「"Host Connectivity Degraded in ESXi" warning in vCenter Server」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。


サマリー

このイベントは、約 16 秒間(VMFS のロック解除のリース タイムアウト)ホストがそのハートビートを更新できなかったことが原因で、ESX ホストのボリューム(このイベントが生成されたボリューム)への接続が低下したことを示しています。 定期的なハートビートの更新に失敗すると、VMFS はボリュームへのハートビートがタイムアウトしたことを宣言し、接続がリストアされるか、デバイスで操作不能が宣言されるまでデバイスのすべての I/O アクティビティをサスペンドします。

これは次の 2 つの要素からなります:
  • ハートビート間隔 = 3 秒
  • ハートビート リースの待機タイムアウト = 16 秒

ホストは、指定したボリューム上のハートビートに対して定期的な I/O(3 秒間隔)を実行することによってそのライブネスを示します。 したがって、ホストのハートビート スロットに一定期間アクティビティが見られない場合は、ホストがボリュームとの接続を失ったと判断することができます。 この待機時間は、ハートビート間隔の数で 5 回、すなわち 16 秒を少し上回るようにすることで正確な判断ができます。

ESX ホストがデバイス naa.xxxxxxxxxxxxxxxxxxxxxxxxxxxxdd11:1 からボリューム san-lun-100 をマウントしている場合、(ケーブルの抜けやディスク アレイの障害などが原因で)このデバイスへの接続が 16 秒以上失われると、次のエラー メッセージが表示されます。
 
Lost access to volume 49xxxxxx-xxxxxxxx-xxxx-xxxxxxxxx619 (san-lun-100) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.

影響

すべての I/O、COS から特定のボリュームへのメタデータ操作、ユーザー インターフェイス(vSphere Client)、または仮想マシンは、内部的にキューに入れられ、一定期間再試行されます。 その期間内にボリュームまたはストレージ デバイスの接続がリストアされない場合、I/O 操作などは失敗します。 これは、すでに実行されている仮想マシンや、仮想マシンによる新しいパワーオン操作に影響する可能性があります。

Environment

VMware vSphere ESXi 8.0
VMware vSphere ESXi 7.0
VMware vSphere ESXi 6.7

VMware vCenter Server 8.0
VMware vCenter Server 7.0
VMware vCenter Server 6.7
 

Cause

本事象はいくつかの根本的なストレージの問題により引き起こされます。

Resolution

この問題を解決するには、vSphere Client および ESXi コマンドラインを用いてストレージの根本的な問題を調査します。

vSphere Client

  1. vSphere Client を使用して vCenter Server に接続します。
     
  2. [ストレージ ビュー] タブを選択し、関連する HBA(ホスト バス アダプタ)を影響を受ける VMFS ボリュームにマップします。
     
  3. LUN へのパスの不整合を特定して解決します。詳細については Troubleshooting fibre channel storage connectivity および Troubleshooting ESXi connectivity to iSCSI arrays using software initiators を参照してください。

   注:接続がリストアされたら、VMFS によって自動的にボリュームのハートビートがリカバリされ、操作が続行されます。
 

ESXi コマンドライン

    1. SSH セッションを使用して ESX ホストのサービス コンソールに接続します。
    2. 次のコマンドを実行します。
      1. vmkfstools  コマンドを使ってVMFS データストア プロパティをクエリします。

        例 :
        vmkfstools –P san-lun-100
        File system label (if any): san-lun-100
        Mode: public
        Capacity 80262201344 (76544 file blocks * 1048576), 36768317440 (35065 blocks) avail
        UUID: 49767b15-1f252bd1-1e57-00215aaf0626
        Partitions spanned (on "lvm"): naa.xxxxxxxxxxxxxxxxxxxxxxxxxxxxdd11:1

      2. 上記のコマンドの LUN(論理ユニット番号)出力の naa ID とともに esxcfg-mpath を使用して、影響を受ける LUN へのすべてのパスの状態を特定します。

        例 :
        esxcfg-mpath -b -d naa.xxxxxxxxxxxxxxxxxxxxxxxxxxxxdd11
        naa.xxxxxxxxxxxxxxxxxxxxxxxxxxxxdd11 : DGC Fibre Channel Disk (naa.xxxxxxxxxxxxxxxxxxxxxxxxxxxxdd11) vmhba0:C0:T0:L0 LUN:0 state:active fc Adapter:
        WWNN: 20:xx:xx:xx:xx:7d:6c:e0 WWPN: 10:xx:xx:xx:xx:7d:6c:e0 Target: WWNN: 50:xx:xx:xx:xx:xx:1f:dd WWPN: 50:xx:xx:xx:xx:xx:1f:dd vmhba0:C0:T1:L0 LUN:0 state:standby fc Adapter:
        WWNN: 20:xx:xx:xx:xx:7d:6c:e0 WWPN: 10:xx:xx:xx:xx:7d:6c:e0 Target: WWNN: 50:xx:xx:xx:xx:xx:1f:dd WWPN: 50:xx:xx:xx:xx:xx:1f:dd

    3. Troubleshooting fibre channel storage connectivity および Troubleshooting ESXi connectivity to iSCSI arrays using software initiators の手順に従い、LUN へのパスの不整合を特定して解決します。

    4. 接続がリストアされたら、VMFS によって自動的にボリュームのハートビートがリカバリされ、操作が続行されます。

:補足情報として Troubleshooting LUN connectivity issues on ESXi hosts を参照ください。

Additional Information

本事象は What is Diagnostics for VMware Cloud Foundation により確認されています。

確認事項は下記です:

  • 製品 : ESXi
  • ログファイル : vobd.log
  • ログ文字列 "vmfsCorrelator" および "esx.problem.vmfs.heartbeat.timedout" を確認