免責事項:これは英文の記事「ESXi Host Port Channel Connectivity Fails After Power Outage(412029)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
停電が発生し、電源復旧後に、ESXiホストでネットワーク接続障害が発生します。ESXiホストと物理スイッチ間のポートチャネルが、Link Aggregation Control Protocol(LACP)のネゴシエーションを正常に確立できず、その結果、ネットワーク接続が劣化、または完全に失われます。
この問題は、電源復旧時に物理ネットワークスイッチがESXiホストより先に起動してしまう場合に発生します。ネットワークトンネルがDownとして表示され、ワークロードの接続が断たれ、vMotionはタイムアウトエラーで失敗します。
観測される症状:
ポートチャネルの状態を確認し、本事象であることを確証するには、vmkpingコマンドを用いた「VMkernelネットワーク接続(vmkping)による疎通確認」を実施してください。冗長経路が存在するはずにもかかわらず、vmkpingで片系のみ疎通する/もう片系が疎通しない、または両系とも疎通しない場合、本メンテナンス手順の実施が必要です。
電源復旧時、物理ネットワークスイッチがESXiホストよりも速く初期化を完了します。スイッチ側はポートチャネル設定を初期化しますが、ESXi側のネットワークサービスがまだ初期化中のため、ホスト側からのLACPネゴシエーションを受け取れません。このタイミング不整合により、スイッチがリンクアグリゲーションを正しく認識できない不整合状態のままポートチャネルが残存します。
この状態が継続する主な理由は以下のとおりです。
物理スイッチ上で、影響を受けているポートチャネルを管理的に無効化(shutdown)し、再度有効化(no shutdown)することでLACPの再ネゴシエーションを強制します。
注:本手順は、影響を受けるESXiホストに対して短時間のネットワーク断を発生させます。停電復旧シナリオにおいては、これが最も迅速な解決手段であり、ホスト再起動を回避できます。
再発防止策
上記手順を実施しても問題が継続する場合は、Broadcom Supportへお問い合わせください。
Broadcomへのサポートリクエスト時に提供すべき情報: