プライマリノードで VMware HA 操作の再構築を実行すると、予期しない仮想マシンのフェイルオーバーが発生する
search cancel

プライマリノードで VMware HA 操作の再構築を実行すると、予期しない仮想マシンのフェイルオーバーが発生する

book

Article ID: 322061

calendar_today

Updated On:

Products

VMware vCenter Server

Issue/Introduction

Symptoms:

免責事項: これは英文の記事 「Performing a Reconfigure for VMware HA operation on a master node causes an unexpected virtual machine failover (2017778)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。


 

  • HA クラスタのマスター ノードで  VMware HA 用に再構成 操作を実行すると、そのマスター ノードで実行されている仮想マシンに対し予期しない仮想マシンのフェイルオーバーが発生する。
     
  • vCenter Server の [イベント] タブに次のようなメッセージが表示される:

    vCenter Server はデータセンターの HA_DRS_Cluster にあるホスト <master hostname> 上で実行中のマスター HA エージェントから切断されています - データセンターのクラスタ HA_DRS_Cluster で <master hostname> の vSphere HA エージェントは無効になりました

    データセンターのクラスタ HA_DRS_Cluster にあるホスト <master hostname> の vSphere HA 可用性状態が未初期化に変更されました

    データセンターのクラスタ HA_DRS_Cluster にあるホスト <slave hostname> の vSphere HA 可用性状態が選択に変更されました

    vSphere HA によるデータセンターのクラスタ HA_DRS_Cluster での <slave hostname> の <virtual machine> のフェイルオーバーが失敗しました。試行数が上限に達するまで、vSphere HA はフェイルオーバーを再試行します。理由: その操作は、現在の状態では実行できません。


Environment

VMware vCenter Server 8.0.x
VMware vCenter Server 7.0.x

Cause

マスター HA ホストが HA に対し手動で再構築されると、これにより残りのスレーブで選択が入力され、新しいマスター ホストが検索されます。

新しく選択されたマスターは古いマスターで実行されていた仮想マシンを不明な電力状態に置き、古いマスター上の仮想マシンがパワーオンされ、実行中であるという通知に対し最大 10 秒待機します。

古いマスターが 10 秒以内にスレーブにならない場合、新しいマスターはその仮想マシンがダウンしているとみなし、再起動を試行します。これにより誤ったフェイルオーバーが発生し、その結果、仮想マシンがパワーオフされなかったためにフェイルオーバー タスクが失敗します。仮想マシンはこのシナリオで影響を受けないままです。

Resolution

この問題を解決するには、監視期間を増やします:

注:
  • vCenter Server 7.0 Update 1以降では、fdm.policy.unknownStateMonitorPeriodのプロパティ名がfdm.unknownStateMonitorPeriodに変更されました。
  • das.configは、これらのプロパティの前に付けることができ、完了するとクラスター内のすべてのホストに適用されます。 

1. vCenter で、クラスタを右クリックして、設定の編集をクリックします。

2. vSphere HA をクリックしてから、詳細オプションをクリックします。

3. 新しいオプションを追加します。 (もしまだ存在していなければ)
  デフォルトオプションは10です。

  7.0U1 より前の場合:
  das.config.fdm.policy.unknownStateMonitorPeriod = 10

  7.0U1 ~ 8.0U1 の場合:
  das.config.fdm.unknownStateMonitorPeriod = 10

  8.0U2 以降の場合:
  das.config.fdm.policy.unknownStateMonitorPeriod = 10


本事象への対応のため、値を10から30に変更します。

  7.0U1 より前の場合:
  das.config.fdm.policy.unknownStateMonitorPeriod = 30

  7.0U1 ~ 8.0U1 の場合:
  das.config.fdm.unknownStateMonitorPeriod = 30

  8.0U2 以降の場合:
  das.config.fdm.policy.unknownStateMonitorPeriod = 30


4. クラスタの HA 設定を無効にしてから再度有効にします。

Additional Information

Performing a Reconfigure for VMware HA operation on a master node causes an unexpected virtual machine failover
在主节点上执行重新配置 VMware HA 操作引发意外虚拟机故障切换

Impact/Risks:
マスター ノードが実際の HA 障害のときに停止している場合、監視期間を増やすと、仮想マシンのフェイルオーバーを開始する時間も同じ分だけ (この場合は 20 秒) 増えます。