NSX for vSphere 6.x Edge 上の高可用性 (HA)
High Availability (HA) では、ハードウェアまたはソフトウェアの障害で 1 台のアプライアンスが利用できなくなっても、NSX Edge アプライアンスが提供するサービスが利用できるようにします。vSphere HA や MSCS などのその他の HA 機能と一致して、Edge HA はダウンタイム ゼロを実現するように設計されていません。これは、アプライアンス間のフェイルオーバーで一部のサービスの再起動が必要となることがあるためです。
環境の問題に加えて、HA 構成エンジンが失敗して正しくない状態になるか、HA デーモンが失敗した場合に、スプリット ブレイン状態が発生します。
ステートフル高可用性
プライマリ NSX Edge アプライアンスがアクティブ状態であり、セカンダリ アプライアンスがスタンバイ状態です。NSX Manager は、プライマリ アプライアンスの構成をスタンバイ アプライアンスにレプリケートします。または、手動で 2 つのアプライアンスを追加します。VMware は、プライマリ アプライアンスとセカンダリ アプライアンスを別々のリソース プールおよびデータストアに作成することをお勧めしています。プライマリ アプライアンスとセカンダリ アプライアンスを同じデータストアに作成する場合は、HA アプライアンス ペアが違う ESXi ホストにデプロイされるよう、クラスタ内のすべてのホスト間でデータストアを共有します。データストアがローカル ストレージの場合は、両方の仮想マシンが同じホスト上にデプロイされます。
すべての NSX Edge サービスは、アクティブなアプライアンス上で動作します。プライマリ アプライアンスは、スタンバイ アプライアンスとともにハートビートを維持し、内部インターフェイスを通じてサービスのアップデートを送信します。
一定時間内 (デフォルトは 15 秒) にプライマリ アプライアンスからハートビートが受信されない場合、プライマリ アプライアンスは非活動と判断されます。スタンバイ アプライアンスがアクティブ状態となり、プライマリ アプライアンスのインターフェイス構成を引き継いで、プライマリ アプライアンスで実行されている NSX Edge サービスを起動します。切り替えの実行時には、[設定およびレポート] の [システム イベント] タブにシステム イベントが表示されます。ロード バランサおよび VPN サービスでは、NSX Edge との TCP 接続を再確立するため、サービスが短い間中断されます。論理スイッチ接続およびファイアウォール セッションは、プライマリ アプライアンスとセカンダリ アプライアンスの間で同期されているため、切り替え時のサービスの中断はありません。
NSX Edge アプライアンスが失敗し、不良状態が報告されると、HA は失敗したアプライアンスを復活させるために強制的な同期を行います。アプライアンスが復活すると、その時点でアクティブ状態のアプライアンスの構成を引き継ぎ、スタンバイ状態を維持します。NSX Edge アプライアンスが非活動状態の場合は、アプライアンスを削除し、新しいアプライアンスを追加します。
NSX Edge は、DRS および vMotion を使用した後であっても、2 つの HA NSX Edge 仮想マシンが同じ ESX ホスト上に存在することのないようにします(vMotion を使用して手動で同じホストにした場合を除く)。2 つの仮想マシンは、構成したアプライアンスと同じリソース プールおよびデータストアにある vCenter にデプロイされます。NSX Edge HA の HA 仮想マシンにはローカル リンク IP が割り当てられるため、それらの仮想マシンは相互に通信できます。管理 IP アドレスを指定してローカル リンクをオーバーライドすることができます。
このリリースの高可用性の堅牢性は、以下の変更とともに改善されました。
NSX Manager:
NSX Edge:
Symptoms:
それぞれのトラブルシューティング手順がお使いの環境に当てはまることを確認します。それぞれの手順で、考えられる原因を排除し、必要に応じて是正措置を取るための指示あるいはドキュメントへのリンクが提供されます。手順は、問題を隔離し、適切な解決方法を特定するために最適な順番で並べられています。手順を省略しないでください。
注:前述のログの引用は単なる例です。日付、時間、および環境変数は、環境によって異なる場合があります。