フェイルオーバーモードがプリエンプティブとなっているアクティブ/スタンバイ高可用性で構成された Tier-0 ルータでは、優先エッジ ノードが再起動するか、メンテナンス モードから復帰すると、スタンバイ エッジの Tier-0 は BGP セッションを失います。
search cancel

フェイルオーバーモードがプリエンプティブとなっているアクティブ/スタンバイ高可用性で構成された Tier-0 ルータでは、優先エッジ ノードが再起動するか、メンテナンス モードから復帰すると、スタンバイ エッジの Tier-0 は BGP セッションを失います。

book

Article ID: 427602

calendar_today

Updated On:

Products

VMware NSX

Issue/Introduction

免責事項:これは英文の記事「In a Tier-0 router configured for Active/Standy High-Availability mode with Preemptive Fail Over, the standby Edge's Tier-0 loses BGP sessions after the primary Edge Node reboots or comes out of maintenance mode.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • Tier-0 はアクティブ/スタンバイモードに設定されています。
  • Tier-0 のフェイルオーバーモードはプリエンプティブに設定されています。
  • フェイルオーバーが発生し、トラフィックが優先エッジノードから非優先エッジノードに移動されました。
  • 優先エッジノードが再起動するか、メンテナンスモードが解除され、スタンバイエッジノードで BGP 障害が発生しました。

Environment

VMware NSX

Resolution

これは設計上想定される動作です。

2 台の NSX Edge ノードがアクティブ/スタンバイ構成の場合、両方の Edge は上流の BGP ピアとのピアリングを確立し、ルート更新を維持します。最初のフェイルオーバー中、トラフィックが優先エッジから非優先エッジに移動するため、短時間(数秒以内)の接続停止が発生することがあります。

フェイルバック中、トラフィックが非優先エッジから優先エッジに適切に移動するために、非優先エッジは 30 秒間 BGP ピアリングを切断します。これにより、トラフィックが優先エッジノード経由で接続を再確立するため、再度短時間の停止が発生する可能性があります。

これは、フェイルバック時に非優先エッジの NSX Edge CLI で確認できます。

 

非優先 (スタンバイ) エッジが稼働しており、フェイルオーバー前に BGP が確立されている場合:

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800       Estab 02:10:43     NC  1418    1339    17     2
192.###.###.254                     64800       Estab 02:10:43     NC  1417    1334    17     2

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800       Estab 02:10:43     NC  7947    7861    16     1
fd00:#:#:#::#:85fe              64800       Estab 02:10:43     NC  7944    7859    16     1

Thu Mar 27 2025 UTC 19:23:46.617

 

フェイルオーバーが発生し、非優先エッジがアクティブになりました。

 

edge02(tier0_sr[2])> get high-availability status
Thu Mar 27 2025 UTC 19:24:23.779
Service Router
UUID                  : 83cc####-####-####-####-#######11675
state                 : Standby                                ←エッジの現在の状態はスタンバイで、必要に応じて引き継ぐのを待機しています。
type                  : TIER0
mode                  : A/S
failover mode         : Preemptive
rank                  : 1
service count         : 0
service score         : 0
HA ports state
    UUID        : dc72####-####-####-####-#######c3ae4
    op_state    : Down                                         ←このエッジはダウン状態です - フェイルオーバーは発生していません。
    addresses   : 169.###.###.2/24;fe80:#:#:#:#:5300/64
Peer Routers
    SR UUID     : fa47####-####-####-####-#######d56ac
    Node UUID   : f0ae####-####-####-####-#######d4639
    HA state    : Active                                       ←優先エッジは稼働しておりオンラインです。

 

 

フェイルオーバーが発生し、非優先エッジがアクティブになりました。

edge02(tier0_sr[2])> get high-availability status
Thu Mar 27 2025 UTC 19:26:06.061
Service Router
UUID                  : 83cc####-####-####-####-#######11675
state                 : Active                                 ←エッジの現在の状態はアクティブであり、トラフィックを引き継いでいます。
type                  : TIER0
mode                  : A/S
failover mode         : Preemptive
rank                  : 1
service count         : 0
service score         : 0
HA ports state
    UUID        : dc72####-####-####-####-#######c3ae4
    op_state    : Up                                           ←このエッジは稼働状態です - フェイルオーバーが発生しました。
    addresses   : 169.###.###.2/24;fe80:#:#:#:#:5300/64
Peer Routers
    SR UUID     : fa47####-####-####-####-#######d56ac
    Node UUID   : f0ae####-####-####-####-#######d4639
    HA state    : Unreachable                                  ←優先エッジに到達できないため、フェイルオーバー アクションが必要です。

 

非優先エッジがアクティブになり、BGPピアリングに変更はありません。停止は短期間で収まるはずです。ピアリングは2時間以上確立されています。

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800       Estab 02:13:24     NC  1421    1343    17     2
192.###.###.254                     64800       Estab 02:13:24     NC  1420    1338    17     2

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800       Estab 02:13:24     NC  7965    7878    16     1
fd00:#:#:#::#:85fe              64800       Estab 02:13:24     NC  7962    7876    16     1

Thu Mar 27 2025 UTC 19:26:27.592

 

優先エッジが機能回復すると、フェイルバックにより BGP ピアリングが 30 秒間切断されます(設計通り)。

フェイルバック前:

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800       Estab 02:18:01     NC  1428    1349    17     2
192.###.###.254                     64800       Estab 02:18:01     NC  1427    1344    17     2

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800       Estab 02:18:01     NC  7994    7907    16     1
fd00:#:#:#::#:85fe              64800       Estab 02:18:01     NC  7991    7905    16     1

Thu Mar 27 2025 UTC 19:31:05.075

 

フェイルバックが開始されました。非優先エッジBGPピアリングは停止しており、30秒間停止状態が続きます。

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800       Idle  00:00:00     NC  1428    1351    0      0
192.###.###.254                     64800       Idle  00:00:00     NC  1427    1346    0      0

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800       Idle  00:00:00     NC  7994    7909    0      0
fd00:#:#:#::#:85fe              64800       Idle  00:00:00     NC  7991    7907    0      0

Thu Mar 27 2025 UTC 19:31:06.068

 

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800        Idle 00:00:29     NC  1428    1351    0      0
192.###.###.254                     64800        Idle 00:00:29     NC  1427    1346    0      0

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS           State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800        Idle 00:00:29      NC  7994    7909    0      0
fd00:#:#:#::#:85fe              64800        Idle 00:00:29      NC  7991    7907    0      0

Thu Mar 27 2025 UTC 19:31:35.179

 

この 30 秒が経過すると、トラフィックは最小限の停止または停止なしで優先エッジにフェイルバックされ、非優先エッジ ノードで BGP が再確立されます。

edge02(tier0_sr[2])>  get bgp neighbor summary
BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv4Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                            AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

192.###.###.254                     64800       Estab 00:00:02     NC  1430    1353    0      0
192.###.###.254                     64800       Estab 00:00:02     NC  1429    1348    0      0

BFD States: NC - Not configured, DC - Disconnected
            DW - Down, IN - Init, UP - Up
BGP summary information for VRF default for address-family: ipv6Unicast
Router ID: 192.###.###.2  Local AS: 65000

Neighbor                        AS          State Up/DownTime  BFD InMsgs  OutMsgs InPfx  OutPfx

fd00:#:#:#::#:84fe              64800       Estab 00:00:01     NC  7996    7911    0      0
fd00:#:#:#::#:85fe              64800       Estab 00:00:01     NC  7993    7909    0      0

Thu Mar 27 2025 UTC 19:31:37.072

Non-Preferred Edge has returned to original High Availability State:
edge02(tier0_sr[2])> get high-availability status
Thu Mar 27 2025 UTC 20:07:20.064
Service Router
UUID                  : 83cc####-####-####-####-#######11675
state                 : Standby                                ←非優先エッジはスタンバイ状態に戻り、必要に応じて引き継ぐのを待機しています。
type                  : TIER0
mode                  : A/S
failover mode         : Preemptive
rank                  : 1
service count         : 0
service score         : 0
HA ports state
    UUID        : dc72####-####-####-####-#######c3ae4
    op_state    : Down
    addresses   : 169.###.###.2/24;fe80:#:#:#:#:5300/64
Peer Routers
    SR UUID     : fa47####-####-####-####-#######d56ac
    Node UUID   : f0ae####-####-####-####-#######d4639
    HA state    : Active                                       ←Preferred Edge が再びオンラインになりました。

 

  

 

 

 

Additional Information

Troubleshooting NSX Edge High Availability

BGP Graceful Restart settings when ECMP routing is enabled

VMware NSX Reference Design Guide