ESXi ホストでのNSXの構成が「コントローラでホストの状態を有効にしています」で停止している
search cancel

ESXi ホストでのNSXの構成が「コントローラでホストの状態を有効にしています」で停止している

book

Article ID: 421661

calendar_today

Updated On:

Products

VMware NSX

Issue/Introduction

免責事項:これは英文の記事「ESXi Host NSX Preparation Stuck at "Enabling Host Status in Controller"」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • ESXi ホストでのNSXの構成時にステータスが 68% または 80% 、「コントローラでホストの状態を有効にしています」の表示で停止しています。

  • NSX Manager UIの システム > ファブリック > ホスト > クラスタ の"ホストの詳細"で、"構成の状態"が「コントローラでホストの状態を有効にしています」で停止しています。

  • ホストの構成の状態に関わらず、影響を受けるホスト上で稼働しているNSX ネットワークを使用している仮想マシンは問題なく正常に動作し続けています。

  • この問題は通常、以下の後に発生します。
    1. 直近でNSX Manager を再起動した
    2. 直近でNSXをアップグレードした
    3. NSXでホストの再同期を必要とする設定変更を実施した
    4. ESXiホストがNSX Controllerから切断される原因となるネットワークの中断が発生した
  • 場合によっては根本原因を示す 8804 や 8814 などの障害コードがログに表示されることがあります。具体的なエラーコードは根本的な問題によって異なる場合があります。
    以下はログの出力例です:

    GET  https://<nsx manager>/api/v1/transport-nodes/<transport-node-id>/state:

    { "details": [ { "failure_code": 8804, "failure_message": "Reconfiguring after last failure: LogicalSwitch full-sync: Status is in-progress on '1' transport nodes.", "state": "in_progress", "sub_system_id": "########-####-####-####-############", "sub_system_type": "Host" } ], "failure_code": 8804, "failure_message": "Host configuration failed. Number of retries : 3005. Next retry attempt will be between 2023-Sep-26 13.30.15 PM and 2023-Sep-26 13.33.15 PM (UTC).", "maintenance_mode_state": "DISABLED", "node_deployment_state": { "details": [], "state": "success" }, "state": "in_progress", "transport_node_id": "########-####-####-####-############"       
    },

    nsxapi.log: (Logのフルパス : /var/log/proton/nsxapi.log)

    2022-02-09T12:29:32.341Z INFO L2HostConfigTaskExecutor2 HostTNDeploymentProgressServiceImpl 11278 FABRIC [nsx@6876 comp="nsx-manager" level="INFO" subcomp="manager"] TN Operation: UPDATE. Host: ########-####-####-####-############ current progress percentage: 80, stateDescription: deployment.progress.tn.create.waiting_for_host_config_reply

    2022-02-09T12:29:32.365Z INFO L2HostConfigTaskExecutor2 TransportNodeAsyncServiceImpl 11278 FABRIC [nsx@6876 comp="nsx-manager" level="INFO" subcomp="manager"] TN TransportNode/########-####-####-####-############ realization state : IN_PROGRESS, convergence state: IN_PROGRESS, realization message : Status is in-progress on '1' transport nodes.


    Note: 上記のログの抜粋はあくまで出力例です。実際の日付、時刻、および環境変数は、お使いの環境によって異なる場合があります。

Environment

VMware NSX

Cause

ホストを構成するプロセスはさまざまなパーセンテージ(例:68%、80%)で停止することがあります。
「コントローラでホストの状態を有効にしています」で停止する場合、これは通常、ホストのデータプレーンと NSX Managerのコントロールプレーン間の同期の問題を示しています。

この問題の原因として以下が考えられます:

  • ホストとNSX Manager間のネットワーク接続の問題
  • 複数のホストが同時に再展開されている場合のNSX Manager 上でのリソースの競合
  • ESXi ホストまたは NSX Manager 側のいずれかでのプロセスの応答停止

Resolution

この問題を回避するには、ホストと NSX Manager 間の信頼性の高いネットワーク接続を確保し、適切なキャパシティプランニングとホストクラスタの段階的な準備によってリソースの競合が発生しないようにしてください。
また、以下の処置が問題の解決に役立つ可能性があります:

  • 影響を受ける ESXi ホストの再同期
    • ほとんどの場合、影響を受ける ESXi ホストを再起動すると再同期が強制されて問題が解決します。
  • NSX Manager の再起動(必要に応じて)
    • ホストの再起動後も問題が解決しない場合は、NSX Manager を再起動することでコンポーネント間の通信の再確立を試みてください。
  • ESXi ホストを NSX メンテナンスモードにし、その後 NSX メンテナンスモードを終了する。
  • 影響を受けているホスト上の NSX をアンインストールして再インストールする:

問題が解決しない場合はCaseを起票してBroadcom サポートチームにお問い合わせください。

Additional Information

この問題についてBroadcomのサポートにお問い合わせいただく際は以下の情報をご提供ください。参考:Creating and managing Broadcom support request (SR) cases

  • NSX Managerのサポートバンドル
  • トランスポートノードの構成に失敗しているESXi ホストのサポートバンドル
  • NSX GUI またはコマンドラインに表示されているエラーメッセージのテキストやスクリーンショット

ログバンドルの取得方法とアップロード方法については以下のドキュメントをご参照ください: