「NSX ALB アダプタで『Adapter Instance is Not Receiving Data』アラートが、約 24 時間ごとに 1 回発生する
search cancel

「NSX ALB アダプタで『Adapter Instance is Not Receiving Data』アラートが、約 24 時間ごとに 1 回発生する

book

Article ID: 442000

calendar_today

Updated On:

Products

VCF Operations/Automation (formerly VMware Aria Suite)

Issue/Introduction

免責事項:これは英文の記事「NSX ALB Adapter Triggers ‘Adapter Instance is Not Receiving Data’ alert once every 24 hours (439796)」の日本語訳です。  
記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • アラートは約 5 分程度の時間差はあるものの、おおよそ24 時間ごとに継続して発生しており、次回のデータ収集サイクル時に自動的に解消されます。

  • Aria Operations のログ上では、「Unable to find cluster」というメッセージとともに、500 Internal Server Error が確認されます。

    YYYY-MM-DDTHH:MM:SS,XXX+0000 ERROR [Collector worker thread X] (XXX) com.vmware.vcops.NSXAdvancedLBAdapter.getCluster - Unable to fetch cluster details
    com.vmware.vcops.exception.AviApiException: org.springframework.web.client.HttpServerErrorException$InternalServerError: 500 INTERNAL SERVER ERROR: "<h1>Server Error (500)</h1>"
            at com.vmware.vcops.client.AviApi.get(AviApi.java:209) ~[nsx-alb.jar:?]
            at com.vmware.vcops.client.AviApi.get(AviApi.java:125) ~[nsx-alb.jar:?]
            at com.vmware.vcops.client.AviClient.getCluster(AviClient.java:50) ~[nsx-alb.jar:?]
            ...
    YYYY-MM-DDTHH:MM:SS,XXX++0000 ERROR [Collector worker thread X] (XXX) com.vmware.vcops.NSXAdvancedLBAdapter.collect - Unable to find cluster

  • NSX Advanced ALB の portal.access.log では、/api/cluster へのリクエストは通常 HTTP 200 にて正常応答をしています。
    しかしながら、断続的に HTTP 500 および HTTP 401 の応答が発生しており、その後再び HTTP 200 による正常応答へ復帰していることを確認できる。

    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster/ HTTP/1.1" 200 ....
    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster/ HTTP/1.1" 200 ....
    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 500 ....
    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....
    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 200 ....
    XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [DD/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 200 ....

Environment

Aria Operations 8.18.x
NSX Advanced Load Balancer Adapter 1.3
NSX Advanced Load Balancer 

Cause

デフォルトでは、Avi API は以下の avi_config 設定により、24 時間ごとにすべての API セッションを強制的に切断するよう構成されています。

"api_force_timeout": 24,

NSX AVI の API portal ログには、API セッション切断後も Aria Operations アプライアンスが AVI に対して API リクエストを継続送信していることを確認できる。
これらのリクエストは複数の API エンドポイントを含んでおり、その後 HTTP 401 「Unauthorized」エラーにより失敗しております。

また、AVI portal ログ上のタイムスタンプは、Aria Operations 側で確認されているエラー発生時刻と一致する。

XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [30/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....
XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX - [29/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....
XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX -[28/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....
XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX -[27/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....
XX.XX.XX.XX [cache:-] 127.0.0.1:6000 [-] - T-ID=XXXXXXXXXXXXXXXXXXXXXXXX -[26/MMM/YYYY:HH:MM:SS +0000] [-] [-] "GET /api//cluster HTTP/1.1" 401 ....

Resolution

VMware Engineering では本事象を認識しており、現在修正に向けて対応を進めております。
なお、現時点で回避策はございません。

Additional Information

NSX ALB Adapter Triggers ‘Adapter Instance is Not Receiving Data’ alert once every 24 hours