vCenter 上の複数の ESXi に対して、"ホストの接続障害" ("Host connection failure") を示す SNMP アラートが断続的にトリガーされる
search cancel

vCenter 上の複数の ESXi に対して、"ホストの接続障害" ("Host connection failure") を示す SNMP アラートが断続的にトリガーされる

book

Article ID: 413320

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項:これは英文の記事「SNMP alerts are triggered intermittently for different ESXi hosts on vCenter server, indicating a "Host connection failure."」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。


  • どの ESXi もアラートが発生している時間帯では、vSphere Client で"応答なし"や"切断状態"の表示にはなっていない。
  • 何の操作を行わなくともアラートは自動で解消する。
  • ESXi と vCenter Server 間のネットワーク接続性の問題は何もない。
  • しかし、vpxd ログには "Exception occurred during host sync; Host communication failed" と記録され、SNMP アラートの問題が生じたことを示している。

vpxd.log

vpxd-8220.log:YYYY-MM-DD|HH:MM.523Z warning vpxd[08112] [Originator@6876 sub=InvtHostCnx opID=HostSync-host-12##48-1f7bd43] Exception occurred during host sync; Host communication failed; [vim.HostSystem:host-12##48, esxi.host.name], e: N5Vmomi5Fault17HostCommunication9ExceptionE (Fault cause: vmodl.fault.HostCommunication)

vpxd-8221.log:YYYY-MM-DD|HH:MM.420Z warning vpxd[14267] [Originator@6876 sub=InvtHostCnx opID=HostSync-host-12##48-2af6c7f6] Exception occurred during host sync; Host communication failed; [vim.HostSystem:host-12##48, esxi.host.name], e: N5Vmomi5Fault17HostCommunication9ExceptionE (Fault cause: vmodl.fault.HostCommunication)

Environment

ESXi 8.0 Update 3

Cause

この問題は ESXi の vpxa サービスがリクエストを処理せずに、直ちに TCP 接続をリセットすることにより引き起こされます。
以下はこの問題の発生を示すログ出力の抜粋です。

/var/run/log/envoy-access.log

YYYY-MM-DD|HH:MM.552Z In(166) envoy-access[2098915]: POST /hgw/host-74866/vpxa 503 upstream_reset_before_response_started{connection_termination} UC 1157 88 gzip 0 - - 10.###.##.43:47328 HTTP/1.1 TLSv1.2 10.###.##.23:443 127.0.0.1:29513 HTTP/1.1 - 127.0.0.1:8089 "HB-host-74866@27398-###0f85" "GetChangesVpxa"

YYY-MM-DD|HH:MM.961Z POST /vpxa 200 ... YYYY-MM-DD|HH:MM964Z POST /vpxa 200 ... YYYY-MM-DD|HH:MM.969Z GET /vpxa/service 200 ... YYYY-MM-DD|HH:MM.552Z POST /hgw/host-74866/vpxa 503

これは既知の問題であり、将来のリリースで恒久的な修正が予定されています。

Resolution

この警告メッセージは ESXi の操作には影響がないため、無視しても問題ありません。

対処 :

  1. 以下のコマンドにより ESXi の vpxa の設定で "read_timeout" を増加させることで、この問題を発生しづらくすることが可能です。[参考情報 : vpxa の "vmacore/http/read_timeout_ms" の初期値は 45 秒 (つまり 45000 ミリ秒) です。]

    # configstorecli config current set -c esx -g services -k vpxa -p vmacore/http/read_timeout_ms -v 120000

  2. 変更を反映するには各 ESXi で vpxa サービスの再起動が必要です。(ESXi や仮想マシンのダウンタイムは生じません。)

    # /etc/init.d/vpxa restart

注 : もし以前に一度もこの vpxa の設定を変更したことがない場合、上記方法による変更は行えません。この場合、以下手順を実施して変更してください。:

  1. vpxa の設定を json ファイルにエクスポート

    # configstorecli config current get -c esx -g services -k vpxa -o tmp.json

  2. json ファイルを以下内容で編集
    ----------------------------------------------------------------------------------------
    {
       "vmacore": {
          "http": {
             "read_timeout_ms": 120000
          }
       }
    }
    ----------------------------------------------------------------------------------------
       注 : もし他の設定が記載されている場合、それらの行は上書きしないで下さい。代わりに以下の例のように既存設定行に対象設定のセクションを追記して下さい。
       例 : 
    ----------------------------------------------------------------------------------------
    {
       "log": {
          "level": "verbose"
       },
       "vmacore": {
          "http": {
             "read_timeout_ms": 120000
          }
       }
    }
    ----------------------------------------------------------------------------------------
  3. 編集した json ファイルをインポート

    # configstorecli config current set -c esx -g services -k vpxa -j tmp.json

    注 : インポートされた設定を以下コマンドにより確認できます。

    # configstorecli config current get -c esx -g services -k vpxa

  4. vpxa を再起動

    # /etc/init.d/vpxa restart