拡張レプリケーション構成が次のエラーで失敗します: "Fault occurred while performing health check. Details: 'Connect: Input/output error"
search cancel

拡張レプリケーション構成が次のエラーで失敗します: "Fault occurred while performing health check. Details: 'Connect: Input/output error"

book

Article ID: 415287

calendar_today

Updated On:

Products

VMware Live Recovery

Issue/Introduction

Symptoms:

免責事項:これは英文の記事「Enhanced Replication configuration fails with the error: "Fault occurred while performing health check. Details: 'Connect: Input/output error"」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

 

  • 拡張レプリケーション マッピング テストを実行すると、次のエラーがスローされます。
    • Fault occurred while performing health check. Details: 'Connect: Input/output error"

  • 拡張レプリケーション マッピング テストが実行されるたびに、ターゲット上の ESXi ホスト 1 台のみが「良好」な接続ステータスを報告します。
    • ターゲット側のESXiホストは「良好」な接続ステータスを示しており、テストが実行されるたびに別のホストに切り替わります。

Validation:

  • さらに調査するには、ESXi ホスト上の/var/run/log/hbrsrv.logを分析し、「Dropping error encountered from network(ネットワークからドロップ エラーが発生しました)」というメッセージで示されるネットワークの問題を特定します。

    Observed multiple errors related to client connection failures and dropped connections:
    Er(163) hbrsrv[6530583]: [Originator@6876 sub=Main] HbrError stack:
    Er(163) hbrsrv[6530583]: [Originator@6876 sub=Main]    [0] ClientConnection (client=[target_esxi_ip]:52928) request callback failed: Failed to read: End of file
    Er(163) hbrsrv[6530583]: [Originator@6876 sub=Main]    [1] Dropping error encountered from network
    In(166) hbrsrv[6530577]: [Originator@6876 sub=Delta] HbrSrv cleaning out ClientConnection ([target_esxi_ip]:52928)
    In(166) hbrsrv[6530583]: [Originator@6876 sub=StatsLog] HbrEvent: {"clientAddress":"[target_esxi_ip]:52928","eventID":"lwdConnectionReset","groupID":"","serverID":"00000010-0000-0000-0400-000000000000","vimHostName":"vrep_FQDN","hbrEvent":1}
    In(166) hbrsrv[6530583]: [Originator@6876 sub=Delta] Destroying client connection (ClientCnx '[target_esxi_ip]:52928' id=0 <shut> <clsd> <uninit>)
    In(166) hbrsrv[6530582]: [Originator@6876 sub=Delta] ClientConnection (ClientCnx '[target_esxi_ip]:49152' id=0 <shut> <uninit>) is stopping ...

  • /var/run/log/hbr-agent.logの「Broken pipe」エラーと「Connection reset」メッセージを検証します。

    In(166) hbr-agent-bin[6531120]: [0x000000bb7ed16700] error: [Proxy [Group: PING-GID-6a0e71e9-01de-450c-9a40-fdc078e34e48] -> [target_esxi_ip:32032]] [b8eeb1b3-6ad8-494b-b9d9-43ec06465c50-HMS-1355] SSL handshake failed: Connection reset by peer
    In(166) hbr-agent-bin[6531120]: [0x000000bb7ed16700] error: [Proxy [Group: PING-GID-6a0e71e9-01de-450c-9a40-fdc078e34e48] -> [target_esxi_ip:32032]] [b8eeb1b3-6ad8-494b-b9d9-43ec06465c50-HMS-1355] Failed to connect to server target_esxi_ip:32032 using broker info: Connection reset by peer
    In(166) hbr-agent-bin[6531120]: [0x000000bb7ec95700] error: [Proxy [Group: PING-GID-6a0e71e9-01de-450c-9a40-fdc078e34e48] -> [target_esxi_ip:32032]] [b8eeb1b3-6ad8-494b-b9d9-43ec06465c50-HMS-1355] Exhausted all server endpoints reported by broker.
    In(166) hbr-agent-bin[6531120]: [0x000000bb7ec95700] info: [RESTRequest] [AppPing] [vrep_ipaddress:51152] [b8eeb1b3-6ad8-494b-b9d9-43ec06465c50-HMS-1355] Completing with OK
    In(166) hbr-agent-bin[6531120]: [0x000000bb7ec95700] error: [RESTConnection] Error writing response: Broken pipe


  • port 32032経由の通信障害が繰り返し発生していないかどうか /opt/vmware/ hms/logs/hms.logを確認してください。

    ERROR com.vmware.hms.net.HbrAgentHealthMonitorService [hms-main-thread-25] (..hms.net.HbrAgentHealthMonitorService) [] | Error occurred while executing ping test call for group 'PING-GID-4bcc4b64-ace7-4434-9761-732d228a8b5b', broker 'vrep_ipaddress', broker port '32032' from host 'target_esxi_ip'.

 

 

Environment

VMware ESXi 8.x
vSphere Replication 9.x

Cause

  • 環境全体の MTU 設定が一貫していません。
  • ソース ESXi ホストとターゲット ESXi ホスト間のMTU 9000 ping テストは失敗しますが、 MTU 1500 ping テストは成功します。

  • 拡張レプリケーションでは、データトラフィックはWANを介してソースESXiホストとターゲットESXiホスト間を直接流れます。両方のホストがMTU 9000に設定され、最大セグメントサイズ(MSS)がWANに対して大きすぎると、データパケット損失が発生します。

 

Resolution

この問題を解決するには、以下の手順に従ってください。

  • ソースおよびターゲット ESXi ホストでMTU1500に変更するか、ネットワーク チームと協力してMTU 関連の問題を解決します。
  • vSphere Replication トラフィックには分離されたネットワークを使用し、必要に応じて MTU を1500または9000に設定します。
  • レプリケーショントラフィックを分離することで、ネットワークの輻輳を防ぎ、最適なパフォーマンスを確保できます。
    参考リンク:
    Isolating the Network Traffic of vSphere Replication

Additional Information