HCX - IX アプライアンスのトンネルが "Service pipeline status is down" エラーによりダウン状態となる
search cancel

HCX - IX アプライアンスのトンネルが "Service pipeline status is down" エラーによりダウン状態となる

book

Article ID: 327148

calendar_today

Updated On:

Products

VMware HCX VMware Cloud on AWS

Issue/Introduction

本事象は既知の問題となり、ワークアラウンドの適用を推奨いたします。

Symptoms:
免責事項:これは英文の記事「HCX - IX appliance tunnel DOWN with error "Service Pipeline is Down" 」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

2020 年 11 月 10 日以降、IX アプライアンスのトンネルがダウン状態となります。

トランスポート用のトンネルはアップ状態のままですが、詳細には "Service pipeline status is down" と表示されます。

Cause

トランスポート用トンネルがアップ状態で、一方でサービスパイプラインがダウン状態となっている場合、サービスメッシュ内のインターコネクト (IX) と WAN 最適化アプライアンス (WO) 間の通信に問題が発生していることが明確に示されています。WO ライセンスが 11 月 9 日で期限切れとなり、アプライアンスで動作している全てのサービスが停止したため、本問題が発生しています。

Resolution

本問題は 2020 年 12 月 4 日にリリース予定の HCX R146 で修正される予定です。
リリース日は変更される可能性があります。恒久的に対応するためには R146 かそれ以降のバージョンへアップグレードが必要です。

R146 のリリース前に、ソースとターゲットサイト間の低帯域によって WO サービスが必要となる移行が予定されている場合、以下手順で既存のバージョンの HCX にパッチを適用できます。
注意 : VMware Cloud on AWS のお客様は HCX Cloud Manager にパッチを適用するためにサポートリクエストを起票する必要があります。
  • HCX Connector と Cloud Manager 上にインストールします。
  • 実行中の移行や構成に関するワークフローがないことを確認します。
  • admin ユーザーで SSH より HCX システムにログインします。
  • ディレクトリを変更します。
cd /tmp
  • パッチファイルをダウンロードします。
curl https://hybridity-depot.vmware.com/patch_KB81558.tar.gz?hdnts=exp=1636694389~hmac=ceceab7b7185452b71734a050d694dcd43525dd5d0d561b2106fba9e765e3e78 -Ok
  • ダウンロードファイルをリネームし、MD5 を確認します。
mv patch_KB81558.tar.gz\?hdnts\=exp\=1636694389~hmac\=ceceab7b7185452b71734a050d694dcd43525dd5d0d561b2106fba9e765e3e78 patch_KB81558.tar.gz

md5sum patch_KB81558.tar.gz 
00cf6fd82f90e4f5019214e8fa0e48ea  patch_KB81558.tar.gz
  • ファイルを解凍します。
tar -vxf patch_KB81558.tar.gz 
  • パッチをインストールします。
mv 01_interconnect-servcie-1.0.jar /opt/vmware/Services/interconnect-service_1.0/01_interconnect-service-1.0.jar
  • パッチファイルの場所を確認します。
ls -lt /opt/vmware/Services/interconnect-service_1.0/01_interconnect-service-1.0.jar 

-rw-r--r-- 1 admin secureall 8219 Nov 11 18:51 /opt/vmware/Services/interconnect-service_1.0/01_interconnect-service-1.0.jar
  • root ユーザーに切り替えます。
su - root
  • app-engine を再起動します。
systemctl restart app-engine
  • app-engine が起動していることを確認します。
systemctl status app-engine 

* app-engine.service - App-Engine
   Loaded: loaded (/etc/systemd/system/app-engine.service; enabled; vendor preset: disabled)
   Active: active (running) since Wed 2020-11-11 23:04:53 GMT; 9h ago
  Process: 10589 ExecStopPost=/bin/sh -a -c rm -f /var/run/admin/app-engine.date (code=exited, status=0/SUCCESS)
  Process: 10637 ExecStart=/etc/systemd/app-engine-start (code=exited, status=0/SUCCESS)
  Process: 10595 ExecStartPre=/etc/systemd/service-dependency-check.sh mongodb database-upgrade zookeeper kafka (code=exited, status=0/SUCCESS)
 Main PID: 13381 (java)
    Tasks: 266
   CGroup: /system.slice/app-engine.service
           `-13381 java -cp /opt/vmware/resources:/opt/vmware/app/*:/opt/vmware/third-party/*:/opt/vmware/Adapters/1.0/*:/opt/vmware/Adapters/1.1/* -Xmx2048m -Xms2048m -XX:MaxPermSize=512m 
  • システムからログアウトします。

HCX Connector と Cloud Manager の両方にパッチが適用されたら、WO アプライアンスをサービスメッシュから再デプロイします。


サービスメッシュから WO サービスを削除していた場合、再度サービスメッシュから追加します。Workaround のセクションを参照してください。

Workaround:
移行処理が可能となるように WO アプライアンスをサービスメッシュから削除します。WO アプライアンスを削除しても IX アプライアンス、もしくは NE アプライアンスへの影響はありません。
WO は、ほとんどの場合、ソースサイトとターゲットサイト間が低帯域の場合に必要とされます。
効果的な圧縮率は仮想マシンが持つデータに依存するため、短期的な解決策として、WO は低帯域なインフラを利用した移行処理時に必要ではない場合があります。





Additional Information

Impact/Risks:
サービスパイプラインがダウン状態となったタイミングで実施されていた以下のアクティブな移行処理は中断され、処理は失敗せず残ったままとなるため、それらの移行処理は停止する必要があります。
  • vMotion / Cold による移行処理
  • VR Bulk / RAV の初期同期

VR Bulk および RAV 移行時のカットオーバー待ち状態の場合、速やかにワークアラウンドを適用いただき定期的なデータ同期処理への影響を限定することで、本問題による影響はありません。
失敗した移行処理は再度実施いただく必要があります。

L2 ネットワーク延伸機能への影響はありません。

全ての HCX のバージョンが本問題の影響を受けます。