この記事では、vSAN クラスタ内のすべてのホストで同時再起動 / シャットダウンを安全に実行する方法についての情報を提供します。6.7 Update 3 以降の ESXi では、組み込みツールを使用してナレッジベースの記事「vSAN -- Maintenance -- Simultaneous Host Reboots / Cluster Full Shutdown -- Risk for Data Unavailability」に記述されている問題を回避できます。
注:このソリューションは、6.7 Update 3 以降の健全な vSAN クラスタにすべてのホストがある場合にのみ適用されます。
ホストのクラスタ レベルの再起動プロセスを開始する前に、次の手順を実行します。
注:
クラスタ内に非健康 / 切断されたホストがある場合は、そのホストをリカバリするか、vSAN クラスタから削除します。vSAN 健全性で使用可能なすべてのホストが緑色で表示されてからのみ、上記のコマンドを再試行します。
環境に 3 ノード クラスタがある場合、reboot_helper.py recover コマンドは 1 台のホストに障害がある状況では動作しません。
この場合、管理者は次の手順を実行します。
1.unicastagent リストから障害ホスト情報を一時的に削除します
2.reboot_helper.py recover の実行後にそのホストを追加します。
以下に、そのホストを削除してクラスタに追加するコマンドを示します。(次のコマンドに精通していない、または不慣れな場合は実行せず、VMware GSS vSAN チームにチケットを発行してサポートを受けてください)
#esxcli vsan cluster unicastagent remove -a <IP Address> -t node -u <NodeUuid>
#esxcli vsan cluster unicastagent add -t node -u <NodeUuid> -U true -a <IP Address> -p 12321
ESXi の IPv6 設定が有効になっていない場合、次のエラーが出力される場合があります。 reboot_helper.py の実行時にログが記録されます。
これは想定されるメッセージであり、このエラーは動作に影響しません。
ERROR:root:Error to run _getIPRouteListFromEsxCLI