vSANのプロアクティブリバランスと自動リバランス
search cancel

vSANのプロアクティブリバランスと自動リバランス

book

Article ID: 320649

calendar_today

Updated On:

Products

VMware vSAN

Issue/Introduction

この記事の目的は、vSAN の「プロアクティブ リバランスと自動リバランス」が適用される場合について説明することです。
 
クラスタのバランスが適切でない、容量使用量が高いディスクと非常に低いディスクが存在するといった、ディスクについてのエラーが Skyline 健全性 チェックで通知される場合は、容量使用量に応じてディスク全体に負荷を分散するために、 vSAN のバージョンに基づいてプロアクティブあるいは自動リバランスを実行する必要がある場合があります。

免責事項:これは英文の記事「vSAN "Proactive rebalance" and "Automatic Rebalance" (319926)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

 

vSAN は2 つの基本的なリバランス調整形式を提供します。

  • リアクティブ リバランス(Reactive Rebalancing)  vSAN が容量使用率が 80% 以上のストレージ デバイスを検出し、このしきい値を下回る他のデバイスにデータの一部を移動しようとするときに発生します。「容量制約リバランス(Capacity Constrained Rebalancing)」がより適切な名前でしょう。この機能は、常に自動化された調整不可能な機能です。
    •  注意: すべてのディスクの使用率が 80% を超えている場合、リアクティブリバランスは実行されません。
  • プロアクティブ リバランス(Proactive Rebalancing) vSAN が他のデバイスと比較して、ストレージ デバイスが不均衡な量の容量を消費していることを検出した場合に発生します。デフォルトでは、vSAN は他のデバイスよりも 30% 以上の容量使用量の差を示すデバイスを探します。「容量対称性リバランス(Capacity Symmetry Rebalancing)」がより適切な名前でしょう。

 

プロアクティブ リバランス(Proactive Rebalance): vCenter GUI の vSAN Health プラグインまたは RVC コンソールを介して、vSAN クラスタ内のオブジェクトのリバランスを手動で開始します。これは、vSAN 6.7 U2 以前のバージョンでのみサポートされています。

自動リバランス(Automatic Rebalance): vSAN 6.7 U3 以降では、プロアクティブ リバランスを手動でトリガーする必要はありません。クラスタ全体の構成としきい値設定を使用して、すべてのリバランス アクティビティを自動化できます。

Symptoms:
分散ストレージ システムの性質上、データは参加ノード全体に分散されます。vSAN はこれらすべてを管理します。クラスタ レベルのオブジェクト マネージャは、データの初期配置だけでなく、データが規定のストレージ ポリシーに準拠し続けるように継続的に調整します。

Environment

VMware vSAN 8.0.x
VMware vSAN 7.0.x
VMware vSAN 6.x

 

Cause

データが不均衡になる理由は、ストレージ ポリシーの変更、ホストまたはディスク グループの退避、ホストの追加、オブジェクトの修復、全体的なデータの増加など、さまざまです。

Resolution

プロアクティブ リバランス: vSAN クラスタが不均衡な場合は、手動リバランスの実行が必要になる場合があります。この操作により、過剰に使用されているディスクから使用量の少ないディスクにコンポーネントが移動されます。手動リバランスを実行すると、この操作は 24 時間実行され、その後停止します。

: 手動でリバランスを実行すると、一部のシステム リソースが使用されるため、このプロセスが完了するまでに数時間かかることがあります。これは、クラスタ全体のディスク使用量のばらつきを減らすためにリバランスする必要があるオブジェクトの数によって異なります。  
vSANパフォーマンス チャートを監視して、ワークロードが最小限のときにプロアクティブ リバランスを実行することを推奨します。

vSphere 6.7 U2 以前でプロアクティブ リバランス を実行するには:

  1. vSphere Web Client で vSAN クラスタに移動します。
  2. [監視]タブをクリックし、 [vSAN]をクリックします。
  3. [健全性]をクリックします。
  4. vSAN 健全性 サービス テーブルで、警告: Virtual SAN ディスク バランスを選択します。ホストのディスク バランスを確認できます。
  5. クラスタをリバランスするには、「ディスクのリバランス」ボタンをクリックします。  
        : このタスクには数時間かかる場合があります。
--------------------------------------------------------------------------------------------------------------------
 

自動リバランス:
vSAN 6.7 U3以降では 、ディスクのリバランスは手動で行う方法ではなく、vSAN クラスタ設定内でサービスとして有効にする必要があります (以下で説明)。有効になっていない場合、vSAN は、いずれかの vSAN ディスクが 80% の容量しきい値を超えた場合にのみ、vSAN ディスクのリバランスを開始します。

注: ディスクのリバランスは、vSAN クラスタの I/O パフォーマンスに影響を与える可能性があります。このパフォーマンスへの影響を回避するには、ピーク パフォーマンスが必要な場合にしきい値を変更するか、自動リバランスをオフにします。  
自動リバランスを設定する手順:

  1. vSANクラスタに移動します。
  2.  [構成]タブをクリックします。  
  3. [vSAN]、[サービス]を選択します。  
  4. [詳細オプション]をクリックして編集します。  
  5. [自動リバランス] をクリックして有効または無効にします。  
  6. 必要に応じて、分散しきい値を 20 ~ 75 の任意のパーセンテージに設定します。

リバランスを開始するためのしきい値は、デフォルトで 30% に設定されています。つまり、2 つのディスクにこの差異がある場合 (一方のディスクの負荷が他方のディスクより 30% 高い)、コンポーネントのリバランスが開始されます。リバランスは、差異が設定されたしきい値の半分 (デフォルトでは 15%) に達するまで (または自動リバランスが無効になるまで) 継続されます。

また、vSAN クラスタのディスク使用状況の詳細を確認できる vSAN ディスク バランスの健全性チェックもあります。自動リバランスが有効になっている場合、vSAN は自動的にこの健全性チェックを緑色に維持しようとします。無効になっている場合、この健全性チェックがトリガーされ、管理者は手動でディスクリバランス タスクをトリガーするか、自動リバランスを再度有効にする必要があります。

 

クラスタ レベルの機能を有効または無効にするトグルは、 図 1 に示すように、vCenter の [構成] > [vSAN] > [サービス] > [詳細オプション] > [自動リバランス]にあります。

推奨事項:  [リバランスしきい値 %] エントリはデフォルト値の 30 のままにしてください。この値を減らすと、再同期トラフィックの量が増加し、機能上の利点がない不要なリバランスが発生する可能性があります。

この新しい機能に対応するために、[vSAN ディスク バランス] 健全性チェックも変更されました。自動リバランスが無効になっているときに、vSAN がしきい値を満たすかそれを超える不均衡を検出すると、図 2 に示すように、自動リバランスを有効にする機能が提供されます。さほど洗練されていなかった手動のリバランス操作は利用できなくなりました。

自動リバランス機能を有効にすると、このバランス調整のヘルス チェック アラームはトリガーされなくなり、リバランス アクティビティが自動的に実行されます。

 

自動リバランスは有効にする必要がありますか?

はい、vSAN クラスタで自動リバランス機能を有効にすることを推奨します。6.7 U3 でこの機能が追加されたとき、VMware はこの機能を顧客環境に徐々に導入したいと考えており、vSAN 7 でもこの方針が維持されています。最近のエディションではスケジューラと再同期が最適化されているため、この機能はいずれデフォルトで有効になる可能性があります。

まれに、クラスタで自動リバランスを一時的に無効にしたい場合があります。短期間で既存のクラスタに多数のホストを追加する場合や、基本的なテストに使用されるネストされたラボ環境などがその 1 つです。ほとんどの場合は自動リバランスを有効にすべきです。

Links  
Document: https://docs.vmware.com/en/VMware-vSphere/6.5/com.vmware.vsphere.virtualsan.doc/GUID-968C05CA-FE2C-45F7-A011-51F5B53BCBF9.html
Document: https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.vsan-monitoring.doc/GUID-968C05CA-FE2C-45F7-A011-51F5B53BCBF9.html
Release Notes: https://docs.vmware.com/en/VMware-vSphere/6.7/rn/vmware-vsan-67u3-release-notes.html

 
 
 
 
Workaround:

残念ながら、自動リバランスが機能しない場合は、vSAN が他のディスクを満杯にさせない上でオブジェクトをリバランスするといった方法を見つけられていないことを意味します。データの移動だけでなく、vSAN はオブジェクトのアクセシビリティを確保する必要があることを考慮してください。

検証するオプションは次のとおりです。

  • スペースをクリーンアップし、使用されていない VM または削除できる大きなファイルを探します。
  • ホストにキャパシティディスクを追加します。
  • 重要ではない VM またはテストに使用されていない VM を検索し、ポリシーを RAID 0 に変更します。
  • デフォルト ポリシーの VM の一部を RAID 5 または RAID 6 イレージャーコーディングに変更できるかどうかを確認します。
  • クラスタで重複排除と圧縮を有効にして、重複データを排除できます。
 

Additional Information

RVC を使用できるリリースで プロアクティブ リバランス を実行するには(廃止予定) :

  1. Ruby vSphere Console (RVC) にログインします。
  2. コンピュータのネームスペースに変更します。
  3. リバランスする必要があるデータの量を確認するには、vSAN クラスタで次のコマンドを実行します:
    vsan.proactive_rebalance_info <vSAN-cluster-number, or "." for current rvc path location>
 
出力は次のようになります。
/localhost/Test-DC/computers/Test-CL> vsan.proactive_rebalance_info .
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-3.labs.org ...
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-1.labs.org ...
2019-08-16 19:31:08 +0000: Retrieving proactive rebalance information from host esxi-2.labs.org ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-3.labs.org (may take a moment) ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-2.labs.org (may take a moment) ...
2019-08-16 19:31:09 +0000: Fetching vSAN disk info from esxi-1.labs.org (may take a moment) ...
2019-08-16 19:31:10 +0000: Done fetching vSAN disk infos

Proactive rebalance start: 2019-08-16 19:30:47 UTC
Proactive rebalance stop: 2019-08-17 19:30:54 UTC
Max usage difference triggering rebalancing: 30.00%
Average disk usage: 56.00%
Maximum disk usage: 63.00% (17.00% above minimum disk usage)
Imbalance index: 10.00%

No disk detected to be rebalanced

このリバランスは 24 時間で開始および停止します。

  • リバランスを開始するには、次のコマンドを実行します:
    vsan.proactive_rebalance -s <vSAN-cluster-number>
出力は次のようになります:
/localhost/Test-DC/computers/Test-CL> vsan.proactive_rebalance . -s
2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-3.labs.org ...
2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-1.labs.org ...
2019-08-16 19:30:55 +0000: Processing vSAN proactive rebalance on host esxi-2.labs.org ...

Proactive rebalance has been started!
  • 次のコマンドを使用して、リバランスのステータスを監視します:
    vsan.proactive_rebalance_info <vSAN-cluster-number>

注意: このタスクには数時間かかる場合があります。

デフォルトの 24 時間を超えてリバランスを実行するには、リバランスの実行時間を変更する必要があります (<値は秒単位です>)。

たとえば、リバランスを 1 週間実行するように設定する:
vsan.proactive_rebalance . -t 604800

この場合、この操作は処理完了するか、もしくは 1 週間実行されます。 1 週間が経過する前にリバランス処理が終了した場合、プロセスは終了します。

vSAN 6.5 のRVCコンソールで使用できる vsan.proactive_rebalance フラグ:

vsan.proactive_rebalance . -h
usage: proactive_rebalance [opts] cluster
Configure proactive rebalance for vSAN
  cluster: Path to ClusterComputeResource
-s, --start            Start proactive rebalance
-t, --time-span=<i>   Determine how long this proactive rebalance lasts in seconds, only be valid when option 'start' is specified
-v, --variance-threshold=<f>    Configure the threshold, that only if disk's used_capacity/disk_capacity exceeds this threshold(comparing to the disk with the least fullness in the cluster), disk is qualified for proactive rebalance, only be valid when option 'start' is specified
  -i, --time-threshold=<i>   Threshold in seconds, that only when variance threshold continuously exceeds this threshold, corresponding disk will be involved to proactive rebalance, only be valid when option 'start' is specified
  -r, --rate-threshold=<i>    Determine how many data in MB could be moved per hour for each node, only be valid when option 'start' is specified
  -o, --stop                      Stop proactive rebalance
  -h, --help                      Show this message

-----------------------------------------------------------------------
 
 
詳細情報:
  • vSAN でのプロアクティブなリバランスについては、『Administering VMware vSAN guide』の「手動リバランス」セクション
  •  
简体中文:vSAN 主动再平衡

 
Impact/Risks:
vSAN の組み込みロジックは、リバランス調整に関しては保守的なアプローチを取るように設計されています。不必要なデータの移動は避けたいと考えています。これにより、再同期プロセス中にリソースが消費され、実質的な改善は得られない可能性があります。vSphere の DRS と同様に、vSAN のリバランスの目的は、ホスト間の容量や負荷の完全な対称性を目指すことではなく、データ配置を調整してリソースの競合の可能性を減らすことです。バランスの取れたデータにアクセスすると、リソースの競合によるパフォーマンス低下の可能性が減り、パフォーマンスが向上します。