vSAN 健全性サービス - キャパシティ使用量 - ストレージ容量
search cancel

vSAN 健全性サービス - キャパシティ使用量 - ストレージ容量

book

Article ID: 426656

calendar_today

Updated On:

Products

VMware vSAN

Issue/Introduction

この記事では、vSAN 健全性サービスの 「キャパシティ使用量の健全性 - ストレージ容量」チェックについて説明し、エラーが報告される原因の詳細について解説します。


注: VC バージョン 7.0 U2 未満では、この健全性チェックは「キャパシティ使用量の健全性 - ディスク容量」という名称でした。

Environment

VMware vSAN (All Versions)

Resolution

Q:[キャパシティ使用量の健全性 – ストレージ容量](旧称: ディスク容量)のチェックは何を判定するものですか?

この健全性チェックは、クラスターレベルのディスク使用率を監視します。
使用率が閾値を超えた場合に警告を発し、使用率がその制限を超過しないように確認するためのものです。

 
Q: エラー状態は何を意味していますか
vSAN の場合: このチェックで警告が報告された場合、障害発生後にクラスターが修復を行うための十分な空き容量がない可能性を示しています。エラーが報告された場合は、リバランスなどの内部処理や、ストレージポリシーの変更、クラスター構成の変更といったユーザー操作が実行できなくなる可能性があります。さらに使用率が極端に高い状態になると、ワークロードからの I/O 操作が失敗する恐れがあります。

vSAN Direct の場合: このチェックで警告またはエラーが表示されている場合、十分な空き容量がなく、CNS(Cloud Native Storage)ボリュームの作成に失敗する可能性があります。

 

予約済み容量 (8.x and newer)

vSAN では、予約済み容量として、リバランス、メンテナンス、ホスト障害時の対応など、システムの安定性とパフォーマンスを維持するためのストレージスペースが確保されます。これは以下の 2 つのパラメータで構成されます。

  • Operations Reserve(OR) 
  • Host Rebuild Reserve (HRR)

予約済み容量は、vSAN 容量の「予約とアラート」セクションにあるトグルを介して有効化できます。

Operations Reserve(OR)

Operations Reserve は一時的なストレージアクティビティ(例: ポリシー変更、リバランス)のために予約されます。
そのパーセンテージは、オブジェクトサイズに関する一般的な仮定や容量デバイスの生のサイズ、ホストあたりのデバイス数、ホストあたりのディスクグループ数、およびクラスターベースの重複排除と圧縮 (DD&C) の使用の有無などの要因によって決定されます。vSAN において、OR はハードウェア構成とソフトウェアサービスによって変化します。

例:

  • 4TB のキャパシティデバイスを使用し、ホストあたり 8 個のキャパシティデバイスと 2 個のディスクグループを持ち、DD&C が有効なクラスターホストは、全容量の 6% に等しい OR を持つ可能性があります。

  • 4TB のキャパシティデバイスを使用し、ホストあたり 2 個のキャパシティデバイスと 1 個のディスクグループを持ち、DD&C が無効なクラスターホストは、全容量の 17% に等しい OR を持つ可能性があります。

Operations Reserve の計算:

  • vSAN ESA cluster:
    Operation Reserve = <ホスト数> * 765GB + <キャパシティデバイス数> * (MIN(<キャパシティデバイスサイズ(GB)> * 0.05, 100) + MIN(<キャパシティデバイスのサイズ(GB)> * 0.0025, 100))

  • vSAN OSA cluster: 
    容量効率が "圧縮のみ" あるいは "なし" の場合
    Operation Reserve = <ホスト数> * 765GB + <キャパシティデバイス数> * MIN(<キャパシティデバイスサイズ(GB)> * 0.05, 100)

    容量効率が "デデュープと圧縮" の場合
    Operation Reserve = <ホスト数> * 765GB + <ディスクグループ数> * MIN(<ディスクグループのサイズ(GB)> * 0.05, 100)


Host Rebuild Reserve (HRR)

Host Rebuild Reserve は、単一ホストの故障回復のために予約されます。
その計算は、Operations Reserve から完全に独立しています。そのパーセンテージは、クラスター内の総ホスト数に対するホスト1台の容量によって計算され、N+1 設計戦略をサポートします。vSAN において、HRR はホストの数が増えるにつれて減少します。

例:  

  • 4 ノードのクラスターは、総容量の 25% に等しい HRR を持つ可能性があります。
  • 12 ノードのクラスターは、総容量の 8% に等しい HRR を持つ可能性があります。
  • 32 ノードのクラスターは、総容量の 3% に等しい HRR を持つ可能性があります。

新しいクラスターのための予約済み容量(Operations Reserve または Operations Reserve + Host Rebuild Reserve)を決定するには、vSAN ReadyNode Sizer または VxRail Sizer を使用してください。これらのツールは、vSAN のバージョン固有の最適化やコーナーケース(例:小規模クラスターにおいて予約済み容量を 30% 未満に制限するなど)を考慮に入れているためです。予約済み容量を計算する際の詳細については、「Understanding Reserved Capacity Concepts in vSAN」を参照してください。

 

閾値の定義

このページにおいて、vSAN Ops 閾値と Host Rebuild 閾値は以下のように定義されます:

  • vSAN ops 閾値 = Total space - Operations reserve
  • Host rebuild 閾値 = Total space - Operations reserve - Host rebuild reserve

注: VMC 環境など、Host Rebuild Reserve 機能が不要なケースでは、Host Rebuild 閾値は vSAN Ops 閾値と等しくなることがあります。

閾値の定義は以下の通りです: 

Host Rebuild Reserve が無効な場合:

  • Red: MIN(総容量の 90%, vSAN Ops 閾値)
  • Yellow: MIN(総容量の 70%, Host Rebuild 閾値)

Host Rebuild Reserve が有効な場合:

  • Red: MIN(総容量の 90%, Host Rebuild 閾値)
  • Yellow: MIN(総容量の 70%, Host Rebuild 閾値の 80%)

注: カスタム閾値が構成されている場合、それはデフォルトの vSAN 容量健全性の閾値よりも優先されます。ユーザー定義の値が常に優先されます。詳細については、「Configure Reserved Capacity for vSAN Cluster」を参照してください。

Q: エラー状態のトラブルシューティングと修正はどのように行いますか?

最初のステップは、すべてのストレージが有効であり、容量デバイスが不足していないことを確認し、vSANデータストアの容量が想定通りであることを確認することです。完全な vSANデータストアの状態を復旧するには、以下の3つのオプションがあります: 

  • vSAN データストア上のスペースを解放するために VM をローカルワークステーションにダウンロードする
    1. 満杯のディスク/ディスクグループを特定する。
    2. 満杯のディスクグループで稼働している VM を特定する。
      1. VMは正常な状態である必要があります。親なし状態またはアクセス不可なVMがある場合は、別のVMを選択して空き領域を確保してください。
      2. 仮想マシンの名前空間予約使用量が10MB未満である必要があります。
    3. パワーオフ (保留中の質問がある仮想マシンについては、「キャンセル」と回答してください)
      1. 複数の質問がある可能性があります。すべてに回答する必要があります。
      2. hostd が応答なし/ハングしている場合、この方法は機能しない可能性があります。
    4. 仮想マシンをローカルワークステーションにダウンロードしてください。
      1. ダウンロードが完了し、すべての仮想マシンデータが含まれていることを確認する。
    5. vSAN 上の仮想マシンの削除

  • vSAN データストア上のリソースを解放するために VM をパワーオフする
    1. 仮想マシンを正常にシャットダウンします。これによりゲストに関連付けられたスワップファイルが削除され、空き領域が確保されます。
    2. 十分な数の仮想マシンがパワーオフされたら、ストレージ vMotionで仮想マシンを代替ストレージに移動する。
    3. 代替ストレージが利用できない場合は、不要なゲストを削除して追加の空き領域を確保してください。

  • vSAN Direct データストアの容量を拡張する。
    vSANサーバに追加ドライブ用の空きスロットがあり、ディスクが利用可能な場合は、vSANダイレクトストレージにディスクを追加して容量を拡張します。適切なリソースが利用可能な場合、これは通常最も簡単な選択肢です。

Additional Information

English version: vSAN Health Service - Capacity utilization - Storage space