この記事では、vSAN 健全性サービスの 「キャパシティ使用量の健全性 - ストレージ容量」チェックについて説明し、エラーが報告される原因の詳細について解説します。
注: VC バージョン 7.0 U2 未満では、この健全性チェックは「キャパシティ使用量の健全性 - ディスク容量」という名称でした。
VMware vSAN (All Versions)
Q:[キャパシティ使用量の健全性 – ストレージ容量](旧称: ディスク容量)のチェックは何を判定するものですか?
この健全性チェックは、クラスターレベルのディスク使用率を監視します。
使用率が閾値を超えた場合に警告を発し、使用率がその制限を超過しないように確認するためのものです。
Q: エラー状態は何を意味していますか?
vSAN の場合: このチェックで警告が報告された場合、障害発生後にクラスターが修復を行うための十分な空き容量がない可能性を示しています。エラーが報告された場合は、リバランスなどの内部処理や、ストレージポリシーの変更、クラスター構成の変更といったユーザー操作が実行できなくなる可能性があります。さらに使用率が極端に高い状態になると、ワークロードからの I/O 操作が失敗する恐れがあります。
vSAN Direct の場合: このチェックで警告またはエラーが表示されている場合、十分な空き容量がなく、CNS(Cloud Native Storage)ボリュームの作成に失敗する可能性があります。
vSAN では、予約済み容量として、リバランス、メンテナンス、ホスト障害時の対応など、システムの安定性とパフォーマンスを維持するためのストレージスペースが確保されます。これは以下の 2 つのパラメータで構成されます。
予約済み容量は、vSAN 容量の「予約とアラート」セクションにあるトグルを介して有効化できます。
Operations Reserve は一時的なストレージアクティビティ(例: ポリシー変更、リバランス)のために予約されます。
そのパーセンテージは、オブジェクトサイズに関する一般的な仮定や容量デバイスの生のサイズ、ホストあたりのデバイス数、ホストあたりのディスクグループ数、およびクラスターベースの重複排除と圧縮 (DD&C) の使用の有無などの要因によって決定されます。vSAN において、OR はハードウェア構成とソフトウェアサービスによって変化します。
例:
4TB のキャパシティデバイスを使用し、ホストあたり 8 個のキャパシティデバイスと 2 個のディスクグループを持ち、DD&C が有効なクラスターホストは、全容量の 6% に等しい OR を持つ可能性があります。
4TB のキャパシティデバイスを使用し、ホストあたり 2 個のキャパシティデバイスと 1 個のディスクグループを持ち、DD&C が無効なクラスターホストは、全容量の 17% に等しい OR を持つ可能性があります。
Operations Reserve の計算:
Operation Reserve = <ホスト数> * 765GB + <キャパシティデバイス数> * (MIN(<キャパシティデバイスサイズ(GB)> * 0.05, 100) + MIN(<キャパシティデバイスのサイズ(GB)> * 0.0025, 100))Operation Reserve = <ホスト数> * 765GB + <キャパシティデバイス数> * MIN(<キャパシティデバイスサイズ(GB)> * 0.05, 100)Operation Reserve = <ホスト数> * 765GB + <ディスクグループ数> * MIN(<ディスクグループのサイズ(GB)> * 0.05, 100)Host Rebuild Reserve は、単一ホストの故障回復のために予約されます。
その計算は、Operations Reserve から完全に独立しています。そのパーセンテージは、クラスター内の総ホスト数に対するホスト1台の容量によって計算され、N+1 設計戦略をサポートします。vSAN において、HRR はホストの数が増えるにつれて減少します。
例:
新しいクラスターのための予約済み容量(Operations Reserve または Operations Reserve + Host Rebuild Reserve)を決定するには、vSAN ReadyNode Sizer または VxRail Sizer を使用してください。これらのツールは、vSAN のバージョン固有の最適化やコーナーケース(例:小規模クラスターにおいて予約済み容量を 30% 未満に制限するなど)を考慮に入れているためです。予約済み容量を計算する際の詳細については、「Understanding Reserved Capacity Concepts in vSAN」を参照してください。
このページにおいて、vSAN Ops 閾値と Host Rebuild 閾値は以下のように定義されます:
注: VMC 環境など、Host Rebuild Reserve 機能が不要なケースでは、Host Rebuild 閾値は vSAN Ops 閾値と等しくなることがあります。
閾値の定義は以下の通りです:
Host Rebuild Reserve が無効な場合:
Host Rebuild Reserve が有効な場合:
注: カスタム閾値が構成されている場合、それはデフォルトの vSAN 容量健全性の閾値よりも優先されます。ユーザー定義の値が常に優先されます。詳細については、「Configure Reserved Capacity for vSAN Cluster」を参照してください。
Q: エラー状態のトラブルシューティングと修正はどのように行いますか?
最初のステップは、すべてのストレージが有効であり、容量デバイスが不足していないことを確認し、vSANデータストアの容量が想定通りであることを確認することです。完全な vSANデータストアの状態を復旧するには、以下の3つのオプションがあります:
English version: vSAN Health Service - Capacity utilization - Storage space