vSAN 健全性サービス - データの健全性 – vSAN オブジェクトの健全性
search cancel

vSAN 健全性サービス - データの健全性 – vSAN オブジェクトの健全性

book

Article ID: 315658

calendar_today

Updated On:

Products

VMware vSAN

Issue/Introduction

この記事では、vSAN 健全性サービスの [データの健全性 – vSAN オブジェクトの健全性] チェック、およびエラー報告がされる場合について、理由の詳細を説明します。

Symptoms:
免責事項:これは英文の記事「vSAN Health Service - Data Health – vSAN Object Health (2108319)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

Environment

VMware vSAN 8.0.x
VMware vSAN 7.0.x

Resolution

Q:[データの健全性 – vSAN オブジェクトの健全性] チェックでは何を行いますか。

オブジェクトの健全性チェックは、ひと目で 2 つの側面がわかるように設計されています。
  1. クラスタ内のすべてのオブジェクトの要約が示され、クラスタの全体像がわかります。
  2. オブジェクトの健全性は分類されるため、オブジェクトが健全か不健全かを評価するだけでなく、それがユーザーにとって何を意味するのか、アクションが必要なのか、リスクにさらされているのか、などを評価するのに役立ちます。

Q:エラー状態とは、どのような状況を意味しますか。

これらは、オブジェクトが健全でない場合になりうる可能性のある状態です。

データの移動:vSAN はデータを ESXi ホスト上と、クラスタ内のストレージにも構築しています。これは、ある種のメンテナンス モードや退避を要求したため、またはアクティビティを再分散しているためです。この状態のオブジェクトは、ポリシーに完全準拠しており健全ですが、vSAN がこれらをアクティブに再構築しています。オブジェクトがリスクにさらされているわけではないため、心配いりません。ただし、オブジェクトがこの状態である間は、パフォーマンスの影響が予測されます。アクティブ データの同期アクティビティの詳細については、コンポーネントの再同期を相互参照してください。

健全:オブジェクトは完全な状態で、ポリシーに完全準拠しており、現在移動中ではなく、作業対象にもなっていません。

アクセス不可:オブジェクトでは、許容されるように構成された数を超える(永続的または一時的な)障害が発生しており、現在使用できず、アクセスできません。障害が一時的でない場合(例:ESXi ホストの再起動)、このようにアクセスできない状態の間はこれらのオブジェクトを使用する仮想マシンが適切に機能できないため、できるだけ早急に、障害の発生した ESXi ホスト、障害の発生したネットワーク、削除されたディスクなどの、根本原因に取り組み、使用できる状態を復旧する必要があります。

可用性に関係しない非準拠:これは、その他の状態がいずれも該当しない場合にすべてを取得する状態です。この状態のオブジェクトは、ポリシーに準拠していませんが、可用性ポリシー (NumberOfFailuresToTolerate) は満たしています。現在、この状態が該当する場合を説明したドキュメントはありません。

可用性に関係しない再構成:vSAN は、ESXi ホスト上とクラスタ内のストレージでデータを再構築しています。これは、可用性に関係しないストレージ ポリシーの変更を要求したためです。つまり、そのようなオブジェクトは NumberOfFailuresToTolerate ポリシーに完全準拠しており、データの移動は NumberOfDiskStripesPerObjectなどの別のポリシーの変更を満たすためです。この状態のオブジェクトは、リスクにさらされているわけではないため、心配いりません。

可用性低下 - アクティブな再構築:オブジェクトでは障害が発生しましたが、障害を許容できるように構成されていました。I/O のフローは継続し、オブジェクトにはアクセスできます。vSAN は、新しいコンポーネントを再構築することでオブジェクトを準拠した状態に戻し、オブジェクトの再保護にアクティブに取り組んでいます。

可用性低下(再構築なし):オブジェクトでは障害が発生しましたが、VSAN で許容できる範囲でした。たとえば、I/O のフローは継続し、オブジェクトにはアクセスできます。ただし、VSAN はオブジェクトの再保護に取り組んでいません。これは遅延タイマー(可用性低下 - 再構築なし - 遅延タイマー)が原因ではなく、別の理由によるものです。考えられる原因としては、クラスタ内に十分なリソースがない、または過去に十分なリソースがなかった、過去に再保護すべき障害があったが VSAN がまだ再試行していない、などが考えられます。いずれかのリソースが枯渇している可能性がある場合は、最初の評価での制限健全性チェックを参照してください。後に続く障害から完全に保護された状態に戻すには、できるだけ早急に障害を解決するかリソースを追加する必要があります。

可用性低下(再構築なし) - 遅延タイマー:オブジェクトでは障害が発生しましたが、vSAN で許容できる範囲でした。I/O のフローは継続し、オブジェクトにはアクセスできます。ただし vSAN は、再保護を発行する前に、60 分間(デフォルト)の遅延タイマーが切れるのを待機しているため、オブジェクトの再保護にまだ取り組んでいません。

障害が発生したエンティティが遅延期間中にリカバリできないことがわかっている場合は、明示的な要求を発行して遅延タイマーをスキップし、再保護をただちに開始することができます。

ただし、障害が発生したホストがアクティブに再起動しているとわかっている場合や、間違ったドライブが誤って引き抜かれた後に再挿入されたとわかっている場合は、オブジェクトを完全に再保護する最も早い方法であるため、これらのタスクが完了するまで待機することをお勧めします。

Q:どのようにエラー状態をトラブルシューティングして修正しますか。

前述のリストでオブジェクトの状態を確認すると、オブジェクトの観点から、vSAN クラスタでどのようなアクティビティが発生しているか、何か是正措置を行う必要があるかどうかがわかります。

オブジェクトの状態について不明な点がある場合や、オブジェクトが想定外の状態になっている場合は、VMware サポートにお問い合わせください。詳細については、「How to file a Support Request in Customer Connect (2006985)」を参照してください。


Additional Information