この記事では、vSAN 健全性サービスの [クラスタの健全性 – vSAN デーモンの稼動状態] チェックについて説明し、エラーが報告される原因の詳細について解説します。
CLOMD (Cluster Level Object Manager Daemon) は、vSAN クラスタの運用で主要な役割を果たします。これは、すべてのESXiホスト上で動作し、新規オブジェクトの作成、障害発生後の既存オブジェクトの修復開始、あらゆる種類のデータ移動および避難を担当します。(例: メンテナンスモードへの移行、vSANからのディスク取り外し時のデータ避難、バランス維持とそれに伴う再調整のトリガー、ポリシー変更の実装など)
実際のデータパスには関与しませんが、データパス操作をトリガーするため、多くの管理ワークフローや障害処理シナリオにおいて重要なコンポーネントです。
仮想マシンのパワーオンや vSAN への Storage vMotion は(そのようには見えませんが)CLOMD が必要となる 2 つの操作です。これらの操作では、スワップオブジェクトの作成が必要であり、オブジェクトの作成には CLOMD が必要なためです。
同様に、vSAN 6.0 以降では、メモリ スナップショットがオブジェクトとして維持されるため、メモリ状態を持つスナップショットを作成する場合にも CLOMD が必要です。
EPD (Entry Persistence Daemon) は、vSAN クラスタを構成する各ホスト上で動作するユーザー空間デーモンです。EPD の主な役割は、オブジェクトの削除時にコンポーネントのリーク(残存)が発生しないようにすることです。
CMMDSD (Cluster Monitoring, Membership, and Directory Service Daemon) は、CMMDS のディレクトリ内容を永続化するためのデーモンです。CMMDS ユーザーワールドプロセスのロードを行い、CMMDS へのインターフェースを提供します。CMMDS は、クラスタへのリンク監視を担い、クラスタメタデータの主要な配信基盤(ファブリック)として機能します。また、クラスタの健全性やネットワークリンクの状態維持も担います。他のモジュールは、この情報を利用して、どのノードがクラスタに参加しているか、また各ノードのどのインターフェースが正常であるかを判断します。
バージョン 8.0U2 以降、この健全性チェックに OSFSD と CMMDSTIMEMACHINED が追加されました。8.0U2 より前のバージョンでは、これらは健全性チェックに表示されません。
OSFSD (Object Store File System Daemon) は、仮想マシンデータの格納と管理を行う分散ファイルシステムを提供する、ESXi ホスト上で動作するデーモンです。これにより、vSAN は主要なストレージ機能に加え、ファイルサービスを提供することが可能になります。
CMMDSTIMEMACHINED (Cluster Monitoring, Membership, and Directory Service Time Machine Daemon) は、オブジェクトバージョンの履歴メタデータ記録を維持する、ESXi ホスト上で動作するデーモンです。メタデータの変更を以前のバージョンにロールバックする手段を提供することで、vSAN クラスタがメタデータの不整合から回復することを可能にします。
VMware vSAN (All Versions)
Q:[クラスタの健全性 – vSAN デーモンの稼動状態(旧称: CLOMD 稼動状態)]チェックは何を判定するものですか?
このチェックは、CLOMD、EPD、CMMDSD、OSFSD(8.0 U2 で追加)、および CMMDSTIMEMACHINED(8.0 U2 で追加)が正常に動作しているかどうかを確認します。 CLOMD については、まずすべての ESXi ホストでサービスが実行されているかを確認し、次にサービスに通信してランタイム統計を取得することで、CLOMD が問い合わせに応答できる状態であることを検証します。EPD、CMMDSD、OSFSD、および CMMDSTIMEMACHINED については、すべての ESXi ホストでサービスが適切に実行されているかどうかを確認します。
注: このチェックは、前述したすべての機能(例: オブジェクトの作成、リバランシングなど)が実際に動作することを保証するものではありません。あくまで CLOMD、EPD、CMMDSD、OSFSD、および CMMDSTIMEMACHINED の各サービスが健全であるかどうかの「一次診断(ファーストレベルのアセスメント)」を行うものです。
Q: エラー状態は何を意味していますか?
vSAN デーモンに何らかの問題が発生している可能性があります。このテストは、それらが稼働し続けているかを確認するための極めて基本的なチェックです。 もしこのチェックでエラーが報告された場合、CLOMD、EPD、CMMDSD、OSFSD、または CMMDSTIMEMACHINED のいずれかのサービスが期待通りに動作していません。該当する ESXi ホスト上で状態を確認する必要があります。
CLOMD の健全性をさらに詳しく調査するには、仮想マシンの作成テスト(プロアクティブテスト)の実行が有効です。これにはオブジェクトの作成が含まれるため、CLOMD の機能を網羅的にテストすることができます。
Q: エラー状態のトラブルシューティングと修正はどのように行いますか?
標準的なクラスター構成では、すべてのノードにおいて CLOMD、EPD、CMMDSD、OSFSD、および CMMDSTIMEMACHINED のすべてのサービスが実行されている必要があります。
ストレッチクラスタ(Stretched Clusters)およびメタデータクラスタ(Metadata Clusters)については、各ノードで該当サービスが実行されているべきかどうか、以下の表を参照してください。
| Data node of stretched cluster | Witness node of stretched cluster | Data node of metadata cluster | Metadata node of metadata cluster | |
| CLOMD | Yes | No | Yes | Yes |
| EPD | Yes | No | Yes | No |
| CMMDSD | Yes | Yes | Yes | Yes |
| OSFSD | Yes | No | Yes | No |
| cmmdsTimemachined | Yes | No | Yes | No |
チェックが行われていない ESXi ホストのデーモンステータスは、"--" と表示されます。
特定の ESXi ホストで CLOMD、EPD、CMMDSD、OSFSD、または CMMDSTIMEMACHINED サービスが実行されていない場合、そのホストの該当サービスのステータスは異常(Abnormal) となります。
このテストを正常に完了させるには、ESXi ホストにヘルスサービスがインストールされており、かつ各サービス(CLOMD、EPD、CMMDSD、OSFSD、CMMDSTIMEMACHINED)が実行されている必要があります。ESXi ホスト上で各サービスの状態を確認するには、次のコマンドを実行してください。
/etc/init.d/cmmdsd status && /etc/init.d/epd status && /etc/init.d/clomd status && /etc/init.d/cmmdsTimeMachine status && /etc/init.d/osfsd status && /etc/init.d/vsanmgmtd status
デーモンが実行されていない場合は、該当する ESXi ホストで再起動コマンドを試行してください。
/etc/init.d/cmmdsd restart && /etc/init.d/epd restart && /etc/init.d/clomd restart && /etc/init.d/cmmdsTimeMachine restart && /etc/init.d/osfsd restart && /etc/init.d/vsanmgmtd restart
これらの手順を実施しても [vSAN デーモンの稼動状態] チェックが失敗する場合、またはこのエラーが頻繁に発生し続ける場合は、Broadcom サポートへお問い合わせください。
詳細については、次の URL を参照してください: Creating and managing Broadcom support request (SR) cases
English version: vSAN Health Service - Cluster Health – vSAN daemon liveness check