vSAN ノードのメンテナンス モードの進行段階の割合
search cancel

vSAN ノードのメンテナンス モードの進行段階の割合

book

Article ID: 419330

calendar_today

Updated On:

Products

VMware vSAN

Issue/Introduction

免責事項:これは英文の記事「Maintenance Mode % progress stages in vSAN nodes.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

 

この記事では、vSAN ノードがメンテナンス モードに入るときに実行されるプロセスに関する情報と、各段階に関連するトラブルシューティングの手順について説明します。

症状:

vSAN 対応の ESXi ホストでは、ジョブの完了に長い時間がかかったり、特定の % を超えるジョブの完了に失敗したりする場合があります。

Environment

VMware vSAN 7.0.x

VMware vSAN 8.0.x

Cause

vSAN 対応の ESXi ホストをメンテナンス モードにすると、さまざまな影響が生じ、実行されるプロセスは、選択したメンテナンス モード オプション (完全なデータ退避、アクセシビリティの確保、アクションなしなど) によって異なります。

Resolution

各パーセンテージで発生する処理の概要:

 

0% - タスク初期化

  • タスクが長時間この % のままである場合、vCenter に問題があるか、vCenter とホスト間の通信に問題があることを示している可能性があります。

2% - 事前チェック

  • ホストがメンテナンス モードに入るのを妨げる可能性のある HA/DRS 設定がある場合、タスクはこの % でハングする可能性があります。

19% - vMotionによるVMの退避

  • タスクがこの % で停止している場合は、残りの VM を手動で移動してみる必要があります。これにより、現在の状態では移行できない (または移行すべきでない) 理由が示されます (例: GPU などのパススルー デバイス、CD/DVD デバイスで ISO が利用できなくなった、他のホストで VM ネットワークが利用できない、VM ディスクがローカル専用のデータストアに保存されている、アフィニティ/アンチアフィニティ ルール、宛先ホスト上のコンピューティング リソースが不十分 (不足、予約、または HA フェイルオーバーの予約設定が原因))。

20%~100% - 他ホストへのデータの再同期/移行

  • これには、a) 他のノードにコピーする必要があるデータの量と、b) コンポーネントの配置に使用できるストレージ リソースに応じて長い時間がかかる場合があります。
  • このステップの実行中、ノードのCMMDS NODE_DECOM_STATEの内容は「decomState」: 4になります。
  • どのデータオブジェクトをまだ移動する必要があるかに関する詳細情報は、CMMDS内の影響を受けるオブジェクトのリスト(「affObjList」)から確認できます。
    # cmmds-tool find -t NODE_DECOM_STATE -u <UUID of node> -f json 

 

 

 

 

 

Additional Information

さらに、vSAN メンテナンス モードの進行状況は、/var/log/clomd.log にある Clomd.log から監視できます。次のようなメッセージが表示されます: 

2020-12-07T20:33:44.919Z 66970 (182601487232)(opID:0)CLOM_ProcessDecomUpdate: Node 00000000-0000-0000-0000-000000000000 state change. Old:DECOM_STATE_NONE New:DECOM_STATE_ACTIVE Mode:1 JobUuid:00000000-0000-0000-0000-000000000000
2020-12-07T20:33:45.446Z 66970 (182601487232)(opID:0)CLOM_ProcessDecomUpdate: Node 00000000-0000-0000-0000-000000000000 state change. Old:DECOM_STATE_ACTIVE New:DECOM_STATE_INITIALIZED Mode:1 JobUuid:00000000-0000-0000-0000-000000000000
2020-12-07T20:33:45.447Z 66970 (182601487232)(opID:0)CLOM_ProcessDecomUpdate: Node 00000000-0000-0000-0000-000000000000 state change. Old:DECOM_STATE_INITIALIZED New:DECOM_STATE_DOM_READY Mode:1 JobUuid:00000000-0000-0000-0000-000000000000
2020-12-07T20:36:16.244Z 66970 (182601487232)(opID:0)CLOM_CrawlerInit: Starting crawler in CRAWLER_PERIODIC mode
2020-12-07T20:38:16.262Z 66970 Obj b0e0485c-81dc-5b68-b021-0025b501006d has intermediate leaves or is not complete. incompleteCmmdsState: 1. nIntermediateLeafs: 0
2020-12-07T20:44:16.525Z 66970 (182601487232)(opID:0)CLOM_ProcessDecomUpdate: Node 00000000-0000-0000-0000-000000000000 state change. Old:DECOM_STATE_DOM_READY New:DECOM_STATE_PREP_COMPLETE Mode:1 JobUuid:00000000-0000-0000-0000-000000000000
2020-12-07T20:44:25.898Z 66970 (182601487232)(opID:0)CLOM_ProcessDecomUpdate: Node 00000000-0000-0000-0000-000000000000state change. Old:DECOM_STATE_PREP_COMPLETE New:DECOM_STATE_COMPLETE Mode:1 JobUuid:00000000-0000-0000-0000-000000000000

進行状況が開始されると DECOM_STATE が初期化済みとしてマークされ、終了すると DECOM_STATE が完了としてマークされます。

ホストとの通信がないために、進行状況 % が 68 になってタイムアウトになる可能性もあります。 ホストのタスク/イベントで以下のメッセージを確認してください。

これが表示される場合は、vCenter に記録されたタイムスタンプ付近のメンテナンス モードに関連するメッセージが hostd、vobd、vmkernel にないか確認してください。 この時点でメンテナンス モードに関連するメッセージが表示されない場合は、vCenter からホストへの要求が受信されていません。