vSAN クラスタのシャットダウンと起動後、vCLS 仮想マシンがパワーオンされない
search cancel

vSAN クラスタのシャットダウンと起動後、vCLS 仮想マシンがパワーオンされない

book

Article ID: 430473

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

Symptoms:

/var/log/vmware/eam/eam.log に次のようなログが出力されます。

ERROR | cluster-agent-3 | AuditedJob.java | 106 | JOB FAILED: [#440855571] InstallClusterAgentJob(ClusterAgent(ID: 'Agent:3861f614-b6e3-4ae1-a9c8-0f1b321157a3:null'))
com.vmware.eam.agent.crud.PreCheckException: Host HostSystem:host-1009 not fully operational. ClusterAgent(ID: 'Agent:3861f614-b6e3-4ae1-a9c8-0f1b321157a3:null')
 at com.vmware.eam.agent.crud.impl.PreCheckBase.wrapHostNotOperational(PreCheckBase.java:386) ~[eam-server.jar:?]
 at com.vmware.eam.agent.crud.impl.PreCheckBase.vmHostInstallCheck(PreCheckBase.java:330) ~[eam-server.jar:?]
 at com.vmware.eam.agent.crud.impl.PreCheckBase.installExistingVmCheck(PreCheckBase.java:185) ~[eam-server.jar:?]
 at com.vmware.eam.agent.crud.impl.InstallAgentPreCheck.check(InstallAgentPreCheck.java:65) ~[eam-server.jar:?]
 at com.vmware.eam.agent.crud.impl.PreCheckBase.execute(PreCheckBase.java:101) ~[eam-server.jar:?]
 at com.vmware.eam.agent.crud.impl.InstallAgentPreCheck.execute(InstallAgentPreCheck.java:24) ~[eam-server.jar:?]
 at com.vmware.eam.job.InstallAgentJob.runWorkflow(InstallAgentJob.java:150) ~[eam-server.jar:?]
 at com.vmware.eam.job.AgentWorkflowJob.call(AgentWorkflowJob.java:93) ~[eam-server.jar:?]
 at com.vmware.eam.job.AgentWorkflowJob.call(AgentWorkflowJob.java:48) ~[eam-server.jar:?]
 at com.vmware.eam.async.impl.AuditedJob.call(AuditedJob.java:58) [eam-server.jar:?]
 at com.vmware.eam.async.impl.FutureRunnable.run(FutureRunnable.java:55) [eam-server.jar:?]
 at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) [?:1.8.0_311]
 at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) [?:1.8.0_311]
 at java.lang.Thread.run(Thread.java:748) [?:1.8.0_311]

 


免責事項: これは英文の記事 vCLS Virtual Machines are not powered on after vSAN cluster shutdown and start の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

Environment

VMware vSphere ESXi 7.0.3
VMware vSphere ESXi 7.0.2

Cause

  • vSAN クラスタのシャットダウンワークフローで、vSAN は EAM サービス内で当該クラスタを無効化します。その結果、クラスタ内のすべての EAM 仮想マシンがパワーオフされ、EAM はクラスタ内ホストのPropertyCollector のリスナ (訳注: ホストのプロパティ情報の収集機能) を停止します。
  • その後 VCSA の再起動に伴い EAM が再起動されると、EAM はのホストの情報 (「パワーオン状態」かつ「メンテナンスモード」であること) を同期します。
  • この状態でホストをメンテナンスモードから解除しても、EAM 側にはホストを監視するリスナが存在しないため、EAM この状態変更を検知できません。
  • 次に、EAM サービス内で該当クラスタが有効化されます。これにより、EAM がホストに新しいリスナを作成し、仮想マシンをパワーオンできるようになります。
  • しかし現行の事前チェックの実装では、ホストの状態が古い (stale) ままであると判断され、EAM は vCLS 仮想マシンをパワーオンしません。
  • さらに、本件のようにクラスタが無効化された状態で再起動が発生した場合、EAMはホストにリスナをアタッチしません。その結果、EAM は古いホスト状態の値を保持したまま、無期限に処理がブロックされた状態に陥ります。

Resolution

この問題は VMware vSphere 7.0 U3o 以降で修正されています。


Workaround:

この問題を回避するには、vCenter Server のシェルで次のコマンドを実行して EAM を再起動します。

service-control --restart eam