免責事項:これは英文の記事「Supervisor Cluster Stuck in “Configuring” State Due to Stale ESXi Task Error: ServerFaultCode – The object 'vim.Task:<task-id>' has already been deleted or has not been completely created」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
本記事では、vSphere with Tanzu 環境において、Supervisor クラスタ が Configuring 状態のまま進行しなくなる問題について説明します。この事象は、ESXi ホスト上でタスクが既に存在しない、または完全に作成されていないことに関連した一般的なシステムエラーを伴うことがあります。
本記事では、その原因と、Supervisor クラスタを正常な状態へ復旧するための推奨解決策について解説します。
以下のいずれか、または複数の症状が確認される場合があります。
Kubernetes Worker Node is schedulable: A general system error occurred. Error message: waiting for node <node-name> to move to ready state.
Kubernetes Worker Node commit work done in vSphere: A general system error occurred. Error message: ServerFaultCode: The object 'vim.Task:<task-id>' has already been deleted or has not been completely created.
VMware vSphere Kubernetes Service
VMware vSphere with Tanzu
この問題は、ESXi ホストの管理レイヤー(hostd)内に古いタスク参照が残存している場合に発生します。
この古いタスクが原因で、実際にはノードが正常であるにもかかわらず、vCenter Server が Kubernetes ワーカーノードがまだ Ready 状態へ遷移中であると誤って判断してしまいます。
この状況は、ESXi におけるタスクのクリーンアップが中断されたり、不完全なまま終了した場合に発生することが一般的です。
本問題を解決するには、影響を受けている ESXi ホスト上で hostd 管理サービスを再起動し、残存している古いタスク情報をクリアしてください。
/etc/init.d/hostd restart
vim-cmd vimsvc/task_list