VCF 診断ツール (VDT) による VKS Supervisor の健全性チェック
search cancel

VCF 診断ツール (VDT) による VKS Supervisor の健全性チェック

book

Article ID: 423666

calendar_today

Updated On:

Products

VMware vSphere Kubernetes Service

Issue/Introduction

免責事項: これは英文の記事 「Using the VCF Diagnostic Tool for vSphere Kubernetes Service (VKS/TKGs)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

 VCF診断ツール(VDT)は、VCSA上で実行され、SSH経由でスーパーバイザーノードに接続する診断ツールです。システム構成に対して一連のチェックを実行し、既知の構成問題に対して、ユーザーフレンドリーなPASS/WARN/FAILの結果を報告します。また、特定の領域に関する情報( INFO )メッセージ も提供し、不整合の検出を容易にします。これらのテストの目的は、ユーザーにとって見逃されやすい、環境に関する診断情報をリアルタイムで提供することです。  

このユーティリティは、VCSA 上の次のディレクトリにログを記録します。

/var/log/vmware/vks/vdt/

このツールの使用は、環境全体に対して変更は加えず完全に読み取り専用のため、ツール実行によるリスクはありません。

フィードバックや機能リクエストは [email protected] までお送りください。

免責事項:このスクリプトは現在ベータ版リリース段階です。
そのため、バグ、エラー、または不完全な機能が含まれている可能性があります。結果の活用にはご注意ください。

Environment

VCSA 8.x

Resolution

1. VCF 診断ツールの最新バージョンをダウンロード

下記KBの下部にある Attachments より 最新バージョンをダウンロードします。
https://knowledge.broadcom.com/external/article/344917

 

2. vCenter へのコピー

任意のファイル移動ユーティリティ(WinSCPなど)を使用して、VDTツールを対象スーパーバイザを管理するVCSAの/rootパーティションにコピーします。
VCSAへのファイル転送は失敗する場合があります。解決策については、次のKBを参照してください。
https://knowledge.broadcom.com/external/article/326317

 

3. vCenter にSSH で接続

4. vdt zip ファイルを vCenter 上で解凍

unzip vdt-<version>.zip
cd vdt-<version>

 

5. (オプション) 同一vCenter 配下に複数のスーパーバイザークラスタが存在する場合について

VCSAに複数のスーパーバイザクラスタが存在する場合、VKS-VDTはVCDBで最初に見つかったスーパーバイザを選択します。
選択するスーパーバイザは毎回同じとは限りません。特定のスーパーバイザに対してチェックを実行したい場合は、SUPERVISOR_NAME 環境変数を次のように設定してください。

# 対象スーパーバイザー名を確認
dcli com vmware vcenter namespacemanagement supervisors summary list | grep name
>         name: sv-1

# 対象スーパーバイザーとしてセット
export SUPERVISOR_NAME="EXACT_SUPERVISOR_NAME" # example: sv-1

 

6. 診断の開始

python vdt.py -p vks

Additional Information

サンプル出力

python vdt.py -p vks
___________________
   "VDT FOR VKS"
        Today: Tuesday, October 28 16:06:47
        Log Level: INFO
When running this tool, a log file is created and included in all future log bundles.  Would you like to continue?[Yy|Nn]: y

______________________
   VKS VCENTER INFO
        [INFO]    vCenter Basic Info
                    Current Time: 2025-10-28 16:07:13.225208
                    vCenter Uptime: up 2 days
                    vCenter Load Average: 0.35, 0.35, 0.26
                    Number of CPUs: 4
                    Total Memory: 20.5
                    vCenter Hostname: <VCSA_FQDN>
                    vCenter PNID:  <VCSA_FQDN>
                    vCenter IP Address: ###.###.###.###
                    vCenter Version: 8.0.3.00500 - 24674346

_______________________________
   VKS SUPERVISOR BASIC INFO
        [INFO]    VKS Basic Info
                    Supervisor Name: sv-1
                    Supervisor Version: v1.29.7+vmware.1-fips-vsc0.1.11-24658526
                    TKG Service Version: 3.4.0+v1.33
                    ESXi Node Count: 4
                    Installed Supervisor Services: 2
                    Namespace Count: 2
                    v1beta1 TKC Count: 1
                    v1alpha3 TKC Count: 0
        [INFO]    Supervisor Name Detection
                    Running VDT against Supervisor: sv-1.
                    If this is not the correct supervisor, please set the environment variable SUPERVISOR_NAME to the correct value.

____________________
   VKS WCP CHECKS
        [PASS]    VKS WCP Pending Upgrade Check
                    All versions are consistent - no pending upgrade detected.
                    - VMware-wcpovf: 24658526
                    - wcp_version: 24658526
                    - 423e9fb7d2849014e483cd76f5055b06: v1.29.7+vmware.wcp.1
                    - 423efe57d7bd36dcfebddc0486a48f86: v1.29.7+vmware.wcp.1
                    - 423e524f1c3f7d035ddc43115735707c: v1.29.7+vmware.wcp.1
________________________
   VKS SUPERVISOR VMS
        [PASS]    Supervisor Port 22 Check
        [PASS]    Supervisor Port 5000 Check
        [PASS]    Supervisor Port 6443 Check
        [PASS]    Supervisor Disk Space Check
        [FAIL]    Supervisor Certificate Check
                    /etc/vmware/wcp/tls/wcpagent.cert on 423e9fb7d2849014e483cd76f5055b06 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/mgmt-image-proxy.crt on 423e9fb7d2849014e483cd76f5055b06 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/apiserver-webhook-client.crt on 423e9fb7d2849014e483cd76f5055b06 expires in -1 days (2025-10-28).
                    /etc/kubernetes/pki/bootstrapper.crt on 423e9fb7d2849014e483cd76f5055b06 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/wcpagent.cert on 423efe57d7bd36dcfebddc0486a48f86 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/mgmt-image-proxy.crt on 423efe57d7bd36dcfebddc0486a48f86 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/apiserver-webhook-client.crt on 423efe57d7bd36dcfebddc0486a48f86 expires in -1 days (2025-10-28).
                    /etc/kubernetes/pki/bootstrapper.crt on 423efe57d7bd36dcfebddc0486a48f86 expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/wcpagent.cert on 423e524f1c3f7d035ddc43115735707c expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/mgmt-image-proxy.crt on 423e524f1c3f7d035ddc43115735707c expires in -1 days (2025-10-28).
                    /etc/vmware/wcp/tls/apiserver-webhook-client.crt on 423e524f1c3f7d035ddc43115735707c expires in -1 days (2025-10-28).
                    /etc/kubernetes/pki/bootstrapper.crt on 423e524f1c3f7d035ddc43115735707c expires in -1 days (2025-10-28).
                    Refer to KB https://knowledge.broadcom.com/external/article/322994
        [PASS]    Supervisor VM Node Configured Check
        [PASS]    Supervisor kubelet Status Check
        [PASS]    Supervisor containerd Status Check
        [PASS]    Supervisor wcp-sync Status Check
        [PASS]    Supervisor Core Container Running Check

________________________________
   VKS SUPERVISOR ETCD HEALTH
        [PASS]    etcd Running Check
        [PASS]    etcd Member List Check
        [PASS]    etcd Endpoint Health Check
        [PASS]    etcd Endpoint Status Check

____________________________
   VKS SUPERVISOR CLUSTER
        [PASS]    Supervisor VM Count
        [PASS]    Supervisor VIP Availability
        [PASS]    Supervisor Nodes Are Ready Check
        [PASS]    Supervisor VMs Roles Check

____________________________
   VKS SUPERVISOR OBJECTS
        [PASS]    Supervisor Clusters Status Check
                    All 1 clusters are provisioned and ready
        [PASS]    Supervisor Machines Status Check
                    All 2 machines are running
        [PASS]    Supervisor Nodes Status Check
                    All 7 nodes are ready
        [PASS]    Supervisor VMs Status Check
                    All 2 VMs are powered on
        [PASS]    Supervisor Package Installs Status Check
                    All 16 package installs are reconcile succeeded
        [PASS]    Supervisor Deployments Status Check
                    All 44 deployments are ready
        [PASS]    Supervisor PVCs Status Check
                    All 4 PVCs are bound
        [WARN]    Supervisor Pods Status Check
                    High restart pods:
                    kube-system/coredns-f98dcc884-s7kfs: 10 restarts
                    vmware-system-appplatform-operator-system/vmware-system-psp-operator-mgr-55589bd86-2fg9x: 12 restarts
                    vmware-system-csi/vsphere-csi-controller-578496977b-bdcfv: 43 restarts
                    (and 3 more)
        [PASS]    Supervisor Services/Endpoints Status Check
                    All 51 services are present
    ---
Report location: /var/log/vmware/vks/vdt/vdt-2025-10-28-160712.txt
JSON location:  /var/log/vmware/vks/vdt/vdt-2025-10-28-160712.json
Log location:  /var/log/vmware/vks/vdt/vdt.log
Feedback Contact: [email protected]
    ---