vCenter Server Appliance の /storage/log 領域が 80% 以上となっている場合のトラブルシューティング
search cancel

vCenter Server Appliance の /storage/log 領域が 80% 以上となっている場合のトラブルシューティング

book

Article ID: 324262

calendar_today

Updated On:

Products

VMware vCenter Server

Issue/Introduction


免責事項:これは英文の記事「vCenter log disk exhaustion or /storage/log full (broadcom.com)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

この記事では、vCenter Server Appliance で /storage/log パーティションがひっ迫している場合のトラブルシューティングと解決方法について説明します。

Symptoms:

  • vCenter Server が次のようなエラーをレポートする
    • vSphere UI Health Alarm", "Log disk exhaustion on vcenter name
    • Database Health Alarm", "Core and Inventory Disk Exhaustion on vcenter name
  • vCenter Server が、503 Service Unavailable エラーでアクセスできない場合がある
  • vSphere Appliance Management Interface (VAMI) の [監視] > [ディスク] に /storage/log の使用率が 75% またはそれ以上であることが表示される
    • 75% 以上の使用率が継続すると 黄色 の警告ステータスをトリガーします
    • 85% に達すると 赤 のクリティカルアラームをトリガーします
  • VAMI の サマリ > 健全性ステータス > ストレージ にて、次のようなエラーをレポートする
    • Health Status: "File system /storage/log is low on storage space. Increase the size of disk /storage/log."
  • vCenter からは、Skyline Health などの vSAN 関連オプションを表示できない場合があります。

Environment

VMware vCenter Server Appliance 6.0.x
VMware vCenter Server Appliance 6.5.x
VMware vCenter Server Appliance 6.7.x
VMware vCenter Server 7.0.x
VMware vCenter Server 8.0

Cause

以下の潜在的な要因があります。
  • vCenter Server ログ バンドルが生成後にクリアされない
  • 非常に高い頻度で大量のイベントのログ出力がある
  • Apache Tomcat Java Servlet サービスなどのサービスでのファイルのクリーンアップの失敗
  • /storage/log パーティションのサイズが不足している

Resolution

次の手順にて vCenter Server の /storage/log 領域を枯渇させている事象を調査します。

  1. root 権限を持つユーザで vCenter Server Appliance へ SSH ログインします。
  2. /storage/log ディレクトリへ移動します。
    # cd /storage/log
  3. 容量の大きなファイルの確認のため、次のコマンドを実行します。
    # find . -type f -print0 | xargs -0 du -h | sort -rh | head -n 10 

    このコマンドはディレクトリ内のサイズの大きい上位 10 ファイルをリストします。出力の例は以下になります。
       3.7G    ./vmware/wcp/stdstream.log-2.stderr
       2.5G    ./vmware/wcp/stdstream.log-1.stderr
       266M    ./vmware/wcp/stdstream.log.stderr
       190M    ./vmware/vpxd/vpxd-profiler-154.log
       104M    ./vmware/procstate
       101M    ./vmware/vsphere-ui/logs/threadmonitor1.log
       83M     ./vmware/wcp/stdstream.log-4.stderr
       46M     ./vmware/vpxd-svcs/perf.log.37
       45M     ./vmware/sso/ssoAdminServer.log
       41M     ./vmware/vsphere-ui/logs/threadmonitor.log
  4. ファイル数の多いディレクトリの確認のため、次のコマンドを実行します。
    # find ./ -type d -exec sh -c 'echo -n "{}: " && find "{}" -type f | wc -l' \; | awk '$2 > 100' | sort -k2,2nr 

    このコマンドは 100 以上のファイルを含むディレクトリをファイル数の多い順にリストします。出力の例は以下になります。
       ./: 1442
       ./etc: 486
       ./etc/vmware: 366
       ./var: 321
       ./var/run: 275
       ./var/log: 274
       ./usr: 108


  5. 容量を多く消費している要因を、これらの容量の大きなファイルやファイル数の多いディレクトリの確認結果より調査します。
  6. 調査結果より、以下の既知事象に該当する問題が無いかを確認します。
    影響のあるバージョン 関連する KB のリンク
    6.0

    6.0 Update 3 未満
    6.5 Update 1 未満

    7.0 Update 1C 未満
    7.0 Update 3c 未満
    7.0 Update 3o 未満
    8.0 Update 1 未満
    7.0, 8.0 の最新バージョンでも未解消
    7.0 Update 1 
     - 7.0 Update 3 にて一部修正
     - 8.0 にて修正
    7.0 Update 2
     - 7.0 Update 3 にて修正
    8.0。 
     - 8.0 Update 3 にて修正
    すべてのバージョン
  7. これら既知の事象に該当する問題を確認できず、また各コマンドの結果にてひっ迫の要因を確認できなかった場合、/storage/log のサイズがログの出力量に対して不足している可能性があります。
    その際は vCenter Server Appliance disk space is full(318953)を参照し、/storage/log の仮想ディスクの拡張を検討してください。
 



Additional Information

vCenter Server Appliance disk space is full (318953)
vCenter Server /storage/log filling up due to localhost_access.log and catalina.log in sso and lookupsvc log directories(318209)

Impact/Risks:
デフォルトの設定で、/storage/log パーティションの使用率が 75% に達した状態が 10 分継続した時:
  • ディスク使用率のアラームがトリガされます。
誤って重要なファイルを削除した場合、 vCenter Server Appliance が正常に動作しなくなる場合があります。
vCenter Server Appliance の仮想ディスクのサイズ変更はデータ破損を発生させる場合があります。


WARNING: 上記の理由により、ファイルの削除またはディスクのサイズ変更を行う直前に vCenter Server Appliance の適切なバックアップ(ファイルベースバックアップまたは VADP によるバックアップ)を作成してください。

 

==============================================

Resolution に記載の find コマンドに加えて、下記の du コマンドもファイルシステム内の容量の大きいディレクトリを速やかに特定するのに役立ちます:

du -xh -d 1 | sort -rh
  • このコマンドを実行し、続けて 'cd' コマンドにてファイルシステム内の容量の大きいサブディレクトリへ移動します。
  • 再度 du コマンドを実行し、ディスクを多く消費している原因を調査します。この手順を必要なだけサブディレクトリ内で繰り返します。
    • OPTIONAL:  '-d' オプションの値を変更することで、コマンドで出力するディレクトリの階層を増やすことができます。'-d 1' の場合はカレントディレクトリから 1 階層まで表示することができます。表示するディレクト数を 1 増やすことで、より速やかにディレクトリを評価できます。 
  • ディスク消費量の多いディレクトリの確認が終わったら、'ls -lsah' コマンドを実行し、ディレクトリ内のファイルをリストします。 
    • ディスク領域の使用率が高くなった原因となる大きなファイルまたは多数のファイルがあるかどうかを特定し、必要に応じて対処をします。