免責事項:これは英文の記事「Alarm on NSX Manager "Manager Disk usage High"」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
NSX Manager Web GUIに、「マネージャ ノードのディスク パーティション / のディスク使用率が 80% に達しています。これは、80% の高しきい値に達しているか、超えています。」という説明のアラームが表示されます。
root@NSXTMGR:~# df -hFilesystem Size Used Avail Use% Mounted onudev 24G 0 24G 0% /devtmpfs 4.8G 1.6M 4.8G 1% /run/dev/sda2 11G 6.4G 3.3G 66% /tmpfs 24G 50M 24G 1% /dev/shmtmpfs 5.0M 0 5.0M 0% /run/locktmpfs 24G 0 24G 0% /sys/fs/cgroup/dev/sda1 942M 7.1M 870M 1% /boot/dev/sda3 11G 24K 9.7G 1% /os_bak/dev/mapper/nsx-config 29G 114M 28G 1% /config/dev/mapper/nsx-config__bak 29G 24K 28G 1% /config_bak/dev/mapper/nsx-image 42G 16G 25G 39% /image/dev/mapper/nsx-repository 31G 9.0G 21G 31% /repository/dev/mapper/nsx-secondary 98G 3.3G 90G 4% /nonconfig/dev/mapper/nsx-tmp 3.7G 14M 3.5G 1% /tmp/dev/mapper/nsx-var+dump 9.3G 24K 8.8G 1% /var/dump/dev/mapper/nsx-var+log 27G 24G 2.3G 92% /var/log ----------> 27GBのうち約24GB使用tmpfs 4.8G 0 4.8G 0% /run/user/1007
root@NSXTMGR:~# du -hsx /var/log/* | sort -rh | head -1514G /var/log/cloudnet <------------ Cloudnetディレクトリの消費量が増加している2.8G /var/log/journal1.1G /var/log/vmware1014M /var/log/corfu821M /var/log/proton502M /var/log/proxy475M /var/log/messaging-manager430M /var/log/async-replicator378M /var/log/search289M /var/log/idps-reporting286M /var/log/site-manager266M /var/log/cbm176M /var/log/corfu-nonconfig175M /var/log/cm-inventory150M /var/log/stats
nsx-ccp ログはローテーションされておらず、.gz ファイルが見当たりません。
root@NSXTMGR:/var/log/cloudnet# ls -lthr-rw-r----- 1 nsx nsx 101M Jan 23 19:55 nsx-ccp-20250123-195552954.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195602167.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195611827.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195621245.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195631156.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195641663.log-rw-r----- 1 nsx nsx 101M Jan 23 19:56 nsx-ccp-20250123-195651234.log-rw-r----- 1 nsx nsx 101M Jan 23 19:57 nsx-ccp-20250123-195700565.log-rw-r----- 1 nsx nsx 101M Jan 23 19:57 nsx-ccp-20250123-195710860.log-rw-r----- 1 nsx nsx 101M Jan 23 19:57 nsx-ccp-metrics-20250123-195720149.log-rw-r----- 1 nsx nsx 101M Jan 23 19:57 nsx-ccp-20250123-195721033.log-rw-r----- 1 nsx nsx 101M Jan 23 19:57 nsx-ccp-20250123-195730390.log-rw-r----- 1 nsx nsx 101M Jan 24 01:51 nsx-ccp-20250124-015129679.log-rw-r----- 1 nsx nsx 101M Jan 24 07:38 nsx-ccp-metrics-20250124-073820148.log-rw-r----- 1 nsx nsx 101M Jan 24 09:30 nsx-ccp-20250124-093010104.log-rw-r----- 1 nsx nsx 101M Jan 24 13:31 nsx-ccp-metrics-20250124-133120113.log-rw-r----- 1 nsx nsx 101M Jan 24 17:21 nsx-ccp-20250124-172148655.log-rw-r----- 1 nsx nsx 101M Jan 24 19:24 nsx-ccp-metrics-20250124-192420110.log-rw-r----- 1 nsx nsx 101M Jan 25 01:16 nsx-ccp-20250125-011652028.log-rw-r----- 1 nsx nsx 101M Jan 25 01:17 nsx-ccp-metrics-20250125-011720086.log-rw-r----- 1 nsx nsx 101M Jan 25 07:09 nsx-ccp-metrics-20250125-070920173.log-rw-r----- 1 nsx nsx 101M Jan 25 09:13 nsx-ccp-20250125-091335828.log-rw-r----- 1 nsx nsx 101M Jan 25 13:02 nsx-ccp-metrics-20250125-130220162.log-rw-r----- 1 nsx nsx 101M Jan 25 17:12 nsx-ccp-20250125-171216615.log-rw-r----- 1 nsx nsx 101M Jan 25 18:55 nsx-ccp-metrics-20250125-185520128.log-rw-r----- 1 nsx nsx 101M Jan 25 23:57 nsx-ccp-20250125-235722385.log-rw-r----- 1 nsx nsx 101M Jan 26 00:48 nsx-ccp-metrics-20250126-004820113.log---------rw-r----- 1 nsx nsx 101M Feb 6 03:03 nsx-ccp-20250206-030350197.log-rw-r----- 1 nsx nsx 101M Feb 6 03:28 nsx-ccp-metrics-20250206-032820152.log
VMware NSX
->nsx-ccp.log に失敗例外が記録されています :(var/log/cloudnet)
2025-02-06T00:39:51.503Z INFO CCP-######-9919-4fd6-9404-######:worker-1 NettyConnection 1512 - [nsx@6876 comp="nsx-manager" level="INFO" subcomp="ccp"] Closing NettyConnection NettyConnection(NettyChannel(local=10.#.#.#:1235, remote=10.#.#.#:39834), active=false)2025-02-06T00:39:52.506Z WARN CCP-######-9919-4fd6-9404-#####:boss-0 DefaultChannelPipeline 1512 An exceptionCaught() event was fired, and it reached at the tail of the pipeline. It usually means the last handler in the pipeline did not handle the exception.io.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open files
#nsx-ccp.log に "Too many open files" という警告が継続的に表示されます。
io.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open filesio.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open filesio.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open filesio.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open filesio.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open filesio.netty.channel.unix.Errors$NativeIoException: accept(..) failed: Too many open files
これは NSX バージョン4.2未満で発生する既知の問題であり、NSX 4.2以降では修正されています。
一時的な回避策は、コントローラサービスを再起動することです。
注:サービスを再起動する前に、「/var/log/cloudnet」フォルダ内の古いログがクリーンアップされていることを確認してください。
root@NSXTMGR:~# /etc/init.d/nsx-ccp restart