コミット テーブルの要素数が 10 万を超えており、何時間経過しても減少しない(以下のスクリプト 2 を参照)
または
以下のいずれかの状況に一致する。
LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME" maximum Memory congestion reached.LSOM: LSOM_ThrowCongestionVOB:3429: Throttled: Virtual SAN node "HOSTNAME"maximum Memory congestion reachedwhile true; do echo "================================================"; date; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do echo $ssd;vsish -e get /vmkModules/lsom/disks/$ssd/info|grep Congestion;done; for ssd in $(localcli vsan storage list |grep "Group UUID"|awk '{print $5}'|sort -u);do llogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by LLOG"|awk -F \: '{print $2}');plogTotal=$(vsish -e get /vmkModules/lsom/disks/$ssd/info|grep "Log space consumed by PLOG"|awk -F \: '{print $2}');llogGib=$(echo $llogTotal |awk '{print $1 / 1073741824}');plogGib=$(echo $plogTotal |awk '{print $1 / 1073741824}');allGibTotal=$(expr $llogTotal \+ $plogTotal|awk '{print $1 / 1073741824}');echo $ssd;echo " LLOG consumption: $llogGib";echo " PLOG consumption: $plogGib";echo " Total log consumption: $allGibTotal";done;sleep 30; done ;
出力例:
529dd4dc-####-####-####-############### memCongestion:### >> This value will be higher than 0 slabCongestion:0 ssdCongestion:0 iopsCongestion:0 logCongestion:0 compCongestion:0 memCongestionLocalMax:0 slabCongestionLocalMax:0 ssdCongestionLocalMax:0 iopsCongestionLocalMax:0 logCongestionLocalMax:0 compCongestionLocalMax:0スクリプト 2:「コミットテーブルの要素数 」の現在の値を確認する
529dd4dc-####-####-####-###############
LLOG consumption: 0.270882 PLOG consumption: 0.632553 Total log consumption: 0.903435
vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"
ホスト上の 2 つのディスクグループの出力例(キャパシティディスクは無視します):
529395f3-####-####-####-###############/ Number of elements in commit tables:300891 >> Disk Group affected ( = Value > 100K )
526709f4-####-####-####-###############/ Number of elements in commit tables:289371 >> Disk Group affected ( = Value > 100K )
大量のコミット テーブル エントリによる LSOM メモリの輻輳。
スクラバ構成値は、vSAN 6.7 P04 および vSAN 7.0 U1 P02 リリースで変更され、より高い頻度でオブジェクトをスクラブします。
これにより、各オブジェクトのスクラバの進行が以前よりも頻繁に持続します。
クラスタにアイドル状態のオブジェクトがある場合、スクラバによって作成されたこれらのオブジェクトのコミット テーブル エントリは LSOM に累積されます。
最終的に、累積によって LSOM メモリの輻輳が発生します。
このコンテキストでのアイドル オブジェクトとは、関連付けられていないオブジェクト/パワーオフになっている仮想マシン/レプリケートされたオブジェクトなどを意味します。
これは、次の vSphere/vSAN リリースで発生します。
Workaround セクションを確認して手順を実行します。
VMware エンジニアリング チームはこの問題を認識しており、vSAN 6.7 P05 および vSAN 7.0 U2 GA で修正をリリースしました。
注:ユーザーが LSOM メモリの輻輳を事前に確認していない場合でも、次の設定変更を適用することを推奨します。
# esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear
# esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin
すでに高いメモリ輻輳の問題が発生しているすべてのホストを修正するには、「コミット テーブルの要素数」をクエリして、以下の手順を実行することを推奨します。
# vsish -e ls /vmkModules/lsom/disks/ 2>/dev/null | while read d ; do echo -n ${d/\//} ; vsish -e get /vmkModules/lsom/disks/${d}WBQStats | grep "Number of elements in commit tables" ; done | grep -v ":0$"
ホスト上の 2 つのディスクグループの出力例:
52f395f3-03fd-f005-bf02-40287362403b/ Number of elements in commit tables:300891 526709f4-8790-8a91-2151-a491e2d3aec5/ Number of elements in commit tables:289371
# esxcfg-advcfg -s 1 /VSAN/ObjectScrubsPerYear
# esxcfg-advcfg -s 0 /VSAN/ObjectScrubPersistMin