PSOD画面には以下のような情報が表示されます:
PCPU X locked up. Failed to ack TLB invalidate (at least 1 locked up, PCPU(s): X).
PCPU(s) did not respond to NMI. Possible hardware problem; contact hardware vendor.
vmkernel.log に PSOD発生前に NVIDIA デバイスが応答しなくなりリセットされたことが記録されている。
YYYY-MM-DDTHH:MM:SS.536Z cpu4:2097455)WARNING: PCI: 740: Dev ####:##:##.1 is unresponsive after reset
YYYY-MM-DDTHH:MM:SS.154Z cpu8:2097387)WARNING: PCI: 740: Dev ####:##:##.2 is unresponsive after reset
ESXi 8.0
この問題は、NVIDIAデバイスが応答しなくなったことが原因です。
PCPU が NVIDIA デバイスのPCI構成空間へのアクセスの際に停止状態になったか、時間がかかりすぎたことで発生します。
これにより、同じ物理コア上のPCPUがTLB無効化要求を処理できなかったために PSODが発生します。
NVIDIA デバイスが応答しなくなった原因について、NVIDIA 社 にお問い合わせください。