Esxi CPU usage is only 5% when several VMs are running on it, and both Esxi host and VMs are extremely slow.
Check iDRAC, there is no red warning.
Check IPMI, there is no event.
Esxi 7.0.x
In vmkernel.log, we found message:
YYYY-MM-DDThh:mm:ss.271Z cpu37:#######)WARNING: Heartbeat: 822: PCPU 78 didn't have a heartbeat for 7 seconds; *may* be locked up.
YYYY-MM-DDThh:mm:ss.272Z cpu78:#######)ALERT: NMI: 690: NMI IPI: RIPOFF(base):RBP:CS [0x35f010(0x#############):0x5:0xf48] (Src 0x1, CPU78)
YYYY-MM-DDThh:mm:ss.273Z cpu78:#######)0x#############:PCISbdfMap_Find@vmkernel#nover+0x48 stack: 0x0
YYYY-MM-DDThh:mm:ss.274Z cpu78:#######)0#############:PCIPassthruGetVmmOwnerWorld@(pciPassthru)#<None>+0x17 stack: 0x420002675160
YYYY-MM-DDThh:mm:ss.274Z cpu78:#######)0x#############:VMKPCIPassthru_DevInUse@vmkernel#nover+0x13 stack: 0x1
YYYY-MM-DDThh:mm:ss.274Z cpu78:#######)0x#############:PCIVGA_KernelConsoleEnabled@vmkernel#nover+0x15 stack: 0x#############
YYYY-MM-DDThh:mm:ss.274Z cpu78:#######)0x#############:SVGAConsoleDraw32@vmkernel#nover+0x3d stack: 0x#############
YYYY-MM-DDThh:mm:ss.275Z cpu78:#######)0x#############:SVGAConsolePuts@vmkernel#nover+0x116 stack: 0x#############
YYYY-MM-DDThh:mm:ss.275Z cpu78:#######)0x#############:TermPutc@vmkernel#nover+0xec7 stack: 0x#############
YYYY-MM-DDThh:mm:ss.275Z cpu78:#######)0x#############:Term_Putb@vmkernel#nover+0x52 stack: 0x#############
YYYY-MM-DDThh:mm:ss.275Z cpu78:#######)0x#############:TTYWriteToGeneric@vmkernel#nover+0x13a stack: 0x1
YYYY-MM-DDThh:mm:ss.276Z cpu78:#######)0x#############:[0x420002475c8f]UserTeletypeWriteBuffer@vmkernel#nover+0x6c stack: 0x#############
YYYY-MM-DDThh:mm:ss.276Z cpu78:#######)0x#############:UserTeletypeWriteInt@vmkernel#nover+0x1eb stack: 0x0
YYYY-MM-DDThh:mm:ss.276Z cpu78:#######)0x#############:TTYWriteMethod@vmkernel#nover+0x36 stack: 0x#############
YYYY-MM-DDThh:mm:ss.277Z cpu78:#######)0x#############:CharDriverAsyncIO@vmkernel#nover+0xf5 stack: 0x#############
YYYY-MM-DDThh:mm:ss.277Z cpu78:#######)0x#############:FDS_AsyncIO@vmkernel#nover+0x6a3 stack: 0x#############
YYYY-MM-DDThh:mm:ss.277Z cpu78:#######)0x#############:FDS_DoSyncIO@vmkernel#nover+0xf4 stack: 0x#############
YYYY-MM-DDThh:mm:ss.277Z cpu78:#######)0x#############:DevFSFileIO@vmkernel#nover+0x38f stack: 0x4308ec0045c0
YYYY-MM-DDThh:mm:ss.278Z cpu78:#######)0x#############:FSSVec_FileIO@vmkernel#nover+0x20 stack: 0x1
YYYY-MM-DDThh:mm:ss.278Z cpu78:#######)0x#############:UserChardevIO@vmkernel#nover+0xfe stack: 0x#############
YYYY-MM-DDThh:mm:ss.278Z cpu78:#######)0x#############:UserChardevWrite@vmkernel#nover+0x1f stack: 0x#############
YYYY-MM-DDThh:mm:ss.278Z cpu78:#######)0x#############:UserVmfs_Writev@vmkernel#nover+0x119 stack: 0x#############
YYYY-MM-DDThh:mm:ss.279Z cpu78:#######)0x#############:LinuxFileDesc_Write@vmkernel#nover+0xe5 stack: 0x#############
YYYY-MM-DDThh:mm:ss.279Z cpu78:#######)0x#############:User_LinuxSyscallHandler@vmkernel#nover+0x1a4 stack: 0x0
YYYY-MM-DDThh:mm:ss.279Z cpu78:#######)0x#############:gate_entry@vmkernel#nover+0x68 stack: 0x0
and
ALERT: NMI: 690: NMI IPI: RIPOFF(base):RBP:CS [0x35f010(0x420002000000):0x5:0xf48] (Src 0x1, CPU78)
The PCPU has become unresponsive, accompanied by a Non-Maskable Interrupt (NMI)—a pattern commonly indicative of an underlying hardware issue.
Engage the hardware vendor for a thorough investigation, as this may point to a failing CPU or motherboard component that could require diagnostics or replacement.