Broadcom 製 NIC を搭載した ESXi ホストが "PF Exception" というエラーで PSOD となる
search cancel

Broadcom 製 NIC を搭載した ESXi ホストが "PF Exception" というエラーで PSOD となる

book

Article ID: 434543

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

Symptoms:

  • bnxtnet ドライバ 234.x より前のバージョンを搭載した ESXi ホストで、次の画像のような "PF Exception 14" エラーで PSOD が発生する可能性があります。
  • PSOD が発生する直前、ESXi の vmkernel.log に次のようなエントリが記録されます。
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu11:2099763)Performing Live coredump: vmxnet3-initiated
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu11:2099763)No disk partition configured to dump data.
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: Coredump to file: /vmfs/volumes//vmkdump/.dumpfile.
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu11:2099763)Dump: 291#: Using dump buffer size 98304
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu0:2099763)Dump: 198#: DumpProgress: Faulting world regs ##
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu2:2099763)Dump: 198#: DumpProgress: Vmm code/data ##
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu2:2099763)Dump: 198#: DumpProgress: Vmk code/rodata/stack ##
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu272:2097675)Vmxnet3: 188##: Tx completion timeout exceeded for tq 0
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu272:2097675)Vmxnet3: 188##: Tx completion timeout exceeded for tq 1
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu272:2097675)Vmxnet3: 188##: Tx completion timeout exceeded for tq 2
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu272:2097675)Vmxnet3: 188##: Tx completion timeout exceeded for tq 3
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu2:2099763)Dump: 198#: DumpProgress: Vmk data/heap 14
    YYYY-MM-DDThh:mm:ss Wa(180) vmkwarning: cpu261:2097678)WARNING: Uplink: 220##: Queue 3 of device vmnic2 stuck, resetting the device
    YYYY-MM-DDThh:mm:ss Wa(180) vmkwarning: cpu8:2099245)WARNING: bnxtnet: bnxtnet_uplink_reset:908#: [vmnic2 : 0x4522c##d0000] TX timeout!
    YYYY-MM-DDThh:mm:ss In(182) vmkernel: cpu4:29505145)Vmxnet3: 19##4: .eth0,00:##:##:##:##:ed, portID(67####87): Hang detected,numHangQ: 8, enableGen: 75
    
    
  • この問題は断続的に発生し、Broadcom bnxtnet Thor 200G および 400G NIC を搭載した ESXi のみで発生します。これらのデバイスは次の PCI ID で識別できます。
    • ベンダー ID (VID): 14e4
    • デバイス ID (DID): 175# または 176# (例: 1750, 1761 など)

    VID と DID は次のコマンドで確認できます。
    # vmkchdev -l | grep vmnic
    ドライバの詳細を特定する方法については、Determining Network/Storage firmware and driver version in ESXi を参照してください。

免責事項: これは英文の記事 ESXi host with Broadcom Thor NICs might encounter PSOD with "PF Exception" の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズコンテンツは最新情報ではない可能性があります。最新情報は英語版の記事を参照してください。

Environment

VMware vSphere ESXi

Cause

この問題はバージョン 234.x より前の bnxtnet ドライバを使用している Broadcom Thor NIC で発生する、ファームウェアの既知の不具合が原因です。

Resolution

この問題は、ドライババージョン 234.0.159.1 以降に含まれる bnxtnet ファームウェアバージョン 234.1.128.0 で修正されています。 

影響を受ける ESXi ホストは、 bnxtnet ドライバを 234.0.159.1 以降にアップデートしてください。ダウンロード方法については、 VMware 互換性ガイド (VCG) を参照してください。