Ntg3XmitPktList と Ntg3TxCompletion 間の TX Hangにより、Ntg3 ドライバーを搭載した ESXi ホスト上の VM がネットワーク接続を失う
search cancel

Ntg3XmitPktList と Ntg3TxCompletion 間の TX Hangにより、Ntg3 ドライバーを搭載した ESXi ホスト上の VM がネットワーク接続を失う

book

Article ID: 406267

calendar_today

Updated On:

Products

VMware vSphere ESXi VMware vSphere ESXi 8.0

Issue/Introduction

免責事項:これは英文の記事「VMs lose network connectivity on ESXi hosts with Ntg3 driver due to TX hang between Ntg3XmitPktList and Ntg3TxCompletion.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • 仮想マシン(VM)が突然、ネットワークの宛先のすべてまたは一部への接続を失います。これらのアドレスへのpingは失敗します。
  • VMの動作中に、vmxnet3 vNICが/var/run/log/vmkernel.logに「Hang検出」に関する次のようなメッセージを生成します。
    "Vmxnet3: 21228: vmname,##:##:##:##:##:##, portID(xxxxxxxx): Hang detected,numHangQ: 4, enableGen: 9218"
    "WARNING: Uplink: 2101#: Queue 0 of device vmnicX stuck, resetting the device"
  • 影響を受けたVMのネットワークを同じ/異なるホスト上の別のvmnicに移行することで接続が回復します。
  • vmnic リンクを UP/Down フラッピングしても効果はありません。

Environment

VMware vSphere ESXi 7.0.x 
VMware vSphere ESXi 8.0.x 

Cause

この問題(TXハング)は、ntg3ドライバにおけるNtg3XmitPktListとNtg3TxCompletion間の稀なデータ競合が原因であると考えられます。
TXQが満杯であることが検出された場合、Ntg3TxCompletionはNtg3XmitPktListの非常に狭いウィンドウ内でTXQ全体の完了(例えば、ほぼ満杯から空になるまで)をマークする必要があります。

Resolution

これはVMware ESXiホストに影響を与える既知の問題であり、修正はインボックスドライバntg3バージョン4.1.15で行われます。

この問題は、Broadcom ダウンロードから入手できる VMware vSphere ESXi 7.0 Update 3v / ESXi 8.0 Update 3e で解決されています。

ソフトウェアの検索やダウンロードに問題がある場合は、Broadcom 製品およびソフトウェアのダウンロード KB を確認してください。