不特定のサーバにおいて NIC ファームウェアのクラッシュにより NIC が応答しなくなる
search cancel

不特定のサーバにおいて NIC ファームウェアのクラッシュにより NIC が応答しなくなる

book

Article ID: 427790

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項: これは英文の記事 「Random nic's on random servers become unresponsive due to nic firmware crashing」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • ESXi ホストが頻繁に「応答なし」状態になり、NIC ファームウェアのクラッシュを報告します

  • NIC は bnxtnet ドライバ/ファームウェアを使用しています
  • ESXi ホストのログには下記のようなメッセージが出力される場合があります:

    <Date> Wa(180) vmkwarning: cpu##:20###43)WARNING: bnxtnet: hwrm_send_msg:388: [vmnicX : 0x452#####4000] HWRM cmd resp_len timeout, cmd_type 0x0(HWRM_VER_GET) seq #####
    <Date> Wa(180) vmkwarning: cpu##:20###43)WARNING: bnxtnet: hwrm_get_version:3140: [vmnicX : 0x452#####4000] VER_GET failed- FW_STATUS_REG: 0x#####
    <Date> Wa(180) vmkwarning: cpu##:20###43)WARNING: bnxtnet: hwrm_snd_fw_msg:585: [vmnicX : 0x452#####4000] Looks like FW is crashed/non-responsive.
    <Date> Wa(180) vmkwarning: cpu##:20###43)WARNING: bnxtnet: hwrm_snd_fw_msg:587: [vmnicX : 0x452#####4000] Dumping FW trace and reporting link down to OS

  • vmnics 上の rx が LRO によって中止されたことが確認されます

Environment

VMware vSphere ESXi

Cause

ネットワークインターフェースカードに障害が発生すると、ESXi ホストのネットワークトラフィックが一時的に停止する可能性があります。このような場合、設定によっては管理 VMkernel インターフェースのアップリンクが機能しなくなり、システム停止につながる可能性があります。

Resolution

再起動すると、サーバを通常の状態に復元できる場合があります。

ネットワークインターフェースカードの障害に関するトラブルシューティングや調査については、ハードウェアベンダー(この場合は Broadcom ハードウェアチーム)にお問い合わせください。
ハードウェアベンダーからの推奨事項を ESXi 環境へ適用する際にサポートが必要な場合は、Broadcom ソフトウェア/VMware サポートケースをオープンしてください。

Note:ネットワークインターフェースカードのファームウェア/ドライバを常に最新の状態に保つことをお勧めします。ネットワークインターフェースカードのファームウェア/ドライバのサポート状況と入手方法は、Hardware Compatibility Guide をご覧ください。

Additional Information

類似事例: 

Warning: Looks like FW is crashed/non-responsive
Performance drops on BCM5741x NICs with GENEVE traffic
Wrong GENEVE inner checksum from NIC firmware on ESXi host with BCM5741x / Broadcom 5741x NIC.