Mellanox nmlx5_core NIC で「Receive length errors」が検出される
search cancel

Mellanox nmlx5_core NIC で「Receive length errors」が検出される

book

Article ID: 432745

calendar_today

Updated On:

Products

VMware vSphere ESXi VMware vSphere ESX 7.x VMware vSphere ESX 8.x

Issue/Introduction

免責事項: これは英文の記事「Receive length errors detected on Mellanox nmlx5_core NICs.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

Mellanox nmlx5_core NIC で受信長エラー (Receive length errors) が検出されます。

vmnic はジャンボ フレーム (MTU 9000) に設定されています。

vmnic の統計情報は以下のように出力されます。


      Packets received: 0
      Packets sent: 0
      Bytes received:
      Bytes sent: 0
      Receive packets dropped: 0
      Transmit packets dropped: 0
      Multicast packets received: 0
      Broadcast packets received:
      Multicast packets sent: 0
      Broadcast packets sent: 0
      Total receive errors:     51844
      Receive length errors:  51844 
      Receive over errors: 0
      Receive CRC errors: 0
      Receive frame errors: 0
      Receive FIFO errors: 0
      Receive missed errors: 0
      Total transmit errors: 0
      Transmit aborted errors: 0
      Transmit carrier errors: 0
      Transmit FIFO errors: 0
      Transmit heartbeat errors: 0
      Transmit window errors: 0

      NIC Private statistics:

      rxOutOfRangeLenPhy: 15
      rxOversizePktsPhy: 51829
      rx_8192_to_10239_bytesPhy: 1390543

 

ホストの vmnic の統計情報は、下記のスクリプトで確認できます。 

/usr/lib/vmware/vm-support/bin/nicinfo.sh

Environment

VMware vSphere ESXi 7.x
VMware vSphere ESXi 8.x

Cause

vmnic の「rxOversizePktsPhy」の値がゼロ以外であり、これが受信長エラーカウンタのパケットとして加算されています。

vmnic の「rxOutOfRangeLenPhy」の値もゼロ以外であり、これも受信長エラーカウンタのパケットとして加算されています。

また、vmnic ポートで 8192 より大きいサイズのパケット「rx_8192_to_10239_bytesPhy」が受信されていることも確認できます (ジャンボ フレームを有効にした場合、ESXi はフレーム サイズ 8972 に制限されます) 。

この場合、設定された MTU より大きいサイズのパケットが物理スイッチ ポートから Mellanox アダプタに送信されており、「受信長エラー (Receive length errors)」として認識されています。


 

Resolution

ESXi のパケット キャプチャには、すでに破棄されたこれらのサイズの大きいパケットは含まれないため、物理スイッチ ポートでパケット キャプチャを実行し、これらのパケットが何であるかを特定してください。この作業については、スイッチ ベンダーまたはネットワーク チームに支援を依頼してください。

MTU 設定がエンドツーエンドで一貫しており、想定されるトラフィック パターンと一致していることを確認してください。

Additional Information

各 vmnic の MTU は、次のコマンドを実行して確認できます。

  esxcli network nic list

この問題は、MTU が 1500 に設定されており、NIC が (オーバーヘッドにより) 1472 バイトより大きいフレーム サイズを受信した場合にも発生する可能性があります。

      rx_64_bytesPhy: 22595317
      rx_65_to_127_bytesPhy: 815736056
      rx_128_to_255_bytesPhy: 227233250
      rx_256_to_511_bytesPhy: 267986423
      rx_512_to_1023_bytesPhy: 340117906
      rx_1024_to_1518_bytesPhy: 141345162
      rx_1519_to_2047_bytesPhy: 1410456575
      rx_2048_to_4095_bytesPhy: 2182
      rx_4096_to_8191_bytesPhy: 3646
      rx_8192_to_10239_bytesPhy: 85703

これらのカウンタが表示するデータは、ESXi カーネルの外部で発生した問題の累積であり、NIC ドライバから ESXi ホストに報告されているものにすぎません。
https://knowledge.broadcom.com/external/article/341594/troubleshooting-nic-errors-and-other-net.html