免責事項: これは英文の記事「Receive length errors detected on Mellanox nmlx5_core NICs.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
Mellanox nmlx5_core NIC で受信長エラー (Receive length errors) が検出されます。
vmnic はジャンボ フレーム (MTU 9000) に設定されています。
vmnic の統計情報は以下のように出力されます。
Packets received: 0
Packets sent: 0
Bytes received:
Bytes sent: 0
Receive packets dropped: 0
Transmit packets dropped: 0
Multicast packets received: 0
Broadcast packets received:
Multicast packets sent: 0
Broadcast packets sent: 0
Total receive errors: 51844
Receive length errors: 51844
Receive over errors: 0
Receive CRC errors: 0
Receive frame errors: 0
Receive FIFO errors: 0
Receive missed errors: 0
Total transmit errors: 0
Transmit aborted errors: 0
Transmit carrier errors: 0
Transmit FIFO errors: 0
Transmit heartbeat errors: 0
Transmit window errors: 0
NIC Private statistics:
rxOutOfRangeLenPhy: 15
rxOversizePktsPhy: 51829
rx_8192_to_10239_bytesPhy: 1390543
ホストの vmnic の統計情報は、下記のスクリプトで確認できます。
/usr/lib/vmware/vm-support/bin/nicinfo.sh
VMware vSphere ESXi 7.x
VMware vSphere ESXi 8.x
vmnic の「rxOversizePktsPhy」の値がゼロ以外であり、これが受信長エラーカウンタのパケットとして加算されています。
vmnic の「rxOutOfRangeLenPhy」の値もゼロ以外であり、これも受信長エラーカウンタのパケットとして加算されています。
また、vmnic ポートで 8192 より大きいサイズのパケット「rx_8192_to_10239_bytesPhy」が受信されていることも確認できます (ジャンボ フレームを有効にした場合、ESXi はフレーム サイズ 8972 に制限されます) 。
この場合、設定された MTU より大きいサイズのパケットが物理スイッチ ポートから Mellanox アダプタに送信されており、「受信長エラー (Receive length errors)」として認識されています。
ESXi のパケット キャプチャには、すでに破棄されたこれらのサイズの大きいパケットは含まれないため、物理スイッチ ポートでパケット キャプチャを実行し、これらのパケットが何であるかを特定してください。この作業については、スイッチ ベンダーまたはネットワーク チームに支援を依頼してください。
MTU 設定がエンドツーエンドで一貫しており、想定されるトラフィック パターンと一致していることを確認してください。
各 vmnic の MTU は、次のコマンドを実行して確認できます。
esxcli network nic list
この問題は、MTU が 1500 に設定されており、NIC が (オーバーヘッドにより) 1472 バイトより大きいフレーム サイズを受信した場合にも発生する可能性があります。
rx_64_bytesPhy: 22595317
rx_65_to_127_bytesPhy: 815736056
rx_128_to_255_bytesPhy: 227233250
rx_256_to_511_bytesPhy: 267986423
rx_512_to_1023_bytesPhy: 340117906
rx_1024_to_1518_bytesPhy: 141345162
rx_1519_to_2047_bytesPhy: 1410456575
rx_2048_to_4095_bytesPhy: 2182
rx_4096_to_8191_bytesPhy: 3646
rx_8192_to_10239_bytesPhy: 85703
これらのカウンタが表示するデータは、ESXi カーネルの外部で発生した問題の累積であり、NIC ドライバから ESXi ホストに報告されているものにすぎません。
https://knowledge.broadcom.com/external/article/341594/troubleshooting-nic-errors-and-other-net.html