ESXi ホストで、バックトレースで FCoE モジュール (qfle3f) を参照する PSOD が発生する。
search cancel

ESXi ホストで、バックトレースで FCoE モジュール (qfle3f) を参照する PSOD が発生する。

book

Article ID: 327438

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

Symptoms:
  • 接続リセットのケースが長時間実行されると、All Paths Down (APD) または同様のパスダウンのシナリオが発生します。
  • ESXi 6.5 または 6.7 ホストで、バックトレースで FCoE モジュール (qfle3f) を参照する PSOD が発生します。

PSOD: Panic bora/vmkernel/main/dlmalloc.c:4908 - Corruption in DLMALLOC referencing details ql_fcoe_delayed_wq.

  • 次のようなバック トレースが表示されます:

0x451b9fd9bd50:[0x418037d0ba15]PanicvPanicInt@vmkernel#nover+0x439 stack: 0x4302d004c490, 0x4180380a7558, 0x451b9fd9bdf8, 0x0, 0x100000001
0x451b9fd9bdf0:[0x418037d0bc48]Panic_NoSave@vmkernel#nover+0x4d stack: 0x451b9fd9be50, 0x451b9fd9be10, 0x43120f780c20, 0x4180380a7539, 0x132c
0x451b9fd9be50:[0x418037d54363]DLM_free@vmkernel#nover+0x6a8 stack: 0x43120f78acc0, 0x418037d51501, 0x5beea699da51a, 0x418037d15653, 0x0
0x451b9fd9be70:[0x418037d51500]Heap_Free@vmkernel#nover+0x115 stack: 0x0, 0x43120f78acc0, 0x2f, 0x40000000, 0x0
0x451b9fd9bec0:[0x418037c3d987]vmk_SpinlockDestroy@vmkernel#nover+0x48 stack: 0x43120f5df000, 0x418038ab09ed, 0x0, 0x418038abcb52, 0x43120f5df000
0x451b9fd9bee0:[0x418038ab09ec]DeleteFabric@(qfle3f)#<None>+0x29 stack: 0x43120f5df000, 0x43120f5df200, 0x0, 0x418038ab2c00, 0x43120f5f3610
0x451b9fd9bf40:[0x418038ab0bd9]_ReleaseFabricReference@(qfle3f)#<None>+0x2e stack: 0x43120f786000, 0x43120f786018, 0x1, 0x418038abc27b, 0x418038abc1f8
0x451b9fd9bf70:[0x418038abc27a]ql_fcoe_do_singlethread_work@(qfle3f)#<None>+0x83 stack: 0x2f, 0x418037d2902f, 0x2f, 0x418038abc1f8, 0x418037d2902a
0x451b9fd9bf90:[0x418037d2902e]vmkWorldFunc@vmkernel#nover+0x4f stack: 0x418037d2902a, 0x0, 0x451b8a6a3100, 0x451b9fda3000, 0x451b8a6a3100
0x451b9fd9bfe0:[0x418037f0e322]CpuSched_StartWorld@vmkernel#nover+0x77 stack: 0x0, 0x0, 0x0, 0x0, 0x0


Environment

VMware vSphere ESXi 7.0.0
VMware vSphere ESXi 6.5
VMware vSphere ESXi 6.7

Cause

FCoE FIP 検出プロセスが検出タイムアウト ハンドラーのキューイングに失敗した場合、検出プロセスの反復処理が失敗しますが、これは期待される動作です。

この問題は、そのセッション オブジェクトへの参照が残っている場合に発生します。これにより、リソースのクリーンアップが不完全になり、再検出が妨げられます。

Resolution

この問題は、次のドライバ バージョンで解決されています。
  • VMware vSphere ESXi 6.7 driver version 2.0.123.0、VMware Downloads から入手できます。
  • VMware vSphere ESXi 7.0 driver version 3.0.125.0、VMware Downloads から入手できます。
注: ESXi 6.5 の場合は、サーバーのハードウェア ベンダーにお問い合わせ下さい。

Workaround:
この問題を回避するには:

ストレージへの接続に FCoE を使用していない場合は、qfle3f を無効にします。
  1. SSH セッションを使用して ESXi ホストに接続します。
  2. 次のコマンドを実行します:
esxcli system module set --enabled=false --module=qfle3f
  1. 上記のコマンドを反映するために、サーバーを再起動します。
複数の FCoE VLAN が構成されている場合は、同じファブリック上の複数の VLAN 構成を削除します。

Additional Information

ドライバのインストール方法の詳細については、Installing async drivers in ESXi 5.x/6.x/7.x using esxcli and offline bundle を参照してください。