使用 Cisco fnic 驱动程序的 ESXi 5.x 主机遇到紫色诊断屏幕,并显示异常 14 和 fnic 驱动程序错误
search cancel

使用 Cisco fnic 驱动程序的 ESXi 5.x 主机遇到紫色诊断屏幕,并显示异常 14 和 fnic 驱动程序错误

book

Article ID: 301280

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

Symptoms:
免责声明:本文为 ESXi 5.x host with a Cisco fnic drivers experiences a purple diagnostic screen with Exception 14 and fnic driver errors (2057831) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。

如果您的 ESXi 主机使用 Cisco fnic 驱动程序,您会遇到紫色诊断屏幕并显示不同错误:
  • 您看到以下消息之后,会立即出现紫色诊断屏幕:

    cpu8:2173)<7>fnic : 4 :: Device reset timed out
    cpu8:2173)<7>fnic : 4 :: Returning from device reset FAILED
    cpu8:2173)<7>fnic : 5 :: Device reset called FCID 0x20100, LUN 0x4e
    cpu8:2173)<7>fnic : 5 :: TAG 0
    cpu0:4424)<7>fnic : 5 :: dev reset cmpl recd. id 0 status FCPIO_SUCCESS
    cpu8:2173)<7>fnic : 5 :: Returning from device reset SUCCESS

     
  • 紫色诊断屏幕显示类似于以下内容的消息:
     
    • YYYY-MM-DDT15:03:03.078Z cpu2:4811)@BlueScreen: #PF Exception 14 in world 4811:helper31-13 IP 0x41803c2706bb addr 0x148
      YYYY-MM-DDT15:03:03.079Z cpu2:4811)Code start: 0x41803bc00000 VMK uptime: 9:00:00:16.695
      YYYY-MM-DDT15:03:03.080Z cpu2:4811)0x41224b2c7e60:[0x41803c2706bb]fnic_terminate_rport_io@<None>#<None>+0x9e stack: 0x1f
      YYYY-MM-DDT15:03:03.081Z cpu2:4811)0x41224b2c7eb0:[0x41803c0dfb14][email protected]#9.2+0x13f stack: 0x410001
      YYYY-MM-DDT15:03:03.083Z cpu2:4811)0x41224b2c7f60:[0x41803c0ea697][email protected]#9.2+0x11a stack: 0x0
      YYYY-MM-DDT15:03:03.084Z cpu2:4811)0x41224b2c7ff0:[0x41803bc3e129]helpFunc@vmkernel#nover+0x568 stack: 0x0
      YYYY-MM-DDT15:03:03.085Z cpu2:4811)0x41224b2c7ff8:[0x0]<unknown> stack: 0x0

       
    • cpu13:16580)pcpu 25 TLB NMI: 0x41225de9b6d0:[0x41801fd8989d]__raw_spin_failed@com.vmware.driverAPI#9.2+0x4 stac
      cpu13:16580)pcpu 25 TLB NMI: 0x41225de9b720:[0x418020131837]fnic_fcpio_cmpl_handler@com.cisco.fnic#9.2.0.0+0x30
      cpu13:16580)pcpu 25 TLB NMI: 0x41225de9b770:[0x41802012d164]fnic_wq_copy_cmpl_handler@com.cisco.fnic#9.2.0.0+0x
      cpu13:16580)pcpu 25 TLB NMI: 0x41225de9b790:[0x41802012981d]fnic_isr_msix_wq_copy@com.cisco.fnic#9.2.0.0+0x18 s
      cpu13:16580)pcpu 25 TLB NMI: 0x41225de9b7d0:[0x41801fd6bd3c][email protected]#9.2+0x2b stac

       
    • YYYY-MM-DDT15:12:27.890Z cpu28:4124)@BlueScreen: #PF Exception 14 in world 4124:idle28 IP 0x41801c071028 addr 0xc70
      YYYY-MM-DDT15:12:27.890Z cpu28:4124)Code start: 0x41801ba00000 VMK uptime: 12:20:51:48.498
      YYYY-MM-DDT15:12:27.892Z cpu28:4124)0x4122407079f8:[0x41801c071028]fnic_host_end_tag@<None>#<None>+0x23 stack: 0x7e3e80e6a5a68
      YYYY-MM-DDT15:12:27.893Z cpu28:4124)0x412240707a78:[0x41801c06dcf3]fnic_fcpio_cmpl_handler@<None>#<None>+0xbca stack: 0x6a0a1db
      YYYY-MM-DDT15:12:27.894Z cpu28:4124)0x412240707ac8:[0x41801c06cad4]fnic_wq_copy_cmpl_handler@<None>#<None>+0xaf stack: 0x0
      YYYY-MM-DDT15:12:27.895Z cpu28:4124)0x412240707ae8:[0x41801c06941d]fnic_isr_msix_wq_copy@<None>#<None>+0x18 stack: 0x417f0000001f
      YYYY-MM-DDT15:12:27.897Z cpu28:4124)0x412240707b28:[0x41801bea2c90][email protected]#9.2+0x2b


注意:上述日志摘录仅为示例。日期、时间和环境变量可能会因环境而有所不同。  


Environment

VMware vSphere ESXi 5.5
VMware vSphere ESXi 5.0
VMware vSphere ESXi 5.1

Cause

如果在 Cisco 环境中有版本低于 1.5.0.8 的 fnic 驱动程序而出现存储中断时,则会出现此问题。fnic 驱动程序会返回设备重置,而不会释放分配给该设备的所有资源。当 fnic 驱动程序开始拆解 LUN 信息时,它会遇到停滞的指针,这引起了紫色诊断屏幕的发生。

Resolution

此问题在 Cisco fnic FC 驱动程序的 1.6.0.17a 版本及更高版本中已解决。可从 VMware Downloads 获取。

要检查 ESXi 上安装的 fnic 驱动程序版本,请执行以下操作:
  1. 通过 SSH 连接到 ESXi 主机。
  2. 运行以下命令:

    esxcfg-info | less
     
  3. 要搜索驱动程序,请运行以下命令:

    /vmkmod/fnic
     
  4. 按Enter键并搜索以下条目:

    “Version...”


    注意:或者您可以运行以下命令以查看当前fnic版本:

    vmkload_mod -s fnic
如果驱动程序是 1.6.0.17a 或更高版本,则继续诊断分析。
 
如果驱动程序版本低于 1.6.0.17a,则从 VMware 下载最新版本的驱动程序,然后将它安装在您的主机上。有关详细信息,请参见 Installing async drivers on VMware ESXi 5.0, 5.1, and 5.5(2005205)

您可以从 VMware Downloads 下载 Ciscofnic 驱动程序:


Additional Information

要在更新本文时收到提醒,请在“Actions” 框中单击 Subscribe to Document