VMFS データストア上の仮想マシンが "NVRAM: write failed" で起動できない
search cancel

VMFS データストア上の仮想マシンが "NVRAM: write failed" で起動できない

book

Article ID: 420631

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

VMFS データストア上の仮想マシンが下記イベントで起動できない。

Error message on <VM_NAME> on <HOST_NAME> in ha-datacenter: NVRAM: write failed.

Symptoms: 
影響を受けた仮想マシンが配置された ESXi 上のエラー。

hostd.log: 
YYYY-MM-DDThh:mm:ss.###Z  info hostd[2103629] [Originator@6876 sub=Libs opID=########-#####-auto-####-h5:########-##-##-##-###] DictionaryLoad: Cannot open file "/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx": Input/output error.
YYYY-MM-DDThh:mm:ss.###Z  info hostd[2103629] [Originator@6876 sub=Libs opID=########-#####-auto-####-h5:########-##-##-##-###] VigorOffline_GenSecPolicy: retry reading /vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx
YYYY-MM-DDThh:mm:ss.###Z  verbose hostd[2103629] [Originator@6876 sub=Vigor.Vmsvc.vm:/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx opID=########-#####-auto-####-h5:########-##-##-##-###] Generate policy from cfg message: Unable to load configuration file '/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx'.
YYYY-MM-DDThh:mm:ss.###Z  error hostd[2103629] [Originator@6876 sub=Vmsvc.vm:/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx opID=########-#####-auto-####-h5:########-##-##-##-###] Could not perform config check (storage accessible): Fault cause: vim.fault.GenericVmConfigFault
YYYY-MM-DDThh:mm:ss.###Z  info hostd[2103629] [Originator@6876 sub=Vmsvc.vm:/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx opID=########-#####-auto-####-h5:########-##-##-##-###] VM state has changed; config check to be retried.
YYYY-MM-DDThh:mm:ss.###Z verbose hostd[2102715] [Originator@6876 sub=Vmsvc.vm:/vmfs/volumes/########-########-####-############/<VM_NAME>/<VM_NAME>.vmx opID=########-#####-auto-####-h5:########-##-##-##-####] Handling vmx message 7273: Input/output error
--> NVRAM: write failed.
YYYY-MM-DDThh:mm:ss.###Z  info hostd[2099508] [Originator@6876 sub=Vimsvc.ha-eventmgr opID=########-#####-auto-####-h5:########-##-##-##-###] Event ###### : Error message on <VM_NAME> on <HOST_NAME> in ha-datacenter: NVRAM: write failed.

Environment

VMware ESXi

Cause

VMFS データストアが作成されているストレージ LUN の応答が遅延し ”No connection” となっている状況で発生する可能性がある。

vmkernel.log: 
YYYY-MM-DDThh:mm:ss.###Z cpu20:2097916)WARNING: ScsiDeviceIO: 1513: Device naa.################################ performance has deteriorated. I/O latency increased from average value of 1687 microseconds to 33751 microseconds.
YYYY-MM-DDThh:mm:ss.###Z cpu32:2097918)WARNING: ScsiDeviceIO: 1513: Device naa.################################ performance has deteriorated. I/O latency increased from average value of 1687 microseconds to 68851 microseconds.
YYYY-MM-DDThh:mm:ss.###Z cpu36:2097920)WARNING: ScsiDeviceIO: 1513: Device naa.################################ performance has deteriorated. I/O latency increased from average value of 1688 microseconds to 34124 microseconds.

YYYY-MM-DDThh:mm:ss.###Z cpu12:2097483)ScsiDeviceIO: 12480: Task mgmt request issued to device naa.################################ is stuck (WorldID ########, Cmd 0x93, CmdSN 3dba8dc). Issuing yellow notification to the application
YYYY-MM-DDThh:mm:ss.###Z cpu11:2097483)ScsiDeviceIO: 12527: Task mgmt request issued to device naa.################################ is stuck (WorldID ########, Cmd 0x93, CmdSN 3dba8dc). Issuing red notification to the application
YYYY-MM-DDThh:mm:ss.###Z cpu7:2103163)ALERT: BC: 3177: File protectedlist closed with dirty buffers. Possible data loss.
YYYY-MM-DDThh:mm:ss.###Z cpu33:2097465)ScsiVmas: 1074: Inquiry for VPD page 00 to device naa.################################" failed with error No connection
YYYY-MM-DDThh:mm:ss.###Z cpu7:13944452)WARNING: ScsiDeviceIO: 12155: READ CAPACITY on device "naa.################################" from Plugin "NMP" failed. I/O error
YYYY-MM-DDThh:mm:ss.###Z cpu34:2097983)ScsiDeviceIO: 7122: Waited for completion for all issued commands for partition naa.################################:1, for 120 secs. 1 completions still awaited. Giving up !

発行された SCSI コマンド (READ, WRITE のみならず VAAI WRITE SAME / 0x93, INQUIRY, READ CAPACITY も) の処理が進まず、”No connection” エラーで失敗する。
仮想マシンの起動に関連した VMFS 上の操作も失敗する。
ターゲット LUN の性能が飽和しているように見受けられる。

Resolution

事象の発生した ESXi ホストの再起動が回避策となる可能性がある。
原因調査と再発防止のため、ストレージサポートに問い合わせる。

Additional Information

Unable to power-on a virutal machine on VMFS datastore with "NVRAM: write failed"
Disabling Hardware Accelerated Init (WRITESAME) in ESXi