仮想マシンの復旧後に REDO ログの破損が報告される
search cancel

仮想マシンの復旧後に REDO ログの破損が報告される

book

Article ID: 344638

calendar_today

Updated On:

Products

VMware vSphere ESXi VMware vSphere ESX 6.x VMware vSphere ESX 7.x VMware vSphere ESX 8.x

Issue/Introduction

免責事項:これは英文の記事「REDO log corruption is reported after restoring the virtual machine」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • スナップショット LUN またはレプリカ LUN から復旧した後に、仮想マシンがパワーオンに失敗する。

  • hostd ログと仮想マシンのログに REDO ログの破損メッセージが報告される。

  • /var/log/hostd.log file に、次のようなエントリが記録される。

    yyyy-mm-ddThh:mm:ss.xxxZ [3F040B90 verbose 'Vmsvc.vm:/vmfs/volumes/5384db8c-715d6034-cfb4-d485647708cc/VM_NAME/VM_NAME.vmx'] Handling message _vmx2: The redo log of VM_NAME-000001.vmdk is corrupted. If the problem persists, discard the redo log.

  • vmware.log ファイルに、次のようなエントリが記録される。

    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| I120: Msg_Question:
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| I120: [msg.hbacommon.corruptredo] The redo log of VM_NAME_2-000001.vmdk is corrupted. If the problem persists, discard the redo log.
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| I120: ----------------------------------------
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| I120: MsgQuestion: msg.hbacommon.corruptredo reply=0
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| I120: Exiting because of failed disk operation.
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| W110: A core file is available in "/vmfs/volumes/501aa3a8-4ca80d42-791f-002655503e15/VM_NAME/vmx-zdump.000"
    yyyy-mm-ddThh:mm:ss.xxxZ| vcpu-0| W110: Writing monitor corefile "/vmfs/volumes/501aa3a8-4ca80d42-791f-002655503e15/VM_NAME/vmmcores.gz"

:前述のログの引用は単なる例です。日付、時間、および環境変数は、環境によって異なる場合があります。



Environment

VMware ESXi 6.x
VMware ESXi 7.0.x
VMware ESXi 8.0.x

Cause

以下のシナリオで vSphere スナップショットを持つ仮想マシンをパワーオンしたときに、この問題が発生することがあります。
  • 仮想マシンがホストされている VMFS データストアが、別の VMFS データストアのレプリカである。
  • パワーオンする前に、仮想マシンが VMFS データストアまたは NFS 共有のストレージ ベース スナップショットから復旧された。
vSphere ホストの差分ディスク メタデータ インメモリに、差分ディスクのヘッダが含まれます。差分ディスクのヘッダーへの更新は、必要に応じてメモリ内で発生し、スナップショット統合などの特定のイベント時か、差分ディスクが閉じられた場合にのみ、変更がディスクに書き込まれます。
 
ストレージ スナップショット操作およびストレージの複製は ESXi ホストに対して透過的です。スナップショット ヘッダーの変更がディスクにフラッシュされる前に、仮想マシンの復旧に使用するストレージ スナップショットが作成された場合、復旧された仮想マシンの差分ディスク メタデータは整合していません。同様に、基になる LUN の複製が停止した時点でヘッダーの変更がフラッシュされていない可能性があるため、VMFS ファイル システムの同期または非同期レプリカには、ヘッダー変更の一部が含まれていない可能性があります。
 
:REDO ログの破損メッセージは単に、ストレージ スナップショットが作成されたとき、または LUN の複製が停止したときに、インメモリ差分ディスク メタデータが、オンディスク メタデータと同期していたことを示します。

Resolution

この問題を回避するには、以下のベスト プラクティスに従います。
 
  • ストレージ スナップショットを作成するときに、仮想マシンがスナップショット上で実行されていることがないようにしてください。
  • 仮想マシンのスナップショットが発生する可能性が低いときに、ストレージ アレイまたは Filer スナップショットを実行します。
  • 仮想マシンがパワーオフ状態であるか、仮想マシン上で実行中のスナップショットがない状態のいずれかで、作成されたスナップショット LUN から仮想マシンを復旧します。
  • ストレージ アレイまたは Filer スナップショットの頻度を下げて、手動またはバックアップで開始される仮想マシン スナップショットのオーバーラップを減らします。


Additional Information

ストレージ スナップショットで仮想マシンのスナップショットを作成できる場合でも、同時 I/O に関してクラッシュ整合性のみが保証されます。
これは、アレイまたは Filer 上のフライト中の I/O はすべて、ストレージ スナップショットを作成する前に完了できることを意味しています。以下はこれに含まれません。

  • 仮想マシンの静止(ファイル システムまたはアプリケーションのいずれかと整合)。
  • vSphere の差分ディスクのインメモリ状態(前述のとおり)。

この記事の更新時にアラートを受信する場合は、[Actions] ボックスで、[Subscribe to Document ]をクリックしてください。

 

REDO log corruption is reported after restoring the virtual machine