VMkernel が修正されたメモリエラーとメモリページのリタイアを報告する
search cancel

VMkernel が修正されたメモリエラーとメモリページのリタイアを報告する

book

Article ID: 426779

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項: これは英文の記事 「VMkernel reports corrected memory errors and retirement of memory pages (398205)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

  • VMkernel は、ESXi ホスト上のマシン チェック アーキテクチャ(MCA)によるレポートとして、メモリ読み取りエラーに関連する複数のイベントを記録します。

/var/run/log/vmkernel.log

cpu26:2104586)MCA: 209: CE Intr G0 B11 S8c00004200800090 Aaca6f602c0 M8000000000000086 Paca6f602c0/40 Memory Controller Read Error on Channel 0.
cpu48:2104583)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8b2e7e7940 M8000000000000086 P8b2e7e7940/40 Memory Controller Read Error on Channel 0.
cpu48:2104583)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8b2e7e7940 M8000000000000086 P8b2e7e7940/40 Memory Controller Read Error on Channel 0.
cpu15:308154417)MCA: 209: CE Poll G0 B11 S8c00014200800090 Aa9738e7240 M8000000000000086 Pa9738e7240/40 Memory Controller Read Error on Channel 0.
cpu15:308154417)MCA: 209: CE Poll G0 B11 S8c00014200800090 Aa9738e7240 M8000000000000086 Pa9738e7240/40 Memory Controller Read Error on Channel 0.
cpu9:2104581)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8ace525d40 M8000000000000086 P8ace525d40/40 Memory Controller Read Error on Channel 0.
cpu9:2104581)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8ace525d40 M8000000000000086 P8ace525d40/40 Memory Controller Read Error on Channel 0.
cpu38:2104588)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8f22aa89c0 M8000000000000086 P8f22aa89c0/40 Memory Controller Read Error on Channel 0.
cpu38:2104588)MCA: 209: CE Intr G0 B11 S8c00004200800090 A8f22aa89c0 M8000000000000086 P8f22aa89c0/40 Memory Controller Read Error on Channel 0.

  • ESXi ホスト上の VMkernel および VMkwarning ログは、複数のメモリページが廃止対象(retirement)として選択されていることを示唆しています。

/var/run/log/vmkwarning.log

cpu21:2097272)WARNING: PageRetire: 624: Number of kernel MPNs selected for retirement is 256
cpu40:2097272)WARNING: PageRetire: 624: Number of kernel MPNs selected for retirement is 512
cpu4:2097272)WARNING: PageRetire: 628: Number of user shared MPNs selected for retirement is 8
cpu40:2097272)WARNING: PageRetire: 624: Number of kernel MPNs selected for retirement is 512
cpu49:2097272)WARNING: PageRetire: 624: Number of kernel MPNs selected for retirement is 1024
cpu49:2097272)WARNING: PageRetire: 624: Number of kernel MPNs selected for retirement is 1024

Environment

VMware vSphere ESXi

Cause

  • 修正されたエラー (CE) は、メモリ モジュール/コントローラの障害を示す複数のメモリ読み取り障害を示しています。
  • ページリタイアイベントは、ハードウェアが VMkernel に特定のメモリ領域を使用しないように指示していることを示します。これは、その領域で継続的に障害が発生し、安全に使用できないためです。 

Resolution

ハードウェアベンダーに連絡して、追加の診断や障害のあるコンポーネントの交換を依頼してください。

Additional Information

  • この問題により、CPU がロックアップし、ホストが応答しない状態になる可能性もあります。
  • 場合によっては、ハードウェアがエラーを修正できない場合、仮想マシンが失敗したり、ESXi ホストで PSOD が発生したりすることがあります。