ESXiにおけるハードドライブのS.M.A.R.T.健全性監視
search cancel

ESXiにおけるハードドライブのS.M.A.R.T.健全性監視

book

Article ID: 428303

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

免責事項: これは英文の記事  ESXi S.M.A.R.T. health monitoring for hard drives (313033) の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

この記事では、以下の手順について説明します。

  • ローカルハードドライブの故障診断。
  • ハードドライブの S.M.A.R.T.(Self-Monitoring, Analysis, and Reporting Technology)ステータスの読み取り。

症状

  • サーバーの POST(Power On Self Test)時にハードドライブの警告が報告される。
  • ローカルハードドライブ上の VMFS 破損により、仮想マシンの電源をオンにできない。
  • ローカルハードドライブのパフォーマンスが著しく低下している。

Environment

VMware vSphere ESXi 6.x

VMware vSphere ESXi 7.x

VMware vSphere ESXi 8.x

Resolution

ESXi 5.1 以降、VMware はハードドライブの健全性を監視するための S.M.A.R.T. 機能を追加しました。この機能は、ローカルコントローラに接続された物理ハードドライブからさまざまな動作パラメータを記録します。
S.M.A.R.T. は、物理ハードディスク(HDD および SSD)の回路基板上のファームウェアの一部として機能します。

ディスクから現在のデータを読み取る手順:

  1. ESXi ホストへのコンソールまたは SSH セッションを開きます。

  2. 次のコマンドを実行して、使用するデバイスパラメータを特定します。
    # esxcli storage core device list

  3. 期待される出力は、ESXi ホストが認識しているすべての SCSI デバイスのリストです。
    例:t10.ATA_____XXXXX________________________XXXXX

  4. ステップ 3 で確認したデバイス値を指定して、データを読み取ります。 
    # esxcli storage core device smart get -d <device>

    : 外部の FC/iSCSI LUN、または RAID コントローラ配下の仮想ディスクは、S.M.A.R.T. ステータスを報告しない場合があります。

以下の表は出力例を分類したものです。

Parameter Value Threshold Worst
Health Status OK N/A N/A
Media Wearout Indicator 0 0 0
Write Error Count N/A N/A N/A
Read Error Count 118 50 118
Power-on Hours 0 0 0
Power Cycle Count 100 0 100
Reallocated Sector Count 100 3 100
Raw Read Error Rate 118 50 118
Drive Temperature 27 0 34
Driver Rated Max Temperature N/A N/A N/A
Write Sectors TOT Count N/A N/A N/A
Read Sectors TOT Count N/A N/A N/A
Initial Bad Block Count N/A N/A N/A

注: 物理ハードドライブには最大 30 個の異なる属性が含まれる可能性があります(上記の例では 13 個のみを表示)。詳細については、How does S.M.A.R.T. function of hard disks Work? を参照してください。

Raw 値(生データ)には、以下の 2 つの結果が含まれる可能性があります。

  • 0~253 の数値
  • 単語(例:N/A または OK)

各カラム(列)の説明

: 各カラムに返される値とその意味は、製造元によって異なる場合があります。詳細については、ハードウェアサプライヤーに確認してください。

  • Parameter(パラメータ)
    属性 ID から人間が判読可能なテキストへの変換です。
    (例:hex 0xE7 = decimal 231 = "Drive Temperature")

    詳細については、Wikipedia の S.M.A.R.T. に関する記事内にある Known ATA S.M.A.R.T. attributes のセクションを参照してください。

  • Value(値)
    ディスクによって報告される現在の値です。上記の例では、Drive Temperature が「27」と報告されており、これは摂氏 27 度を意味します。値は数値(0~253)または単語(N/A、OK)のいずれかになります。

  • Threshold(しきい値)
    その属性の(故障とみなされる)限界値です。

  • Worst(ワースト)
     そのパラメータでこれまでに記録された中で最も悪い(高い/低い)値です。

smartd デーモン

  • smartd デーモンのステータスを確認するには、以下のコマンドを実行します。
    # /etc/init.d/smartd status

Additional Information

vm-support ログバンドルでも、smartinfo.sh.txt ファイル内に S.M.A.R.T. の詳細がキャプチャされます。このファイルは、バンドル内の commands/ ディレクトリにあります。
Configuring advanced options for ESXi
Using ESXi Shell in ESXi