VMware vSphere 5.x の ESXi Dump Collector サービスのトラブルシューティング
search cancel

VMware vSphere 5.x の ESXi Dump Collector サービスのトラブルシューティング

book

Article ID: 308225

calendar_today

Updated On:

Products

VMware vSphere ESXi

Issue/Introduction

この記事には、vSphere 5.0 で ESXi Dump Collector (netdump) 機能をトラブルシューティングするための手順が記載されています。

停止の前に、ESXi ホストの netdump クライアントおよび Dump Collector サーバが正しく構成されていること、およびホストが構成された UDP ポートで Dump Collector サーバへのネットワーク接続を確立できることを確認します。このポートは、ESXi ホストが起動されて実行されているときに接続をテストするのに必要です。
停止中に ESX/ESXi ホストの netdump クライアントから実行可能なトラブルシューティングはほとんどありません。ホストが紫色の診断画面が表示されて停止し、Dump Collector サーバにアクセスできなかった場合、ダンプは失敗して、再試行できません。
ダンプが、ディスクの診断パーティションに正常に保存された場合は、「Collecting diagnostic information from an ESX or ESXi host that experiences a purple diagnostic screen (1004128)」を参照してください。
ダンプがディスクの診断パーティションに保存できなかった場合、または Network Dump Collector 経由で取得できなかった場合は、「Using the local debugger to review logs after an ESXi host fails with a purple diagnostic screen (2003067)」を参照してください。
:この記事は、ESXi 5.0 を対象としています。ESXi 4.1 に関する情報については、「Troubleshooting network coredump collection in vSphere 4.1 (2003122)」を参照してください。


Symptoms:
免責事項:これは英文の記事 「Troubleshooting the ESXi Dump Collector service in VMware vSphere 5.x (2003042)」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。

vSphere ESXi 5.0 ホスト上で紫色の診断画面が表示されて停止したときに、次の症状が発生します。

  • ESXi Dump Collector がコアダンプを受信できません。
  • 次のようなエラーにより、ESXi Dump Collector サービスに接続できません。

    HostIP から DumpCollectorIP へのネットワーク コアダンプを開始します。
    Netdump: 失敗しました: IP DumpCollectorIP のダンプ サーバに接続できませんでした。
    Netdump を停止しています。

    ダンプ: nnn: IP DumpCollectorIP の ARP がタイムアウトしました。


Environment

VMware vSphere ESXi 5.1
VMware vSphere ESXi 5.0
VMware vSphere ESXi 5.5

Resolution

vSphere 5.x でネットワーク Dump Collector (netdump) 機能をトラブルシューティングするには、次の手順を実行します。

  1. netdump Dump Collector サーバが起動されていること、ネットワークで待機していること、および受信されたコアダンプを格納するのに十分な領域を確保していることを確認します。詳細については、次の項目を参照してください。

  2. netdump プロトコルを使用して、ホストがネットワーク経由でコアダンプを送信するように正しく構成されていることを確認します。詳細については、「Configuring an ESXi 5.0 host to capture a VMkernel coredump from a purple diagnostic screen via the Network Dump Collector (2002955)」を参照してください。

  3. ESXi 5.1 では、次のコマンドを使用して netdump の機能を確認します。

    esxcli system coredump network check

    コアダンプが正常に転送されると、次の出力が返されます。

    構成された netdump サーバが実行中であることが確認されました

    コアダンプの転送が失敗すると、次のような出力が返されます。

    構成された netdump サーバと通信できませんでした:構成された netdump サーバは一定時間内に応答しませんでした

  4. ホストが構成された UDP ポートでリモート netdump Dump Collector サービスに接続できること、Dump Collector サービスがテスト接続を報告することを確認します。

    1. ホストへの ESXi Shell コンソール セッションを開きます。詳細については、「Using Tech Support Mode in ESXi 4.1 and ESXi 5.x (1017910)」を参照してください。

    2. 変更が有効になるように、次のコマンドを使用してファイアウォール ルールを更新します。

      esxcli network firewall refresh

      :この設定は再起動後には保持されません。再起動してもこの設定を保持するには、「追加情報」セクションを参照してください。

    3. 次のコマンドを使用して Netdump ファイアウォール ルールが有効化されていることを検証します。

      esxcli network firewall ruleset list --ruleset-id=netDump

      次のような出力が得られます。

      Name Enabled
      ------- -------
      netDump true


    4. 次のコマンドを使用して、ネットワーク コアダンプを送信するために構成された VMkernel インターフェイス名とターゲット IP アドレスを特定します。

      esxcli system coredump network get

      次のような出力が得られます。

      Enabled: True
      Host VNic: vmk0
      Network Server IP: 10.11.12.13
      Network Server Port: 6500

      : ESXi 5.0 の場合、仮想スイッチ VLAN タギングを使用する VMkernel ポートでは、さらに構成が必要となることがあります。詳細については、「Mixed vSphere 5.0 and 5.1 environments behind VLAN require configuration changes (2032821)」を参照してください。

    5. 次のコマンドを使用して、ネットワーク コアダンプを送信するために構成された VMkernel インターフェイスの IPv4 アドレスを特定します。

      esxcli network ip interface ipv4 get --interface-name=vmk0

      次のような出力が得られます。

      Name IPv4 Address IPv4 NetMask IPv4 Broadcast Address Type DHCP DNS
      ---- ------------ ------------ -------------- ------------ --------
      vmk0 10.55.66.77 255.0.0.0 10.255.255.255 STATIC false


    6. 次のコマンドを使用して、ESXi ホストから IP アドレスとポートの Dump Collector サービスにテスト トラフィックを送信します。

      nc -z -w 1 -s VMkernelIPAddress -u DumpCollectorIPAddress DumpCollectorPortNumber

      例:

      nc -z -w 1 -s 10.55.66.77 -u 10.11.12.13 6500

      nc コマンドは、リモート Netdump サーバがトラフィックを受信するかどうかにかかわらず、成功した接続を報告します。

    7. 接続が確立したことを表すメッセージがあるか、受信 Dump Collector サービスからのログを確認します。

      たとえば、vCenter Server 5.0 Dump Collector ログには、次のようなメッセージで不明なクライアント接続が報告されます。

    yyyy-mm-ddTHH:MM:SS.nnnZ| netdumper| Bad magic:0xa656761.Expected:0xadeca1bf
    yyyy-mm-ddTHH:MM:SS.nnnZ| netdumper| Skipping bad packet.

  1. エラーがないか、受信 Dump Collector サービスからのログを確認します。詳細については、「Location of vSphere ESXi Dump Collector log files (2003277)」を参照してください。

    : Dump Collector ログと受信 zdump ファイル名の日付とタイムスタンプには、コアダンプを出力する ESXi ホストの時刻ではなく、Dump Collector を実行するサーバの時刻が反映されます。

    Dump Collector サービスの通常の起動のログは次のようになります。

    netdumper| Log for vmware-netdumper pid=PidNumber version=VVV build=build-BBBBB option=Release
    netdumper| The process is 32-bit.
    netdumper| Host codepage=UTF-8 encoding=UTF-8
    log FIFO capture : Msg_Reset:
    log FIFO capture : [msg.dictionary.load.openFailed] Cannot open file "/path": No such file or directory
    netdumper| Configured to handle 1024 clients in parallel.
    netdumper| Configuring /path/to/coredump/storage as the directory to store the cores
    netdumper| Configured to use ListeningIPAddress:Port as the IP address:port
    netdumper| Using /var/log/vmware/netdumper/netdumper.log as the logfile.
    netdumper| Configure to daemonize netdumper


    msg.dictionary.load.openFailed メッセージでは、いくつかの存在しない構成ファイルに言及しています。これは正常です。

  2. 停止中、コンソール VMkernel ログ ビューアを使用して、停止にいたった画面でログ メッセージを確認します。ここに、ネットワーク コアダンプが失敗した理由が記載されている場合があります。詳細については、「Using the local debugger to review logs after an ESXi host fails with a purple diagnostic screen (2003067)」を参照してください。

    通常の netdump は次のようになります。

    netdumper| Starting network coredump from VMkernelIPAddress to DumpCollectorIPAddress.
    netdumper| Dump: nnnn: Compressed dump took bbbbbb bytes total.
    netdumper| NetDump: Successful.
    netdumper| Stopping Netdump.


  3. ESX/ESXi ホストから Network Dump Collector サーバへのネットワーク接続が成功するものの、重大な障害が発生して紫色の診断画面が表示されるときに、ホストがサーバにアクセスできない場合、ネットワーク接続は停止により影響を受けている場合があります。この場合、ディスクベースの方法およびシリアルポートベースの方法で診断情報を取得します。詳細については、「Configuring an ESX/ESXi host to capture a VMkernel coredump from a purple diagnostic screen (1000328)」および「Enabling serial-line logging for an ESX or ESXi host (1003900)」を参照してください。


Additional Information

再起動後に(上記手順 4c の)ファイアウォール構成を保持するには、次の手順を実行します。
  1. 新しく定義された netdump.xml ファイルを恒久的ストレージ(/store/ など)または VMFS ボリューム(/vmfs/volumes/volume/)にコピーします。

    cp /etc/vmware/firewall/netdump.xml location-of-xml

    : VMFS ボリュームを単一の場所に格納して、複数のホストにコピーすることができます。

  2. 次の行をホストの /etc/rc.local ファイルに追加します。

    cp location-of-xml-file /etc/vmware/firewall
    esxcli network firewall refresh


    ここで location-of-xml ファイルとは、ファイルのコピー先となった場所です。
Troubleshooting the ESXi Dump Collector service in VMware vSphere 5.x