排除一个在无响应的状态中的 ESXi/ESX 主机
search cancel

排除一个在无响应的状态中的 ESXi/ESX 主机

book

Article ID: 301396

calendar_today

Updated On:

Products

VMware vCenter Server VMware vSphere ESXi

Issue/Introduction

本文提供在 vCenter Server 中状态为已断开连接或不响应的 ESXi/ESX 主机的故障排除步骤。 另外,本文为您提供了通过验证网络和管理服务器代理的配置是否正确,以及确认 ESXi/ESX 主机上资源的可用性来消除问题常见原因的步骤。


Symptoms:

免责声明:本文为 Troubleshooting an ESXi/ESX host in non responding state (1003409) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。


  • ESXi/ESX 主机在 VirtualCenter 或 vCenter Server 中显示为“无响应”
  • ESXi/ESX 主机在 vCenter Server 中显示为“已断开”
  • 无法将 ESXi/ESX 主机连接到 vCenter Server
  • ESXi/ESX 主机上的虚拟机在 vCenter Server 中为灰显
  • 当尝试将 ESXi/ESX 主机添加到 vCenter Server 时,您会看到类似以下内容的错误:

    Unable to access the specified host, either it doesn't exist, the server software is not responding, or there is a network problem

  • vpxd.log 文件中,您会看到类似以下内容的条目:

    • <YYYY-MM-DD>T<time>.696-05:00 [08128 info 'vpxdvpxdMoHost' opID=37D08048-00006071-85] [HostMo] host connection state changed to [DISCONNECTED] for host-26725

      </time>
    • <YYYY-MM-DD>T<time>.508-04:00 [04944 error 'vpxdvpxdInvtHostCnx' opID=HB-host-385@3560-79f8b53e] [VpxdInvtHostSyncHostLRO] FixNotRespondingHost failed for host host-385, marking host as notResponding
      <YYYY-MM-DD>T<time>.633-04:00 [00812 error 'vpxdvpxdInvtHostCnx' opID=HB-host-385@3565-12c9cfec] [VpxdInvtHostSyncHostLRO] FixNotRespondingHost failed for host host-385, marking host as notResponding</time></time>


      有关详细信息,请参见 VMware vCenter Server 6.0 日志文件的位置 (2115740)

      注意: 上述日志摘录仅为示例。 日期、时间和环境变量可能会因环境而有所不同。


Environment

VMware vCenter Server 6.0.x
VMware vCenter Server 5.1.x
VMware ESX 4.1.x
VMware ESX 4.0.x
VMware vCenter Server 4.0.x
VMware ESX Server 3.0.x
VMware ESXi 4.0.x Embedded
VMware vSphere ESXi 6.5
VMware vCenter Server 6.5.x
VMware ESXi 3.5.x Embedded
VMware vSphere ESXi 5.1
VMware vSphere ESXi 6.0
VMware vCenter Server 5.0.x
VMware vCenter Server 4.1.x
VMware ESXi 3.5.x Installable
VMware VirtualCenter 2.5.x
VMware ESXi 4.1.x Embedded
VMware vSphere ESXi 5.5
VMware vSphere ESXi 5.0
VMware ESXi 4.1.x Installable
VMware VirtualCenter 2.0.x
VMware ESX Server 3.5.x
VMware ESXi 4.0.x Installable

Resolution

验证下面每个故障排除步骤是否适合您的环境。 每个步骤均提供相关说明或文档链接,用于消除可能的原因并采取必要的补救措施。 这些步骤按照最合适的顺序排序,以隔离问题并确定正确的解决方法。 在每个步骤完成之后,尝试连接到 vCenter Server。 请勿跳过任何一个步骤。

处于“无响应”状态的 VMware ESX/ESXi 主机

ESXi

  1. 验证 ESXi 主机是否处于已打开电源状态。 有关详细信息,请参见确定 ESXi/ESX 主机关闭电源或重新启动的原因 (2088077)
  2. 验证是否可以重新连接 ESXi 主机,或重新连接 ESXi 主机是否可以解决问题。 有关详细信息,请参见在 vCenter Server 中更改 ESXi 或 ESX 主机的连接状态 (2075640)
  3. 验证 ESXi 主机是否能够响应位于正确 IP 地址的 vCenter Server。 如果 vCenter Server 未能从 ESXi 主机收到检测信号,则它会进入“无响应”状态。 要验证是否设置了正确的受管 IP 地址,请参见验证 VMware vCenter Server 受管 IP 地址 (2087222)将 ESXi 5.0 主机添加到 vCenter Server 后,主机被标记为“60 秒无响应” (2110815)。 另请参见在将 ESXi/ESX 添加或连接到清单后,其从 vCenter Server 断开连接 (2096240)当 vCenter Server 未收到检测信号时,ESX/ESXi 主机不断断开连接并重新连接 (2086781)
  4. 使用 IP 和 FQDN 验证是否存在从 vCenter Server 到 ESXi 主机的网络连接。 有关详细信息,请参见用 ping 命令测试网络连接 (2076574)
  5. 验证您是否能够通过 TCP/UDP 端口 902 从 vCenter Server 连接到 ESXi 主机。 如果从版本 2.x 升级了主机,且您无法在端口 902 上建立连接,请验证是否能够在端口 905 上建立连接。 有关详细信息,请参见使用Telnet验证端口的连通性 (2020963)
  6. 验证重新启动 ESXi 管理代理是否可以解决问题。 有关详细信息,请参见在 ESXi 或 ESX 主机上重新启动管理代理 (2048205)
  7. 验证受影响的 ESXi 主机上的 hostd 进程是否已停止响应。 有关详细信息,请参见 vmware-hostd 服务失败或在 ESX/ESXi 主机上停止响应时排除故障 (2086202)
  8. 受影响的 ESXi 主机上的 vpxa 代理已停止响应。 有关详细信息,请参见 vCenter Server Agent 不启动时对其进行故障排除 (2086881)
  9. 验证 ESXi 主机是否出现紫色诊断屏幕。 有关详细信息,请参见解释 ESX/ESXi 主机紫色诊断屏幕 (2077746)
  10. ESXi 主机可能因为基础存储问题从 vCenter Server 断开连接。 有关详细信息,请参见确定 ESX/ESXi 主机上的光纤通道、iSCSI 和 NFS 存储问题 (2074930)

ESX

  1. 验证 ESX 主机是否处于已启动状态。
  2. 验证是否可以重新连接 ESX 主机,或重新连接 ESX 主机是否可以解决问题。 有关详细信息,请参见 Changing an ESXi or ESX host's connection status in vCenter Server (1003480)
  3. 验证 ESX 主机是否能够响应位于正确 IP 地址的 vCenter Server。 如果 vCenter Server 未能从 ESX 主机收到检测信号,则它会进入“无响应”状态。 要验证是否设置了正确的受管 IP 地址,请参见 Verifying the vCenter Server Managed IP Address (1008030)。 另请参见 ESXi/ESX host disconnects from vCenter Server after adding or connecting it to the inventory (2040630)
  4. 使用 IP 和 FQDN 验证是否存在从 vCenter Server 到 ESX 主机的网络连接。 有关详细信息,请参见 Testing network connectivity with the ping command (1003486)
  5. 验证您是否能够通过 TCP/UDP 端口 902 从 vCenter Server 连接到 ESX 主机。 如果从版本 2.x 升级了 ESX 主机,且您无法在端口 902 上建立连接,请验证是否能够在端口 905 上建立连接。 有关详细信息,请参见 Testing port connectivity with Telnet (1003487)
  6. 验证 ESX 管理服务 vmware-hostd 是否正在运行。 有关详细信息,请参见 Verifying that the Management Service is running on an ESX host (1003494)Troubleshooting vmware-hostd service if it fails or stops responding on an ESXi/ESX host (1002849)
  7. 验证 VirtualCenter 代理服务 vmware-vpxa 是否正在运行。 有关详细信息,请参见 Verifying that the vCenter Server Agent Service is running on an ESX host (1003495)
  8. 验证 xinetd 服务是否正在运行。 如果 xinetd 未运行,则身份验证可能会失败。 有关详细信息,请参见 Determining if the xinetd service is running on an ESX host (1007323)
  9. 验证重新启动 ESX 管理代理是否可以解决问题。 有关详细信息,请参见 Restarting the Management agents on an ESXi or ESX host (1003490)
  10. 验证是否有进程正在过度耗用服务控制台上的资源。 有关详细信息,请参见 Checking for resource starvation of the ESX Service Console (1003496)
  11. ESX 主机可能因为基础存储问题从 vCenter Server 断开连接。 要进一步调查,请参见 Identifying Fibre Channel, iSCSI, and NFS storage issues on ESXi/ESX hosts (1003659)

处于“已断开”状态的 VMware ESXi 主机


  1. 受影响的 ESXi 主机已由用户从 vCenter Server 明确地断开连接。 有关详细信息,请参见 VMware vSphere 5.1 Documentation 中的“断开和重新连接主机”部分。
  2. ESXi 主机许可证已过期。 有关详细信息,请参见 VMware vSphere 6.0 Documentation 中的“ESXi 主机的许可”部分。
  3. 阻止流量通过端口 902 的防火墙问题。 有关详细信息,请参见 TCP and UDP Ports required to access VMware vCenter Server, VMware ESXi and ESX hosts, and other network components (1012382)
注意: 如果在尝试执行了本文中的步骤后问题仍然存在,请执行以下操作:


Additional Information

有关其他信息,请参见 All ESX hosts simultaneously show a status of Not Responding in vCenter (1011878)

Troubleshooting an ESXi/ESX host in non responding state
使用Telnet验证端口的连通性
在 ESXi 中重新启动管理代理
确定 ESX/ESXi 主机上的光纤通道、iSCSI 和 NFS 存储问题
在 vCenter Server 中更改 ESXi 或 ESX 主机的连接状态
用 ping 命令测试网络连接
解释 ESX/ESXi 主机紫色诊断屏幕
vmware-hostd 服务失败或在 ESX/ESXi 主机上停止响应时排除故障
ESXi 主机间歇性地与 vCenter Server 断开连接
vCenter Server Agent 不启动时对其进行故障排除
验证 VMware vCenter Server 受管 IP 地址
确定 ESXi/ESX 主机关闭电源或重新启动的原因
在将 ESXi/ESX 添加或连接到清单后,其从 vCenter Server 断开连接
将 ESXi 5.0 主机添加到 vCenter Server 后,主机被标记为“60 秒无响应”
VMware vCenter Server 6.0 日志文件的位置