vCenter Server 中出现错误“vSphere HA 虚拟机无法故障切换 (vSphere HA virtual machine failed to failover)”
search cancel

vCenter Server 中出现错误“vSphere HA 虚拟机无法故障切换 (vSphere HA virtual machine failed to failover)”

book

Article ID: 340913

calendar_today

Updated On:

Products

VMware vCenter Server

Issue/Introduction

本文提供以下方面的信息:
  • 从虚拟机清除 vSphere HA 虚拟机无法故障切换 (vSphere HA virtual machine failed to failover) 错误。
  • 出现 vSphere HA 虚拟机无法故障切换 (vSphere HA virtual machine failed to failover) 错误时,处理错误。
  • 减少 vSphere HA 虚拟机无法故障切换 (vSphere HA virtual machine failed to failover) 错误的发生。


Symptoms:
免责声明:本文为 "vSphere HA virtual machine failed to failover" error in vCenter Server (2034571) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。

  • 在隔离响应设为保持打开电源的群集中,当主机被隔离时,可能会在虚拟机上显示以下错误。

    vSphere HA 虚拟机未能故障切换 (vSphere HA virtual machine failed to failover)

  • 虚拟机继续运行,而不会出现任何问题。


Environment

VMware vCenter Server 5.5.x
VMware vCenter Server 5.0.x
VMware vCenter Server 5.1.x

Cause

只要 High Availability 主代理声明主机死机,就会发生此行为。但是,虚拟机将继续运行,而不会发生任何事件。此警报并不意味着 HA 已失败或是停止了工作。当触发此警报时,意味着一个或多个虚拟机未能由受 HA 保护的群集中的主机打开电源。
发生此问题的可能原因如下:

  • 主机仍在运行,但已从网络断开连接。群集的主机隔离响应设置为保持打开电源

    • 当主机与网络隔离时,群集中的其余主机不知道该主机是已崩溃还是仅从网络断开了连接。因此,其余主机将尝试打开最后被记录为在已隔离主机上运行的虚拟机的电源。启用“保持打开电源”时,与网络隔离的主机将保持虚拟机启动并运行,且不会尝试关闭其电源,因此文件会一直被锁定。已隔离主机锁定文件时,其余主机将无法对虚拟机执行打开电源任务,从而导致触发警报。

  • 主机仍在运行,但已从网络断开连接。群集的主机隔离响应设置为关机关闭电源

    • 通过此主机隔离响应,主机将会在识别出已被隔离时尝试向其上运行的虚拟机发送关机或关闭电源命令。虚拟机完全关机且原始隔离主机不再拥有对虚拟机文件的锁定时,群集中的其余主机将能够获取打开虚拟机电源所需的锁定。如果虚拟机未成功关机或未释放锁定,则将触发警报。

  • 主机已失败,且虚拟机存储处于已降级状态。群集中的其余主机无法联系存储设备,且无法打开虚拟机电源,从而导致触发警报。

Resolution

这在 VMware vCenter Server 5.0.x、5.1.x 和 5.5.x 中是预期行为。由于虚拟机继续运行而未发生任何事件,您可以放心忽略此问题。

要从虚拟机中清除该警报,请执行以下操作:
  1. 选择具有已触发警报的虚拟机。
  2. 单击警报选项卡,然后单击触发的警报按钮。
  3. 右键单击 vSphere HA 虚拟机故障切换失败警报,然后单击清除
注意:如果此警报存在于多个虚拟机上,则可以在左侧窗格中选择主机、群集、数据中心或 vCenter Server 对象并继续执行步骤 2,以通过较少的几步来清除警报。

有关处理警报的详细信息,请参见:

要降低发生此问题的可能性,请执行以下操作:

  • 使用多个管理网络。有关详细信息,请参见:vSphere High Availability Deployment Best Practices
  • 确保在发生管理网络问题时 vCenter Server 中的数据存储检测信号正在进行正确通信,以便 HA 能够有效运行。

    例如,如果使用 SAN 和基于 IP 的存储,请将几个基于 SAN 的数据存储挂载到群集中的主机,以便 HA 可使用它们来代替基于 IP 的存储。或者,如果仅使用基于 IP 的存储,请考虑将一个或多个用于该存储的网络与用于管理网络的网络进行故障隔离。


Additional Information

"vSphere HA virtual machine failed to failover" error in vCenter Server