主机将 vSphere HA 状态显示为“网络已分区”
search cancel

主机将 vSphere HA 状态显示为“网络已分区”

book

Article ID: 307477

calendar_today

Updated On:

Products

VMware vCenter Server

Issue/Introduction

Symptoms:
免责声明:本文为 Host shows the vSphere HA status as Network Partitioned (2012649) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本。


  • 主机将 vSphere HA 状态报告为“网络已分区”
  • 在网络已分区主机的 fdm.log 文件中,您会看到以下条目:

    info 'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::MainLoop] curState 1 lastState 3
    info 'Election' opID=SWI-eb460f87] Startup: Got AmMaster
    0 info 'Election' opID=SWI-eb460f87] [ClusterElection::ChangeState] Startup => SlaveConnecting : StartupStateFunc
    'Cluster' opID=SWI-eb460f87] Change state to SlaveConnecting:20224569933819
    verbose 'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::CheckElectionState] Transitioned from Startup to SlaveConnecting
    info 'Cluster' opID=SWI-eb460f87] [ClusterManagerImpl::ConnectToMaster] Connecting to master host-143 @ 10.4.252.33:8182
    info 'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::MainLoop] curState 3 lastState 1
    warning 'Libs' opID=SWI-2e80d2bf] SSL_VerifyX509: Certificate verification is disabled, so connection will proceed despite the error
    verbose 'Cluster' opID=SWI-eb460f87] [ClusterManagerImpl::VerifyHost] Thumbprint match 9B:FD:53:E3:99:4D:91:3A:55:40:05:B4:B4:A5:3B:49:92:CD:F1:60 for host host-143
    'Cluster' opID=SWI-eb460f87] [ClusterManagerImpl::ConnectToMaster] Connected to master @ host-143
    2012-01-23T15:51:55.105Z [FFE48B90 info 'Election' opID=SWI-eb460f87] Slave to host @ 10.4.252.33
    2012-01-23T15:51:55.105Z [FFE48B90 info 'Election' opID=SWI-eb460f87] [ClusterElection::ChangeState] SlaveConnecting => Slave : SlaveConnectingStateFunc
    2012-01-23T15:51:55.105Z [FFE48B90 info 'Cluster' opID=SWI-eb460f87] Change state to Slave:20224569933819
    2012-01-23T15:51:55.105Z [FFE07B90 verbose 'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::CheckElectionState] Transitioned from SlaveConnecting to Slave
    'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::MainLoop] curState 4 lastState 3
    'Election' opID=SWI-eb460f87] [ClusterElection::ChangeState] Slave => Startup : Lost master
    'Cluster' opID=SWI-eb460f87] Change state to Startup:0
    verbose 'Cluster' opID=SWI-8948711d] [ClusterManagerImpl::CheckElectionState] Transitioned from Slave to Startup
    info 'Message'] Destroying connection

  • fdm.log 文件(位于列为已启用 HA 群集的主主机的主机上)中,您会看到以下条目:

    verbose 'Cluster' opID=SWI-14c14582 '[ClusterManagerImpl::IsBAdIP] 192.168.111.41 is bad ip
    verbose 'Cluster' opID=SWI-14c14582 '[ClusterManagerImpl::InvalidCredentialsIP::IsBadIP 291.168.111.41 is in the bad ip manager
    warning 'Election' opID=SWI-14c14582ReadMsg [60 times] Received messge from bad ip 192.168.111.41 - dropping
    verbose 'Cluster' opID=SWI-14c14582 '[ClusterManagerImpl::Verify Host] Thumbprint mismatch (BC:87:D4:76:EE:E1:66:0D:83:EA:A3:7F:
    verbose 'Cluster' opID=SWI-14c14582 '[ClusterManagerImpl::InvalidCredentialsIP::SetBadIP] Blacklisting ip address 192.168.111.41 for 60 seconds
    warning 'Cluster Slave host-124 has invalid credentials - closing connection


Environment

VMware vCenter Server 5.0.x
VMware vCenter Server 5.1.x

Cause

当提供给主主机的 SSL 证书指纹不是主主机所需的 SSL 证书指纹时,会出现此问题。主主机的 fdm.log 文件会显示指纹不匹配错误。

Resolution

要解决此问题,请执行以下操作:
  1. 禁用 HA。

    要禁用 HA,请执行以下操作:
    1. 在 vCenter Server 清单中,右键单击群集,然后单击编辑设置
    2. 取消选择打开 vSphere HA 选项。
    3. 单击确定
    4. 等待所有主机重新配置“近期任务”中的 HA。

  2. 确保启用 SSL 证书检查。

    对于 vCenter 5.0 及更低版本:
    1. 在连接到 vCenter Server 的 vSphere Client 中,单击系统管理 > vCenter Server 设置
    2. 如果 vCenter Server 系统属于某一连接组,请从“当前 vCenter Server”下拉列表中选择要配置的服务器。
    3. 在设置列表中,选择 SSL 设置

    对于 vCenter Server 5.1 及更高版本:
    1. vSphere Web Client 中,导航到 vCenter Server 实例。
    2. 单击管理选项卡。
    3. 在“设置”下,单击常规
    4. 单击编辑,然后选择 SSL 设置

  3. 选择 vCenter 需要已验证的主机 SSL 证书。如果有需要手动验证的主机,则这些主机将显示在对话框底部的主机列表中。
  4. 单击确定
  5. 对于需要验证的每个主机,确定其指纹。
    1. 登录到直接控制台。有关详细信息,请参见 vSphere Installation and Setup Guide 中的“登录 ESXI Shell”部分。
    2. 在“系统自定义”菜单中,单击查看支持信息。此时指纹将显示在右列中。

      注意
      • 如果您无法访问直接控制台,请将未安装主机证书的 vSphere Client 直接连接到主机。当系统提示您确认证书时,请单击查看证书 > 详细信息,然后向下滚动到指纹。
      • 如果出现问题的原因是 SSL 指纹不匹配,则单击确定后,所有列出的主机都将与 vCenter Server 断开连接。重新连接每个主机以刷新 SSL 指纹。这需要根密码。

  6. 将从主机获取的指纹与“vCenter Server 设置”对话框中列出的指纹进行对比。
  7. 如果指纹匹配,请选中与该主机对应的复选框。
  8. 单击确定。此时未选中的主机将断开连接。

  9. 将主机重新连接到 vCenter Server。

    要重新连接主机,请执行以下操作:
    1. 右键单击断开连接的主机,然后单击连接
    2. 出现提示时,输入主机的凭据以将主机重新连接到 vCenter Server。

      将显示一个弹出框,指出主机的 SSL 证书的 SHA1 指纹。

    3. 单击。主机现已连接到 vCenter Server。

  10. 启用 HA。

    要启用 HA,请执行以下操作:
    1. 在 vCenter Server 清单中,右键单击群集,然后单击编辑设置
    2. 选择打开 vSphere HA 选项。
    3. 单击确定
    4. 等待所有主机重新配置“近期任务”中的 HA。
主机现在应将 vSphere HA 状态显示为“已连接 (从属)”或“已连接 (主要)”,具体取决于启用 HA 时的选举结果。

Additional Information

注意:如果在 ESX/ESXi 管理 VLAN 上启用了代理 ARP,也可能会出现此问题。要解决此问题,请禁用代理 ARP。有关详细信息,请参见 Troubleshooting network connection issues caused by proxy ARP (1005965)Host shows the vSphere HA status as Network Partitioned