利用 vSphere 5.1 及更高版本,当出现网络配置错误时,您可以回滚到之前的网络配置。 此外,您可以借此从任何配置错误中恢复,方法是直接连接到主机,进而通过直接控制台用户界面 (DCUI) 修复任何网络问题。 回滚同时适用于标准交换机和 Distributed Switch。
背景
每台主机上都会配置管理网络,该网络用于与 vCenter Server 通信,以及在 vSphere HA 配置和运行期间与其他主机交互。 通过 vCenter Server 集中管理主机至关重要。 如果主机上的管理网络中断或存在配置错误,vCenter Server 将无法连接到主机,并因此无法集中管理 vSphere 基础架构。
在 vSphere 标准交换机 (VSS) 环境中,您可以通过 DCUI 重新配置主机管理网络,这样,您将可以从主机上的管理网络故障中恢复。
但是,在有多个主机连接到一个 Distributed Switch 的 VDS 环境中,管理端口组的任何网络故障或配置错误都可能导致所有主机与 vCenter Server 系统断开连接。 在这种情况下,vCenter Server 无法对 VDS 端口组配置进行任何集中更改,也无法将这些更改推送给主机。 从此情况恢复的唯一方法是,转到单独的主机并通过正确的管理网络配置构建一个 VSS。 当通过 VSS 重新配置所有主机的管理网络并使其可以通过管理网络通信后,vCenter Server 将重新获得管理主机和重新配置 VDS 的能力。
为避免此类返回 VSS 的运行问题,如果您的主机上没有物理网卡限制,则您可以将 VSS 用于管理网络,将 VDS 用于所有其他虚拟基础架构和虚拟机通信。 在这样的部署中,您的主机上至少要有四个网络适配器:两个连接到 VSS,两个连接到 VDS。
vSphere 5.1 中引入的自动回滚和恢复功能可解决有关在 VDS 上使用管理网络的问题。 首先,自动回滚功能可自动检测管理网络上的任何配置更改。 如果主机无法连接到 vCenter Server 系统,它将不允许更改生效。 其次,您还可以通过 DCUI 重新配置每个主机的 VDS 管理网络。
vSphere Network 回滚
回滚默认启用。 但是,您可以在 vCenter Server 层级启用或禁用回滚。
多种网络事件可以触发回滚。 这些事件分为以下几个类别:
- 主机网络回滚(虚拟交换机或网络系统)
- Distributed Switch 回滚
主机网络回滚
对主机网络配置进行无效更改时会发生主机网络回滚。 此外,断开主机连接的每个网络更改都会触发回滚。 以下是一些可能触发回滚的主机网络配置更改示例:
- 更新物理 NIC 的速度或双工
- 更新 DNS 和路由设置
- 更新包含管理 VMkernel 网络适配器的标准端口组的绑定与故障切换策略或流量调整策略
- 更新包含管理 VMkernel 网络适配器的标准端口组的 VLAN
- 将管理 VMkernel 网络适配器及其交换机的 MTU 增加至物理基础架构不支持的值
- 更改管理 VMkernel 网络适配器的 IP 设置
- 将管理 VMkernel 网络适配器从标准交换机或 Distributed Switch 上移除
- 移除包含管理 VMkernel 网络适配器的标准交换机或 Distributed Switch 的物理 NIC
如果网络连接由于上述任何原因而断开,任务将失败,主机将恢复至最近一次有效配置。
Distributed Switch 回滚
当对 Distributed Switch、分布式端口组或分布式端口等 Distributed Switch 相关对象进行无效更新时会发生 Distributed Switch 回滚。 对 Distributed Switch 配置进行以下更改可能触发回滚:
- 更改 Distributed Switch 的 MTU
- 更改管理 VMkernel 网络适配器的分布式端口组中的以下设置
- 绑定与故障切换
- VLAN
- 流量调整
- 阻止包含管理 VMkernel 网络适配器的分布式端口组中的所有端口
- 替代管理 VMkernel 网络适配器连接到的分布式端口对应的上述策略
如果任何更改导致无效配置出现,则可能会导致一个或多个主机与 Distributed Switch 不同步的问题。
如果知道冲突配置设置的位置,您可以手动更正该设置。 例如,如果您错误地将管理 VMkernel 网络适配器迁移到一个新 VLAN,则该 VLAN 可能无法通过 Truck 端口与物理交换机联通。 当您更正物理交换机配置时,下一次 Distributed Switch 至主机同步将解决配置问题。
如果不确定问题的位置,您可以将 Distributed Switch 或分布式端口组回滚到之前的配置。 您手动执行所有这些步骤。
注意: 有关通过 vSphere Web Client 回滚到之前配置或使用 vSphere Web Client 禁用网络回滚的信息,请参见 vSphere Networking Guide 中的“网络回滚和恢复”。
使用直接控制台用户界面 (DCUI) 从网络配置错误中恢复。
利用 vSphere 5.1 及更高版本,您可以直接连接到主机,进而使用直接控制台用户界面 (DCUI) 修复 Distributed Switch 属性或其他网络配置错误。
注意:
- 无状态 ESXi 实例不支持恢复。
- 必须在 Distributed Switch 上配置管理网络。 只有这样,才能使用 DCUI 修复 Distributed Switch 配置错误。
从 DCUI 还原 VDS:
- 连接到 DCUI。
- 从网络还原选项菜单中,选择还原 vDS。
- 在适当的情况下,键入 VLAN 上行链路和已阻止属性的正确值。
- 按 Enter 键。
DCUI 将从现有配置错误端口克隆一个主机本地端口,并将您提供的值应用于 VLAN 和阻止的属性。 DCUI 更改管理网络,以便使用新的主机本地端口将连接性还原至 vCenter Server。vCenter Server 选取新的主机本地端口,并通过新信息更新其数据库。vCenter Server 会创建一个连接到管理网络的独立端口。