vSphere 5.x 和 6.x 中的 VMware High Availability 的高级配置选项
search cancel

vSphere 5.x 和 6.x 中的 VMware High Availability 的高级配置选项

book

Article ID: 301401

calendar_today

Updated On:

Products

VMware vCenter Server VMware vSphere ESXi

Issue/Introduction

在多数环境中,您不得更改 VMware High Availability (HA) 默认设置。但是,根据您的特定环境,必须修改某些 HA 选项。

本文介绍可用的不同配置选项以及应用这些选项的方式。


Symptoms:
免责声明: 本文为 Advanced configuration options for VMware High Availability in vSphere 5.x and 6.x (2033250) 的翻译版本 尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。 有关最新内容,请参见英文版本。

Environment

VMware vCenter Server 6.0.x
VMware vCenter Server 5.5.x
VMware vCenter Server 5.1.x
VMware vCenter Server 5.0.x
VMware vSphere ESXi 6.5

Resolution

注意:并不是所有配置变量均适用于 vCenter Server 的所有版本。在更高版本中提供了新变量后,这些变量将保留在全部后续版本中。

应用 VMware HA 自定义

使用 vSphere Web Client

  1. 登录到 VMware vSphere Web Client。
  2. 转至主页 > vCenter > 群集
  3. 在“对象”下,单击要修改的群集。
  4. 单击管理
  5. 单击 vSphere HA
  6. 单击编辑
  7. 单击高级选项
  8. 单击添加,然后根据需要在“选项”和“值”字段中输入内容(见下文)。
  9. 取消选中打开 vSphere HA
  10. 单击确定
  11. 等待 HA 取消配置,单击编辑,然后选中打开 vSphere HA
  12. 单击确定并等待群集重新配置。
使用 vSphere Client 确定
  1. 以管理员身份使用 vSphere Client 登录到 vCenter Server。
  2. 右键单击清单中的群集,然后单击编辑设置
  3. 单击 VMware HA
  4. 单击高级选项
  5. 根据需要在选项字段中输入内容(见下文)。
  6. 单击确定
  7. 再次单击确定
  8. 等待重新配置群集任务完成,然后再次从清单中右键单击该群集。
  9. 单击属性
  10. 禁用 VMware HA 并等待重新配置群集任务完成。
  11. 右键单击该群集并选择启用 VMware HA,以使设置生效。

    注意:如果需要重新配置主机,请见下文。

HA 高级选项有三种类型,每种类型通过不同方法进行设置。

  • vCenter Server 选项 (VC) – 这些选项在 vCenter Server 级别进行配置并应用到所有 HA 群集,但是,如果存在特定于群集的选项,则 vCenter Server 选项会被特定于群集的选项覆盖。如果使用 vCenter Server 选项管理器配置 vCenter Server 选项,则无需重新启动 vCenter Server – 有关详细信息,请参见特定选项。但如果通过将选项字符串添加到 vpxd.cfg 文件(作为 config/vpxd/das 标记的子项)来配置这些选项,则需要重新启动。
  • 群集选项(群集) – 这些选项针对单个群集配置,如果它们影响 HA 代理 (FDM) 的行为,则它们将应用到该群集中的 FDM 的所有实例。这些选项通过使用 HA 群集级别的高级选项机制或者通过 UI 或 API 来配置。使用下面的“fdm options”机制还可应用名称以“das.config.”开头的选项,但是不建议此做法,因为这些选项应同等地应用于所有 FDM 实例。
  • FDM 选项 (FDM) – 这些选项针对主机上的单个 FDM 实例配置。这些选项的配置方法是将相应选项作为 config/fdm 标记的子项添加到主机的/etc/opt/vmware/fdm/fdm.cfg文件。如果卸载 FDM(例如,如果从 vCenter Server 中移除主机然后再重新添加),或者由 Auto Deploy 管理的主机重新引导,则会丢失以此方式设置的选项。

常见选项


版本

名称

描述

重新配置

选项类型

群集配置

5.0、5.1 和 5.5

das.allowNetworkX

可用于指定由 HA 使用的特定管理网络,其中 X 是一个介于 0 和 9 之间的数字。例如,如果将值设置为“Management Network”,则只会使用与具有此名称的端口组关联的网络。确保使用命名的端口组配置所有主机,并且这些网络可兼容。在 5.5 中,如果已为群集启用 vSAN,则会忽略此选项。

是。在所有主机上重新配置 HA 以使规范生效。

群集

5.0、5.1 和 5.5

das.ignoreRedundantNetWarning

如果未针对由 HA 使用的网络为主机配置冗余网络,HA 将报告该主机出现配置问题。对于低于 5.5 的版本,HA 仅使用管理网络,而在 5.5 版本中,如果已启用 vSAN,HA 将使用为 vSAN 配置的网络。有效值为 true/false。设置为 true 可禁止配置问题。如果未设置该选项,则假定为 false。

是。在主机上重新配置 HA 以解决该主机的配置问题。

群集

5.0、5.1、5.5 和 6.0

das.heartbeatDsPerHost

默认情况下,HA 为 HA 群集中的每个主机选择 2 个检测信号数据存储。此选项可用于将数值增加到 2 至 5(包括二者)之间的值。

是。在群集中的所有主机上重新配置 HA。

群集

5.0、5.1、5.5 和 6.0

das.ignoreInsufficientHbDatastore

如果 HA 无法为 das.heartbeatDsPerHost 指定的主机选择所需数目的数据存储,则会报告主机配置问题。将此选项设置为 true 可禁止此警告,而设置为 false 可启用此警告。如果未设置该选项,则假定值为 false。

是。在群集中的所有主机上重新配置 HA。

群集

5.0、5.1 和 5.5

das.includeFTcomplianceChecks

在群集配置文件合规性检查过程中是否检查群集对 Fault Tolerance 的合规性。如果未计划在群集中使用 FT,则将此选项设置为 false。值为 true 将启用检查。如果未设置,则假定值为 true。

群集

5.5 U3vpxd.das.fdmWaitForUpdatesTimeoutSecHA 等待 FDM 主节点响应的超时期间。

注意:此设置需要从 vCenter Server 高级设置进行应用。有关详细信息,请参见vCenter Server and Host Management 指南中的“在 vSphere Web Client 中配置高级设置”部分。
是,需要重新启动 vCenter Server。VC

接入控制

5.0、5.1、5.5、6.0 和 6.5

das.vmMemoryMinMB

以 MB 为单位的值,用于虚拟机的内存预留(如果用户未设置非零内存预留)。如果未设置该选项,则假定为 0。



群集

5.0、5.1、5.5、6.0 和 6.5


das.vmCpuMinMHz

以 MHz 为单位的值,用于虚拟机的 CPU 预留(如果用户未设置非零 CPU 预留)。如果未设置该选项,则假定为 32。



群集

5.0、5.1、5.5 和 6.0

das.slotCpuInMHz

以 MHz 为单位的最大值,用于插槽大小的 CPU 组件。如果未设置该选项,则不施加任何限制。在 5.1 中,可以在 UI 和 API 中精确指定插槽大小的 CPU 组件(请参见 vim.cluster.slotPolicy 对象)。请注意,此选项和 UI/API 行为方式有所不同 – 此选项设置最大值,而 UI/API 设置精确值。如果已定义插槽策略,并且已指定此选项,则会忽略此选项指定的值。

群集

5.0、5.1、5.5 和 6.0

das.slotMemInMB

以 MB 为单位的最大值,用于插槽大小的内存组件。如果未设置该选项,则不施加任何限制。在 5.1 中,可以在 UI 和 API 中精确指定插槽大小的内存组件(请参见 vim.cluster.slotPolicy 对象)。请注意,此选项和 UI/API 行为方式有所不同 – 此选项设置最大值,而 UI/API 设置精确值。如果已定义插槽策略,并且已指定此选项,则会忽略此选项指定的值。

群集

6.0das.config.fdm.memreservationmb 默认情况下,vSphere HA 代理运行时的配置内存限制为 250 MB。如果主机用尽可预留的容量,主机可能不允许此预留。您可以使用此高级选项来降低内存限制以避免此问题。仅可指定大于 100(最小值)的整数。相反,为防止在大型群集(包含 6,000 至 8,000 个虚拟机)的主代理选举期间出现问题,应将此限制增加至 325 MB。

注意:此限制更改后,必须为群集中的所有主机运行重新配置 HA 任务。另外,在将新主机添加到群集或重新引导现有主机时,应对这些主机执行此任务以便更新此内存设置。
群集

重新启动虚拟机

5.0、5.1 和 5.5

das.maxvmrestartcount

FDM 主代理在放弃前尝试重新启动虚拟机的最大次数。如果未设置此选项,则尝试次数为 5 次。仅当自首次尝试重新启动以来经过的时间小于 das.maxvmrestartperiod 的值时,此限制才适用。请注意,FT 辅助虚拟机重新启动次数由单独的参数控制,即 das.maxftvmrestartcount。
警告:将此值设置为非常大的数值会创建大量额外的日志记录,这些日志记录会影响系统日志目录。

群集

5.0、5.1 和 5.5

das.maxvmrestartperiod

FDM 主代理在首次尝试重新启动失败后尝试重新启动虚拟机期间的最大时间量(以秒为单位)。该时间从 FDM 主代理首次尝试重新启动虚拟机开始计算。此时间限制优先于 das.maxvmrestartcount。如果未设置此选项,则不施加任何限制。

群集

5.0、5.1 和 5.5

das.maxftvmrestartcount

FDM 主代理在放弃前尝试启动 FT 虚拟机对的辅助虚拟机的最大次数。如果未设置此选项,则尝试次数为 5 次。
警告:将此值设置为非常大的数值会创建大量额外的日志记录,这些日志记录会影响系统日志目录

群集

5.0U1、5.1、5.5

das.maskCleanShutdownEnabled

如果虚拟机已关闭,并且其主数据存储不可访问,则 HA 无法确定是否应重新启动虚拟机。因此,它必须做出决定。如果此选项设置为 false,则响应的 FDM 主代理将假定不应重新启动虚拟机,而如果此选项设置为 true,则响应的 FDM 将假定应重新启动虚拟机。在 5.0U1 中,如果未设置该选项,则假定值为 false;而在 ESXi 5.1 及更高版本中,则假定值为 true。

群集

5.5 和 6.0das.respectVmVmAntiAffinityRules如果要在失败后重新启动虚拟机,请遵守虚拟机-虚拟机反关联性规则。有效值为“false”(默认值)和“true”群集
6.0das.maxresetsVMCP 进行重置尝试的最大次数。如果受 APD 状况影响而对虚拟机执行重置操作失败,VMCP 将在放弃之前重试重置这么多次。群集
6.0das.maxterminatesVMCP 进行虚拟机终止重试的最大次数。群集
6.0das.terminateretryintervalsec如果 VMCP 无法终止虚拟机,则此选项表示 VMCP 重试终止之前系统等待的秒数。群集
6.0 U3
das.reregisterRestartDisabledVMs
在特定虚拟机上禁用 vSphere HA 时,此选项
可确保发生故障后虚拟机
可在其他主机上注册。这让您可以打开该虚拟机的电源,
而无需手动进行重新注册。
注意:使用此选项时,vSphere HA 不会
打开虚拟机电源,只会注册虚拟机。
群集

隔离响应

5.0、5.1、5.5 和 6.0

das.isolationAddressX

在由 HA 使用的网络 (*) 上未观察到任何代理网络流量时,FDM 代理用来检查隔离的 IP 地址,其中 X 是一个 0 至 9 之间的数字。默认情况下,HA 将使用默认的管理网络网关作为隔离地址,并使用由此高级选项指定的地址作为要检查的其他地址。我们建议为每个由 HA 使用的管理网络添加隔离地址。(*) 对于低于 5.5 的版本,HA 仅使用管理网络,但在 5.5 版本中,如果在群集上还启用了 vSAN,则 HA 将使用 vSAN 网络进行代理间通信。

群集

5.0、5.1、5.5 和 6.0

das.useDefaultIsolationAddress

在确定主机是否与网络隔离时,是否应使用默认隔离地址(管理网络的网关)。有效值为 true/false。默认情况下,使用管理网络默认网关。如果默认网关是不可 ping 的地址,请将“das.isolationaddressX”设置为可 ping 的地址,并通过将此选项设置为“false”禁用默认网关。

群集

5.1、5.5、6.0

das.config.fdm.isolationPolicyDelaySec

在确定主机被隔离后,FDM 代理在执行隔离策略之前等待的秒数。最小值为 30。如果设置为低于 30 的值,则延迟为 30 秒。

群集

5.0、5.1、5.5 和 6.0

das.isolationShutdownTimeout

在启动客户机关机之后,FDM 在发出关机命令之前等待虚拟机关闭电源的秒数。如果未设置该选项,则使用 300 秒。

群集

6.0das.config.fdm.reportfailoverfailevent如果设置为 1,则在 vSphere HA 尝试重新启动虚拟机失败时启用详细的每虚拟机事件生成。默认值为 0。在 vSphere 6.0 之前的版本中,会默认生成此事件。群集

虚拟机/应用程序监控

5.0、5.1、5.5 和 6.0

das.iostatsInterval

如果 FDM 检测到 VMtools 检测信号数量不足以触发虚拟机已配置的虚拟机/应用程序监控策略,则 FDM 会检查在上次 ioStatsInterval 期间是否发出了任何 I/O,并在此间隔内未出现任何 I/O 时才重置虚拟机。有效值为 0 或更大值。如果未设置该选项,则假定为 120 秒。

群集

Fault Tolerance

5.0、5.1 和 5.5

das.maxFtVmsPerHost

指定可同时在一个主机上运行的 Fault Tolerance 虚拟机的数量。如果未设置,则使用值 4。值为 -1 或 0 表示禁用限制。在执行用户启动的打开电源或 vMotion 操作时,此限制将由 vCenter Server 强制执行,在执行初始放置和负载平衡操作时,将由 DRS 强制执行。HA 不会强制执行此限制以最大化正常运行时间。DRS 不会更正此限制的任何冲突。

群集

日志记录

5.0、5.1 和 5.5

das.config.log.maxFileNum

控制由基于 FDM 文件的记录器保留的 FDM 日志文件轮换数量。默认情况下,基于文件的记录器仅由在早于 ESX 5.0 的 ESX 版本上运行的 FDM 使用。如果要更改 ESX 5.0 之前版本主机保留的日志文件轮换数量,请将此选项设置为所需的日志文件数量。对于 ESX 5.0 及更高版本的主机,FDM 默认情况下会记录到 syslog,因此需要使用 syslog 配置机制来更改保留的日志记录历史记录数量。但是,对于 ESXi 5.0 及更高版本的主机,还可以启用基于文件的记录器。要执行此操作,请将此值设置为有效值。如果使用的是 vSphere 5.0 Update 1 或更高版本,还必须将 das.config.log.outputToFiles 选项设置为 true。对于所有 ESX 版本,将 das.config.log.maxFileNum 选项设置为 1 将禁用日志文件轮换。使用 das.config.log.directory 选项可以更改日志文件的位置。

群集

5.0、5.1 和 5.5

das.config.log.maxFileSize

控制由基于 FDM 文件的记录器写出的每个日志文件的大小。如果未指定此选项,则文件大小为 1 MB。此选项与 das.config.log.maxFileNum 结合使用可控制日志历史记录。

群集

5.0、5.1 和 5.5

das.config.log.level

基于严重性级别(无、警告、信息、详细和琐事)控制在日志中记录的信息量。

群集

不太常见的选项


注意:这些选项有一系列微妙的影响,如果未经 VMware 支持指导,不应在生产环境中使用。

版本名称描述重新配置选项类型

群集配置

5.0、5.1 和 5.5vpxd.das.aamMemoryLimit由 HA 使用的资源池(aam 资源池)的内存限制(以 MB 为单位)。如果未指定,则使用 100 MB。此值将应用到 vCenter Server 清单中的所有群集。是。必须在所有需要更改的主机上重新配置 HA。VC
5.0、5.1、5.5vpxd.das.electionWaitTimeSec在将主机列表发送到新主机以使 vCenter Server 了解选举结果之后,vCenter Server 等待的秒数。如果在超时之前主机不是主代理或已连接的从属代理,则会引发超时异常。如果未指定,则使用值 120。此值不能超过 2000,因为这样会导致 HA 发生故障。
否。下次配置 FDM 时应用。VC
5.0、5.1 和 5.5fdm.nodeGoodness如果举行主代理选举,则 FDM 会交换适合度值,而具有最大适合度值的 FDM 将被选举为主代理。使用由 vCenter Server 分配的 ID 将破坏这些关系。此参数可用于覆盖为指定 FDM 计算出的最佳值。要在每次举行的选举中强制将特定主机选举为主代理,并且主机处于活动状态,则将此选项设置为较大的正值。不应在群集级别指定此选项。否。在下次选举中使用新的最佳值。fdm
5.0、5.1、5.5、6.0 和 6.5
vpxd.das.sendProtectListIntervalSecvCenter Server 连续两次调用与其连接的 HA 主代理以请求保护新虚拟机之间的最短时间(以秒为单位)。如果未指定,则使用 60 秒。此选项还可控制 vCenter Server 将主更新发送到虚拟机以托管在其与主机更改兼容时打开电源的虚拟机的兼容信息的频率。
是。在设置此选项后需要重新启动 vCenter Server。VC
5.5fdm.cluster.vsanDatastoreLockDelay在 vsan 数据存储对象为“已获取”前的延迟(以秒为单位)。在 vSan 数据存储由主代理获取之前,无法在数据存储上执行虚拟机的故障切换。延迟为隔离或分区的从属代理与其打开电源的虚拟机进行通信提供了时间,从而避免重复打开电源。默认设置是等待 30 秒,而且前提是已定义了检测信号数据存储。否。选举主代理时会读取该值。fdm

接入控制

5.0、5.1 和 5.5vpxd.das.slotMemMinMBvCenter Server 范围的默认值(以 MB 为单位),用于内存预留(如果没有为虚拟机指定内存预留)。为群集设置 das.vmMemoryMinMB 群集选项将覆盖该群集的此值。如果未设置此选项,则假定值为 0,除非由 das.vmMemoryMinMB 覆盖。否。在下次执行接入控制时会考虑该值。VC
5.0、5.1 和 5.5vpxd.das.slotCpuMinMHzvCenter Server 范围的默认值(以 MHz 为单位),用于 CPU 预留(如果没有为虚拟机指定 CPU 预留)。为群集设置 das.vmCPUinMHz 群集选项将覆盖该群集的此值。如果未设置此选项,则假定值为 32,除非由 das.vmCPUinMHz 覆盖。否。在下次执行接入控制时会考虑该值。VC
6.0vpxd.das.completemetadataupdateintervalsec设置虚拟机-主机关联性规则后的时间段(以秒为单位),在该时间段内,vSphere HA 可以重新启动已禁用 DRS 的群集中的虚拟机以替代此规则。默认值为 300 秒。VC

检测故障

5.0、5.1 和 5.5das.config.fdm.hostTimeout控制以下时间(以秒为单位):在声明从属主机未连接并启动工作流来确定主机是已死机、已隔离还是已分区之前,主 FDM 等待从属 FDM 响应检测信号的时间(以秒为单位)。如果未指定,则使用 10 秒。是。在所有主机上重新配置 HA。群集
5.0、5.1 和 5.5fdm.deadIcmpPingIntervalICPM ping 可用于确定当从属主机上的 FDM 未连接到主机时,从属主机是否可访问网络。此选项可控制两次 ping 操作之间的间隔(以秒表示)。如果未指定,则使用 10 秒。在 ESXi 5.0 中进行更改后,必须在群集中的所有主机上重新配置 HA。在 5.1 及更高版本中,则无需重新配置。群集
5.0、5.1 和 5.5das.config.fdm.icmpPingTimeout定义在假定正在执行 ping 操作的主机无法访问网络之前,FDM 等待 ICMP ping 回复的时间(以秒为单位)。如果未指定,则使用 5 秒。在 ESXi 5.0 中进行更改后,必须在群集中的所有主机上重新配置 HA。在 5.1 及更高版本中,则无需重新配置。群集
5.0、5.1 和 5.5vpxd.das.heartbeatPanicMaxTimeout此选项控制以下过程的持续时间:受 PSOD 影响的主机释放文件锁定以允许 HA 重新启动此前在其上面运行的虚拟机。如果未指定,则使用 60 秒。HA 将主机 Misc.HeartbeatPanicTimeout 高级选项设置为此 HA 选项的值。HA 选项以秒为单位。是,在设置该选项后,需要在所有 HA 群集中的所有主机上重新配置 HA。VC

重新启动虚拟机

5.0、5.1 和 5.5das.config.fdm.policy.unknownStateMonitorPeriod定义 HA 主代理在检测到虚拟机已失败之后在尝试重新启动虚拟机之前等待的秒数。如果未指定,则使用 10 秒。群集
5.0、5.1 和 5.5das.perHostConcurrentFailoversLimit指定 FDM 同时进行的并发故障切换数。设置一个较大值将允许更多虚拟机同时重新启动,但是将增加每次打开电源的平均延迟时间,因为较大数量给主机和存储添加了更多压力。默认值为 32。此值根据经验确定,目的是提供最低的总延迟。群集

虚拟机操作协调

5.0、5.1 和 5.5das.config.fdm.ft.cleanupTimeout当 vSphere Fault Tolerance 虚拟机由 vCenter Server 打开电源时,vCenter Server 会通知 HA 主代理其正在执行此操作。此选项可控制 HA 主代理等待辅助虚拟机成功打开电源的秒数。如果打开电源所花时间超过此时间(很可能是因为 vCenter Server 与主机失去连接或已失败),主代理将尝试打开辅助虚拟机的电源。如果未指定该选项,则使用 900 秒。群集
5.0、5.1 和 5.5das.config.fdm.storageVmotionCleanupTimeout如果使用 5.0 之前版本的主机在已启用 HA 的群集中执行 Storage vMotion 并移动虚拟机的主数据存储,则 HA 可能会将 Storage vMotion 的完成情况解释为失败,并且可能会尝试重新启动源虚拟机。要避免此问题,HA 主代理将等待指定秒数,以等待 Storage vMotion 完成或失败。如果 Storage vMotion 完成或定时器过期,则主代理将评估是否出现故障。如果未指定该选项,则使用 900 秒作为超时值。群集

正在报告

5.0、5.1 和 5.5das.config.log.outputToFiles为 ESXi 5.0 及更高版本的主机启用基于 FDM 文件的记录器。5.0 主机会记录到 ESX syslog,因此默认情况下不启用基于文件的日志记录。此选项对 5.0 之前版本的主机不起作用。要启用基于文件的记录器,请将 das.config.log.outputToFiles 设置为 true,并将 das.config.log.maxFileNum 设置为大于 2 的数值。要禁用基于文件的日志记录,请将此选项设置为 false。群集
5.0、5.1 和 5.5das.config.log.directory设置由基于 FDM 文件的记录器使用的目录。如果未指定,则会将文件写入到/var/log/vmware/fdm 中。有关详细信息,请参见 das.config.log.maxFileNum 选项。群集
5.0、5.1 和 5.5das.config.fdm.stateLogIntervalFDM 记录群集状态摘要的频率(以秒为单位)。如果未指定,则使用 600 秒(10 分钟)。在 ESXi 5.0 中 - 是,必须在所有主机上重新配置 HA。在 ESXi 5.1 及更高版本中 - 否群集
5.0、5.1 和 5.5das.config.fdm.event.maxMasterEvents定义由主代理缓存的最大事件数。如果未指定,则会缓存 1000 个事件。在 ESXi 5.0 中 - 是,必须在所有主机上重新配置 HA。在 ESXi 5.1 及更高版本中,否群集
5.0、5.1 和 5.5das.config.fdm.event.maxSlaveEvents定义由从属代理缓存的最大事件数。如果未指定,则会缓存 600 个事件。在 ESXi 5.0 中 - 是,必须在所有主机上重新配置 HA。在 5.1 及更高版本中 - 否群集
5.0、5.1 和 5.5vpxd.das.reportNoMasterSecvCenter Server 参数,用于控制在发布群集配置问题以报告 vCenter Server 无法找到相应群集的 HA 主代理之前等待的秒数。如果未指定,则使用 120 秒。是,需要重新启动 vCenter Server。VC



Additional Information

有关 vCenter Server 4.1 及更早版本的信息,请参见 Advanced Configuration options for VMware High Availability for pre-5.0 (1006421)

Advanced configuration options for VMware High Availability in vSphere 5.x and 6.x