vSAN 运行状况服务 - 数据运行状况 - vSAN 对象运行状况
search cancel

vSAN 运行状况服务 - 数据运行状况 - vSAN 对象运行状况

book

Article ID: 301166

calendar_today

Updated On:

Products

VMware vSAN

Issue/Introduction

本文介绍了 vSAN 运行状况服务中的数据运行状况 - vSAN 对象运行状况检查,并详细介绍了可能报告错误的原因。

Symptoms:
免责声明:本文为 vSAN Health Service - Data Health – vSAN Object Health (2108319) 的翻译版本。尽管我们会不断努力为本文提供最佳翻译版本,但本地化的内容可能会过时。有关最新内容,请参见英文版本 。

Environment

VMware vSAN 6.0.x

Resolution

问: “数据运行状况 - vSAN 对象运行状况”检查的用途是什么?
此对象运行状况检查旨在提供两个方面的汇总内容。
  1. 通过汇总群集中的所有对象,提供群集范围概览。
  2. 将对象运行状况加以分类,不仅帮助您评估对象运行状况是否正常,还提供这种情况对用户的影响、用户是否需要采取操作以及用户是否面临风险等信息。
问:如果该检查处于错误状态,意味着什么?

以下为对象运行不正常时可能具有的状态。

数据移动 (Data move):由于您请求了某种形式的维护模式或撤出,或者由于重新平衡活动,vSAN 在群集中的 ESXi 主机和存储上重新构建数据。这种状态下的对象完全符合其策略且运行正常,但是 vSAN 正积极地重新构建它们。您无需担心,对象没有面临任何风险。但是,对象处于这种状态时可能会影响性能。您可以交差引用重新同步组件视图,以了解主动数据同步活动的详细信息。

正常(Healthy):对象处于理想状态,完全符合其策略,目前没有被移动,也没有被处理。

不可访问(Inaccessible):对象遇到的永久或临时故障数已超过配置的允许的故障数,当前不可用且不可访问。如果不是临时故障(例如:ESXi 主机重新引导),您必须尽快处理根本原因,如 ESXi 主机故障、网络故障或磁盘被移除,以便恢复可用性,因为使用这些对象的虚拟机在此不可访问状态下无法正常运行。

与可用性无关的不合规性(Non-availability related incompliance):这是其他任何状态都不适用时的总称。这种状态的对象不符合其策略,但是满足可用性 (NumberOfFailuresToTolerate) 策略。目前没有适用于此状态的已记载案例。

与可用性无关的重新配置 (Non-availability related reconfig):由于您请求了与可用性无关的存储策略变更,vSAN 在群集中的 ESXi 主机和存储上重新构建数据。换句话说,此类对象完全符合NumberOfFailuresToTolerate策略,数据移动是为了满足其他策略变更,如NumberOfDiskStripesPerObject。您无需担心这种状态的对象,它没有任何风险。

可用性降低 (Reduced availability)- 主动重建:对象遇到故障,但是其配置能够允许此故障。I/O 继续流动,并且对象可访问。vSAN 积极地重新构建新组件以使对象恢复合规状态,进而重新保护对象。

可用性降低但不进行重新构建 (Reduced availability with no rebuild):对象遇到故障,但是 vSAN 能够允许此故障。例如:I/O 正在流动,并且对象可访问。但是,vSAN 并未尝试重新保护对象。这不是因为延迟计时器(可用性降低 - 不重新构建 - 延迟计时器)导致的,而是因为其他原因。这可能是因为群集中资源不足,或者是因为过去资源不足,或者是过去重新保护失败而 vSAN 尚未重新尝试。请参考限制运行状况检查,首先评估是否存在资源可能用尽的情况。您必须尽快解决故障或添加资源,以便恢复完全受保护的状态,从而防止后续出现故障。

未进行重建的情况下可用性降低 - 延迟计时器 (Reduced availability with no rebuild - delay timer):对象遇到故障,但是 vSAN 能够允许此故障。I/O 正在流动,并且对象可访问。但是,vSAN 尚未尝试重新保护对象,正在等待 60 分钟(默认)延迟计时器过期后发布重新保护请求。

如果确定故障实体无法在延迟期限内重新恢复,则可以选择发布明确请求以跳过延迟计时器并立即启动重新保护。

但是,如果确定故障主机正积极重新引导,或者确定错误的驱动器被错误地牵引或正在重新插入,则最好等待这些任务完成,这是完全重新保护对象的最快速的方法。

问:如何排除故障并修复错误状态?

通过查看上述列表中的对象状态,您可以从对象的角度了解 vSAN 群集上正在发生的活动,以及是否需要采取相应的纠正措施。

如果对于对象状态有任何疑虑,或者对象处于异常状态,请联系 VMware 技术支持。有关详细信息,请参见 How to file a Support Request in My VMware (2006985)



Additional Information

有关收集 VMware Virtual SAN (VSAN) 日志的详细信息,请参见 Collecting Virtual SAN (VSAN) support logs and uploading to VMware (2072796)

另请参见:
vSAN Health Service - Data Health – vSAN Object Health