免責事項:これは英文の記事「vCenter Server triggered an alarm: ESX Agent Manager (EAM) status changed from Green to Red, then recovered to Green within 30 minutes.」の日本語訳です。記事はベストエフォートで翻訳を進めているため、ローカライズ化コンテンツは最新情報ではない可能性があります。最新情報は英語版の記事で参照してください。
vCenter Server より下記のような ESX Agent Manager (EAM) のステータスが Green から Red となったことを通知するアラームがトリガーされ、その後 30 分で Green に復旧することがあります。
* Event: eam status changed from green to red
* Alarm: Alarm 'ESX Agent Manager Health Alarm' on Datacenters changed from Green to Red
VMware vCenter Server 7.0
VMware vCenter Server 8.0
EAM にて Full Garbage Collection (Full GC) が実行されている最中に vmon による EAM のヘルスチェックが行われると、EAM はヘルスチェックへ応答に失敗し、EAM のヘルスステータスが Red へと切り替わります。
これは稀に発生する可能性のある事象であり、必要な対処等はありません。EAM のヘルスステータスは次のヘルスチェックが動作する 30 分後に Green に戻ります。
vmon のヘルスチェックと、EAM での Full GC のログの例は下記になります。(出力の一部は省略しています)
- /var/log/vmware/vmon/vmon.log
YYYY-MM-DDT17:50:05.223Z In(05) host-#### <eam> Running the API Health command as user eamYYYY-MM-DDT17:50:05.223Z In(05) host-#### <eam-healthcmd> Constructed command: /usr/bin/python -B /usr/lib/vmware-eam/watchdog/vmon/healthCommandVmon.py /etc/vmware/../vmware-eam/catalina.properties YYYY-MM-DDT17:50:15.459Z Wa(03) host-#### <eam> Service api-health command's stderr: Exception while retrieving health xml from url http://localhost:15005/eam/healthstatus. Exception: timed outYYYY-MM-DDT17:50:15.459Z Wa(03)+ host-#### YYYY-MM-DDT17:50:15.474Z Wa(03) host-#### <eam> Health of service failed. Health data: {"localizable_msgs": [{"id": "com.vmware.vmon.svc_health_fail", "default_message": "Failed to retrieve service health.", "args": []}]}YYYY-MM-DDT17:50:15.474Z In(05) host-#### <eam> Recover from service api health check failure. Fail count 0
- /var/log/vmware/eam/vmware-eam-gc.log
YYYY-MM-DDT17:49:50.197+0000: 59446095.329: [Full GC (Ergonomics) ... 28.7186387 secs] [Times: user=0.31 sys=0.25, real=28.72 secs]
ご利用の環境でのアラームが同様の理由かについては、これらのログが同時刻に出力しているかより判断が可能です。
もし頻繁にアラームが発生する場合は、EAM のヒープメモリが不足している可能性がありますので、その際はサポートへお問い合わせください。