Para solução de problemas, pode ser necessário verificar se todos os processos estão consumindo uma quantidade significativa de recursos no console de serviço. Os processos que consomem uma quantidade significativa de recursos podem impedir o funcionamento correto do sistema. Este artigo contém as etapas para verificar a falta de recursos no console de serviço do host ESX.
Introdução ao monitoramento de desempenho <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
Se algum processo estiver utilizando uma quantidade significativa de CPU ou memória no console de serviço do host ESX, pode impedir o funcionamento correto do sistema. O ESX inclui o utilitário top que permite verificar a utilização de recursos do console de serviço. Ele pode ser usado para visualizar os valores atuais das estatísticas e determinar a falta de recursos no console serviço do host ESX.
Para verificar a utilização dos processos no console de serviço:
<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />
Verificar a escassez de CPU no host ESX
As estatísticas a serem verificadas são média de carga e ociosidade da CPU. Estas estatísticas fornecem uma indicação geral da ocupação do host ESX.
A média de carga é a medida do número de processos em espera na fila de execução, mais o número de processos executados para intervalos de 1, 5 e 15 minutos. A média de carga 1,00 significa que as CPUs físicas da máquina do host ESX são utilizadas em sua totalidade e uma média de carga 0,5 indica que estão utilizadas parcialmente. A média de carga 2,00 indica que o sistema está ocupado. Se a média de carga for superior a 4,00, o sistema está muito congestionado e o desempenho será afetado.
A média de carga semelhante à seguinte indica que não existe uma fila de espera de tarefas no Console de serviço ESX para processamento:
load average: 0.14, 0.06, 0.01
A média de carga semelhante à seguinte indica que as tarefas estão em espera na fila de execução para serem processadas:
load average: 2.00, 2.00, 2.00
Os contadores de estado da CPU fornecem uma visão geral da utilização da CPU em cada estado no sistema. Se a tela se parecer com o exemplo a seguir, o sistema terá uma percentagem alta de CPU ociosa. Uma CPU altamente ociosa significa que o sistema não está ocupado:
CPU states: cpu user nice system irq softirq iowait idle
total 0,1% 0,0% 0,0% 0,0% 1,3% 12,1% 86,2%
Se a saída do contador da CPU ociosa for baixa, verifique qual estado está consumindo o tempo de CPU. Os estados diferentes significam:
Quando o estado ocioso da CPU estiver em 0%, se parecerá com o seguinte:
CPU states: cpu user nice system irq softirq iowait idle
total 1,1% 0,0% 0,1% 0,0% 0,0% 98,6% 0,0%
O tempo de CPU está sendo consumido no estado iowait. Se o tempo de CPU for consumido no estado iowait, verifique o subsistema disco para determinar qual é a causa do atraso na resposta do subsistema de armazenamento.
Observação: Se o tempo de CPU for consumido no estado user, é possível determinar o processo que está consumindo a CPU da lista de tarefas abaixo das estatísticas. A lista de tarefas é atualizada a cada poucos segundos para fornecer uma visão atualizada da lista de processos. Neste exemplo, vmware-hostd está consumindo 0,9% da CPU disponível:
Verificar a escassez de memória em um host ESX
Memória e arquivos de troca (swap) são as estatísticas que devem ser verificadas. Estas estatísticas fornecem uma indicação geral da quantidade de memória utilizada e se ocorreu a troca de arquivos (swapping) no sistema. Esta tela mostra um exemplo da saída esperada:
O exemplo acima indica que há 268248 KB (268 MB) de RAM no sistema e que 84864 KB (85 MB) estão livres. Há 554168 KB (554 MB) de arquivos de troca disponíveis no sistema e 503152 KB (503 MB) estão livres. Neste caso há RAM disponível para uso do console de serviço e, portanto, ocorre pouca troca de arquivos virtuais.
Observação: Essa visão só mostra a quantidade de RAM atribuída ao console de serviço do host ESX, pois não fornece uma visão da RAM total no servidor.
Para solucionar problemas de um host ESX que exibe uma quantidade menor de memória RAM e número maior de arquivos de troca:
Observação: É possível também exibir a quantidade de memória e memória virtual em uso no arquivo /proc/meminfo.
A escassez de recursos de E/S pode ser causada por vários problemas, mas normalmente ocorre quando um LUN é removido e o host ESX não é verificado novamente. Para remover os LUNs do host ESX, consulte Removing a LUN containing a datastore from VMware ESXi/ESX 4.x (1029786).
Para obter mais informações, consulte VMware HA configuration fails with a VMWareClusterManager Rule not enabled error (1004495).