Como verificar a escassez de recursos no Console de Serviço ESX

Products

VMware vCenter Server

Issue/Introduction

Disclaimer: Este artigo é uma tradução do Performance graphs display only the realtime data after upgrading to vCenter Server 4.1 (1030819). Como os artigos são traduzidos em uma base de melhor esforço, o conteúdo pode tornar-se desatualizado. Para obter o conteúdo mais recente, consulte o artigo em Inglês.

Para solução de problemas, pode ser necessário verificar se todos os processos estão consumindo uma quantidade significativa de recursos no console de serviço. Os processos que consomem uma quantidade significativa de recursos podem impedir o funcionamento correto do sistema. Este artigo contém as etapas para verificar a falta de recursos no console de serviço do host ESX.

Symptoms:

Utilização máxima da CPU no host ESX
Utilização máxima da memória no host ESX
Lentidão de resposta ao administrar um host ESX

Environment

VMware vCenter Server 4.1.x

Resolution

Introdução ao monitoramento de desempenho <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

Se algum processo estiver utilizando uma quantidade significativa de CPU ou memória no console de serviço do host ESX, pode impedir o funcionamento correto do sistema. O ESX inclui o utilitário top que permite verificar a utilização de recursos do console de serviço. Ele pode ser usado para visualizar os valores atuais das estatísticas e determinar a falta de recursos no console serviço do host ESX.

Para verificar a utilização dos processos no console de serviço:

Faça login no console de serviço do host ESX no diretório raiz de qualquer sessão SSH ou diretamente do console do servidor.
Digite top.
Para sair, pressione Q.
Depois de examinar a saída, digite logout e pressione Enter para sair do sistema.

A tela a seguir aparece e mostra a utilização de recursos e processos em execução no servidor:

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />

Verificar a escassez de CPU no host ESX

As estatísticas a serem verificadas são média de carga e ociosidade da CPU. Estas estatísticas fornecem uma indicação geral da ocupação do host ESX.

A média de carga é a medida do número de processos em espera na fila de execução, mais o número de processos executados para intervalos de 1, 5 e 15 minutos. A média de carga 1,00 significa que as CPUs físicas da máquina do host ESX são utilizadas em sua totalidade e uma média de carga 0,5 indica que estão utilizadas parcialmente. A média de carga 2,00 indica que o sistema está ocupado. Se a média de carga for superior a 4,00, o sistema está muito congestionado e o desempenho será afetado.

A média de carga semelhante à seguinte indica que não existe uma fila de espera de tarefas no Console de serviço ESX para processamento:

load average: 0.14, 0.06, 0.01

A média de carga semelhante à seguinte indica que as tarefas estão em espera na fila de execução para serem processadas:

load average: 2.00, 2.00, 2.00

Os contadores de estado da CPU fornecem uma visão geral da utilização da CPU em cada estado no sistema. Se a tela se parecer com o exemplo a seguir, o sistema terá uma percentagem alta de CPU ociosa. Uma CPU altamente ociosa significa que o sistema não está ocupado:

CPU states: cpu user nice system irq softirq iowait idle
total 0,1% 0,0% 0,0% 0,0% 1,3% 12,1% 86,2%

Se a saída do contador da CPU ociosa for baixa, verifique qual estado está consumindo o tempo de CPU. Os estados diferentes significam:

User é a percentagem de tempo do processador usado para processos de usuário em execução, como um aplicativo.
Nice é a percentagem de tempo do processador usado para um processo de usuário executado com prioridade de programação alterada.
System é a percentagem de tempo do processador usado para um processo do sistema, como kernel ou ativação de drivers.
Irq é a percentagem de tempo do processador usado para pedidos de interrupção de hardware.
Softirq é a percentagem de tempo do processador usado para pedidos de interrupção de software.
Iowait é a percentagem de tempo de processador em espera para o término de entrada/saída do disco.
Idle é a percentagem de tempo livre do processador.

Quando o estado ocioso da CPU estiver em 0%, se parecerá com o seguinte:

CPU states: cpu user nice system irq softirq iowait idle
total 1,1% 0,0% 0,1% 0,0% 0,0% 98,6% 0,0%

O tempo de CPU está sendo consumido no estado iowait. Se o tempo de CPU for consumido no estado iowait, verifique o subsistema disco para determinar qual é a causa do atraso na resposta do subsistema de armazenamento.

Observação: Se o tempo de CPU for consumido no estado user, é possível determinar o processo que está consumindo a CPU da lista de tarefas abaixo das estatísticas. A lista de tarefas é atualizada a cada poucos segundos para fornecer uma visão atualizada da lista de processos. Neste exemplo, vmware-hostd está consumindo 0,9% da CPU disponível:

Verificar a escassez de memória em um host ESX

Memória e arquivos de troca (swap) são as estatísticas que devem ser verificadas. Estas estatísticas fornecem uma indicação geral da quantidade de memória utilizada e se ocorreu a troca de arquivos (swapping) no sistema. Esta tela mostra um exemplo da saída esperada:

O exemplo acima indica que há 268248 KB (268 MB) de RAM no sistema e que 84864 KB (85 MB) estão livres. Há 554168 KB (554 MB) de arquivos de troca disponíveis no sistema e 503152 KB (503 MB) estão livres. Neste caso há RAM disponível para uso do console de serviço e, portanto, ocorre pouca troca de arquivos virtuais.

Observação: Essa visão só mostra a quantidade de RAM atribuída ao console de serviço do host ESX, pois não fornece uma visão da RAM total no servidor.

Para solucionar problemas de um host ESX que exibe uma quantidade menor de memória RAM e número maior de arquivos de troca:

Desative todos os serviços de terceiros que foram instalados para testes. Os serviços de terceiros podem estar utilizando os recursos de memória.
Tente aumentar a quantidade de memória RAM atribuída ao console de serviço do host ESX. Para obter mais informações, consulte Increasing the amount of RAM assigned to the ESX Server service console (1003501).
Verifique todas as configurações de máquina virtual para garantir que nenhuma delas tenha uma reserva de CPU excessivamente alta, como 10000 MHz.

Observação: É possível também exibir a quantidade de memória e memória virtual em uso no arquivo /proc/meminfo.

A escassez de recursos de E/S pode ser causada por vários problemas, mas normalmente ocorre quando um LUN é removido e o host ESX não é verificado novamente. Para remover os LUNs do host ESX, consulte Removing a LUN containing a datastore from VMware ESXi/ESX 4.x (1029786).

Informações adicionais

Para obter mais informações, consulte VMware HA configuration fails with a VMWareClusterManager Rule not enabled error (1004495).

Additional Information

Performance graphs display only the realtime data after upgrading to vCenter Server 4.1