Este artigo oferece informações sobre o isolamento de um problema de desempenho no ESXi/ESX. Desempenho ruim pode ser causado por várias áreas diferentes: restrições de CPU, sobrecarga de memória, latência do armazenamento ou latência da rede. Se uma ou mais das suas máquinas virtuais tiver um tempo de resposta ruim, considere cada uma dessas áreas para encontrar o gargalo.
Cada etapa abaixo oferece instruções e links para os documentos adequados.
As etapas são ordenadas na sequência mais apropriada para isolar o problema e identificar a resolução correta. Elas também são ordenadas na sequência mais adequada para reduzir a perda de dados.
Observação: após a conclusão de cada etapa, determine se o problema de desempenho ainda existe. Cumpra cada uma das etapas de correção do problema na ordem, sem pular nenhuma das etapas.
Este artigo inclui quatro seções principais:
Restrições de CPU
Para determinar se o desempenho ruim é devido a uma restrição de CPU:
- Use o comando
esxtop
para determinar se o servidor do ESXi/ESX está sobrecarregado. Para obter mais informações sobre esxtop, consulte o Guia de gerenciamento de recursos da sua versão do ESXi/ESX:
- Examine o código
load average
na primeira linha da saída do comando.
Uma carga média de 1,00 significa que as CPUs físicas da máquina do ESXi/ESX Server estão sendo totalmente utilizadas e uma carga média de 0,5 significa que estão sendo utilizadas pela metade. Uma carga média de 2,00 significa que o sistema como um todo está sobrecarregado.
- Examine o campo
%READY
para obter a porcentagem de tempo durante o qual a máquina virtual estava pronta, mas não podia ser programada para execução em uma CPU física.
Em condições normais, esse valor deve permanecer abaixo de 5%. Se os valores de tempo de prontidão forem altos nas máquinas virtuais que apresentam desempenho ruim, verifique as limitações da CPU:
Se a média de carga for muito alta e o tempo de prontidão não for causado por limitações da CPU, ajuste a carga da CPU no host. Para ajustar a carga da CPU no host:
- Aumente o número de CPUs físicas no host
OU
- Diminua o número de CPUs virtuais alocadas para o host. Para diminuir o número de CPUs virtuais alocadas para o host:
- Se você estiver usando o ESX 3.5, determine se o compartilhamento de IRQ é um problema. Para obter mais informações, consulte ESX has performance issues due to IRQ sharing (1003710).
Sobrecarga da memória
Para determinar se o desempenho ruim é devido a sobrecarga de memória:
- Use o comando
esxtop
para determinar se a memória do servidor do ESXi/ESX está sobrecarregada. Para obter mais informações sobre esxtop, consulte o Guia de gerenciamento de recursos da sua versão do ESXi/ESX:
- Examine código
MEM overcommit avg
na primeira linha da saída do comando. Este valor reflete a razão entre a memória solicitada e a memória disponível, menos 1.
Exemplos:
- Se as máquinas virtuais exigirem 4 GB de RAM e o host tiver 4 GB de RAM, a razão será 1:1. Depois de subtrair 1 (de 1/1), o campo
MEM overcommit avg
mostra 0. Não há sobrecarga e não é necessária RAM adicional. - Se as máquinas virtuais exigirem 6 GB de RAM e o host tiver 4 GB de RAM, a razão será 1.5:1. Depois de subtrair 1 (de 1.5/1), o campo
MEM overcommit avg
mostra .5. A RAM está sobrecarregada em 50%, o que significa que é necessário 50% mais RAM do que a disponível.
Se a memória está sobrecarregada, ajuste a carga de memória no host. Para ajustar a carga de memória:
- Aumente o número de RAMs físicas no host
OU
- Diminua a quantidade de RAM alocada para as máquinas virtuais. Para diminuir a quantidade de memória RAM alocada:
- Determine se as máquinas virtuais estão aumentadas e/ou efetuando trocas.
Para detectar aumentos ou trocas:
- Execute o
esxtop
. - Digite m para memória
- Digite f para campos
- Selecione a letra J para Memory Ballooning Statistics (MCTL)
- Analise o valor
MCTLSZ
.
MCTLSZ (MB)
exibe a quantidade de memória física convidada recuperada pelo driver balão.
- Digite f para Field
- Selecione a letra para Memory Swap Statistics (SWAP STATS).
- Analise o valor
SWCUR
.
SWCUR (MB)
mostra o Swap Usage atual.
Para resolver esse problema, verifique se o aumento e/ou a troca não é causado pelo limite de memória configurado incorretamente. Se o limite de memória estiver configurado incorretamente, redefina-a corretamente. Para obter mais informações, consulte:
Latência do armazenamento
Para determinar se o desempenho ruim é devido a latência do armazenamento:
- Determine se o problema é relacionado ao armazenamento local. Migre as máquinas virtuais para uma localização de armazenamento diferente.
- Reduza o número de Máquinas virtuais por LUN.
- Procure entradas de registro nos convidados do Windows com esta aparência:
The device, \Device\ScsiPort0, did not respond within the timeout period.
- Usando o
esxtop
, procure um tempo alto de latência DAVG. Para obter mais informações, consulte Using esxtop to identify storage performance issues (1008205). - Determine a taxa máxima de transferência de entrada e de saída que você pode obter com o comando
iometer
. Para obter mais informações, consulte Testing virtual machine storage I/O performance for VMware ESXi and ESX (1006821). - Compare os resultados de
iometer
de uma VM com os resultados de uma máquina física conectada ao mesmo armazenamento. - Verifique se há conflitos de reserva SCSI. Para obter mais informações, consulte Analyzing SCSI Reservation conflicts on VMware Infrastructure 3.x and vSphere 4.x (1005009).
- Se você estiver usando o armazenamento iSCSI e quadros jumbo, verifique se tudo está configurado corretamente. Para obter mais informações, consulte:
- Se você estiver usando o armazenamento iSCSI e diversificação de caminhos com o iniciador de software iSCSI, verifique se tudo está configurado corretamente. Para obter mais informações, consulte as seguintes seções do Guia de configuração do iSCSI SAN:
Se você identificar um problema relacionado ao armazenamento:
- Verifique se a matriz de hardware e as placas HBA são certificadas para ESX/ESXi. Para obter mais informações, consulte a Hardware Compatibility List da VMWare.
- Verifique se a BIOS do seu servidor físico está atualizada. Para obter mais informações, consulte Checking your firmware and BIOS levels to ensure compatibility with ESX/ESXi (1037257).
- Verifique se o firmware do seu HBA está atualizado. Para obter mais informações, consulte Slow performance caused by out of date firmware on a RAID controller or HBA (1006696).
- Verifique se o ESX pode reconhecer o modo correto e política de caminho do tipo de matriz SATP Storage e PSP Path Selection. Para obter mais informações, consulte Verifying correct storage settings on ESX 4.x, ESXi 4.x and ESXi 5.0 (1020100).
Latência da rede
O desempenho da rede pode ser altamente afetado pelo desempenho da CPU. Descarte um problema de desempenho da CPU antes de investigar a latência da rede.
Para determinar se o desempenho ruim é devido a latência da rede:
- Teste a largura máxima de banda da máquina virtual com a ferramenta Iperf. Essa ferramenta está disponível em http://sourceforge.net/projects/iperf/.
Observação: a VMware não endossa nem recomenda qualquer utilitário de terceiros em particular.
- Enquanto usar a Iperf, altere o tamanho das janelas TCP para 64 K. O desempenho também depende deste valor. Para alterar o tamanho das janelas TCP:
- No lado do servidor, insira este comando:
iperf -s
- No lado do cliente, insira este comando:
iperf.exe -c sqlsed -P 1 -i 1 -p 5001 -w 64K -f m -t 10 900M
- Execute a Iperf com uma máquina fora do host ESXi/ESX. Compare os resultados com o que você espera que você deve obter, dependendo do seu ambiente físico.
- Execute a Iperf com outra máquina fora do host ESXi/ESX na mesma VLAN no mesmo switch físico. Se o desempenho for bom e o problema só puder ser reproduzido com uma máquina em outra localização geográfica, o problema estará relacionado ao seu ambiente de rede.
- Execute a Iperf entre duas VMs no mesmo servidor/grupo de portas/vswitch ESX. Se o resultado for bom, você poderá excluir um problema de CPU, de memória ou de armazenamento.
Se você identificar um gargalo na rede:
- Siga as etapas em Troubleshooting network performance issues (1004087).
- Se você estiver usando o armazenamento iSCSI e quadros jumbo, verifique se tudo está configurado corretamente. Para obter mais informações, consulte:
- Se você estiver usando Network I/O Control, verifique se os compartilhamentos e os limites estão configurados corretamente para o seu tráfego. Para obter mais informações, consulte Network I/O Resource Management in vSphere 4.1 with vDS (1022585).
- Verifique se o traffic shaping está configurado corretamente. Para obter mais informações, consulte Traffic Shaping Policy no Guia de configuração do ESXi/ESX.