Uma máquina virtual funcionando em ESX/ESXi VMware não responde a nenhuma entrada externa ou não apresenta nenhuma atividade. Especificamente:
Este artigo fornece as etapas para isolar as possíveis causas de uma máquina virtual de vSphere tornar-se sem resposta.
Uma máquina virtual sem resposta não responde a nenhuma tentativa de conexão e pode não responder a nenhuma tentativa de inicialização. Há uma variedade de razões para que uma máquina virtual possa acabar em um estado no qual não responde. Este artigo habilita você a identificar e resolver estas causas comuns e, quando resolvido, retornar a máquina virtual para um estado operacional.
É possível desligar uma máquina virtual sem solucionar o motivo, mas isso vai evitar a coleta e a análise de informações que possam ajudar a determinar a causa raiz da interrupção. Para obter mais informações sobre desligar a máquina virtual, consulte Powering off a virtual machine on an ESXi host (1014165) and Powering off an unresponsive virtual machine on an ESX host (1004340).
Este artigo pressupõe que o problema está ocorrendo atualmente. Se você estiver solucionando um problema que ocorreu no passado, algumas informações necessárias podem não estar disponíveis.
Resolução
Os serviços que uma máquina virtual fornece podem ficar sem resposta ou inacessíveis devido a uma série de causas, incluindo problemas com os aplicativos ou sistema operacional convidado dentro da máquina virtual, problemas com o monitor da máquina virtual ou dispositivos virtuais, contenção de recursos no host ou problemas com armazenamento subjacente ou de infraestrutura de comunicação de rede.
Se o sistema operacional convidado está produzindo qualquer atividade, ele está funcionando. Neste caso, a falta de resposta é provavelmente devido a um problema de conectividade ou contenção de recursos ou é específico para um componente de nível superior, como um aplicativo dentro do serviço executado no sistema operacional convidado.
Validar o escopo
É importante ter sintomas precisos e uma compreensão do escopo de um problema. Para confirmar o escopo do problema, faça estas verificações:
Observação: Se uma máquina virtual é desligada e não pode ser ligada novamente, consulte Troubleshooting a virtual machine that is unable to power on (2001005).
Identificar a causa
Neste ponto, você estabeleceu que uma ou mais máquinas virtuais não responde(m), tanto ao console virtual quanto através da rede. O próprio host está respondendo. Pode haver um problema com a acessibilidade ou contenção de recursos ou com armazenamento subjacente ou com a infraestrutura de comunicação de rede.
Para identificar a causa:
Plano de ação
Neste ponto, você estabeleceu que o host executando a máquina, ou máquinas, virtual está tanto respondendo quanto não encontrando nenhum armazenamento compartilhado ou problemas de infraestrutura de comunicação de rede. O sistema operacional convidado não falhou com um erro crítico, mas permanece sem resposta no console da máquina virtual e através da rede.
Tome medidas para recuperar ou coletar informações sobre a máquina virtual que não responde com base na camada da arquitetura que é suspeita:
Se as informações de diagnóstico úteis são produzidas pelo sistema operacional convidado em resposta a um destes eventos, envolva o fornecedor do sistema operacional convidado para investigar mais.
a. Suspenda a máquina virtual e colete o arquivo de estado suspenso .vmss. Para obter mais informação, consulte Suspending a virtual machine on ESX/ESXi to collect diagnostic information (2005831).
b. Colete logs do host executando a máquina virtual. Para obter mais informação, consulte Collecting diagnostic information for VMware products (1008524).
c. Ligue a máquina virtual novamente, e a reinicie.
d. Envolva o Suporte da VMware fornecendo as informações coletadas nas etapas 1, 3a e 3b. Para obter mais informação, consulte How to File a Support Request.
Observação: Se a máquina virtual não pode ser suspensa porque outra tarefa de gestão está em andamento, consulte Collecting information about tasks in VMware ESX and ESXi (1013003) e Restarting the Management agents on an ESX or ESXi Server (1003490). Se as tentativas de suspender a máquina virtual falharem e não parece que tarefa de gestão está presente, pule para a próxima seção e tente travar a máquina virtual.
Se um problema foi isolado com o monitor de máquina virtual, ou a %WAIT é relativamente elevada ou as tentativas de suspender a máquina virtual falharam, colete dados de desempenho e trave a máquina virtual vigorosamente para coletar informações adicionais sobre o seu estado interno.
Colete dados de desempenho enquanto o problema está acontecendo. Para obter mais informação, consulte Using performance collection tools to gather data for fault analysis (1006797).
Trave a máquina virtual para coletar informações sobre o seu estado interno. Para obter mais informação, consulte Crashing a virtual machine on ESX/ESXi to collect diagnostic information (2005715).
Observação: Se as tentativas de travar a máquina virtual falham, pule para a próxima seção e tente travar o host.
Envolva o Suporte da VMware, fornecendo as informações coletadas nas etapas 1 e 2. Para obter mais informações, consulte How to File a Support Request.
Se um problema foi isolado para o monitor de máquina virtual, mas as tentativas de suspender ou travar a máquina virtual falharam, isto reflete um problema com o VMkernel. Colete um pacote de registro do host, evacue todas as máquinas virtuais não afetadas do host e use um NMI para, intencionalmente, gerar uma tela roxa de diagnóstico.
Colete dados de desempenho enquanto o problema está acontecendo. Para obter mais informação, consulte Using performance collection tools to gather data for fault analysis (1006797).
Mova todas as máquinas virtuais não afetadas para fora do host usando o vMotion. Se possível, use o Modo de Manutenção para evitar que máquinas virtuais adicionais sejam iniciadas no host.
Configure o host para pânico ao receber uma interrupção não mascarável e em seguida emita um NMI para disparar um pânico. Para obter mais informações, consulte Using hardware NMI facilities to troubleshoot unresponsive hosts (1014767).
Depois que o host gerou uma tela roxa de diagnóstico e completou o despejo de informação de diagnóstico, tire um instantâneo ou fotografia do console e reinicie o host.
Colete informações de diagnóstico do host. Para obter mais informação, consulte Collecting diagnostic information from an ESX or ESXi host that experiences a purple diagnostic screen (1004128).
Envolva o Suporte da VMware, fornecendo as informações coletadas nas etapas 1, 4 e 5. Para obter mais informações, consulte How to File a Support Request.