O que é gerenciamento de incidentes? - Guia do usuário avançado do AMS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é gerenciamento de incidentes?

O gerenciamento de incidentes é o processo que o AMS usa para registrar, agir, comunicar o progresso e fornecer notificação de incidentes ativos.

O objetivo do processo de gerenciamento de incidentes é garantir que a operação normal do seu serviço gerenciado seja restaurada o mais rápido possível, que o impacto nos negócios seja minimizado e que todas as partes envolvidas sejam mantidas informadas.

Exemplos de incidentes incluem (mas não estão restritos a) perda ou degradação da conectividade de rede, um processo ou API que não responde ou uma tarefa agendada que não está sendo executada (por exemplo, falha no backup).

O gráfico a seguir mostra o fluxo de trabalho de um incidente relatado por você ao AMS.

Fluxo de trabalho de gerenciamento de incidentes entre as operações do AMS e o cliente com um incidente relatado pelo cliente.

Este gráfico mostra o fluxo de trabalho de um incidente relatado pelo AMS a você.

Fluxo de trabalho de gerenciamento de incidentes entre as operações do AMS e o cliente com um incidente CloudWatch detectado.

Prioridade do incidente

Os incidentes criados no centro de suporte, no console ou na API de suporte (SAPI) da AWS têm classificações diferentes dos incidentes criados no console do AMS.

  • Baixo: funções não críticas do seu serviço ou aplicativo comercial relacionadas aos recursos da AWS ou do AMS são afetadas.

  • Médio: um serviço ou aplicativo comercial relacionado aos recursos do AWS and/or AMS sofre um impacto moderado e está funcionando em um estado degradado.

  • Alto: sua empresa é significativamente afetada. Funções críticas do seu aplicativo relacionadas aos recursos do AWS and/or AMS não estão disponíveis. Reservado para as interrupções mais críticas que afetam os sistemas de produção.

nota

O AWS Support Console oferece cinco níveis de prioridade de incidentes que traduzimos para os três níveis do AMS.

Problema versus incidente

Quando a AMS acredita que um incidente revela um defeito maior ou uma configuração incorreta e pode ocorrer novamente, ele é considerado um problema e não apenas um incidente. Nesses casos, a AMS realiza análises do problema e oferece sugestões para resolvê-lo.