Captura de eventos do Amazon ECS no console
O console do Amazon ECS fornece a funcionalidade de captura de eventos que armazena eventos gerados pelo Amazon ECS, como ações de serviço e alterações de estado de tarefas, no Amazon CloudWatch Logs por meio do EventBridge. Esse recurso inclui uma interface de consulta com capacidade de filtragem para monitoramento e solução de problemas.
Os eventos fornecem informações detalhadas sobre como suas implantações de serviços, serviços, tarefas e instâncias operam. Você pode usar essas informações para solucionar problemas de falhas na implantação de tarefas ou serviços.
Ao ativar a captura de eventos, você tem acesso a todos os eventos que o Amazon ECS gera por um período de retenção de sua escolha, estendendo-se além das limitações nativas dos últimos 100 eventos não filtrados ou tarefas interrompidas visíveis por apenas uma hora.
Como funciona
A captura de eventos usa o EventBridge para armazenar eventos em um grupo de logs predefinido do Amazon CloudWatch Logs. O console do Amazon ECS fornece consultas pré-criadas e opções de filtragem, além de correlacionar eventos para fornecer ciclos de vida de tarefas em um formato intuitivo.
Você pode consultar e recuperar os seguintes tipos de eventos:
Eventos de ação de serviço: ajudam a identificar problemas de provisionamento ou alocação de recursos
Eventos de ciclo de vida da tarefa: ajude a identificar por que tarefas ou contêineres falham na inicialização ou param de ser executados
O console do Amazon ECS permite que você configure a captura de eventos com um clique e fornece consultas e filtragens comumente usadas sem exigir que você aprenda linguagens de consulta ou navegue entre vários consoles.
Tipos de eventos
A captura de eventos armazena todos os eventos gerados pelo Amazon ECS nas seguintes categorias:
- Eventos de alteração no estado da tarefa
Paradas de contêineres e outros eventos de encerramento, que você pode usar para solucionar problemas ou monitorar os cronogramas do ciclo de vida das tarefas.
- Ações de serviço
Eventos como atingir um estado estável, falha no posicionamento de tarefas ou restrições de recursos.
- Alterações de estados da implantação de serviços
Eventos como implantações em andamento, concluídas ou com falha acionados por configurações de disjuntor e reversão, para monitorar o estado de uma implantação de serviço.
- Alterações do estado da instância de contêiner
Para workloads em instâncias gerenciadas do Amazon ECS e EC2, os eventos mostram o status conectado e desconectado.
Configuração do grupo de logs
Quando você ativa a captura de eventos, o Amazon ECS cria automaticamente os seguintes recursos:
Um grupo de logs do Amazon CloudWatch Logs chamado
/aws/events/ecs/containerinsights/${clusterName}/performanceUma regra do EventBridge que ingere todos os eventos da origem
aws.ecse os encaminha para o grupo de logs
Você pode especificar um período de retenção para o grupo de logs de um dia a dez anos. O período de retenção padrão é 7 dias.
Considerações
Considere o seguinte ao usar a captura de eventos:
A captura de eventos armazena todos os eventos para simplificar. Você não pode configurar regras no console do Amazon ECS para capturar somente eventos específicos.
O console do Amazon ECS fornece critérios de consulta predefinidos. Para consultas avançadas, use os insights de logs do Amazon CloudWatch Logs para consultar diretamente o grupo de logs.
A funcionalidade Live Tail não está disponível no console do Amazon ECS. Use o Amazon CloudWatch Logs diretamente para live tail.
Quando você desabilita a captura de eventos, a regra do EventBridge é excluída.
A captura de eventos gera custos adicionais para a ingestão de dados do EventBridge, armazenamento do Amazon CloudWatch Logs e execução de consultas.
Para obter informações sobre preços do EventBridge, consulte Preços do Amazon EventBridge
. Para obter informações sobre preços do CloudWatch, consulte Preços do CloudWatch
.
Solução de problemas baseada em eventos
Use eventos gerados pelo Amazon ECS para responder perguntas comuns de solução de problemas.
Análise de falha na tarefa
Você pode analisar os eventos de alteração de estado da tarefa STOPPED, os códigos de parada e os códigos de saída do contêiner para determinar por que uma tarefa falhou ao ser iniciada ou falhou durante a execução.
Você pode analisar os eventos de ação de serviço em busca de falhas de posicionamento e informações sobre restrições de recursos para determinar por que uma tarefa falhou ao ser posicionada por causa de restrições de recursos.
Cenários comuns de falha de tarefa
As falhas anormais mais comuns de tarefas estão relacionadas às seguintes questões:
Falhas na implantação do serviço CI/CD
Falhas no ajuste de escala automático
Falhas no rebalanceamento de tarefas
Saídas anormais de contêineres, como erros de falta de memória (OOM)
Falhas anormais de tarefas produzem eventos de mudança de estado da tarefa STOPPED com um código de parada EssentialContainerExited ou TaskFailedToStart. Você pode filtrar por esses códigos de parada para examinar os comportamentos de execução e parada de contêineres.