

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Monitoramento AWS CloudHSM usando métricas, registros de auditoria e alarmes
<a name="introduction"></a>

*Shubhansu Sawaria, Amazon Web Services ()AWS*

*Fevereiro de 2025* ([histórico do documento](doc-history.md))

Este guia descreve as ferramentas de observabilidade e monitoramento e as melhores práticas para gerenciar um [AWS CloudHSM](https://docs.aws.amazon.com/cloudhsm/latest/userguide/introduction.html)cluster. Para monitorar um AWS CloudHSM cluster, você mede, rastreia e avalia sua disponibilidade, desempenho, segurança e funcionalidade.

Ativado AWS, você pode analisar registros, métricas, eventos e rastreamentos da carga de trabalho para entender a integridade da carga de trabalho. Isso ajuda você a obter insights operacionais ao longo do tempo. O monitoramento ajuda a garantir que os recursos funcionem conforme o esperado para que você possa detectar e resolver problemas de forma proativa. Use métricas, registros e eventos monitorados para definir alarmes quando os limites forem excedidos.

## Público-alvo
<a name="intended-audience"></a>

Este guia é destinado a arquitetos de soluções, DevOps engenheiros seniores e membros da equipe que projetam, implementam ou gerenciam soluções de monitoramento e observabilidade para AWS CloudHSM cargas de trabalho.

## Resultados de negócios desejados
<a name="targeted-business-outcomes"></a>

Ao implementar as melhores práticas de monitoramento e alerta, você pode ajudar a obter uma infraestrutura de alto desempenho, resiliente, eficiente, segura e econômica para seus aplicativos e cargas de trabalho. Essas melhores práticas permitem observação e análise quase em tempo real da integridade geral e do desempenho do seu AWS CloudHSM cluster.

O monitoramento e os alertas ajudam a evitar a degradação ou interrupção dos serviços de TI associados. No caso de degradação não planejada ou interrupção do serviço, as ferramentas de monitoramento e alerta podem facilitar a detecção, escalonamento, reação, investigação e resolução oportunas.

Uma solução robusta de monitoramento e alerta contribui para os seguintes resultados comerciais principais:
+ Aprimorando a experiência do cliente
+ Construindo a confiança do cliente
+ Mitigação de perdas financeiras associadas a interrupções de serviço não planejadas
+ Aumentar a produtividade dos desenvolvedores ajudando-os a identificar e resolver problemas mais rapidamente
+ Aumentar a eficácia e a eficiência operacionais aumentando a disponibilidade