Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Surveillance à AWS CloudHSM l'aide de métriques, de journaux d'audit et d'alarmes
Shubhansu Sawaria, Amazon Web Services ()AWS
Février 2025 (historique du document)
Ce guide décrit les outils d'observabilité et de surveillance ainsi que les meilleures pratiques pour gérer un AWS CloudHSMcluster. Pour surveiller un AWS CloudHSM cluster, vous mesurez, suivez et évaluez sa disponibilité, ses performances, sa sécurité et ses fonctionnalités.
Sur AWS, vous pouvez analyser les journaux, les métriques, les événements et les traces de la charge de travail pour comprendre l'état de la charge de travail. Cela vous permet d'obtenir des informations opérationnelles au fil du temps. La surveillance permet de s'assurer que les ressources fonctionnent comme prévu afin que vous puissiez détecter et résoudre les problèmes de manière proactive. Utilisez des métriques, des journaux et des événements surveillés pour définir des alarmes lorsque les seuils sont dépassés.
Public visé
Ce guide est destiné aux architectes de solutions, aux DevOps ingénieurs seniors et aux membres de l'équipe qui conçoivent, mettent en œuvre ou gèrent des solutions de surveillance et d'observabilité pour les charges de AWS CloudHSM travail.
Résultats commerciaux ciblés
En mettant en œuvre les meilleures pratiques en matière de surveillance et d'alerte, vous pouvez contribuer à mettre en place une infrastructure hautement performante, résiliente, efficace, sécurisée et optimisée en termes de coûts pour vos applications et vos charges de travail. Ces meilleures pratiques permettent d'observer et d'analyser en temps quasi réel l'état général et les performances de votre AWS CloudHSM cluster.
La surveillance et les alertes vous aident à prévenir la dégradation ou l'interruption des services informatiques associés. En cas de dégradation ou d'interruption de service imprévue, les outils de surveillance et d'alerte peuvent faciliter la détection, l'escalade, la réaction, l'investigation et la résolution en temps opportun.
Une solution de surveillance et d'alerte robuste contribue aux principaux résultats commerciaux suivants :
-
Améliorer l'expérience client
-
Renforcer la confiance des clients
-
Atténuer les pertes financières associées aux interruptions de service imprévues
-
Augmenter la productivité des développeurs en les aidant à identifier et à résoudre les problèmes plus rapidement
-
Améliorer l'efficacité et l'efficience opérationnelles en augmentant la disponibilité