Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Bonnes pratiques en matière de surveillance dans Amazon EKS
Approche de mise en œuvre stratégique
Une stratégie de surveillance Amazon EKS réussie commence par une approche de mise en œuvre progressive et bien planifiée.
-
Commencez par identifier et surveiller les indicateurs critiques qui ont une incidence directe sur les opérations de votre entreprise et la fiabilité des applications. Cette base doit inclure des mesures d'infrastructure essentielles, des indicateurs clés de performance des applications et des mesures de sécurité critiques. Élargissez progressivement la couverture du suivi en fonction des besoins opérationnels et des leçons apprises, et assurez-vous que chaque ajout apporte une valeur significative.
-
Mettez en œuvre des processus de déploiement automatisés en utilisant des outils d'infrastructure en tant que code (IaC) tels que Terraform ou CloudFormation pour garantir la cohérence et la répétabilité.
-
Testez et validez les systèmes de surveillance pour garantir la fiabilité et la précision.
-
Affinez les paramètres de surveillance en permanence en fonction de l'évolution des besoins de l'entreprise.
Gestion efficace des données
Une bonne gestion des données est essentielle pour maintenir une solution de surveillance efficace et rentable.
-
Mettez en œuvre des politiques de conservation des données claires qui équilibrent les besoins d'analyse historique avec les coûts de stockage.
-
Configurez les taux d'échantillonnage appropriés pour les différents types de mesures : fréquence plus élevée pour les métriques critiques et fréquence inférieure pour les moins critiques.
-
Utilisez l'agrégation de métriques pour réduire le volume de données tout en conservant des informations pertinentes, en particulier pour l'analyse des tendances à long terme.
-
Mettez en œuvre des procédures systématiques de conservation et d'archivage des journaux pour les systèmes de journalisation centralisés (tels que les CloudWatch journaux) afin de gérer les coûts de stockage et de garantir l'accès aux données importantes.
Note
La rotation des journaux au niveau du conteneur est gérée automatiquement par le kubelet dans Amazon EKS version 1.21 ou ultérieure.
-
Envisagez de mettre en œuvre une hot-warm-cold architecture pour le stockage des journaux afin d'optimiser à la fois la vitesse d'accès et la rentabilité.
Configuration et gestion des alertes
La configuration des alertes doit être soigneusement étudiée afin de maintenir l'efficacité sans provoquer de fatigue liée aux alertes.
-
Définissez des seuils clairs et exploitables en fonction des objectifs de niveau de service (SLOs) et des modèles de performance historiques.
-
Mettez en œuvre un système de gravité des alertes à plusieurs niveaux qui fait clairement la distinction entre les problèmes critiques nécessitant une attention immédiate et les problèmes moins urgents.
-
Assurez-vous que les alertes fournissent suffisamment de contexte et d'informations exploitables pour faciliter la résolution rapide des problèmes.
-
Établissez des procédures d'escalade claires avec une propriété et des temps de réponse définis pour les différentes sévérités d'alerte.
-
Passez régulièrement en revue et affinez les configurations d'alerte afin de préserver leur pertinence et leur efficacité.
Optimisation des ressources
La surveillance continue de l'utilisation des ressources est essentielle pour maintenir des opérations rentables.
-
Mettez en œuvre une surveillance complète des ressources sur tous les composants du cluster, y compris les nœuds, les pods et les volumes persistants.
-
Configurez le dimensionnement automatique en fonction des modèles d'utilisation réels et des exigences de performance pour garantir une utilisation efficace des ressources tout en préservant les performances.
-
Utilisez des balises de répartition des coûts pour suivre la consommation de ressources par différentes équipes, applications ou environnements.
-
Analysez régulièrement les indicateurs d'efficacité des ressources pour identifier les opportunités d'optimisation et mettre en œuvre des améliorations.
-
Envisagez de mettre en œuvre des outils de gestion des coûts pour suivre et optimiser les dépenses liées au cloud.
Sécurité
Les considérations de sécurité doivent faire partie intégrante de votre stratégie de surveillance.
-
Mettez en œuvre les principes du moindre privilège d'accès pour tous les composants de surveillance afin de garantir que les utilisateurs et les services ne disposent que des autorisations dont ils ont besoin.
-
Activez la journalisation complète des audits pour suivre tous les accès et modifications apportés aux systèmes de surveillance.
-
Procédez à des examens de sécurité réguliers des configurations de surveillance et des modèles d'accès afin d'identifier les vulnérabilités potentielles.
-
Mettez en œuvre le chiffrement pour les données de surveillance sensibles en transit et au repos.
-
Intégrez la surveillance de la sécurité aux systèmes de gestion des informations et des événements de sécurité (SIEM) existants pour une visibilité complète de la sécurité.