

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Fonctionnalités de résilience des clusters pour l'orchestration des SageMaker HyperPod clusters avec Amazon EKS
<a name="sagemaker-hyperpod-eks-resiliency"></a>

SageMaker HyperPod fournit les fonctionnalités de résilience des clusters suivantes. 

**Topics**
+ [Système de surveillance de la santé](sagemaker-hyperpod-eks-resiliency-health-monitoring-agent.md)
+ [Vérifications de surveillance de l’état de base](sagemaker-hyperpod-eks-resiliency-basic-health-check.md)
+ [Vérifications de surveillance approfondie de l’état](sagemaker-hyperpod-eks-resiliency-deep-health-checks.md)
+ [Récupération automatique des nœuds](sagemaker-hyperpod-eks-resiliency-node-recovery.md)
+ [Étiquettes Kubernetes liées à la résilience par SageMaker HyperPod](sagemaker-hyperpod-eks-resiliency-node-labels.md)
+ [Mise en quarantaine, remplacement ou redémarrage manuels d’un nœud](sagemaker-hyperpod-eks-resiliency-manual.md)
+ [Configurations de résilience suggérées](sagemaker-hyperpod-eks-resiliency-config-tips.md)