

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Recursos de resiliência de cluster para orquestração SageMaker HyperPod de clusters com o Amazon EKS
<a name="sagemaker-hyperpod-eks-resiliency"></a>

SageMaker HyperPod fornece os seguintes recursos de resiliência de cluster. 

**Topics**
+ [Sistema de Monitoramento de Saúde](sagemaker-hyperpod-eks-resiliency-health-monitoring-agent.md)
+ [Verificações de integridade básica](sagemaker-hyperpod-eks-resiliency-basic-health-check.md)
+ [Verificações de integridade profundas](sagemaker-hyperpod-eks-resiliency-deep-health-checks.md)
+ [Recuperação automática de nós](sagemaker-hyperpod-eks-resiliency-node-recovery.md)
+ [Rótulos Kubernetes relacionados à resiliência da SageMaker HyperPod](sagemaker-hyperpod-eks-resiliency-node-labels.md)
+ [Colocar em quarentena, substituir ou reinicializar manualmente um nó](sagemaker-hyperpod-eks-resiliency-manual.md)
+ [Configurações sugeridas de resiliência](sagemaker-hyperpod-eks-resiliency-config-tips.md)