

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 用于使用 Amazon EKS 进行 SageMaker HyperPod 集群编排的集群弹性功能
<a name="sagemaker-hyperpod-eks-resiliency"></a>

SageMaker HyperPod 提供以下集群弹性功能。

**Topics**
+ [Health 监控系统](sagemaker-hyperpod-eks-resiliency-health-monitoring-agent.md)
+ [基本运行状况检查](sagemaker-hyperpod-eks-resiliency-basic-health-check.md)
+ [深度运行状况检查](sagemaker-hyperpod-eks-resiliency-deep-health-checks.md)
+ [自动节点恢复](sagemaker-hyperpod-eks-resiliency-node-recovery.md)
+ [与弹性相关的 Kubernetes 标签由 SageMaker HyperPod](sagemaker-hyperpod-eks-resiliency-node-labels.md)
+ [手动隔离、替换或重启节点](sagemaker-hyperpod-eks-resiliency-manual.md)
+ [建议的弹性配置](sagemaker-hyperpod-eks-resiliency-config-tips.md)