

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Comece a usar o suporte do Amazon EKS em SageMaker HyperPod
<a name="sagemaker-hyperpod-eks-prerequisites"></a>

Além do formulário geral [Pré-requisitos para usar SageMaker HyperPod](sagemaker-hyperpod-prerequisites.md) SageMaker HyperPod, verifique os seguintes requisitos e considerações para orquestrar clusters SageMaker HyperPod usando o Amazon EKS.

**Importante**  
Você pode definir a configuração de recursos para criar SageMaker HyperPod clusters usando o Console de gerenciamento da AWS CloudFormation e. Para obter mais informações, consulte [Criação de um SageMaker HyperPod cluster com a orquestração do Amazon EKS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md) e [Criação de SageMaker HyperPod clusters usando CloudFormation modelos](smcluster-getting-started-eks-console-create-cluster-cfn.md).

**Requisitos**

**nota**  
Antes de criar um HyperPod cluster, você precisa de um cluster Amazon EKS em execução configurado com VPC e instalado usando o Helm.
+ Se estiver usando o console de SageMaker IA, você pode criar um cluster Amazon EKS na página do console do HyperPod cluster. Para obter mais informações, consulte [Criação de um SageMaker HyperPod cluster com a orquestração do Amazon EKS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md).
+ Se estiver usando a AWS CLI, você deve criar um cluster Amazon EKS antes de criar um HyperPod cluster ao qual se associar. Para obter mais informações, consulte [Criação de um cluster do Amazon EKS](https://docs.aws.amazon.com/eks/latest/userguide/create-cluster.html) no Guia do usuário do Amazon EKS.

Ao provisionar o cluster do Amazon EKS, considere o seguinte:

1. **Versão compatível do Kubernetes**
   + SageMaker HyperPod é compatível com as versões 1.28, 1.29, 1.30, 1.31, 1.32, 1.33 e 1.34 do Kubernetes.

1. **Modo de autenticação de cluster do Amazon EKS**
   + O modo de autenticação de um cluster Amazon EKS suportado por SageMaker HyperPod are `API` `API_AND_CONFIG_MAP` e.

1. **Redes**
   + SageMaker HyperPod requer o plug-in Amazon VPC Container Network Interface (CNI) versão 1.18.3 ou posterior.
**nota**  
AWS O [plug-in VPC CNI para Kubernetes](https://github.com/aws/amazon-vpc-cni-k8s) é o único CNI compatível com o. SageMaker HyperPod
   + O [tipo de sub-rede](https://docs.aws.amazon.com/vpc/latest/userguide/configure-subnets.html#subnet-types) em sua VPC deve ser privado HyperPod para clusters.

1. **Perfis do IAM**
   + Certifique-se de que as funções necessárias do IAM HyperPod estejam configuradas conforme orientado na [AWS Identity and Access Management para SageMaker HyperPod](sagemaker-hyperpod-prerequisites-iam.md) seção.

1. **Complementos do cluster do Amazon EKS**
   + Você pode continuar usando os vários complementos fornecidos pelo Amazon EKS, como o [Kube-proxy](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-kube-proxy.html), o [CoreDNS](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-coredns.html), [o plug-in Amazon VPC Container Network Interface (](https://docs.aws.amazon.com/eks/latest/userguide/add-ons-vpc-cni.html)CNI), a identidade GuardDuty de pod do Amazon EKS, o agente, o driver Amazon Container Storage Interface (CSI), FSx o driver Mountpoint for Amazon S3 CSI, o agente Distro for e o agente Observability. AWS OpenTelemetry CloudWatch

**Considerações sobre a configuração de SageMaker HyperPod clusters com o Amazon EKS**
+ É necessário usar perfis do IAM distintos com base no tipo de nó. Para HyperPod nós, use uma função baseada em[Função do IAM para SageMaker HyperPod](sagemaker-hyperpod-prerequisites-iam.md#sagemaker-hyperpod-prerequisites-iam-role-for-hyperpod). Para os nós do Amazon EKS, consulte [Amazon EKS node IAM role](https://docs.aws.amazon.com/eks/latest/userguide/create-node-role.html).
+ Você pode provisionar e montar volumes adicionais do Amazon EBS em SageMaker HyperPod nós usando duas abordagens: usar [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs)para provisionamento de volumes em nível de cluster (disponível ao criar ou atualizar grupos de instâncias) ou usar o driver Amazon Elastic Block Store (Amazon EBS) Container Storage Interface (CSI) para gerenciamento dinâmico de volumes em nível de pod. Com [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html#sagemaker-Type-ClusterInstanceGroupSpecification-InstanceStorageConfigs), defina o [caminho local](https://kubernetes.io/docs/concepts/storage/volumes/#local) `/opt/sagemaker` para montar adequadamente os volumes em seus pods do Amazon EKS. Para obter informações sobre como implantar o controlador [CSI do Amazon EBS](https://docs.aws.amazon.com/eks/latest/userguide/ebs-csi.html) em HyperPod nós, consulte. [Usando o driver CSI do Amazon EBS em SageMaker HyperPod clusters EKS](sagemaker-hyperpod-eks-ebs.md)
+ Se você usa rótulos de tipo de instância para definir restrições de agendamento, certifique-se de usar os tipos de instância de SageMaker AI ML prefixados com. `ml.` Por exemplo, para instâncias P5, use `ml.p5.48xlarge` em vez de `p5.48xlarge`.

**Considerações para configurar a rede para SageMaker HyperPod clusters com o Amazon EKS**
+ Cada instância de HyperPod cluster oferece suporte a uma interface de rede elástica (ENI). Para saber o número máximo de pods por tipo de instância, consulte a tabela a seguir.    
[See the AWS documentation website for more details](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/sagemaker-hyperpod-eks-prerequisites.html)
+ Somente pods com `hostNetwork = true` têm acesso ao serviço de metadados de instância (IMDS) do Amazon EC2 por padrão. Use a identidade do Amazon EKS Pod ou as [funções do IAM para contas de serviço (IRSA)](https://docs.aws.amazon.com/eks/latest/userguide/iam-roles-for-service-accounts.html) para gerenciar o acesso às AWS credenciais dos pods.
+  HyperPod Os clusters orquestrados pelo EKS oferecem suporte a modos duplos de endereçamento IP, permitindo a configuração com ou IPv4 para clusters do IPv6 IPv6 Amazon EKS em ambientes de IPv6 VPC e sub-rede habilitados. Para obter mais informações, consulte [Configuração SageMaker HyperPod com uma Amazon VPC personalizada](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc).

**Considerações sobre o uso dos recursos de resiliência HyperPod do cluster**
+ A substituição automática de nós não é compatível com instâncias de CPU.
+ O agente HyperPod de monitoramento de integridade precisa ser instalado para que a recuperação automática do nó funcione. O agente pode ser instalado usando o Helm. Para obter mais informações, consulte [Instalar pacotes no cluster do Amazon EKS usando o Helm](sagemaker-hyperpod-eks-install-packages-using-helm-chart.md).
+ O agente de verificação HyperPod profunda de integridade e monitoramento de integridade é compatível com instâncias de GPU e Trn.
+ SageMaker A IA aplica a seguinte contaminação aos nós quando eles estão passando por verificações de integridade detalhadas:

  ```
  effect: NoSchedule
  key: sagemaker.amazonaws.com/node-health-status
  value: Unschedulable
  ```
**nota**  
Você não pode adicionar taints personalizadas aos nós em grupos de instâncias com a opção `DeepHealthChecks` ativada.

 Depois que seu cluster Amazon EKS estiver em execução, configure seu cluster usando o gerenciador de pacotes Helm conforme as instruções [Instalar pacotes no cluster do Amazon EKS usando o Helm](sagemaker-hyperpod-eks-install-packages-using-helm-chart.md) antes de criar seu HyperPod cluster.