

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Execução de trabalhos em SageMaker HyperPod clusters orquestrados pelo Amazon EKS
<a name="sagemaker-hyperpod-eks-run-jobs"></a>

Os tópicos a seguir fornecem procedimentos e exemplos de acesso a nós de computação e execução de cargas de trabalho de ML em clusters provisionados SageMaker HyperPod orquestrados com o Amazon EKS. Dependendo de como você configurou o ambiente em seu HyperPod cluster, há muitas maneiras de executar cargas de trabalho de ML em HyperPod clusters.

**nota**  
Ao executar trabalhos por meio da SageMaker HyperPod CLI ou do kubectl, HyperPod pode rastrear a utilização da computação (horas de GPU/CPU) em namespaces (equipes). Essas métricas aumentam a eficácia dos relatórios de uso, que fornecem:  
Visibilidade sobre o consumo de recursos alocados e tomados emprestados.
Informações sobre a utilização de recursos pelas equipes para auditoria (até 180 dias).
Atribuição de custos alinhada a políticas de governança de tarefas.
Para utilizar os relatórios de uso, você deve instalar a infraestrutura de relatórios de uso. É altamente recomendável configurar a [governança de tarefas](sagemaker-hyperpod-eks-operate-console-ui-governance.md) para impor cotas de computação e permitir a atribuição granular de custos.  
Para obter mais informações sobre como configurar e gerar relatórios de uso, consulte [Relatar o uso de computação em HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-usage-reporting.html).

**dica**  
Para uma experiência prática e orientação sobre como configurar e usar um SageMaker HyperPod cluster orquestrado com o Amazon EKS, recomendamos fazer este workshop de [suporte do Amazon EKS](https://catalog.us-east-1.prod.workshops.aws/workshops/2433d39e-ccfe-4c00-9d3d-9917b729258e). SageMaker HyperPod

Os usuários de cientistas de dados podem treinar modelos básicos usando o conjunto de clusters EKS como orquestrador do cluster. SageMaker HyperPod Os cientistas utilizam a [SageMaker HyperPod CLI](https://github.com/aws/sagemaker-hyperpod-cli) e os `kubectl` comandos nativos para encontrar SageMaker HyperPod clusters disponíveis, enviar trabalhos de treinamento (Pods) e gerenciar suas cargas de trabalho. A SageMaker HyperPod CLI permite o envio de trabalhos usando um arquivo de esquema de trabalho de treinamento e fornece recursos para listagem, descrição, cancelamento e execução de trabalhos. Os cientistas podem usar o [Kubeflow Training Operator](https://www.kubeflow.org/docs/components/training/overview/) de acordo com as cotas de computação gerenciadas e gerenciadas pela HyperPod [SageMaker IA MLflow para gerenciar experimentos de ML e execuções](https://docs.aws.amazon.com/sagemaker/latest/dg/mlflow.html) de treinamento. 

**Topics**
+ [Instalando a SageMaker HyperPod CLI](sagemaker-hyperpod-eks-run-jobs-access-nodes.md)
+ [SageMaker HyperPod Comandos CLI](sagemaker-hyperpod-eks-hyperpod-cli-reference.md)
+ [Executando trabalhos usando a SageMaker HyperPod CLI](sagemaker-hyperpod-eks-run-jobs-hyperpod-cli.md)
+ [Executar trabalhos usando o `kubectl`](sagemaker-hyperpod-eks-run-jobs-kubectl.md)