Criar uma fila de trabalhos do SageMaker Training no AWS Batch - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar uma fila de trabalhos do SageMaker Training no AWS Batch

As filas de trabalhos do SageMaker Training se integram diretamente ao serviço SageMaker AI para fornecer agendamento de tarefas em tecnologia sem servidor, sem exigir que você gerencie a infraestrutura computacional subjacente.

Pré-requisitos

Antes de criar uma lista de trabalhos do SageMaker Training, certifique-se de ter:

Create a SageMaker Training job queue (AWS Batch console)
  1. Abra o console AWS Batch em https://console.aws.amazon.com/batch/.

  2. No painel de navegação, escolha Filas de trabalho e Criar.

  3. Em Tipo de orquestração, escolha SageMaker Training.

  4. Em Configuração da fila de trabalhos:

    1. Em Nome, insira o nome da fila de trabalho.

    2. Em Prioridade, insira um valor entre 0 e 1000. Uma fila de trabalhos com maior prioridade tem preferência para ambientes de serviço.

    3. (Opcional) Para Política de Agendamento do Nome do Recurso da Amazon (ARN), escolha uma política de agendamento existente.

    4. Para Ambientes de serviços conectados, selecione um ambiente de serviço da lista para associar à lista de tarefas.

  5. (Opcional) Em Limites de estado de trabalho:

    1. Em Configuração incorreta, escolha SERVICE_ENVIRONMENT_MAX_RESOURCE e insira o Tempo máximo de execução (segundos) .

    2. Em Capacidade, escolha INSUFFICIENT_INSTANCE_CAPACITY e insira o Tempo máximo de execução (segundos).

  6. Selecione Criar fila de trabalho.

Create a SageMaker Training job queue (AWS CLI)

Use o comando create-job-queue para criar uma fila de trabalhos do SageMaker Training.

O exemplo a seguir cria uma fila de trabalhos básica do SageMaker Training que usa um ambiente de serviço:

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

Substitua ExampleServiceEnvironment pelo nome do seu ambiente de serviço.

Esse comando retorna uma saída semelhante à seguinte:

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

Depois de criar sua fila de trabalhos, verifique se ela foi criada com sucesso e se está em um estado válido.

Use o comando describe-job-queues para visualizar detalhes sobre a lista de trabalhos:

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

Esse comando retorna uma saída semelhante à seguinte:

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

Verifique se:

  • O state é ENABLED

  • O status é VALID

  • O statusReason é JobQueue Healthy

  • O jobQueueType é SAGEMAKER_TRAINING

  • serviceEnvironmentOrder faz referência ao seu ambiente de serviço