Cree una cola SageMaker de trabajos de formación en AWS Batch - AWS Batch

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree una cola SageMaker de trabajos de formación en AWS Batch

SageMaker Las colas de tareas de formación se integran directamente con el servicio de SageMaker IA para ofrecer una programación de tareas sin servidor sin necesidad de gestionar la infraestructura informática subyacente.

Requisitos previos

Antes de crear una cola de trabajos SageMaker de formación, asegúrese de disponer de lo siguiente:

Create a SageMaker Training job queue (AWS Batch console)
  1. Abra la AWS Batch consola en. https://console.aws.amazon.com/batch/

  2. En el panel de navegación, elija Colas de trabajos y luego Crear.

  3. Para el tipo de orquestación, selecciona SageMaker Entrenamiento.

  4. Para configurar la cola de trabajos:

    1. En Nombre, introduzca el nombre de la cola de trabajos.

    2. En Prioridad, introduzca un valor entre 0 y 1000. Se da preferencia a una cola de trabajos con mayor prioridad para los entornos de servicio.

    3. (Opcional) En Política de programación Nombre de recurso de Amazon (ARN), elija una política de programación existente.

    4. En el caso de los entornos de servicios conectados, seleccione un entorno de servicios de la lista para asociarlo a la cola de trabajos.

  5. (Opcional) Para los límites estatales de Job:

    1. En Configuración incorrecta, elija SERVICE_ENVIRONMENT_MAX_RESOURCE e introduzca el tiempo máximo de ejecución (segundos).

    2. En Capacidad, elija INSUFFICIENT_INSTANCE_CAPACITY e introduzca el tiempo máximo de ejecución (segundos).

  6. Elija Crear cola de trabajos

Create a SageMaker Training job queue (AWS CLI)

Utilice el create-job-queue comando para crear una cola de trabajos de SageMaker formación.

El siguiente ejemplo crea una cola de trabajos de SageMaker formación básica que utiliza un entorno de servicios:

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

ExampleServiceEnvironmentSustitúyala por el nombre de tu entorno de servicio.

El comando devuelve un resultado similar al siguiente:

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

Tras crear la cola de trabajos, compruebe que se ha creado correctamente y que su estado es válido.

Utilice el describe-job-queues comando para ver los detalles de la cola de trabajos:

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

El comando devuelve un resultado similar al siguiente:

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

Asegúrese de que:

  • El state es ENABLED

  • El status es VALID

  • El statusReason es JobQueue Healthy

  • El jobQueueType es SAGEMAKER_TRAINING

  • Las serviceEnvironmentOrder referencias a su entorno de servicio