Cargas útiles de trabajos de servicio en AWS Batch - AWS Batch

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cargas útiles de trabajos de servicio en AWS Batch

Cuando envía trabajos de servicio utilizando SubmitServiceJob, proporciona dos parámetros clave que definen el trabajo:serviceJobType, yserviceRequestPayload.

  • serviceJobTypeEspecifica qué AWS servicio ejecutará el trabajo. Para los trabajos de SageMaker formación, este valor esSAGEMAKER_TRAINING.

  • serviceRequestPayload es una cadena codificada en JSON que contiene la solicitud completa que normalmente se envía directamente al servicio de destino. Para los trabajos de SageMaker formación, esta carga útil contiene los mismos parámetros que utilizaría con la CreateTrainingJobAPI de SageMaker IA.

Para obtener una lista completa de todos los parámetros disponibles y sus descripciones, consulta la referencia de la CreateTrainingJobAPI de SageMaker IA. Todos los parámetros que sean compatibles con CreateTrainingJob se pueden incluir en la carga útil del trabajo de servicio.

Para ver más ejemplos de configuraciones de trabajos de formación APIs, consulte la CLI y SDKs la Guía para desarrolladores de SageMaker IA.

Recomendamos utilizar PySDK para la creación de trabajos de servicio, ya que PySDK tiene clases y utilidades auxiliares. Para ver un ejemplo del uso de PySDK, consulta los ejemplos de SageMaker IA en GitHub.

Ejemplo de carga útil de un trabajo de servicio

El siguiente ejemplo muestra una carga útil de trabajo de servicio sencilla para un trabajo de SageMaker formación que ejecuta un guion de formación que dice «hola mundo»:

Esta carga útil se pasará como una cadena JSON al parámetro serviceRequestPayload cuando se llame SubmitServiceJob.

{ "TrainingJobName": "my-simple-training-job", "RoleArn": "arn:aws:iam::123456789012:role/SageMakerExecutionRole", "AlgorithmSpecification": { "TrainingInputMode": "File", "TrainingImage": "763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.0.0-cpu-py310", "ContainerEntrypoint": [ "echo", "hello world" ] }, "ResourceConfig": { "InstanceType": "ml.c5.xlarge", "InstanceCount": 1, "VolumeSizeInGB": 1 }, "OutputDataConfig": { "S3OutputPath": "s3://your-output-bucket/output" }, "StoppingCondition": { "MaxRuntimeInSeconds": 30 } }