Cargas útiles de trabajos de servicio en AWS Batch - AWS Batch

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cargas útiles de trabajos de servicio en AWS Batch

Cuando envía trabajos de servicio mediante SubmitServiceJob, proporciona dos parámetros clave que definen el trabajo:serviceJobType, yserviceRequestPayload.

  • serviceJobTypeEspecifica qué AWS servicio ejecutará el trabajo. Para los trabajos de SageMaker formación, este valor esSAGEMAKER_TRAINING.

  • serviceRequestPayloadEs una cadena codificada en JSON que contiene la solicitud completa que normalmente se enviaría directamente al servicio de destino. En el SageMaker caso de los trabajos de formación, esta carga útil contiene los mismos parámetros que utilizaría con la SageMaker API de IA. CreateTrainingJob

Para obtener una lista completa de todos los parámetros disponibles y sus descripciones, consulta la referencia de la CreateTrainingJobAPI de SageMaker IA. Todos los parámetros compatibles se CreateTrainingJob pueden incluir en la carga útil de su trabajo de servicio.

Para ver más ejemplos de configuraciones de trabajos de formación APIs, consulte la CLI y SDKs la Guía para desarrolladores de SageMaker IA.

Recomendamos usar PySDK para la creación de trabajos de servicio, ya que PySDK tiene clases y utilidades auxiliares. Para ver un ejemplo del uso de PySDK, consulte SageMaker los ejemplos de IA en. GitHub

Ejemplo de carga útil de un trabajo de servicio

El siguiente ejemplo muestra una carga útil de trabajo de servicio sencilla para un trabajo de SageMaker formación que ejecuta un guion de formación que dice «hola mundo»:

Esta carga útil se pasaría como una cadena JSON al serviceRequestPayload parámetro cuando se llame. SubmitServiceJob

{ "TrainingJobName": "my-simple-training-job", "RoleArn": "arn:aws:iam::123456789012:role/SageMakerExecutionRole", "AlgorithmSpecification": { "TrainingInputMode": "File", "TrainingImage": "763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.0.0-cpu-py310", "ContainerEntrypoint": [ "echo", "hello world" ] }, "ResourceConfig": { "InstanceType": "ml.c5.xlarge", "InstanceCount": 1, "VolumeSizeInGB": 1 }, "OutputDataConfig": { "S3OutputPath": "s3://your-output-bucket/output" }, "StoppingCondition": { "MaxRuntimeInSeconds": 30 } }