Cargas úteis de trabalho de serviço em AWS Batch - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Cargas úteis de trabalho de serviço em AWS Batch

Ao enviar trabalhos de serviço usando SubmitServiceJob, você fornece dois parâmetros principais que definem o trabalho: serviceJobType serviceRequestPayload e.

  • O serviceJobType especifica qual AWS serviço executará o trabalho. Para trabalhos SageMaker de treinamento, esse valor éSAGEMAKER_TRAINING.

  • A serviceRequestPayload é uma string codificada em JSON que contém a solicitação completa que normalmente seria enviada diretamente para o serviço de destino. Para trabalhos de SageMaker treinamento, essa carga contém os mesmos parâmetros que você usaria com a CreateTrainingJobAPI de SageMaker IA.

Para ver uma lista completa de todos os parâmetros disponíveis e suas descrições, consulte a referência da CreateTrainingJobAPI SageMaker AI. Todos os parâmetros suportados pelo CreateTrainingJob podem ser incluídos na carga útil do seu trabalho de serviço.

Para ver exemplos de mais configurações de tarefas de treinamento APIs, consulte CLI SDKs e o Guia SageMaker do Desenvolvedor de IA.

Recomendamos usar o PySDK para a criação de trabalhos de serviço porque o PySDK tem classes auxiliares e utilitários. Para ver um exemplo de uso do PySDK, consulte exemplos de SageMaker IA em. GitHub

Exemplo de carga útil de trabalho de serviço

O exemplo a seguir mostra uma carga útil de um trabalho de serviço simples para um trabalho de SageMaker treinamento que executa um script de treinamento “hello world”:

Essa carga seria passada como uma string JSON para o serviceRequestPayload parâmetro durante a chamada. SubmitServiceJob

{ "TrainingJobName": "my-simple-training-job", "RoleArn": "arn:aws:iam::123456789012:role/SageMakerExecutionRole", "AlgorithmSpecification": { "TrainingInputMode": "File", "TrainingImage": "763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.0.0-cpu-py310", "ContainerEntrypoint": [ "echo", "hello world" ] }, "ResourceConfig": { "InstanceType": "ml.c5.xlarge", "InstanceCount": 1, "VolumeSizeInGB": 1 }, "OutputDataConfig": { "S3OutputPath": "s3://your-output-bucket/output" }, "StoppingCondition": { "MaxRuntimeInSeconds": 30 } }