Payloads für Servicejobs in AWS Batch - AWS Batch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Payloads für Servicejobs in AWS Batch

Wenn Sie Serviceaufträge mit senden SubmitServiceJob, geben Sie zwei wichtige Parameter an, die den Job definieren:serviceJobType, undserviceRequestPayload.

  • Der serviceJobType gibt an, welcher AWS Dienst den Job ausführt. Für SageMaker Trainingsjobs ist dieser WertSAGEMAKER_TRAINING.

  • Das serviceRequestPayload ist eine JSON-kodierte Zeichenfolge, die die vollständige Anfrage enthält, die normalerweise direkt an den Zieldienst gesendet würde. Für SageMaker Trainingsjobs enthält diese Payload dieselben Parameter, die Sie für die KI-API verwenden würden. SageMaker CreateTrainingJob

Eine vollständige Liste aller verfügbaren Parameter und ihrer Beschreibungen finden Sie in der SageMaker CreateTrainingJobAI-API-Referenz. Alle von unterstützten Parameter CreateTrainingJob können in Ihre Service-Job-Payload aufgenommen werden.

Beispiele für weitere Konfigurationen von Trainingsjobs finden Sie unter APIsCLI und SDKs im SageMaker AI Developer Guide.

Wir empfehlen, das pySDK für die Erstellung von Dienstaufträgen zu verwenden, da pySDK über Hilfsklassen und Hilfsprogramme verfügt. Ein Beispiel für die Verwendung von pySDK finden Sie unter SageMaker KI-Beispiele auf. GitHub

Beispiel für eine Payload für Service-Jobs

Das folgende Beispiel zeigt eine einfache Payload für einen Servicejob für einen SageMaker Trainingsjob, der ein „Hello World“ -Trainingsskript ausführt:

Diese Payload würde beim Aufrufen als JSON-Zeichenfolge an den serviceRequestPayload Parameter übergeben. SubmitServiceJob

{ "TrainingJobName": "my-simple-training-job", "RoleArn": "arn:aws:iam::123456789012:role/SageMakerExecutionRole", "AlgorithmSpecification": { "TrainingInputMode": "File", "TrainingImage": "763104351884.dkr.ecr.us-west-2.amazonaws.com/pytorch-training:2.0.0-cpu-py310", "ContainerEntrypoint": [ "echo", "hello world" ] }, "ResourceConfig": { "InstanceType": "ml.c5.xlarge", "InstanceCount": 1, "VolumeSizeInGB": 1 }, "OutputDataConfig": { "S3OutputPath": "s3://your-output-bucket/output" }, "StoppingCondition": { "MaxRuntimeInSeconds": 30 } }