Überwachen Sie Serviceaufträge in einer Warteschlange AWS Batch - AWS Batch

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen Sie Serviceaufträge in einer Warteschlange AWS Batch

Sie können den Status der Jobs in Ihrer Warteschlange für SageMaker Schulungsaufträge mithilfe vonlist-service-jobs, und überwachenget-job-queue-snapshot.

Laufende Jobs in deiner Warteschlange anzeigen:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Jobs anzeigen, die in der Warteschlange warten:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Jobs anzeigen, die eingereicht wurden, SageMaker aber noch nicht laufen:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Verschaffen Sie sich einen Überblick über die Jobs, die sich ganz oben in Ihrer Warteschlange befinden:

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Dieser Befehl zeigt die Reihenfolge der anstehenden Serviceaufträge in Ihrer Warteschlange an.

Erhalten Sie detaillierte Informationen zu Serviceaufträgen

Verwenden Sie diesen DescribeServiceJobVorgang, um umfassende Informationen zu einem bestimmten Serviceauftrag abzurufen, einschließlich seines aktuellen Status, der Dienstressourcen-IDs und detaillierter Informationen zu Versuchen.

Detaillierte Informationen zu einem bestimmten Job anzeigen:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Dieser Befehl gibt umfassende Informationen über den Job zurück, darunter:

  • Job-ARN und aktueller Status

  • Identifikatoren für Serviceressourcen (z. B. ARN für SageMaker Schulungsjobs)

  • Priorität einplanen und Konfiguration erneut versuchen

  • Payload der Serviceanfrage, die die ursprünglichen Serviceparameter enthält

  • Detaillierte Informationen zu den Versuchen mit Start- und Stoppzeiten

  • Statusmeldungen vom Zieldienst

Überwachen Sie SageMaker Trainingsjobs

Wenn Sie SageMaker Trainingsjobs bis überwachen AWS Batch, können Sie sowohl auf die AWS Batch Jobinformationen als auch auf die zugrunde liegenden SageMaker Trainingsjobdetails zugreifen.

Die Dienstressourcen-ID in den Jobdetails enthält den ARN für den SageMaker Trainingsjob:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Sie können diesen ARN verwenden, um weitere Informationen direkt zu erhalten von SageMaker:

aws sagemaker describe-training-job \ --training-job-name my-training-job

Überwachen Sie den Auftragsfortschritt, indem Sie sowohl AWS Batch den Status als auch den Status des SageMaker Schulungsauftrags überprüfen. Der AWS Batch Jobstatus zeigt den gesamten Joblebenszyklus, während der Status des SageMaker Schulungsauftrags dienstspezifische Details zum Trainingsprozess enthält.