Monitora i lavori di assistenza in coda AWS Batch - AWS Batch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Monitora i lavori di assistenza in coda AWS Batch

Puoi monitorare lo stato dei lavori nella coda dei lavori di SageMaker Training utilizzandolist-service-jobs, eget-job-queue-snapshot.

Visualizza i lavori in esecuzione nella tua coda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Visualizza i lavori in attesa in coda:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Visualizza i lavori inviati SageMaker ma non ancora in esecuzione:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Ottieni un'istantanea dei lavori in primo piano:

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Questo comando mostra l'ordine dei lavori di assistenza imminenti nella coda.

Ottieni informazioni dettagliate sulle mansioni di assistenza

Utilizzate l'DescribeServiceJoboperazione per ottenere informazioni complete su una specifica mansione di servizio, tra cui lo stato corrente, gli identificatori delle risorse di servizio e informazioni dettagliate sui tentativi.

Visualizza informazioni dettagliate su un lavoro specifico:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Questo comando restituisce informazioni complete sul lavoro, tra cui:

  • Job ARN e stato attuale

  • Identificatori delle risorse del servizio (ad esempio SageMaker Training job ARN)

  • Priorità di pianificazione e configurazione dei nuovi tentativi

  • Payload della richiesta di servizio contenente i parametri di servizio originali

  • Informazioni dettagliate sui tentativi con orari di inizio e fine

  • Messaggi di stato dal servizio di destinazione

Monitora i lavori di SageMaker formazione

Quando si monitorano i lavori di SageMaker formazione tramite AWS Batch, è possibile accedere sia alle informazioni sulla AWS Batch mansione sia ai dettagli dei lavori di SageMaker formazione sottostanti.

L'identificatore della risorsa di servizio nei dettagli del lavoro contiene l'ARN del lavoro di SageMaker formazione:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Puoi utilizzare questo ARN per ottenere ulteriori dettagli direttamente da: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Monitora l'avanzamento del lavoro controllando sia AWS Batch lo stato del lavoro che lo stato del lavoro di SageMaker formazione. Lo stato del AWS Batch lavoro mostra il ciclo di vita complessivo del lavoro, mentre lo stato del lavoro di SageMaker formazione fornisce dettagli specifici del servizio sul processo di formazione.