Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Monitora i lavori di assistenza in coda AWS Batch
Puoi monitorare lo stato dei lavori nella coda dei lavori di SageMaker Training utilizzandolist-service-jobs, eget-job-queue-snapshot.
Visualizza i lavori in esecuzione nella tua coda:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
Visualizza i lavori in attesa in coda:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
Visualizza i lavori inviati SageMaker ma non ancora in esecuzione:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
Ottieni un'istantanea dei lavori in primo piano:
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
Questo comando mostra l'ordine dei lavori di assistenza imminenti nella coda.
Ottieni informazioni dettagliate sulle mansioni di assistenza
Utilizzate l'DescribeServiceJoboperazione per ottenere informazioni complete su una specifica mansione di servizio, tra cui lo stato corrente, gli identificatori delle risorse di servizio e informazioni dettagliate sui tentativi.
Visualizza informazioni dettagliate su un lavoro specifico:
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
Questo comando restituisce informazioni complete sul lavoro, tra cui:
-
Job ARN e stato attuale
-
Identificatori delle risorse del servizio (ad esempio SageMaker Training job ARN)
-
Priorità di pianificazione e configurazione dei nuovi tentativi
-
Payload della richiesta di servizio contenente i parametri di servizio originali
-
Informazioni dettagliate sui tentativi con orari di inizio e fine
-
Messaggi di stato dal servizio di destinazione
Monitora i lavori di SageMaker formazione
Quando si monitorano i lavori di SageMaker formazione tramite AWS Batch, è possibile accedere sia alle informazioni sulla AWS Batch mansione sia ai dettagli dei lavori di SageMaker formazione sottostanti.
L'identificatore della risorsa di servizio nei dettagli del lavoro contiene l'ARN del lavoro di SageMaker formazione:
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
Puoi utilizzare questo ARN per ottenere ulteriori dettagli direttamente da: SageMaker
aws sagemaker describe-training-job \ --training-job-namemy-training-job
Monitora l'avanzamento del lavoro controllando sia AWS Batch lo stato del lavoro che lo stato del lavoro di SageMaker formazione. Lo stato del AWS Batch lavoro mostra il ciclo di vita complessivo del lavoro, mentre lo stato del lavoro di SageMaker formazione fornisce dettagli specifici del servizio sul processo di formazione.