Surveiller les tâches de service dans une AWS Batch file d'attente - AWS Batch

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveiller les tâches de service dans une AWS Batch file d'attente

Vous pouvez suivre le statut des tâches de votre file d'attente de SageMaker formation à l'aide delist-service-jobs, etget-job-queue-snapshot.

Consultez les tâches en cours dans votre file d'attente :

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Consultez les offres d'emploi en attente :

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Afficher les tâches qui ont été soumises SageMaker mais qui ne sont pas encore en cours d'exécution :

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Obtenez un aperçu des offres d'emploi figurant en tête de liste :

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Cette commande indique l'ordre des tâches de service à venir dans votre file d'attente.

Obtenez des informations détaillées sur les tâches de service

Utilisez cette DescribeServiceJobopération pour obtenir des informations complètes sur une tâche de service spécifique, notamment son statut actuel, les identifiants des ressources de service et des informations détaillées sur les tentatives.

Afficher des informations détaillées sur une tâche spécifique :

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Cette commande renvoie des informations complètes sur la tâche, notamment :

  • Job ARN et statut actuel

  • Identifiants de ressources de service (tels que l'ARN de SageMaker la tâche de formation)

  • Planification de la priorité et configuration des nouvelles tentatives

  • Charge utile de la demande de service contenant les paramètres de service d'origine

  • Informations détaillées sur les tentatives avec heures de début et d'arrêt

  • Messages d'état provenant du service cible

Surveiller les offres SageMaker de formation

Lorsque vous SageMaker surveillez les tâches de formation AWS Batch, vous pouvez accéder à la fois aux informations relatives aux AWS Batch tâches et aux détails des tâches de SageMaker formation sous-jacentes.

L'identifiant de ressource de service indiqué dans les détails de la tâche contient l'ARN de la tâche de SageMaker formation :

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Vous pouvez utiliser cet ARN pour obtenir des informations supplémentaires directement auprès de SageMaker :

aws sagemaker describe-training-job \ --training-job-name my-training-job

Surveillez l'avancement des tâches en vérifiant à la fois AWS Batch le statut et le statut des tâches de SageMaker formation. Le statut du AWS Batch poste indique le cycle de vie global du travail, tandis que le statut du poste de SageMaker formation fournit des informations spécifiques au service sur le processus de formation.