Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Supervise los trabajos de servicio en una cola AWS Batch
Puede supervisar el estado de los trabajos de su cola de trabajos de SageMaker formación utilizandolist-service-jobs, yget-job-queue-snapshot.
Cómo ver los trabajos en ejecución en la cola:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
Cómo ver los trabajos en espera en la cola:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
Vea los trabajos que se han enviado SageMaker pero que aún no están en ejecución:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
Cómo obtener una instantánea de los trabajos que están al comienzo de su lista:
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
Este comando muestra el orden de los próximos trabajos de servicio en la cola.
Obtención de información detallada sobre el trabajo de servicio
Utilice la operación DescribeServiceJob para obtener información completa sobre un trabajo de servicio específico, como su estado actual, los identificadores de recursos de servicio y la información detallada sobre los intentos.
Cómo ver la información detallada sobre un trabajo específico:
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
Este comando devuelve información completa sobre el trabajo, como:
-
el ARN del trabajo y estado actual,
-
Identificadores de recursos de servicio (como el ARN del trabajo de SageMaker formación)
-
la configuración de la prioridad de programación y reintentos,
-
la carga útil de solicitud de servicio que contiene los parámetros de servicio originales,
-
la información detallada sobre los intentos con las horas de inicio y finalización,
-
los mensajes de estado del servicio de destino.
SageMaker Supervise los trabajos de formación
Al supervisar los trabajos de SageMaker formación AWS Batch, puede acceder tanto a la información del AWS Batch puesto como a los detalles subyacentes del puesto de SageMaker formación.
El identificador de recursos de servicio en los detalles del trabajo contiene el ARN del trabajo de SageMaker formación:
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
Puedes usar este ARN para obtener detalles adicionales directamente de: SageMaker
aws sagemaker describe-training-job \ --training-job-namemy-training-job
Supervise el progreso del trabajo comprobando tanto AWS Batch el estado como el estado del trabajo de SageMaker formación. El estado del AWS Batch puesto muestra el ciclo de vida general del trabajo, mientras que el estado del puesto de SageMaker formación proporciona detalles específicos del servicio sobre el proceso de formación.