Visualización del estado de la cola de trabajos - AWS Batch

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Visualización del estado de la cola de trabajos

Tras crear una cola de trabajos y enviar los trabajos, es importante supervisar su progreso. Puede utilizar la página Detalles del trabajo para revisar, gestionar y supervisar su cola de trabajos.

Visualización de información de la cola de trabajos

En la AWS Batch consola, seleccione Colas de trabajos en el panel de navegación y elija la cola de trabajos que desee para ver sus detalles. En esta página puede revisar y administrar la cola de trabajos o ver información adicional sobre las operaciones de la cola de trabajos, como la instantánea de la cola de trabajos, los límites de estado de los trabajos, el orden del entorno, las etiquetas y el código JSON de la cola de trabajos.

Detalles de la cola de trabajos

En esta sección se muestran información general y opciones de mantenimiento para la cola de trabajos. Tenga en cuenta que puede buscar el nombre de recurso de Amazon (ARN) en esta sección.

Para buscar esta información mediante AWS Command Line Interface, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.

Instantánea de la cola de trabajos

Esta sección proporciona una lista estática de los primeros 100 trabajos de RUNNABLE que están en cola. Puede utilizar el campo de búsqueda para buscar información en cualquier columna de la sección de resultados y reducir la lista. Los trabajos del área de resultados de instantánea se ordenan según la estrategia de ejecución de la cola de trabajos. En el first-in-first-out caso de las colas de trabajos (FIFO), el orden de los trabajos se basa en la hora de envío. En el caso de la programación equitativa de las colas de trabajos, el orden de los trabajos se basa en la prioridad de los trabajos y en el uso de recursos compartidos.

Como los resultados son una instantánea de la cola de trabajos, la lista de resultados no se actualiza automáticamente. Para actualizar la lista, seleccione Actualizar en la parte superior de la sección. Elija el hipervínculo del nombre del trabajo para ir a Detalles del trabajo y ver el estado u otra información relacionada.

Para buscar esta información mediante AWS CLI, utilice la GetJobQueueSnapshotoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Límites del estado de trabajo

Utilice esta pestaña para revisar la información de configuración sobre el tiempo que un trabajo puede tener el estado RUNNABLE antes de que se cancele.

Para buscar esta información mediante AWS CLI, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.

Orden de entornos

Si su cola de trabajos se ejecuta en varios entornos, esta pestaña muestra el orden y una descripción general.

Para buscar esta información mediante AWS CLI, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.

Etiquetas

Utilice esta pestaña para revisar y administrar las etiquetas asociadas a esta cola de trabajos.

JSON

Utilice esta pestaña para copiar el código JSON asociado a esta cola de trabajos. A continuación, puede reutilizar el JSON para AWS CloudFormation plantillas y AWS CLI scripts.

Supervise los trabajos de servicio

Puede supervisar el estado de los trabajos de servicio de su cola de trabajos mediante varios AWS Batch comandos. Los trabajos de servicio son trabajos que se ejecutan en AWS servicios como SageMaker Formación, donde se AWS Batch proporcionan funciones de programación y creación de colas mientras que el servicio de destino se encarga de la ejecución de los trabajos.

Enumere los trabajos de servicio por estado

Utilice la ListServiceJobsoperación para ver los trabajos de servicio de la cola filtrados por estado. Los trabajos de servicio pueden tener los siguientes estados:

  • SUBMITTED- El trabajo se ha enviado pero aún no se ha procesado

  • PENDING- El trabajo está pendiente y a la espera de recursos

  • RUNNABLE- Job está listo para ejecutarse y esperando en la cola

  • STARTING- Job se está iniciando

  • RUNNING- Job se está ejecutando actualmente

  • SCHEDULED- El trabajo se ha enviado al servicio de destino pero aún no se está ejecutando

  • SUCCEEDED- Job completado satisfactoriamente

  • FAILED- No se pudo completar el trabajo

Vea los trabajos en ejecución en su cola:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Vea los trabajos en espera en la cola:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Vea los trabajos que se han enviado SageMaker pero que aún no se están ejecutando:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Ver todos los trabajos realizados correctamente:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SUCCEEDED

Ver los trabajos fallidos para su solución de problemas:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status FAILED

Filtrar trabajos de servicio

Puede filtrar los trabajos de servicio por nombre mediante la coincidencia de patrones. Si el valor de un filtro termina con un asterisco (*), coincide con cualquier nombre de trabajo que comience por la cadena anterior a la «*».

Busque trabajos con nombres que comiencen por «formación»:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=training*

Encuentre trabajos con nombres específicos:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2

Combine filtros de estado y nombre:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING \ --filters name=JOB_NAME,values=production*

Gestione conjuntos de resultados de gran tamaño

Cuando tenga muchos trabajos de servicio, utilice la paginación para gestionar los resultados de forma eficaz.

Limite el número de resultados devueltos:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10

Usa el siguiente token para obtener resultados adicionales:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10 \ --next-token eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

Obtenga información detallada sobre el trabajo de servicio

Utilice la DescribeServiceJoboperación para obtener información completa sobre un trabajo de servicio específico, incluido su estado actual, los identificadores de los recursos de servicio y la información detallada sobre los intentos.

Vea información detallada sobre un trabajo específico:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Este comando devuelve información completa sobre el trabajo, que incluye:

  • ARN del trabajo y estado actual

  • Identificadores de recursos de servicio (como el ARN del trabajo de SageMaker formación)

  • Prioridad de programación y configuración de reintentos

  • Carga útil de solicitud de servicio que contiene los parámetros de servicio originales

  • Información detallada sobre los intentos con las horas de inicio y finalización

  • Mensajes de estado del servicio de destino

Supervise los trabajos de SageMaker formación

Al supervisar los trabajos de SageMaker formación AWS Batch, puede acceder tanto a la información del AWS Batch puesto como a los detalles subyacentes del puesto de SageMaker formación.

El identificador de recursos de servicio en los detalles del trabajo contiene el ARN del trabajo de SageMaker formación:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Puedes usar este ARN para obtener detalles adicionales directamente de: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Supervise el progreso del trabajo comprobando tanto AWS Batch el estado como el estado del trabajo de SageMaker formación. El estado del AWS Batch puesto muestra el ciclo de vida general del trabajo, mientras que el estado del puesto de SageMaker formación proporciona detalles específicos del servicio sobre el proceso de formación.

Finalice los trabajos de servicio

Utilice la TerminateServiceJoboperación para detener un trabajo de servicio en ejecución.

Finalizar un trabajo de servicio específico:

aws batch terminate-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d \ --reason "Job terminated by user request"

Cuando se termina un trabajo de servicio, AWS Batch se detiene el trabajo y se lo notifica al servicio de destino. En el SageMaker caso de los trabajos de formación, esto también detendrá el trabajo de formación en SageMaker IA.