Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Visualización del estado de la cola de trabajos
Tras crear una cola de trabajos y enviar los trabajos, es importante supervisar su progreso. Puede utilizar la página Detalles del trabajo para revisar, gestionar y supervisar su cola de trabajos.
Visualización de información de la cola de trabajos
En la AWS Batch consola, seleccione Colas de trabajos en el panel de navegación y elija la cola de trabajos que desee para ver sus detalles. En esta página puede revisar y administrar la cola de trabajos o ver información adicional sobre las operaciones de la cola de trabajos, como la instantánea de la cola de trabajos, los límites de estado de los trabajos, el orden del entorno, las etiquetas y el código JSON de la cola de trabajos.
Detalles de la cola de trabajos
En esta sección se muestran información general y opciones de mantenimiento para la cola de trabajos. Tenga en cuenta que puede buscar el nombre de recurso de Amazon (ARN) en esta sección.
Para buscar esta información mediante AWS Command Line Interface, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.
Instantánea de la cola de trabajos
Esta sección proporciona una lista estática de los primeros 100 trabajos de RUNNABLE que están en cola. Puede utilizar el campo de búsqueda para buscar información en cualquier columna de la sección de resultados y reducir la lista. Los trabajos del área de resultados de instantánea se ordenan según la estrategia de ejecución de la cola de trabajos. En el first-in-first-out caso de las colas de trabajos (FIFO), el orden de los trabajos se basa en la hora de envío. En el caso de la programación equitativa de las colas de trabajos, el orden de los trabajos se basa en la prioridad de los trabajos y en el uso de recursos compartidos.
Como los resultados son una instantánea de la cola de trabajos, la lista de resultados no se actualiza automáticamente. Para actualizar la lista, seleccione Actualizar en la parte superior de la sección. Elija el hipervínculo del nombre del trabajo para ir a Detalles del trabajo y ver el estado u otra información relacionada.
Para buscar esta información mediante AWS CLI, utilice la GetJobQueueSnapshotoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
Límites del estado de trabajo
Utilice esta pestaña para revisar la información de configuración sobre el tiempo que un trabajo puede tener el estado RUNNABLE antes de que se cancele.
Para buscar esta información mediante AWS CLI, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.
Orden de entornos
Si su cola de trabajos se ejecuta en varios entornos, esta pestaña muestra el orden y una descripción general.
Para buscar esta información mediante AWS CLI, utilice la DescribeJobQueuesoperación junto con el nombre de la cola de trabajos o el ARN correspondiente.
Etiquetas
Utilice esta pestaña para revisar y administrar las etiquetas asociadas a esta cola de trabajos.
JSON
Utilice esta pestaña para copiar el código JSON asociado a esta cola de trabajos. A continuación, puede reutilizar el JSON para AWS CloudFormation plantillas y AWS CLI scripts.
Supervise los trabajos de servicio
Puede supervisar el estado de los trabajos de servicio de su cola de trabajos mediante varios AWS Batch comandos. Los trabajos de servicio son trabajos que se ejecutan en AWS servicios como SageMaker Formación, donde se AWS Batch proporcionan funciones de programación y creación de colas mientras que el servicio de destino se encarga de la ejecución de los trabajos.
Enumere los trabajos de servicio por estado
Utilice la ListServiceJobsoperación para ver los trabajos de servicio de la cola filtrados por estado. Los trabajos de servicio pueden tener los siguientes estados:
-
SUBMITTED- El trabajo se ha enviado pero aún no se ha procesado -
PENDING- El trabajo está pendiente y a la espera de recursos -
RUNNABLE- Job está listo para ejecutarse y esperando en la cola -
STARTING- Job se está iniciando -
RUNNING- Job se está ejecutando actualmente -
SCHEDULED- El trabajo se ha enviado al servicio de destino pero aún no se está ejecutando -
SUCCEEDED- Job completado satisfactoriamente -
FAILED- No se pudo completar el trabajo
Vea los trabajos en ejecución en su cola:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
Vea los trabajos en espera en la cola:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
Vea los trabajos que se han enviado SageMaker pero que aún no se están ejecutando:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
Ver todos los trabajos realizados correctamente:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SUCCEEDED
Ver los trabajos fallidos para su solución de problemas:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status FAILED
Filtrar trabajos de servicio
Puede filtrar los trabajos de servicio por nombre mediante la coincidencia de patrones. Si el valor de un filtro termina con un asterisco (*), coincide con cualquier nombre de trabajo que comience por la cadena anterior a la «*».
Busque trabajos con nombres que comiencen por «formación»:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=training*
Encuentre trabajos con nombres específicos:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2
Combine filtros de estado y nombre:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING \ --filters name=JOB_NAME,values=production*
Gestione conjuntos de resultados de gran tamaño
Cuando tenga muchos trabajos de servicio, utilice la paginación para gestionar los resultados de forma eficaz.
Limite el número de resultados devueltos:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10
Usa el siguiente token para obtener resultados adicionales:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10 \ --next-tokeneyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...
Obtenga información detallada sobre el trabajo de servicio
Utilice la DescribeServiceJoboperación para obtener información completa sobre un trabajo de servicio específico, incluido su estado actual, los identificadores de los recursos de servicio y la información detallada sobre los intentos.
Vea información detallada sobre un trabajo específico:
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
Este comando devuelve información completa sobre el trabajo, que incluye:
-
ARN del trabajo y estado actual
-
Identificadores de recursos de servicio (como el ARN del trabajo de SageMaker formación)
-
Prioridad de programación y configuración de reintentos
-
Carga útil de solicitud de servicio que contiene los parámetros de servicio originales
-
Información detallada sobre los intentos con las horas de inicio y finalización
-
Mensajes de estado del servicio de destino
Supervise los trabajos de SageMaker formación
Al supervisar los trabajos de SageMaker formación AWS Batch, puede acceder tanto a la información del AWS Batch puesto como a los detalles subyacentes del puesto de SageMaker formación.
El identificador de recursos de servicio en los detalles del trabajo contiene el ARN del trabajo de SageMaker formación:
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
Puedes usar este ARN para obtener detalles adicionales directamente de: SageMaker
aws sagemaker describe-training-job \ --training-job-namemy-training-job
Supervise el progreso del trabajo comprobando tanto AWS Batch el estado como el estado del trabajo de SageMaker formación. El estado del AWS Batch puesto muestra el ciclo de vida general del trabajo, mientras que el estado del puesto de SageMaker formación proporciona detalles específicos del servicio sobre el proceso de formación.
Finalice los trabajos de servicio
Utilice la TerminateServiceJoboperación para detener un trabajo de servicio en ejecución.
Finalizar un trabajo de servicio específico:
aws batch terminate-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d\ --reason "Job terminated by user request"
Cuando se termina un trabajo de servicio, AWS Batch se detiene el trabajo y se lo notifica al servicio de destino. En el SageMaker caso de los trabajos de formación, esto también detendrá el trabajo de formación en SageMaker IA.