Visualizar o status da fila de trabalhos - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar o status da fila de trabalhos

Depois de criar uma fila de trabalho e enviar trabalhos, é importante poder monitorar o progresso. É possível usar a página Detalhes do trabalho para revisar, gerenciar e monitorar a fila de trabalhos.

Visualizar informações sobre a fila de trabalhos

No AWS Batch console, selecione Filas de trabalhos no painel de navegação e escolha a fila de trabalhos desejada para ver seus detalhes. Nessa página, é possível revisar e gerenciar a fila de trabalhos e ver informações adicionais sobre as operações da fila, como o snapshot da fila de trabalhos, limites de estado do trabalho, a ordem do ambiente, etiquetas e o código JSON da fila de trabalhos.

Detalhes da fila de trabalhos

Esta seção fornece uma visão geral e as opções de manutenção para a fila de trabalhos. Observação: é possível encontrar o nome do recurso da Amazon (ARN) nesta seção.

Para encontrar essas informações por meio do AWS Command Line Interface, use a DescribeJobQueuesoperação junto com o nome da fila de trabalhos ou o ARN correspondente.

Snapshot da fila de trabalhos

Esta seção fornece uma lista estática dos primeiros 100 trabalhos RUNNABLE na fila. É possível usar o campo de pesquisa para restringir a lista, procurando informações em qualquer coluna da seção de resultados. Os trabalhos na área de resultados do snapshot são classificados com base na estratégia de execução da fila de trabalhos. Para filas de trabalhos first-in-first-out (FIFO), a ordem dos trabalhos é baseada no tempo de envio. Para filas de trabalho de agendamento justo, a ordem dos trabalhos é baseada na prioridade do trabalho e no uso do compartilhamento.

Como os resultados são um snapshot da fila de trabalhos, a lista não é atualizada automaticamente. Para atualizá-la, selecione Atualizar na parte superior da seção. Selecione o hiperlink do nome do trabalho para navegar até Detalhes do trabalho e visualizar o status do trabalho e outras informações relacionadas.

Para encontrar essas informações por meio do AWS CLI, use a GetJobQueueSnapshotoperação junto com o nome da fila de trabalhos ou o ARN correspondente.

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

Limites de estados de trabalhos

Use essa guia para rever as informações de configuração relacionadas a quanto tempo um trabalho pode permanecer em um estado RUNNABLE antes de ser cancelado.

Para encontrar essas informações por meio do AWS CLI, use a DescribeJobQueuesoperação junto com o nome da fila de trabalhos ou o ARN correspondente.

Ordem do ambiente

Se a sua fila de tarefas é executada em vários ambientes, essa guia fornece a ordem e uma visão geral deles.

Para encontrar essas informações por meio do AWS CLI, use a DescribeJobQueuesoperação junto com o nome da fila de trabalhos ou o ARN correspondente.

Tags

Use essa guia para rever e gerenciar as etiquetas associadas a essa fila de trabalho.

JSON

Use essa guia para copiar o código JSON que está associado a essa fila de trabalho. Em seguida, você pode reutilizar o JSON para AWS CloudFormation modelos e AWS CLI scripts.

Monitore trabalhos de serviço

Você pode monitorar o status dos trabalhos de serviço em sua fila de trabalhos usando vários AWS Batch comandos. Os trabalhos de serviço são trabalhos executados em AWS serviços como o SageMaker Treinamento, que AWS Batch fornece recursos de agendamento e enfileiramento enquanto o serviço de destino lida com a execução do trabalho.

Listar trabalhos de serviço por status

Use a ListServiceJobsoperação para visualizar trabalhos de serviço em sua fila filtrados por status. Os trabalhos de serviço podem ter os seguintes status:

  • SUBMITTED- O trabalho foi enviado, mas ainda não foi processado

  • PENDING- O trabalho está pendente e aguardando recursos

  • RUNNABLE- Job está pronto para ser executado e aguardando na fila

  • STARTING- O trabalho está sendo iniciado

  • RUNNING- Job está em execução no momento

  • SCHEDULED- O trabalho foi enviado ao serviço de destino, mas ainda não está em execução

  • SUCCEEDED- Job concluído com sucesso

  • FAILED- Não foi possível concluir o trabalho

Veja os trabalhos em execução na sua fila:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

Veja os trabalhos em espera na fila:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

Exibir trabalhos que foram enviados, SageMaker mas ainda não estão em execução:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

Veja todos os trabalhos bem-sucedidos:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SUCCEEDED

Exibir trabalhos com falha para solução de problemas:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status FAILED

Filtrar trabalhos de serviço

Você pode filtrar trabalhos de serviço por nome usando a correspondência de padrões. Se um valor de filtro terminar com um asterisco (*), ele corresponderá a qualquer nome de trabalho que comece com a string antes de '*'.

Encontre vagas com nomes que comecem com “treinamento”:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=training*

Encontre vagas com nomes específicos:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2

Combine filtros de status e nome:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING \ --filters name=JOB_NAME,values=production*

Lidar com grandes conjuntos de resultados

Quando você tem muitos trabalhos de serviço, use a paginação para gerenciar os resultados de forma eficaz.

Limite o número de resultados retornados:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10

Use o próximo token para obter resultados adicionais:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10 \ --next-token eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

Obtenha informações detalhadas sobre o trabalho de serviço

Use a DescribeServiceJoboperação para obter informações abrangentes sobre um trabalho de serviço específico, incluindo seu status atual, identificadores de recursos de serviço e informações detalhadas sobre tentativas.

Veja informações detalhadas sobre um trabalho específico:

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

Esse comando retorna informações abrangentes sobre o trabalho, incluindo:

  • Job ARN e status atual

  • Identificadores de recursos de serviço (como ARN do trabalho SageMaker de treinamento)

  • Prioridade de agendamento e configuração de novas tentativas

  • Carga útil da solicitação de serviço contendo os parâmetros originais do serviço

  • Informações detalhadas da tentativa com horários de início e término

  • Mensagens de status do serviço de destino

Monitore trabalhos SageMaker de treinamento

Ao monitorar os trabalhos de SageMaker treinamento AWS Batch, você pode acessar as informações do AWS Batch trabalho e os detalhes subjacentes do trabalho de SageMaker treinamento.

O identificador do recurso de serviço nos detalhes do trabalho contém o ARN do trabalho de SageMaker treinamento:

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

Você pode usar esse ARN para obter detalhes adicionais diretamente de: SageMaker

aws sagemaker describe-training-job \ --training-job-name my-training-job

Monitore o progresso do trabalho verificando AWS Batch o status e o status do trabalho de SageMaker treinamento. O status do AWS Batch trabalho mostra o ciclo de vida geral do trabalho, enquanto o status do trabalho de SageMaker treinamento fornece detalhes específicos do serviço sobre o processo de treinamento.

Encerrar trabalhos de serviço

Use a TerminateServiceJoboperação para interromper um trabalho de serviço em execução.

Encerre um trabalho de serviço específico:

aws batch terminate-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d \ --reason "Job terminated by user request"

Quando você encerra um trabalho de serviço, AWS Batch interrompe o trabalho e notifica o serviço de destino. Para trabalhos SageMaker de treinamento, isso também interromperá o trabalho de treinamento em SageMaker IA.