As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Visualizar o status da fila de trabalhos
Depois de criar uma fila de trabalho e enviar trabalhos, é importante poder monitorar o progresso. É possível usar a página Detalhes do trabalho para revisar, gerenciar e monitorar a fila de trabalhos.
Visualizar informações sobre a fila de trabalhos
No AWS Batch console, selecione Filas de trabalhos no painel de navegação e escolha a fila de trabalhos desejada para ver seus detalhes. Nessa página, é possível revisar e gerenciar a fila de trabalhos e ver informações adicionais sobre as operações da fila, como o snapshot da fila de trabalhos, limites de estado do trabalho, a ordem do ambiente, etiquetas e o código JSON da fila de trabalhos.
Detalhes da fila de trabalhos
Esta seção fornece uma visão geral e as opções de manutenção para a fila de trabalhos. Observação: é possível encontrar o nome do recurso da Amazon (ARN) nesta seção.
Para encontrar essas informações por meio do AWS Command Line Interface, use a DescribeJobQueues
operação junto com o nome da fila de trabalhos ou o ARN correspondente.
Snapshot da fila de trabalhos
Esta seção fornece uma lista estática dos primeiros 100 trabalhos RUNNABLE
na fila. É possível usar o campo de pesquisa para restringir a lista, procurando informações em qualquer coluna da seção de resultados. Os trabalhos na área de resultados do snapshot são classificados com base na estratégia de execução da fila de trabalhos. Para filas de trabalhos first-in-first-out (FIFO), a ordem dos trabalhos é baseada no tempo de envio. Para filas de trabalho de agendamento justo, a ordem dos trabalhos é baseada na prioridade do trabalho e no uso do compartilhamento.
Como os resultados são um snapshot da fila de trabalhos, a lista não é atualizada automaticamente. Para atualizá-la, selecione Atualizar na parte superior da seção. Selecione o hiperlink do nome do trabalho para navegar até Detalhes do trabalho e visualizar o status do trabalho e outras informações relacionadas.
Para encontrar essas informações por meio do AWS CLI, use a GetJobQueueSnapshot
operação junto com o nome da fila de trabalhos ou o ARN correspondente.
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
Limites de estados de trabalhos
Use essa guia para rever as informações de configuração relacionadas a quanto tempo um trabalho pode permanecer em um estado RUNNABLE
antes de ser cancelado.
Para encontrar essas informações por meio do AWS CLI, use a DescribeJobQueues
operação junto com o nome da fila de trabalhos ou o ARN correspondente.
Ordem do ambiente
Se a sua fila de tarefas é executada em vários ambientes, essa guia fornece a ordem e uma visão geral deles.
Para encontrar essas informações por meio do AWS CLI, use a DescribeJobQueues
operação junto com o nome da fila de trabalhos ou o ARN correspondente.
Tags
Use essa guia para rever e gerenciar as etiquetas associadas a essa fila de trabalho.
JSON
Use essa guia para copiar o código JSON que está associado a essa fila de trabalho. Em seguida, você pode reutilizar o JSON para AWS CloudFormation modelos e AWS CLI scripts.
Monitore trabalhos de serviço
Você pode monitorar o status dos trabalhos de serviço em sua fila de trabalhos usando vários AWS Batch comandos. Os trabalhos de serviço são trabalhos executados em AWS serviços como o SageMaker Treinamento, que AWS Batch fornece recursos de agendamento e enfileiramento enquanto o serviço de destino lida com a execução do trabalho.
Listar trabalhos de serviço por status
Use a ListServiceJobs
operação para visualizar trabalhos de serviço em sua fila filtrados por status. Os trabalhos de serviço podem ter os seguintes status:
-
SUBMITTED
- O trabalho foi enviado, mas ainda não foi processado -
PENDING
- O trabalho está pendente e aguardando recursos -
RUNNABLE
- Job está pronto para ser executado e aguardando na fila -
STARTING
- O trabalho está sendo iniciado -
RUNNING
- Job está em execução no momento -
SCHEDULED
- O trabalho foi enviado ao serviço de destino, mas ainda não está em execução -
SUCCEEDED
- Job concluído com sucesso -
FAILED
- Não foi possível concluir o trabalho
Veja os trabalhos em execução na sua fila:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status RUNNING
Veja os trabalhos em espera na fila:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status RUNNABLE
Exibir trabalhos que foram enviados, SageMaker mas ainda não estão em execução:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status SCHEDULED
Veja todos os trabalhos bem-sucedidos:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status SUCCEEDED
Exibir trabalhos com falha para solução de problemas:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status FAILED
Filtrar trabalhos de serviço
Você pode filtrar trabalhos de serviço por nome usando a correspondência de padrões. Se um valor de filtro terminar com um asterisco (*), ele corresponderá a qualquer nome de trabalho que comece com a string antes de '*'.
Encontre vagas com nomes que comecem com “treinamento”:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --filters name=JOB_NAME,values=training*
Encontre vagas com nomes específicos:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2
Combine filtros de status e nome:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --job-status RUNNING \ --filters name=JOB_NAME,values=production*
Lidar com grandes conjuntos de resultados
Quando você tem muitos trabalhos de serviço, use a paginação para gerenciar os resultados de forma eficaz.
Limite o número de resultados retornados:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --max-results 10
Use o próximo token para obter resultados adicionais:
aws batch list-service-jobs \ --job-queue
my-sm-training-fifo-jq
\ --max-results 10 \ --next-tokeneyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...
Obtenha informações detalhadas sobre o trabalho de serviço
Use a DescribeServiceJob
operação para obter informações abrangentes sobre um trabalho de serviço específico, incluindo seu status atual, identificadores de recursos de serviço e informações detalhadas sobre tentativas.
Veja informações detalhadas sobre um trabalho específico:
aws batch describe-service-job \ --job-id
a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
Esse comando retorna informações abrangentes sobre o trabalho, incluindo:
-
Job ARN e status atual
-
Identificadores de recursos de serviço (como ARN do trabalho SageMaker de treinamento)
-
Prioridade de agendamento e configuração de novas tentativas
-
Carga útil da solicitação de serviço contendo os parâmetros originais do serviço
-
Informações detalhadas da tentativa com horários de início e término
-
Mensagens de status do serviço de destino
Monitore trabalhos SageMaker de treinamento
Ao monitorar os trabalhos de SageMaker treinamento AWS Batch, você pode acessar as informações do AWS Batch trabalho e os detalhes subjacentes do trabalho de SageMaker treinamento.
O identificador do recurso de serviço nos detalhes do trabalho contém o ARN do trabalho de SageMaker treinamento:
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
Você pode usar esse ARN para obter detalhes adicionais diretamente de: SageMaker
aws sagemaker describe-training-job \ --training-job-name
my-training-job
Monitore o progresso do trabalho verificando AWS Batch o status e o status do trabalho de SageMaker treinamento. O status do AWS Batch trabalho mostra o ciclo de vida geral do trabalho, enquanto o status do trabalho de SageMaker treinamento fornece detalhes específicos do serviço sobre o processo de treinamento.
Encerrar trabalhos de serviço
Use a TerminateServiceJob
operação para interromper um trabalho de serviço em execução.
Encerre um trabalho de serviço específico:
aws batch terminate-service-job \ --job-id
a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
\ --reason "Job terminated by user request"
Quando você encerra um trabalho de serviço, AWS Batch interrompe o trabalho e notifica o serviço de destino. Para trabalhos SageMaker de treinamento, isso também interromperá o trabalho de treinamento em SageMaker IA.