As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Visualizar o status da fila de trabalhos
Depois de criar uma fila de trabalho e enviar trabalhos, é importante poder monitorar o progresso. É possível usar a página Detalhes do trabalho para revisar, gerenciar e monitorar a fila de trabalhos.
Visualizar informações sobre a fila de trabalhos
No console do AWS Batch, selecione Filas de trabalho, no painel de navegação, e escolha a fila de trabalho desejada para visualizar seus detalhes. Nessa página, é possível revisar e gerenciar a fila de trabalhos e ver informações adicionais sobre as operações da fila, como o snapshot da fila de trabalhos, limites de estado do trabalho, a ordem do ambiente, etiquetas e o código JSON da fila de trabalhos.
Detalhes da fila de trabalhos
Esta seção fornece uma visão geral e as opções de manutenção para a fila de trabalhos. Observação: é possível encontrar o nome do recurso da Amazon (ARN) nesta seção.
Para encontrar essas informações no AWS Command Line Interface, use a operação DescribeJobQueues com o nome da fila de trabalho ou o ARN correspondente.
Snapshot da fila de trabalhos
Esta seção fornece uma lista estática dos primeiros 100 trabalhos RUNNABLE na fila. É possível usar o campo de pesquisa para restringir a lista, procurando informações em qualquer coluna da seção de resultados. Os trabalhos na área de resultados do snapshot são classificados com base na estratégia de execução da fila de trabalhos. Para filas de trabalho por ordem de chegada, a ordem dos trabalhos é baseada no tempo de envio. Para as filas de trabalho de agendamento de compartilhamento justo, a ordem dos trabalhos se baseia na prioridade do trabalho e no uso do compartilhamento.
Como os resultados são um snapshot da fila de trabalhos, a lista não é atualizada automaticamente. Para atualizá-la, selecione Atualizar na parte superior da seção. Selecione o hiperlink do nome do trabalho para navegar até Detalhes do trabalho e visualizar o status do trabalho e outras informações relacionadas.
Para encontrar essas informações no AWS CLI, use a operação GetJobQueueSnapshot com o nome da fila de trabalho ou o ARN correspondente.
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
Limites de estados de trabalhos
Use essa guia para rever as informações de configuração relacionadas a quanto tempo um trabalho pode permanecer em um estado RUNNABLE antes de ser cancelado.
Para encontrar essas informações no AWS CLI, use a operação DescribeJobQueues com o nome da fila de trabalho ou o ARN correspondente.
Ordem do ambiente
Se a sua fila de tarefas é executada em vários ambientes, essa guia fornece a ordem e uma visão geral deles.
Para encontrar essas informações no AWS CLI, use a operação DescribeJobQueues com o nome da fila de trabalho ou o ARN correspondente.
Tags
Use essa guia para rever e gerenciar as etiquetas associadas a essa fila de trabalho.
JSON
Use essa guia para copiar o código JSON que está associado a essa fila de trabalho. Em seguida, você pode reutilizar o JSON para modelos do AWS CloudFormation e scripts da AWS CLI.
Monitorar trabalhos de serviço
Você pode monitorar o status dos trabalhos de serviço em sua fila de trabalhos usando vários comandos AWS Batch. Os trabalhos de serviço são trabalhos executados em serviços AWS como o SageMaker Training, onde o AWS Batch fornece recursos de agendamento e enfileiramento enquanto o serviço de destino lida com a execução do trabalho.
Listar trabalhos de serviço por status
Use a operação ListServiceJobs para visualizar trabalhos de serviço em sua fila filtrados por status. Os trabalhos de serviço podem ter os seguintes status:
-
SUBMITTED- O trabalho foi enviado, mas ainda não foi processado -
PENDING- O trabalho está pendente e aguardando recursos -
RUNNABLE- O trabalho está pronto para ser executado e aguardando na fila -
STARTING- O trabalho está sendo iniciado -
RUNNING- O trabalho está sendo executado no momento -
SCHEDULED- O trabalho foi enviado ao serviço de destino, mas ainda não está em execução -
SUCCEEDED- O trabalho foi concluído com sucesso. -
FAILED- Falha ao concluir o trabalho.
Veja os trabalhos em execução na sua fila:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
Veja os trabalhos em espera na fila:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
Veja os trabalhos que foram enviados ao SageMaker, mas ainda não estão em execução:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
Veja todos os trabalhos bem-sucedidos:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SUCCEEDED
Veja os trabalhos com falha para solução de problemas:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status FAILED
Filtrar trabalhos de serviço
Você pode filtrar trabalhos de serviço por nome usando a correspondência de padrões. Se um valor de filtro terminar com um asterisco (*), ele corresponderá a qualquer nome de trabalho que comece com a string antes de '*'.
Encontre trabalhos com nomes que comecem com “training”:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=training*
Encontre trabalhos com nomes específicos:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2
Combine filtros de status e nome:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING \ --filters name=JOB_NAME,values=production*
Lidar com grandes conjuntos de resultados
Quando você tem muitos trabalhos de serviço, use a paginação para gerenciar os resultados de forma eficaz.
Limite o número de resultados retornados:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10
Use o próximo token para obter resultados adicionais:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10 \ --next-tokeneyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...
Obter informações detalhadas sobre o trabalho de serviço
Use a operação DescribeServiceJob para obter informações abrangentes sobre um trabalho de serviço específico, incluindo seu status atual, identificadores de recursos de serviço e informações detalhadas sobre tentativas.
Visualizar informações detalhadas sobre um trabalho específico:
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
Esse comando retorna informações abrangentes sobre o trabalho, incluindo:
-
ARN do trabalho e status atual
-
Identificadores de recursos de serviço (como ARN do trabalho do SageMaker Training)
-
Prioridade de agendamento e configuração de novas tentativas
-
Carga útil da solicitação de serviço contendo os parâmetros originais do serviço
-
Informações detalhadas da tentativa com horários de início e término
-
Mensagens de status do serviço de destino
Monitorar trabalhos do SageMaker Training
Ao monitorar trabalhos do SageMaker Training por meio do AWS Batch, você pode acessar as informações do trabalho AWS Batch e os detalhes subjacentes do trabalho do SageMaker Training.
O identificador do recurso de serviço nos detalhes do trabalho contém o ARN do trabalho do SageMaker Training:
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
Você pode usar esse ARN para obter detalhes adicionais diretamente do SageMaker:
aws sagemaker describe-training-job \ --training-job-namemy-training-job
Monitore o progresso do trabalho verificando o status AWS Batch e o status do trabalho do SageMaker Training. O status do trabalho AWS Batch mostra o ciclo de vida geral do trabalho, enquanto o status do trabalho do SageMaker Training fornece detalhes específicos do serviço sobre o processo de treinamento.
Encerrar trabalhos de serviço
Use a operação TerminateServiceJob para interromper um trabalho de serviço em execução.
Encerre um trabalho de serviço específico:
aws batch terminate-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d\ --reason "Job terminated by user request"
Quando você encerra um trabalho de serviço, o AWS Batch interrompe o trabalho e notifica o serviço de destino. Para trabalhos do SageMaker Training, isso também interromperá o trabalho de treinamento no SageMaker AI.