Mapeando AWS Batch o status do trabalho do serviço para o status de SageMaker IA - AWS Batch

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Mapeando AWS Batch o status do trabalho do serviço para o status de SageMaker IA

Quando você envia trabalhos para uma SageMaker fila de trabalhos usando SubmitServiceJob, AWS Batch gerencia o ciclo de vida do trabalho e mapeia os estados do trabalho para estados de AWS Batch trabalho de SageMaker treinamento equivalentes. Os trabalhos de serviço, como trabalhos de SageMaker treinamento, seguem um ciclo de vida de estado diferente dos trabalhos tradicionais em contêineres. Embora os trabalhos de serviço compartilhem a maioria dos estados com os trabalhos em contêineres, eles introduzem o SCHEDULED estado e apresentam diferentes comportamentos de repetição, principalmente para lidar com erros de capacidade insuficientes do serviço de destino.

A tabela a seguir mostra o estado do AWS Batch trabalho e o SageMaker Status/ SecondaryStatus correspondente:

Status do lote SageMaker Status primário da IA SageMaker Status secundário de IA Descrição
SUBMITTED N/D N/D Job enviado para a fila, aguardando a avaliação do agendador.
RUNNABLE N/D N/D Job está na fila e pronto para agendamento. Os trabalhos nesse estado são iniciados assim que recursos suficientes estiverem disponíveis no ambiente de serviço. Os trabalhos podem permanecer nesse estado indefinidamente quando recursos suficientes não estão disponíveis.
SCHEDULED InProgress Pending Trabalho de serviço enviado com sucesso à SageMaker AI
STARTING InProgress Downloading SageMaker Trabalho de treinamento baixando dados e imagens. A capacidade de treinamento foi adquirida e a inicialização do trabalho começa.
RUNNING InProgress Training SageMaker Algoritmo de execução de tarefas de treinamento
RUNNING InProgress Uploading SageMaker Trabalho de treinamento: upload de artefatos de saída após a conclusão do treinamento
SUCCEEDED Completed Completed SageMaker Trabalho de treinamento concluído com sucesso. O upload dos artefatos de saída foi concluído.
FAILED Failed Failed SageMaker O trabalho de treinamento encontrou um erro irrecuperável.
FAILED Stopped Stopped SageMaker O trabalho de treinamento foi interrompido manualmenteStopTrainingJob.