As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Mapeando AWS Batch o status do trabalho do serviço para o status de SageMaker IA
Quando você envia trabalhos para uma SageMaker fila de trabalhos usando SubmitServiceJob, AWS Batch gerencia o ciclo de vida do trabalho e mapeia os estados do trabalho para estados de AWS Batch trabalho de SageMaker treinamento equivalentes. Os trabalhos de serviço, como trabalhos de SageMaker treinamento, seguem um ciclo de vida de estado diferente dos trabalhos tradicionais em contêineres. Embora os trabalhos de serviço compartilhem a maioria dos estados com os trabalhos em contêineres, eles introduzem o SCHEDULED
estado e apresentam diferentes comportamentos de repetição, principalmente para lidar com erros de capacidade insuficientes do serviço de destino.
A tabela a seguir mostra o estado do AWS Batch trabalho e o SageMaker Status/ SecondaryStatus correspondente:
Status do lote | SageMaker Status primário da IA | SageMaker Status secundário de IA | Descrição |
---|---|---|---|
SUBMITTED |
N/D | N/D | Job enviado para a fila, aguardando a avaliação do agendador. |
RUNNABLE |
N/D | N/D | Job está na fila e pronto para agendamento. Os trabalhos nesse estado são iniciados assim que recursos suficientes estiverem disponíveis no ambiente de serviço. Os trabalhos podem permanecer nesse estado indefinidamente quando recursos suficientes não estão disponíveis. |
SCHEDULED |
InProgress |
Pending |
Trabalho de serviço enviado com sucesso à SageMaker AI |
STARTING |
InProgress |
Downloading |
SageMaker Trabalho de treinamento baixando dados e imagens. A capacidade de treinamento foi adquirida e a inicialização do trabalho começa. |
RUNNING |
InProgress |
Training |
SageMaker Algoritmo de execução de tarefas de treinamento |
RUNNING |
InProgress |
Uploading |
SageMaker Trabalho de treinamento: upload de artefatos de saída após a conclusão do treinamento |
SUCCEEDED |
Completed |
Completed |
SageMaker Trabalho de treinamento concluído com sucesso. O upload dos artefatos de saída foi concluído. |
FAILED |
Failed |
Failed |
SageMaker O trabalho de treinamento encontrou um erro irrecuperável. |
FAILED |
Stopped |
Stopped |
SageMaker O trabalho de treinamento foi interrompido manualmenteStopTrainingJob . |