Cycle de vie de l'entraînement Spot géré - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Cycle de vie de l'entraînement Spot géré

Vous pouvez contrôler une tâche d'entraînement en utilisant les valeurs TrainingJobStatus et SecondaryStatus renvoyées par DescribeTrainingJob. La liste ci-dessous montre comment les valeurs TrainingJobStatus et SecondaryStatus changent en fonction du scénario d'entraînement :

  • Instances Spot acquises sans interruption pendant l'entraînement

    1. InProgress: StartingDownloadingTrainingUploading

  • Instances Spot interrompues une fois. Par la suite, suffisamment d'instances Spot ont été acquises pour terminer la tâche d'entraînement.

    1. InProgress: StartingDownloadingTrainingInterruptedStartingDownloadingTrainingUploading

  • Instances Spot interrompues deux fois et délai MaxWaitTimeInSeconds dépassé.

    1. InProgress: StartingDownloadingTrainingInterruptedStartingDownloadingTrainingInterruptedDownloadingTraining

    2. Stopping: Stopping

    3. Stopped: MaxWaitTimeExceeded

  • Les instances Spot n'ont jamais été lancées.

    1. InProgress: Starting

    2. Stopping: Stopping

    3. Stopped: MaxWaitTimeExceeded