

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 托管的 Spot 训练生命周期
<a name="model-managed-spot-training-status"></a>

您可以使用 [DescribeTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingJob.html) 返回的 `TrainingJobStatus` 和 `SecondaryStatus` 监控训练作业。下面的列表显示了 `TrainingJobStatus` 和 `SecondaryStatus` 值如何根据训练场景而变化：
+ **在训练期间不间断地获得的 Spot 实例**

  1. `InProgress`: `Starting`↠ `Downloading` ↠ `Training` ↠ `Uploading`
+ **竞价型实例中断一次。之后，获得了足够的竞价型实例来完成训练作业。**

  1. `InProgress`: `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Starting` ↠ `Downloading` ↠ `Training` ↠ `Uploading` 
+ **Spot 实例中断两次并且超出了 `MaxWaitTimeInSeconds`。**

  1. `InProgress`: `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Downloading` ↠ `Training` 

  1. `Stopping`: `Stopping` 

  1. `Stopped`: `MaxWaitTimeExceeded` 
+ **Spot 实例从未启动。**

  1. `InProgress`: `Starting` 

  1. `Stopping`: `Stopping` 

  1. `Stopped`: `MaxWaitTimeExceeded` 