

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 受管 Spot 訓練生命週期
<a name="model-managed-spot-training-status"></a>

您可以使用 [DescribeTrainingJob](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeTrainingJob.html) 傳回的 `TrainingJobStatus` 和 `SecondaryStatus` 來監控訓練任務。以下清單顯示 `TrainingJobStatus` 和 `SecondaryStatus` 值如何變更，視訓練案例而定：
+ **在訓練期間於不中斷情況下取得的 Spot 執行個體**

  1. `InProgress`: `Starting`↠ `Downloading` ↠ `Training` ↠ `Uploading`
+ **Spot 執行個體中斷一次。之後，取得足夠的 Spot 執行個體來完成訓練任務。**

  1. `InProgress`: `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Starting` ↠ `Downloading` ↠ `Training` ↠ `Uploading` 
+ **Spot 執行個體中斷兩次且超過 `MaxWaitTimeInSeconds`。**

  1. `InProgress`: `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Starting` ↠ `Downloading` ↠ `Training` ↠ `Interrupted` ↠ `Downloading` ↠ `Training` 

  1. `Stopping`: `Stopping` 

  1. `Stopped`: `MaxWaitTimeExceeded` 
+ **Spot 執行個體從未啟動。**

  1. `InProgress`: `Starting` 

  1. `Stopping`: `Stopping` 

  1. `Stopped`: `MaxWaitTimeExceeded` 