

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 獲取即時的潛在執行個體
<a name="inference-recommender-prospective"></a>

Inference Recommender 也可以在 SageMaker AI 模型詳細資訊頁面上為您提供*潛在執行個體*或可能適用於您模型的執行個體類型清單。Inference Recommender 會自動針對您的模型執行初步基準測試，以提供前五大潛在執行個體。由於這些是初步建議，因此建議您執行進一步的執行個體建議任務，以取得更準確的結果。

您可以使用 [DescribeModel](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeModel.html) API、SageMaker Python SDK 或 SageMaker AI 主控台，以程式設計方式檢視模型的預期執行個體清單。

**注意**  
在此功能可用之前，您無法取得在 SageMaker AI 中建立的模型之預期執行個體。

若要透過主控台檢視您模型的預期執行個體，請執行以下操作：

1. 前往位在 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) 的 SageMaker 主控台。

1. 在左側導覽窗格中，選擇**推論**，然後選擇**模型**。

1. 從模型清單中選擇您的模型。

在模型的詳細資料頁面上，前往**要部署模型的預期執行個體**區段。以下螢幕擷取畫面顯示了此區段。

![模型詳細資訊頁面上預期執行個體清單的螢幕擷取畫面。](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/inf-rec-prospective.png)


在本節中，您可以檢視針對模型部署的成本、輸送量和延遲最佳化的預期執行個體，以及每個執行個體類型的其他資訊，例如記憶體大小、CPU 和 GPU 計數以及每小時成本。

如果您決定要對範例承載進行基準測試，並針對模型執行完整推論建議任務，則可以從此頁面啟動預設的推論建議任務。若要透過主控台啟動預設任務，請執行以下操作：

1. 在**要部署模型的潛在執行個體區段**的模型詳細資料頁面上，選擇**執行推論建議程式任務**。

1. 在快顯對話方塊中，對於**用於基準測試承載的 S3 儲存貯體**，輸入您為模型儲存範例承載的 Amazon S3 位置。

1. 針對**承載內容類型**，輸入承載資料的 MIME 類型。

1. (選用) 在**使用 SageMaker Neo 編譯模型**區段中，對於**資料輸入組態**，請以字典格式輸入資料形式。

1. 選擇**執行工作**。

Inference Recommender 會啟動任務，您可以從 SageMaker AI 主控台的**推論建議程式**清單頁面檢視任務及其結果。

如果要執行進階任務並執行自訂負載測試，或者想要為任務設置其他設定和參數，請參閱[執行自訂負載測試](inference-recommender-load-test.md)。