

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 檢視端點狀態
<a name="model-dashboard-endpoints"></a>

如果您想要使用訓練過的模型對即時資料執行推論，請將模型部署到即時端點。為了確保預測的適當延遲，您需要確保託管模型的執行個體有效率地執行。模型儀表板的端點監控特徵可顯示有關端點組態的即時資訊，並協助您透過指標追蹤端點效能。

**監控設定**

模型儀表板會連結至現有的 SageMaker AI 端點詳細資訊頁面，這些頁面會顯示您可以在 Amazon CloudWatch 中選取的即時指標圖形。在儀表板中，您可以在端點處理即時推論請求時追蹤這些指標。一些您可以選取的指標如下：
+ `CpuUtilization`：每個個別 CPU 核心使用率的總和，每個核心的使用率介於 0% 至 100% 之間。
+ `MemoryUtilization`：執行個體上的容器使用的記憶體的百分比，介於 0% 至 100% 之間。
+ `DiskUtilization`：執行個體所用容器使用的磁碟空間百分比，介於 0% 至 100% 之間。。

如需可即時檢視指標的完整清單，請參閱[Amazon CloudWatch 中的 Amazon SageMaker AI 指標](monitoring-cloudwatch.md)。

**執行期設定**

Amazon SageMaker AI 支援託管模型的自動擴展。自動擴展會動態調整針對模型佈建的執行個體數目，因應工作負載的變更。當工作負載增加時，自動擴展會讓更多的執行個體上線。當工作負載減少時，自動擴展會移除不必要的執行個體，讓您不需為了用不到的已佈建執行個體再支付費用。您可以在模型儀表板中自訂以下執行期設定：
+ *更新權重*：使用數值加權來變更指派給每個執行個體的工作負載量。如需在自動擴展期間執行個體加權的更多相關資訊，請參閱[設定 Amazon EC2 Auto Scaling 的執行個體加權](https://docs.aws.amazon.com/autoscaling/ec2/userguide/ec2-auto-scaling-mixed-instances-groups-instance-weighting.html)。
+ *更新執行個體計數*：變更可在工作負載增加時，工作負載提供服務的執行個體總數。

如需端點執行期設定的更多相關資訊，請參閱 [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)。

**端點組態設定**

端點組態設定會顯示您在建立端點時指定的設定。這些設定會通知 SageMaker AI 要為您的端點佈建哪些資源。部分設定包含在下列：
+ *資料擷取*：您可以選擇擷取有關端點輸入和輸出的資訊。例如，您可能想取樣傳入流量，以查看結果是否與訓練資料相關。您可以自訂取樣頻率、儲存資料的格式，以及儲存資料的 Amazon S3 位置。如需設定資料擷取組態的更多相關資訊，請參閱[資料擷取](model-monitor-data-capture.md)。
+ *生產變體*：請參閱*執行期設定*中的先前討論。
+ *非同步調用組態*：如果端點是非同步的，本節包括從 SageMaker AI 用戶端傳送至模型容器的並行請求數目上限、成功和失敗通知的 Amazon S3 位置，以及端點輸出的輸出位置。如需非同步輸出的更多相關資訊，請參閱[非同步端點操作](async-inference-create-invoke-update-delete.md)。
+ *加密金鑰*：如果您要加密您的輸出，可以輸入加密金鑰。

如需端點組態設定的更多相關資訊，請參閱 [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)。

## 檢視一個端點的狀態和組態
<a name="model-dashboard-endpoint-view"></a>

**若要檢視模型端點的狀態和組態，請完成下列步驟：**

1. 開啟 [SageMaker AI 主控台](https://console.aws.amazon.com/sagemaker/)。

1. 選擇在左側面板中的**控管**。

1. 選擇**模型儀表板**。

1. 在模型儀表板的**模型**區段中，選取要檢視之端點的模型名稱。

1. 選取在**端點**區段中的端點名稱。