

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 在 SageMaker AI 主控台檢視端點詳細資訊
<a name="manage-endpoints-console"></a>

若要在 SageMaker AI 主控台檢視端點，請執行下列動作：

1. 前往位在 [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/) 的 SageMaker AI 主控台。

1. 在左側導覽窗格中，選擇**推論**。

1. 從下拉式清單中，選擇**端點**。

1. 在**端點**頁面，選擇您的端點。

端點詳細資訊頁面應會開啟，並顯示已為您的端點收集的端點和指標摘要。

以下部分說明端點詳細資訊頁面上的索引標籤。

# 端點監控
<a name="manage-endpoints-console-monitoring"></a>

建立 SageMaker AI 託管端點後，您可以使用 Amazon CloudWatch 監控端點，由 Amazon CloudWatch 收集原始資料，並將該資料處理成近乎即時的可讀取指標。使用這些指標，您可以存取歷史資訊，並更加了解端點的執行狀況。如需更多資訊，請參閱 *[Amazon CloudWatch 使用者指南](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/)*。

您可以從端點詳細資訊頁面的**監控**索引標籤，檢視從端點收集的 CloudWatch 指標資料。

**監控**索引標籤包含下列區段：
+ **操作指標**：查看用於追蹤端點資源使用率的指標，例如 CPU 利用率和記憶體使用率。
+ **調用指標**：檢視追蹤傳送到端點的 `InvokeEndpoint` 請求數量、運作狀態和狀態的指標，例如調用模型錯誤和模型延遲。
+ **運作狀態指標**：檢視追蹤端點整體運作狀態的指標，例如調用失敗和通知失敗。

如需每個指標的詳細說明，請參閱[使用 CloudWatch 監控 SageMaker AI](https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html)。

下列螢幕擷取畫面顯示無伺服器端點的**操作指標**區段。

![\[端點詳細資訊頁面的操作指標區段中的指標圖螢幕擷取畫面。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/hosting-operational-metrics.png)




您可以針對指定區段中的指標調整要追蹤的**期間**和**統計資料**，以及要檢視指標資料的時間長度。您也可以選擇**新增小工具**，在每個區段的檢視中新增和移除指標小工具。在**新增小工具**對話方塊中，您可以選取並取消選取要查看的指標。

可用的指標可能取決於您的端點類型。例如，無伺服器端點具有一些無法用於即時端點的指標。如需端點類型的特定指標資訊，請參閱以下頁面：
+ [監控無伺服器端點](https://docs.aws.amazon.com/sagemaker/latest/dg/serverless-endpoints-monitoring.html)
+ [監控非同步端點](https://docs.aws.amazon.com/sagemaker/latest/dg/async-inference-monitor.html)
+ [多模型端點部署的 CW 指標](https://docs.aws.amazon.com/sagemaker/latest/dg/multi-model-endpoint-cloudwatch-metrics.html)
+ [推論管道日誌和指標](https://docs.aws.amazon.com/sagemaker/latest/dg/inference-pipeline-logs-metrics.html)

# 設定
<a name="manage-endpoints-console-settings"></a>

您可以選擇**設定**索引標籤來檢視有關端點的其他資訊，例如資料擷取設定、端點組態和標籤。

# 建立和檢視警示
<a name="manage-endpoints-console-alarms"></a>

在端點詳細資訊頁面的**警示**索引標籤上，您可以檢視和建立簡單的靜態閾值指標警示，並在其中指定指標的閾值。如果指標違反閾值，警示就會進入 `ALARM` 狀態。如需有關 CloudWatch 警示的詳細資訊，請參閱[使用 Amazon CloudWatch 警示](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html)。

在**端點摘要**區段中，您可以檢視**警示**欄位，告訴您端點上目前有多少警示處於啟用狀態。

若要檢視處於該 `ALARM` 狀態的警示，請選擇**警示**索引標籤。**警示**索引標籤顯示端點警示的完整清單，以及其狀態和條件的詳細資訊。下列螢幕擷取畫面顯示此區段中已針對端點設定的警示清單。

![\[端點詳細資訊頁面上的警示索引標籤螢幕擷取畫面，顯示 CloudWatch 警示清單。\]](http://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/images/hosting-alarms-tab.png)


警示狀態可以是 `In alarm`、`OK`，或者 `Insufficient data` (如果收集的指標資料不足)。

若要為您的端點建立新警示，請執行以下動作：

1. 在**警示**索引標籤中，選擇**建立警示**。

1. **建立警示**頁面隨即開啟。對於 **Alarm name** (警示名稱)，輸入警示的名稱。

1. (選用) 輸入警示的說明。

1. 對於**指標**，選擇您要追蹤的警示的 CloudWatch 指標。

1. 對於**變體名稱**，選擇您要監視的端點模型變體。

1. 對於**統計資料**，選擇所選指標的其中一個可用統計資料。

1. 對於**期間**，選擇用於計算每個統計資料值的時段。例如，如果您選擇平均值統計資料和 5 分鐘的期間，則警示監控的每個資料點就是每 5 分鐘間隔的指標資料點平均值。

1. 對於**評估期間**，請輸入您要在評估是否進入警示狀態時要考量警示的資料點數量。

1. 對於**條件**，選擇您要用於警示閾值的條件。

1. 對於**閾值**，輸入所需的閾值。

1. (選用) 對於**通知**，您可以選擇**新增通知**來建立或指定在警示狀態變更時接收通知的 Amazon SNS 主題。

1. 選擇 **Create alarm** (建立警示)。

建立警示後，您可以隨時返回**警示**索引標籤來檢視其狀態。您也可以從此區段選取警示，然後選取**編輯**或**刪除**。