本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於推論端點的 Amazon SageMaker AI 增強指標
增強型指標可為 Amazon SageMaker AI 即時端點提供執行個體層級和容器層級監控資料。當您啟用增強型指標時,Amazon CloudWatch 指標可以包含 InstanceId、 ContainerId和 AcceleratorId維度 (可用性因命名空間而異),以取得每個執行個體、每個容器和每個 GPU 的精細可見性。增強型指標適用於單一模型端點和推論元件。多容器端點 (MCE) 支援執行個體層級增強指標,但不支援容器層級指標。
增強型指標的主要特性:
-
執行個體層級精細程度。使用率和調用指標包括一個維
InstanceId度,可識別託管端點的特定執行個體。這適用於所有即時端點。 -
容器層級精細程度。對於使用推論元件的端點,指標包含可識別執行模型之特定容器的
ContainerId維度。容器層級維度會出現在AWS/SageMaker命名空間 (調用指標) 和/aws/sagemaker/InferenceComponents命名空間 (使用指標) 中。 -
每個 GPU 精細程度。GPU 使用率指標包含可識別執行個體上特定 GPU 的
AcceleratorId維度。 -
可設定的發佈頻率。您可以將指標發佈間隔設定為 10、30、60、120、180、240 或 300 秒。預設值為 60 秒。無論是否啟用增強型指標,此間隔都適用於使用率指標。啟用增強型指標後,它也適用於調用指標。
啟用增強型指標
當您呼叫 CreateEndpointConfig API 時,您可以在 MetricsConfig 參數True中將 EnableEnhancedMetrics設定為 ,以啟用增強型指標。
MetricsConfig 參數具有下列欄位:
| 參數 | Type | 必要 | 預設 | 說明 |
|---|---|---|---|---|
EnableEnhancedMetrics |
Boolean | 否 | False |
啟用執行個體層級和容器層級指標維度。 |
MetricPublishFrequencyInSeconds |
Integer | 否 | 60 |
指標發佈至 Amazon CloudWatch 的間隔,以秒為單位。預設為 |
注意
MetricsConfig 在端點組態層級設定 。您無法為相同端點上的個別推論元件設定不同的設定。
若要在現有端點上啟用增強型指標,請使用所需的MetricsConfig設定建立新的端點組態,然後使用新的端點組態名稱呼叫 UpdateEndpoint。這會觸發藍/綠或滾動部署。在部署完成之前,增強型指標不會顯示。在已設定的端點上變更MetricsConfig設定時,套用相同的程序。
當您設定 時MetricsConfig,DescribeEndpoint 和 DescribeEndpointConfig 都會在回應MetricsConfig中傳回 。
當您啟用增強型指標時,SageMaker AI 會在三個 CloudWatch 命名空間中為指標新增額外的維度:/aws/sagemaker/Endpoints用於使用率指標、AWS/SageMaker用於調用指標,以及/aws/sagemaker/InferenceComponents用於推論元件使用率指標。
執行個體層級使用率指標
/aws/sagemaker/Endpoints 命名空間包含所有即時端點的使用率指標,包括使用推論元件的端點。當您啟用增強型指標時, InstanceId和 AcceleratorId(僅限 GPU 指標) 維度會與現有的命名空間維度一起提供。如需指標和維度的完整清單,請參閱 SageMaker AI 端點指標。
當您啟用增強型指標時,可使用下列額外維度:
| 維度 | 說明 |
|---|---|
InstanceId |
篩選特定執行個體的使用率指標。 |
AcceleratorId |
(僅限 GPU 指標) 篩選特定 GPU 的使用率指標。 |
執行個體和容器層級調用指標
AWS/SageMaker 命名空間包含調用指標。當您啟用增強型指標時, InstanceId和 ContainerId(僅限推論元件) 維度會與現有的命名空間維度一起提供。如需指標和維度的完整清單,請參閱 SageMaker AI 端點調用指標。
當您啟用增強型指標時,可使用下列額外維度:
| 維度 | 說明 |
|---|---|
InstanceId |
篩選特定執行個體的調用指標。 |
ContainerId |
(僅限推論元件) 篩選特定容器的調用指標。 |
容器層級使用率指標
/aws/sagemaker/InferenceComponents 命名空間包含使用推論元件之端點的使用率指標。當您啟用增強型指標時,InstanceId、 ContainerId和 AcceleratorId(僅限 GPU 指標) 維度會與現有的命名空間維度一起可用。如需指標和維度的完整清單,請參閱 SageMaker AI 推論元件指標。
當您啟用增強型指標時,可使用下列額外維度:
| 維度 | 說明 |
|---|---|
InstanceId |
篩選特定執行個體的使用率指標。 |
ContainerId |
篩選特定容器的使用率指標。 |
AcceleratorId |
(僅限 GPU 指標) 篩選特定 GPU 的使用率指標。 |
可設定的指標頻率
您可以設定指標發佈至 CloudWatch 的間隔。預設頻率為 60 秒。
有效值:10、30、60、120、180、240 或 300 秒。
當 EnableEnhancedMetrics 設為 時False,此頻率僅適用於使用率指標;調用指標會以預設的 60 秒間隔繼續發佈。設為 時True,此頻率同時適用於使用率和調用指標。
注意
以少於 60 秒 (高解析度) 的間隔發佈的指標會保留 3 小時。
標準 CloudWatch 定價適用於每個唯一維度組合的每個指標。增強型指標會增加指標串流的數量,因為每個執行個體、容器和 GPU 都會建立額外的維度組合。如需定價詳細資訊,請參閱 Amazon CloudWatch 定價
程式碼範例:設定增強型指標
下列範例示範如何在啟用增強型指標的情況下建立端點組態,以及如何驗證組態。