View a markdown version of this page

使用 Amazon CloudWatch 指標監控容量保留用量 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 Amazon CloudWatch 指標監控容量保留用量

您可以使用 Amazon CloudWatch 指標來監控與 SageMaker 訓練計畫相關聯的容量保留使用率。此功能可讓您在個別計劃層級和帳戶中所有計劃上存取執行個體用量的歷史和即時指標,因此您可以針對容量和成本做出明智的決策。這些指標將直接發佈至您的帳戶,SageMaker 訓練計畫服務將無法存取這些指標。

加入考量事項

AWSServiceRoleForSageMakerCapacityReservation 服務連結角色 (SLR) 必須存在於您的帳戶中,才能發佈指標。您需要將 iam:CreateServiceLinkedRole 許可新增至您的帳戶角色。當您下次呼叫 時,SageMaker AI 會自動設定所需的 SLRCreateTrainingPlan。設定 SLR 後,CloudWatch 指標將可用於新計劃購買。

下列陳述式需要新增至您的 IAM 政策:

{ "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "*", "Condition": { "StringEquals": { "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com" } } }
注意

Resource 欄位設定為 "*"( 需要CreateServiceLinkedRole) 時,Condition區塊會將此許可限制為僅建立 SageMaker AI 容量保留 SLR。此外,如果因為某些原因而刪除角色,則會在下一次CreateTrainingPlan呼叫時透過 API 或主控台重新建立該角色。

手動建立服務連結角色

您也可以透過 建立 SLR, AWS CLI 而不是依賴 SageMaker AI 透過執行下列命令來設定 SLR:

aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com

此命令會在您的帳戶中建立 AWSServiceRoleForSageMakerCapacityReservation角色。如需有關服務連結角色的詳細資訊,請參閱使用服務連結角色

重要

服務只會在建立 SLR 之後開始發佈指標。在建立 SLR 之前購買的計劃不會在 CloudWatch 上顯示任何較舊的使用率資料。

容量保留用量指標

SageMaker AI 會在aws/sagemaker/CapacityReservations命名空間中發佈下列指標。

指標 描述
UsedInstanceCount 目前正在使用的執行個體數量。單位:計數
AvailableInstanceCount 可供使用的執行個體數量。單位:計數
TotalInstanceCount 訓練計畫中的執行個體總數。單位:計數
InstanceUtilization 目前正在使用的預留容量執行個體百分比。單位:百分比

容量保留指標維度

您可以使用下列維度來篩選指標。

維度 Description
ReservationName 依名稱篩選指標。
ComponentType 依 SageMaker AI 元件篩選指標,例如 SageMaker HyperPod 叢集、訓練任務、推論端點或 Studio 應用程式。
AvailabilityZone 依可用區域篩選指標。
InstanceType 依執行個體類型篩選指標。
ReservationType 依保留類型篩選指標 (TrainingPlan)。

檢視容量保留的 Amazon CloudWatch 指標

您可以使用 Amazon CloudWatch 主控台或 檢視容量保留指標 AWS CLI。

使用 Amazon CloudWatch 主控台檢視容量保留指標
  1. 透過 https://console.aws.amazon.com/cloudwatch/ 開啟 CloudWatch 主控台。

  2. 在導覽窗格中,選擇指標,然後選擇所有指標

  3. 選擇 aws/sagemaker/CapacityReservations 命名空間。

  4. 選擇要篩選的指標維度。

  5. 選取指標旁的核取方塊以繪製圖形。

若要使用 列出可用的指標 AWS CLI,請執行下列命令:

aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"