View a markdown version of this page

Amazon CloudWatch メトリクスを使用してキャパシティ予約の使用状況をモニタリングする - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon CloudWatch メトリクスを使用してキャパシティ予約の使用状況をモニタリングする

Amazon CloudWatch メトリクスを使用して、SageMaker トレーニングプランに関連するキャパシティ予約の使用率をモニタリングできます。この機能は、インスタンスの使用状況に関する履歴メトリクスとリアルタイムメトリクスの両方に、個々のプランレベルとアカウント内のすべてのプランでアクセスできるため、容量とコストについて情報に基づいた意思決定を行うことができます。これらのメトリクスは アカウントに直接公開され、SageMaker トレーニングプランサービスはそれらにアクセスできません。

オンボーディングに関する考慮事項

メトリクスを発行するには、AWSServiceRoleForSageMakerCapacityReservationサービスにリンクされたロール (SLR) がアカウントに存在する必要があります。アカウントロールにアクセスiam:CreateServiceLinkedRole許可を追加する必要があります。SageMaker AI は、次回 を呼び出すときに、必要な SLR を自動的にセットアップしますCreateTrainingPlan。SLR を設定すると、CloudWatch メトリクスが新しいプラン購入で利用可能になります。

次のステートメントを IAM ポリシーに追加する必要があります。

{ "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "*", "Condition": { "StringEquals": { "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com" } } }
注記

Resource フィールドが "*" ( に必須CreateServiceLinkedRole) に設定されている間、 Conditionブロックはこのアクセス許可を制限して SageMaker AI キャパシティ予約 SLR のみを作成します。さらに、何らかの理由でロールが削除された場合、そのロールは API またはコンソールを介して次のCreateTrainingPlan呼び出しで再作成されます。

サービスにリンクされたロールの手動作成

次のコマンドを実行して、SageMaker AI に依存してセットアップ AWS CLI する代わりに、 を使用して SLR を作成することもできます。

aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com

このコマンドは、アカウントに AWSServiceRoleForSageMakerCapacityReservationロールを作成します。サービスにリンクされたロールの詳細については、「サービスリンクロールの使用」を参照してください。

重要

サービスは、SLR の作成後にのみメトリクスの発行を開始します。SLR の作成前に購入したプランには、CloudWatch の古い使用率データは表示されません。

キャパシティ予約使用状況メトリクス

SageMaker AI は、 aws/sagemaker/CapacityReservations名前空間に次のメトリクスを発行します。

メトリクス 説明
UsedInstanceCount 現在使用中のインスタンスの数。単位: 個
AvailableInstanceCount 使用可能なインスタンスの数。単位: 数
TotalInstanceCount トレーニングプラン内のインスタンスの総数。単位: 数
InstanceUtilization 現在使用中のリザーブドキャパシティーインスタンスの割合。単位: パーセント

キャパシティ予約メトリクスディメンション

次のディメンションを使用してメトリクスをフィルタリングできます。

ディメンション 説明
ReservationName 名前でメトリクスをフィルタリングします。
ComponentType SageMaker HyperPod クラスター、トレーニングジョブ、推論エンドポイント、Studio アプリなどの SageMaker AI コンポーネントでメトリクスをフィルタリングします。
AvailabilityZone アベイラビリティーゾーンでメトリクスをフィルタリングします。
InstanceType インスタンスタイプでメトリクスをフィルタリングします。
ReservationType 予約タイプ () でメトリクスをフィルタリングしますTrainingPlan

キャパシティ予約の Amazon CloudWatch メトリクスを表示する

Amazon CloudWatch コンソールまたは を使用して、キャパシティ予約メトリクスを表示できます AWS CLI。

Amazon CloudWatch コンソールを使用してキャパシティ予約メトリクスを表示するには
  1. CloudWatch コンソールの https://console.aws.amazon.com/cloudwatch/ を開いてください。

  2. ナビゲーションペインで、メトリクスを選択し、次にすべてのメトリクスを選択します。

  3. aws/sagemaker/CapacityReservations 名前空間を選択します。

  4. フィルタリングするメトリクスディメンションを選択します。

  5. メトリクスの横にあるチェックボックスをオンにしてグラフ化します。

を使用して使用可能なメトリクスを一覧表示するには AWS CLI、次のコマンドを実行します。

aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"