View a markdown version of this page

Surveillez l'utilisation des réservations de capacité à l'aide CloudWatch des métriques Amazon - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillez l'utilisation des réservations de capacité à l'aide CloudWatch des métriques Amazon

Vous pouvez utiliser CloudWatch les métriques Amazon pour surveiller l'utilisation des réservations de capacité associées à vos plans de SageMaker formation. Cette fonctionnalité donne accès à des mesures historiques et en temps réel sur l'utilisation des instances, au niveau du plan individuel et pour tous les plans de votre compte, afin que vous puissiez prendre des décisions éclairées concernant la capacité et les coûts. Ces statistiques seront publiées directement dans votre compte et le service des plans de SageMaker formation n'y aura pas accès.

Considérations relatives à l'intégration

Le rôle AWSServiceRoleForSageMakerCapacityReservation lié au service (SLR) doit exister dans votre compte pour que les statistiques soient publiées. Vous devez ajouter l'iam:CreateServiceLinkedRoleautorisation au rôle de votre compte. SageMaker L'IA configurera automatiquement le reflex requis lors de votre prochain appelCreateTrainingPlan. Une fois le SLR configuré, CloudWatch les mesures seront disponibles pour les achats de nouveaux forfaits.

La déclaration suivante doit être ajoutée à votre politique IAM :

{ "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "*", "Condition": { "StringEquals": { "iam:AWSServiceName": "capacityreservation.sagemaker.amazonaws.com" } } }
Note

Bien que le Resource champ soit défini sur "*" (obligatoire pourCreateServiceLinkedRole), le Condition bloc limite cette autorisation à la création du SLR de réservation de capacité SageMaker AI uniquement. De plus, si le rôle est supprimé pour une raison quelconque, il est recréé lors du prochain CreateTrainingPlan appel via l'API ou la console.

Création manuelle d'un rôle lié à un service

Vous pouvez également créer le reflex au AWS CLI lieu de vous fier à l' SageMaker IA pour le configurer en exécutant la commande suivante :

aws iam create-service-linked-role --aws-service-name capacityreservation.sagemaker.amazonaws.com

Cette commande crée le AWSServiceRoleForSageMakerCapacityReservation rôle dans votre compte. Pour de plus amples informations sur les rôles liés à un service, veuillez consulter Utilisation des rôles liés à un service.

Important

Le service commence à publier les métriques uniquement après la création du SLR. Les forfaits achetés avant la création du SLR n'afficheront aucune ancienne donnée d'utilisation sur CloudWatch.

Mesures d'utilisation des réservations de capacité

SageMaker AI publie les métriques suivantes dans l'espace de aws/sagemaker/CapacityReservations noms.

Métrique Description
UsedInstanceCount Nombre d’instances actuellement utilisées. Unité : nombre
AvailableInstanceCount Nombre d’instances qui sont disponibles. Unité : nombre
TotalInstanceCount Le nombre total d'instances dans votre plan de formation. Unité : nombre
InstanceUtilization Pourcentage d’instances de capacité réservées qui sont actuellement utilisées. Unité : pourcentage

Dimensions métriques de réservation de capacité

Vous pouvez utiliser les dimensions suivantes pour filtrer les indicateurs.

Dimension Description
ReservationName Filtre les métriques par nom.
ComponentType Filtre les métriques par composant d' SageMaker IA, tel qu'un SageMaker HyperPod cluster, un job de formation, un point de terminaison d'inférence ou une application Studio.
AvailabilityZone Filtre les métriques par zone de disponibilité.
InstanceType Filtre les métriques par type d'instance.
ReservationType Filtre les statistiques par type de réservation (TrainingPlan).

Consultez les CloudWatch statistiques Amazon relatives aux réservations de capacité

Vous pouvez consulter les statistiques de réservation de capacité à l'aide de la CloudWatch console Amazon ou du AWS CLI.

Pour consulter les statistiques de réservation de capacité à l'aide de la CloudWatch console Amazon
  1. Ouvrez la CloudWatch console à l'adresse https://console.aws.amazon.com/cloudwatch/.

  2. Dans le volet de navigation, choisissez Metrics, puis All metrics.

  3. Choisissez l’espace de nom aws/sagemaker/CapacityReservations.

  4. Choisissez une dimension métrique à utiliser pour filtrer.

  5. Cochez la case à côté d'une métrique pour la représenter graphiquement.

Pour répertorier les métriques disponibles à l'aide de AWS CLI, exécutez la commande suivante :

aws cloudwatch list-metrics --namespace "aws/sagemaker/CapacityReservations"