Surveiller les tâches Ray à l'aide de métriques - AWS Glue

Surveiller les tâches Ray à l'aide de métriques

Vous pouvez surveiller les tâches Ray en utilisant AWS Glue Studio et Amazon CloudWatch. CloudWatch collecte et traite les métriques brutes d'AWS Glue avec Ray, ce qui les rend disponibles pour analyse. Ces métriques sont affichées dans la console AWS Glue Studio, ce qui vous permet de surveiller votre tâche pendant son exécution.

Pour obtenir une présentation générale de la procédure de surveillance de AWS Glue, consultez Surveillance de AWS Glue avec des métriques Amazon CloudWatch. Pour obtenir une présentation générale de l'utilisation des métriques CloudWatch publiées par AWS Glue, consultez Surveillance de avec Amazon CloudWatch.

Surveillance des tâches Ray dans la console AWS Glue

Sur la page de détails d'une exécution de tâche, sous la section Informations de l'exécution, vous pouvez afficher les graphiques agrégés prédéfinis qui affichent les métriques disponibles pour la tâche. AWS Glue Studio envoie les métriques de tâche à CloudWatch pour chaque tâche. Vous pouvez ainsi créer un profil de votre cluster et de vos tâches, ainsi qu'accéder à des informations détaillées sur chaque nœud.

Pour plus d'informations sur les graphiques de métriques disponibles, consultez Affichage des métriques Amazon CloudWatch pour une exécution de tâche Ray.

Vue d'ensemble des métriques relatives aux tâches Ray dans CloudWatch

Nous publions les métriques Ray lorsque la surveillance détaillée est activée dans CloudWatch. Les métriques sont publiées dans l'espace de noms Glue/Ray CloudWatch.

  • Métriques des instances

    Nous publions des métriques sur l'utilisation du processeur, de la mémoire et du disque des instances affectées à une tâche. Ces métriques sont identifiées par des fonctionnalités telles que ExecutorId, ExecutorType et host. Elles constituent un sous-ensemble des métriques standard de l'agent Linux CloudWatch. Vous trouverez des informations sur les noms et les fonctionnalités des métriques dans la documentation CloudWatch. Pour plus d'informations, consultez Metrics collected by the CloudWatch agent (Métriques collectées par l'agent CloudWatch).

  • Métriques du cluster Ray

    Nous transmettons les métriques des processus Ray qui exécutent votre script à cet espace de noms, puis nous vous fournissons celles qui sont les plus essentielles pour vous. Les mesures disponibles peuvent varier selon la version de Ray. Pour plus d'informations sur la version de Ray exécutée par votre tâche, consultez Versions AWS Glue.

    Ray collecte des métriques au niveau de l'instance. Il fournit également des métriques pour les tâches et le cluster. Pour plus d'informations sur la stratégie métrique sous-jacente de Ray, consultez Metrics dans la documentation Ray.

Note

Nous ne publions pas les métriques Ray dans l'espace de noms Glue/Job Metrics/, qui n'est utilisé que pour les tâches AWS Glue ETL.