Surveillance des applications et des tâches EMR sans serveur - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Surveillance des applications et des tâches EMR sans serveur

Avec Amazon CloudWatch Metrics for EMR Serverless, vous pouvez recevoir des CloudWatch métriques en une minute et accéder à des CloudWatch tableaux de bord pour visualiser les near-real-time opérations et les performances de vos applications EMR Serverless.

EMR Serverless envoie des métriques à chaque minute. CloudWatch EMR Serverless émet ces métriques au niveau de l'application ainsi qu'au niveau de la tâche, du type de travailleur et aux niveaux. capacity-allocation-type

Pour commencer, utilisez le modèle de tableau de CloudWatch bord EMR Serverless fourni dans le référentiel EMR GitHub Serverless et déployez-le.

Note

Les charges de travail interactives EMR sans serveur sont uniquement activées pour la surveillance au niveau de l'application et ont une nouvelle dimension de type de travailleur. Spark_Kernel Pour surveiller et déboguer vos charges de travail interactives, vous pouvez consulter les journaux et l'interface utilisateur d'Apache Spark depuis votre espace de travail EMR Studio.

Surveillance des métriques

Important

Nous restructurons notre affichage des métriques pour ajouter ApplicationName et JobName en tant que dimensions. Les anciens indicateurs existants sont toujours disponibles, mais nous vous recommandons d'utiliser les nouveaux indicateurs.

Dimensions actuelles

Le tableau ci-dessous décrit les dimensions EMR Serverless disponibles dans l'espace de noms. AWS/EMR Serverless

Dimensions des métriques EMR sans serveur
Dimension Description
ApplicationId

Filtre toutes les métriques d'une application EMR sans serveur à l'aide de l'ID de l'application.

ApplicationName

Filtre toutes les métriques d'une application EMR sans serveur utilisant le nom. Si le nom n'est pas fourni ou contient des caractères non ASCII, il est publié sous le nom [Non spécifié].

JobId

Filtre toutes les métriques d'un EMR Serverless, l'ID d'exécution de la tâche.

JobName

Filtres pour toutes les métriques d'une tâche EMR sans serveur exécutée en utilisant le nom. Si le nom n'est pas fourni ou contient des caractères non ASCII, il est publié sous le nom [Non spécifié].

WorkerType

Filtres pour tous les indicateurs d'un type de travailleur donné. Par exemple, vous pouvez filtrer pour SPARK_DRIVER et SPARK_EXECUTORS pour les tâches Spark.

CapacityAllocationType

Filtres pour tous les indicateurs d'un type d'allocation de capacité donné. Par exemple, vous pouvez filtrer PreInitCapacity pour la capacité pré-initialisée et OnDemandCapacity pour tout le reste.

Surveillance au niveau de l'application

Vous pouvez surveiller l'utilisation de la capacité au niveau de l'application EMR Serverless à l'aide des métriques Amazon. CloudWatch Vous pouvez également configurer une vue unique pour surveiller l'utilisation de la capacité des applications dans un CloudWatch tableau de bord.

Métriques relatives aux applications EMR sans serveur
Métrique Description Unit Dimension
MaxCPUAllowed

Processeur maximal autorisé pour l'application.

vCPU ApplicationId, ApplicationName
MaxMemoryAllowed

Mémoire maximale en Go autorisée pour l'application.

Gigaoctets (Go) ApplicationId, ApplicationName
MaxStorageAllowed

Stockage maximal en Go autorisé pour l'application.

Gigaoctets (Go) ApplicationId, ApplicationName
CPUAllocated

Le nombre total de v CPUs alloués.

vCPU ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
IdleWorkerCount

Nombre total de travailleurs inactifs.

Nombre ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
MemoryAllocated

Mémoire totale allouée en Go.

Gigaoctets (Go) ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
PendingCreationWorkerCount

Nombre total de travailleurs en attente de création.

Nombre ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
RunningWorkerCount

Nombre total de travailleurs utilisés par l'application.

Nombre ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
StorageAllocated

Espace de stockage sur disque total en Go alloué.

Gigaoctets (Go) ApplicationId, ApplicationName, WorkerType, CapacityAllocationType
TotalWorkerCount

Le nombre total de travailleurs disponibles.

Nombre ApplicationId, ApplicationName, WorkerType, CapacityAllocationType

Surveillance au niveau des tâches

Amazon EMR Serverless envoie les métriques suivantes au niveau des tâches toutes les minutes. Amazon CloudWatch Vous pouvez consulter les valeurs métriques pour les exécutions de tâches agrégées par état d'exécution des tâches. L'unité de chacune des métriques est le nombre.

Mesures EMR Serverless au niveau des tâches
Métrique Description Dimension
SubmittedJobs

Le nombre de tâches dans un état Soumis.

ApplicationId, ApplicationName
PendingJobs

Le nombre de tâches en attente.

ApplicationId, ApplicationName
ScheduledJobs

Le nombre de tâches dans un état planifié.

ApplicationId, ApplicationName
RunningJobs

Le nombre de tâches en cours d'exécution.

ApplicationId, ApplicationName
SuccessJobs

Le nombre d'emplois dont l'état est « Success ».

ApplicationId, ApplicationName
FailedJobs

Le nombre de tâches en état d'échec.

ApplicationId, ApplicationName
CancellingJobs

Le nombre d'emplois dans un État annulable.

ApplicationId, ApplicationName
CancelledJobs

Le nombre de tâches dont l'état est annulé.

ApplicationId, ApplicationName

Vous pouvez surveiller les métriques spécifiques au moteur pour les tâches EMR sans serveur en cours et terminées avec une application spécifique au moteur. UIs Lorsque vous consultez l'interface utilisateur d'une tâche en cours d'exécution, vous voyez l'interface utilisateur de l'application en direct avec des mises à jour en temps réel. Lorsque vous consultez l'interface utilisateur d'une tâche terminée, vous voyez l'interface utilisateur persistante de l'application.

Exécution de tâches

Pour vos tâches EMR sans serveur en cours d'exécution, vous pouvez consulter une interface en temps réel qui fournit des métriques spécifiques au moteur. Vous pouvez utiliser l'interface utilisateur Apache Spark ou l'interface utilisateur Hive Tez pour surveiller et déboguer vos tâches. Pour y accéder UIs, utilisez la console EMR Studio ou demandez un point de terminaison URL sécurisé avec le. AWS Command Line Interface

Tâches terminées

Pour les tâches EMR sans serveur terminées, vous pouvez utiliser le serveur d'historique Spark ou l'interface utilisateur de Persistent Hive Tez pour afficher les détails, les étapes, les tâches et les statistiques relatives à l'exécution des tâches Spark ou Hive. Pour y accéder UIs, utilisez la console EMR Studio ou demandez un point de terminaison URL sécurisé avec le. AWS Command Line Interface

Surveillance au niveau du Job Worker

Amazon EMR Serverless envoie à Amazon les métriques suivantes au niveau du travailleur, disponibles dans l'espace de AWS/EMRServerless noms et le Job Worker Metrics groupe de métriques. CloudWatch EMR Serverless collecte des points de données auprès de travailleurs individuels lors de l'exécution des tâches au niveau de la tâche, du type de travailleur et du niveau. capacity-allocation-type Vous pouvez l'utiliser ApplicationId comme dimension pour surveiller plusieurs tâches appartenant à la même application.

Mesures EMR Serverless au niveau des travailleurs
Métrique Description Unit Dimension
WorkerCpuAllocated

Nombre total de cœurs de vCPU alloués aux travailleurs dans le cadre d'une exécution de tâche.

vCPU JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerCpuUsed

Nombre total de cœurs de vCPU utilisés par les travailleurs dans le cadre d'une exécution de tâche.

vCPU JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerMemoryAllocated

Mémoire totale en Go allouée aux travailleurs dans le cadre d'une exécution de tâche.

Gigaoctets (Go) JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerMemoryUsed

Mémoire totale en Go utilisée par les travailleurs lors de l'exécution d'une tâche.

Gigaoctets (Go) JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerEphemeralStorageAllocated

Nombre d'octets de stockage éphémère alloués aux travailleurs dans le cadre d'une exécution de tâche.

Gigaoctets (Go) JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerEphemeralStorageUsed

Le nombre d'octets de stockage éphémère utilisés par les travailleurs dans le cadre d'une exécution de tâche.

Gigaoctets (Go) JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerStorageReadBytes

Nombre d'octets lus depuis le stockage par les travailleurs lors d'une exécution de tâche.

Octets JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType
WorkerStorageWriteBytes

Nombre d'octets écrits dans le stockage par les travailleurs lors d'une exécution de tâche.

Octets JobId, JobName, ApplicationId, ApplicationName, WorkerType, et CapacityAllocationType

Les étapes ci-dessous décrivent comment afficher les différents types de métriques.

Console
Pour accéder à l'interface utilisateur de votre application à l'aide de la console
  1. Accédez à votre application EMR Serverless dans le studio EMR en suivant les instructions de la section Mise en route depuis la console.

  2. Pour consulter l'application UIs et les journaux spécifiques au moteur d'une tâche en cours d'exécution :

    1. Choisissez un poste doté d'un RUNNING statut.

    2. Sélectionnez le poste sur la page des détails de la candidature ou accédez à la page des détails du poste correspondant à votre poste.

    3. Dans le menu déroulant Display UI, choisissez Spark UI ou Hive Tez UI pour accéder à l'interface utilisateur de l'application correspondant à votre type de tâche.

    4. Pour consulter les journaux du moteur Spark, accédez à l'onglet Executors de l'interface utilisateur Spark, puis cliquez sur le lien Logs pour le pilote. Pour consulter les journaux du moteur Hive, cliquez sur le lien Logs du DAG approprié dans l'interface utilisateur Hive Tez.

  3. Pour consulter les applications spécifiques au moteur UIs et les journaux relatifs à une tâche terminée, procédez comme suit :

    1. Choisissez un poste doté d'un SUCCESS statut.

    2. Sélectionnez le poste sur la page des détails de candidature de votre candidature ou accédez à la page des détails du poste.

    3. Dans le menu déroulant de l'interface utilisateur d'affichage, choisissez Spark History Server ou Persistent Hive Tez UI pour accéder à l'interface utilisateur de l'application correspondant à votre type de tâche.

    4. Pour consulter les journaux du moteur Spark, accédez à l'onglet Executors de l'interface utilisateur Spark, puis cliquez sur le lien Logs pour le pilote. Pour consulter les journaux du moteur Hive, cliquez sur le lien Logs du DAG approprié dans l'interface utilisateur Hive Tez.

AWS CLI
Pour accéder à l'interface utilisateur de votre application à l'aide du AWS CLI
  • Pour générer une URL que vous pouvez utiliser pour accéder à l'interface utilisateur de votre application pour les tâches en cours et les tâches terminées, appelez l'GetDashboardForJobRunAPI.

    aws emr-serverless get-dashboard-for-job-run / --application-id <application-id> / --job-run-id <job-id>

    L'URL que vous générez est valide pendant une heure.