View a markdown version of this page

Métriques Hadoop et Spark dans Ganglia - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Métriques Hadoop et Spark dans Ganglia

Note

La dernière version d’Amazon EMR à inclure Ganglia était Amazon EMR 6.15.0. Pour surveiller votre cluster, les versions supérieures à 6.15.0 incluent l'agent Amazon CloudWatch .

Ganglia fournit des rapports sur les métriques Hadoop pour chaque instance. Les différents types de métriques sont préfixés par catégorie : système de fichiers distribué (dfs.*), machine virtuelle Java (jvm.*), (mapred.*) et appels de procédure MapReduce distante (rpc.*).

YARN-based Les métriques Ganglia telles que Spark et Hadoop ne sont pas disponibles pour les versions 4.4.0 et 4.5.0 d'EMR. Utilisez une version ultérieure pour employer ces métriques.

Les métriques de Ganglia pour Spark ont généralement des préfixes pour l'ID d'application YARN et Spark DAGScheduler. Ainsi, les préfixes suivent ce format :

  • DAGScheduler.*

  • application_xxxxxxxxxx_xxxx.driver.*

  • application_xxxxxxxxxx_xxxx.executor.*