Plateformes prises en charge Comment ça marche Régions disponibles Champ d'application et exigences

Caractéristiques et capacités

Plateformes prises en charge

Langages : applications Python et Scala Spark
Plateformes cibles : Amazon EMR, EMR Serverless et Glue AWS

Comment ça marche

En cas de défaillance de votre application Spark, vous pouvez utiliser l'agent de résolution des problèmes pour rechercher automatiquement ce qui s'est mal passé. Il analyse vos journaux d'événements Spark, vos messages d'erreur et l'utilisation des ressources pour identifier le problème exact, qu'il s'agisse d'un manque de mémoire, d'une erreur de configuration ou d'un bogue de code.

Lorsque vous demandez à une invite en langage naturel d'analyser votre charge de travail Spark, l'agent se connecte aux ressources de votre plateforme et extrait des fonctionnalités (notamment les journaux d'événements Spark, les plans de requêtes, les chronologies des exécuteurs, les traces de journal, les configurations et les métriques) :

Sur EMR-EC2 : il se connecte à l'interface utilisateur persistante EMR du cluster
On Glue : il crée le contexte à partir de l'interface utilisateur Spark de Glue Studio pour le travail
Sur EMR-Serverless : il se connecte au serveur d'historique Spark sans serveur EMR pour le travail
L'agent analyse également les traces de votre pile d'erreurs et les détails de configuration pour vous fournir des informations exploitables.

Pour les charges de travail défaillantes, vous obtenez une explication claire de la cause première et des étapes spécifiques pour y remédier. Si l'agent détecte un problème lié au code, il fournit automatiquement des recommandations de code pour vous indiquer exactement ce qu'il faut modifier dans votre code. Vous pouvez également demander des suggestions au niveau du code directement quand vous le souhaitez, sans analyse complète.

Régions disponibles

L'agent de résolution des problèmes Spark est disponible dans les régions suivantes :

Asie-Pacifique : Tokyo (ap-northeast-1), Séoul (ap-northeast-2), Singapour (ap-southeast-1), Sydney (ap-southeast-2) et Mumbai (ap-southeast-1)
Amérique du Nord : Canada (ca-central-1)
Europe : Stockholm (eu-nord-1), Irlande (eu-west-1), Londres (eu-west-2), Paris (eu-west-3) et Francfort (eu-central-1)
Amérique du Sud : São Paulo (sa-east-1)
États-Unis : Virginie du Nord (us-east-1), Ohio (us-east-2) et Oregon (us-west-2)

Champ de résolution des problèmes liés à Spark et exigences des utilisateurs

États de charge de travail Spark pris en charge : les outils ne prennent en charge que les réponses aux charges de travail Spark ayant échoué.
Interface utilisateur persistante EMR : lors de l'analyse des charges de travail Amazon EMR-EC2, l'outil d'analyse tente de se connecter à l'interface utilisateur persistante EMR pour récupérer les informations clés de Spark. Les considérations relatives à l'interface utilisateur EMR Persistent sont documentées ici.
Interface utilisateur de Glue Studio Spark : lors de l'analyse des charges de travail AWS Glue, l'outil d'analyse tente de récupérer les informations clés de Spark en analysant les journaux d'événements Spark des utilisateurs depuis Amazon S3. La taille maximale autorisée des journaux d'événements Spark est documentée ici : 512 Mo et 2 Go pour les journaux évolutifs.
Recommandations relatives au code : prise en charge uniquement pour les charges de travail Amazon EMR-EC2 et AWS Glue pour les charges de travail PySpark
Ressources régionales : L'agent de résolution des problèmes Spark est régional et utilise les ressources EMR sous-jacentes de cette région pour le processus de dépannage. Le dépannage interrégional n'est pas pris en charge.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation de l'agent de dépannage

Résolution des problèmes et questions et réponses