Introduction Présentation de l'architecture

Qu'est-ce que l'agent de mise à niveau Apache Spark pour Amazon EMR

Introduction

L'agent de mise à niveau Apache Spark pour Amazon EMR est une fonctionnalité d'intelligence artificielle conversationnelle qui accélère les mises à niveau des versions d'Apache Spark pour vos applications EMR. Les mises à niveau traditionnelles de Spark nécessitent des mois d'efforts d'ingénierie pour analyser les modifications des API, résoudre les conflits de dépendance et valider l'exactitude fonctionnelle. L'agent simplifie le processus de mise à niveau grâce à des instructions en langage naturel, à la transformation automatique du code et à la validation de la qualité des données.

Vous pouvez utiliser l'agent pour mettre à niveau PySpark les applications Scala s'exécutant sur Amazon EMR on EC2 et Amazon EMR Serverless. L'agent analyse votre code, identifie les modifications requises et effectue des transformations automatisées tout en gardant le contrôle de l'approbation de toutes les modifications.

Note

L'agent de mise à niveau Apache Spark est disponible sans frais supplémentaires dans le cadre d'Amazon EMR. Vous ne payez que pour les ressources Amazon EMR sous-jacentes utilisées lors de l'exécution des tâches de validation.

Présentation de l'architecture

L'agent de mise à niveau comporte trois composants principaux : tout assistant AI compatible avec MCP présent dans votre environnement de développement pour l'interaction, le proxy MCP AWS qui gère les communications sécurisées entre votre client et le serveur MCP, et le serveur MCP géré par Amazon SageMaker Unified Studio (en version préliminaire) qui fournit des outils de mise à niveau Spark spécialisés pour Amazon EMR. Ce schéma illustre la manière dont vous interagissez avec le serveur MCP géré par Amazon SageMaker Unified Studio via votre assistant AI.

L'assistant AI orchestrera la mise à niveau à l'aide d'outils spécialisés fournis par le serveur MCP en suivant les étapes suivantes :

Planification : l'agent analyse la structure de votre projet et génère ou révise un plan de mise à niveau qui guide le processus de mise à niveau de end-to-end Spark.
Compiler et compiler : l'agent met à jour l'environnement de construction et les dépendances, compile le projet et corrige de manière itérative les échecs de compilation et de test.
Outils d'édition de code Spark : l'agent applique des mises à jour de code ciblées pour résoudre les incompatibilités entre les versions de Spark, en corrigeant à la fois les erreurs de compilation et d'exécution.
Exécution et validation : l'agent soumet des tâches de validation à distance à EMR, surveille l'exécution et les journaux, et résout de manière itérative les problèmes d'exécution et de qualité des données.
Observabilité : l'agent suit la progression de la mise à niveau à l'aide des outils d'observabilité EMR et permet aux utilisateurs de consulter les analyses et le statut des mises à niveau à tout moment.

Référez-vous Utilisation des outils de mise à niveau Spark à la liste des principaux outils pour chaque étape.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Support standard

Configuration de l'agent de mise à niveau