Was ist Apache Spark Upgrade Agent für Amazon EMR - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Was ist Apache Spark Upgrade Agent für Amazon EMR

Einführung

Der Apache Spark Upgrade Agent für Amazon EMR ist eine dialogorientierte KI-Funktion, die Apache Spark-Versionsupgrades für Ihre EMR-Anwendungen beschleunigt. Herkömmliche Spark-Upgrades erfordern monatelangen technischen Aufwand, um API-Änderungen zu analysieren, Abhängigkeitskonflikte zu lösen und die funktionale Korrektheit zu überprüfen. Der Agent vereinfacht den Upgrade-Prozess durch Eingabeaufforderungen in natürlicher Sprache, automatisierte Codetransformation und Datenqualitätsprüfung.

Sie können den Agenten für Upgrades PySpark und Scala-Anwendungen verwenden, die auf Amazon EMR on EC2 und Amazon EMR Serverless ausgeführt werden. Der Agent analysiert Ihren Code, identifiziert erforderliche Änderungen und führt automatisierte Transformationen durch, wobei Ihre Genehmigungskontrolle über alle Änderungen gewahrt bleibt.

Übersicht über die Architektur

Der Upgrade-Agent besteht aus drei Hauptkomponenten: jedem MCP-kompatiblen KI-Assistenten in Ihrer Entwicklungsumgebung zur Interaktion, dem MCP-Proxy, der AWS die sichere Kommunikation zwischen Ihrem Client und dem MCP-Server übernimmt, und dem Amazon SageMaker Unified Studio Managed MCP Server (in der Vorschauversion), der spezielle Spark-Upgrade-Tools für Amazon EMR bereitstellt. Dieses Diagramm zeigt, wie Sie über Ihren KI-Assistenten mit dem Amazon SageMaker Unified Studio Managed MCP Server interagieren.

Apache Spark Upgrade Agent

Der KI-Assistent orchestriert das Upgrade mithilfe spezieller Tools, die vom MCP-Server bereitgestellt werden. Gehen Sie dabei wie folgt vor:

  1. Planung: Der Agent analysiert Ihre Projektstruktur und generiert oder überarbeitet einen Upgrade-Plan, der den end-to-end Spark-Upgrade-Prozess steuert.

  2. Kompilieren und Erstellen: Der Agent aktualisiert die Build-Umgebung und die Abhängigkeiten, kompiliert das Projekt und behebt iterativ Build- und Testfehler.

  3. Tools zur Bearbeitung von Spark-Code: Der Agent wendet gezielte Code-Updates an, um Inkompatibilitäten zwischen Spark-Versionen zu beheben und sowohl Build- als auch Runtime-Fehler zu beheben.

  4. Ausführung und Validierung: Der Agent sendet Remote-Validierungsaufträge an EMR, überwacht die Ausführung und protokolliert und behebt iterativ Laufzeit- und Datenqualitätsprobleme.

  5. Beobachtbarkeit: Der Agent verfolgt den Upgrade-Fortschritt mithilfe von EMR-Observability-Tools und ermöglicht es Benutzern, Upgrade-Analysen und den Status jederzeit einzusehen.

Eine Liste der wichtigsten Tools Verwenden der Spark-Upgrade-Tools für jeden Schritt finden Sie unter.