Spark Troubleshooting Agent Workflow in dettaglio

Per avviare il processo di risoluzione dei problemi, è necessario accedere agli identificatori delle applicazioni Spark non funzionanti in esecuzione su piattaforme supportate (EMR-EC2, EMR Serverless AWS , Glue o Amazon Data Notebooks). SageMaker L'applicazione deve avere log accessibili, Spark History Server e dettagli di configurazione. Assicurati di disporre delle autorizzazioni necessarie per accedere alle risorse della piattaforma e ai metadati dell'applicazione. Una volta stabiliti questi requisiti, puoi inviare una richiesta come la seguente per avviare il flusso di lavoro di risoluzione dei problemi:


Analyze my EMR step execution failure, EMR id <step-id> with cluster id <cluster-id>

A questo punto, l'agente orchestrerà la risoluzione dei problemi utilizzando strumenti specializzati. Il flusso di lavoro segue questi passaggi:

Estrazione delle funzionalità e creazione del contesto: l'agente raccoglie e analizza automaticamente i dati di telemetria dall'applicazione Spark, inclusi i log di History Server, le impostazioni di configurazione e le tracce di errore. Vedrai lo strumento raccogliere informazioni sulle metriche delle prestazioni, sui modelli di utilizzo delle risorse e sulle firme di errore.
Analisi e identificazione delle cause principali: l'agente sfrutta i modelli di intelligenza artificiale e la knowledge base Spark per correlare le funzionalità estratte e identificare le cause principali dei problemi o degli errori di prestazioni. Riceverai:
- Analisi approfondite: dettagli tecnici su ciò che l'agente ha scoperto e analizzato.
- Causa principale: spiegazione chiara di cosa è andato storto e perché.
- Valutazione iniziale: indipendentemente dal fatto che il problema sia correlato al codice, alla configurazione o alle risorse, verranno fornite alcune linee guida e analisi generali per la mitigazione.
Raccomandazioni sul codice (se applicabile): se l'analisi identifica problemi relativi al codice in base alla classificazione degli errori, l'agente può suggerire di utilizzare lo strumento di raccomandazione del codice per fornire consigli specifici per implementare la correzione del codice consigliata con codice esatto e sostituzioni suggerite. before/after

Il processo di risoluzione dei problemi è iterativo: puoi continuare la conversazione per approfondire problemi specifici; puoi anche utilizzare gli strumenti in modo interattivo nello sviluppo del nostro codice Spark locale per correggere i bug del codice o migliorare continuamente il codice.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Risoluzione dei problemi e domande e risposte

Esempi rapidi