Strumento di ottimizzazione delle prestazioni per le applicazioni Apache Spark

Best practice per l'osservabilità dell'EMR

L'osservabilità dell'EMR comprende un approccio completo di monitoraggio e gestione per i cluster EMR. AWS La base si basa su Amazon CloudWatch come servizio di monitoraggio principale, integrato da EMR Studio e da strumenti di terze parti come Prometheus e Grafana per una maggiore visibilità. In questo documento, esploriamo aspetti specifici dell'osservabilità dei cluster:

Spark observability (GitHub): per quanto riguarda l'interfaccia utente Spark, in Amazon EMR sono disponibili tre opzioni.
Spark troubleshooting (GitHub) — Risoluzioni per errori.
Monitoraggio del cluster EMR (GitHub): monitoraggio delle prestazioni del cluster.
Risoluzione dei problemi EMR (GitHub): identifica, diagnostica e risolvi i problemi più comuni del cluster EMR.
Ottimizzazione dei costi (GitHub): questa sezione descrive le migliori pratiche per l'esecuzione di carichi di lavoro convenienti.

Strumento di ottimizzazione delle prestazioni per le applicazioni Apache Spark

AWS Lo strumento EMR Advisor analizza i registri degli eventi di Spark per fornire consigli personalizzati per ottimizzare le configurazioni dei cluster EMR, migliorare le prestazioni e ridurre i costi. Sfruttando i dati storici, suggerisce le dimensioni e le impostazioni dell'infrastruttura ideali degli esecutori, consentendo un utilizzo più efficiente delle risorse e migliorando le prestazioni complessive del cluster.
Lo strumento Amazon CodeGuru Profiler aiuta gli sviluppatori a identificare i colli di bottiglia e le inefficienze nelle loro applicazioni Spark raccogliendo e analizzando i dati di runtime. Lo strumento si integra perfettamente con le applicazioni Spark esistenti, richiede una configurazione minima e fornisce informazioni dettagliate tramite la AWS console sull'utilizzo della CPU, sui modelli di memoria e sugli hotspot prestazionali.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

CloudTrail registri

Usa la scalabilità dei cluster Amazon EMR per adattarti ai carichi di lavoro in continua evoluzione