

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Prácticas recomendadas de observabilidad de EMR
<a name="emr-metrics-observability"></a>

La observabilidad de EMR abarca un enfoque integral de monitoreo y gestión para los clústeres de AWS EMR. La base se basa en Amazon CloudWatch como servicio de monitoreo principal, complementado por EMR Studio y herramientas de terceros como Prometheus y Grafana para mejorar la visibilidad. En este documento, analizamos aspectos específicos de la observabilidad de los clústeres:

1. *[Observabilidad de Spark](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Applications/Spark/observability.md)* (GitHub): con respecto a la interfaz de usuario de Spark, tiene tres opciones en Amazon EMR.

1. *[Solución de problemas con Spark](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Applications/Spark/troubleshooting.md)* (GitHub): soluciones para errores.

1. Monitoreo de *[clústeres EMR (GitHub): monitoreo](https://aws.github.io/aws-emr-best-practices/docs/bestpractices/Observability/best_practices/)* del rendimiento del clúster.

1. *[Solución de problemas de EMR](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Troubleshooting/Troubleshooting%20EMR.md)* (GitHub): identifique, diagnostique y resuelva problemas comunes del clúster de EMR.

1. *[Optimización de costos](https://github.com/aws/aws-emr-best-practices/blob/main/website/docs/bestpractices/Cost%20Optimizations/best_practices.md)* (GitHub): en esta sección se describen las mejores prácticas para ejecutar cargas de trabajo rentables.

## Herramienta de optimización del rendimiento para aplicaciones de Apache Spark
<a name="performance-optimization"></a>

1. AWS La herramienta [EMR Advisor](https://github.com/aws-samples/aws-emr-advisor) analiza los registros de eventos de Spark para ofrecer recomendaciones personalizadas para optimizar las configuraciones de los clústeres de EMR, mejorar el rendimiento y reducir los costos. Al aprovechar los datos históricos, sugiere tamaños de ejecutores y configuraciones de infraestructura ideales, lo que permite una utilización más eficiente de los recursos y un mejor rendimiento general del clúster.

1. La herramienta [Amazon CodeGuru Profiler](https://github.com/amzn/amazon-codeguru-profiler-for-spark) ayuda a los desarrolladores a identificar los cuellos de botella y las ineficiencias en el rendimiento de sus aplicaciones Spark mediante la recopilación y el análisis de los datos de tiempo de ejecución. La herramienta se integra perfectamente con las aplicaciones de Spark existentes, requiere una configuración mínima y proporciona información detallada a través de la AWS consola sobre el uso de la CPU, los patrones de memoria y los puntos críticos de rendimiento.