EMR 관찰성 모범 사례

EMR 관찰성에는 AWS EMR 클러스터에 대한 포괄적인 모니터링 및 관리 접근 방식이 포함됩니다. 기반은 Amazon CloudWatch를 기본 모니터링 서비스로 사용하며, EMR Studio와 향상된 가시성을 위해 Prometheus 및 Grafana와 같은 타사 도구로 보완됩니다. 이 문서에서는 클러스터 관찰성의 특정 측면을 살펴봅니다.

Spark 관찰성(GitHub) - Spark 사용자 인터페이스와 관련하여 Amazon EMR에는 세 가지 옵션이 있습니다.
Spark 문제 해결(GitHub) - 오류 해결.
EMR 클러스터 모니터링(GitHub) - 클러스터 성능을 모니터링합니다.
EMR 문제 해결(GitHub) - 일반적인 EMR 클러스터 문제를 식별, 진단 및 해결합니다.
비용 최적화(GitHub) -이 섹션에서는 비용 효율적인 워크로드를 실행하는 모범 사례를 간략하게 설명합니다.

Apache Spark 애플리케이션을 위한 성능 최적화 도구

AWS EMR Advisor 도구는 Spark 이벤트 로그를 분석하여 EMR 클러스터 구성을 최적화하고 성능을 향상하며 비용을 절감하기 위한 맞춤형 권장 사항을 제공합니다. 기록 데이터를 활용하면 이상적인 실행기 크기와 인프라 설정을 제안하여 리소스 사용률을 높이고 전체 클러스터 성능을 개선할 수 있습니다.
Amazon CodeGuru Profiler 도구를 사용하면 개발자가 런타임 데이터를 수집하고 분석하여 Spark 애플리케이션의 성능 병목 현상과 비효율성을 식별할 수 있습니다. 이 도구는 최소한의 설정이 필요한 기존 Spark 애플리케이션과 원활하게 통합되며 AWS 콘솔을 통해 CPU 사용량, 메모리 패턴 및 성능 핫스팟에 대한 자세한 인사이트를 제공합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

CloudTrail 로그

Amazon EMR 클러스터 조정을 사용하여 워크로드 변경에 맞게 조정