기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
GitHub의 Amazon EMR on EKS 모범 사례 안내서에 대한 링크
오픈 소스 커뮤니티 협업을 통해 Amazon EMR on EKS 모범 사례 안내서
보안
참고
Amazon EMR on EKS에서의 보안에 대한 자세한 내용은 Amazon EMR on EKS 보안 모범 사례 섹션을 참조하세요.
Encryption best practices:
Managing network security
AWS 보안 암호 관리자를 사용하여 보안 암호를 저장합니다
Pyspark 작업 제출
Pyspark job submission:
스토리지
Using EBS volumes:
Using Amazon FSx for Lustre volumes:
Using Instance store volumes:
메타스토어 통합
Using Hive metastore:
Glue 사용: AWS
디버깅
Using Spark debugging:
Connecting to Spark UI on the driver pod
How to use self-hosted Spark history server with Amazon EMR on EKS
Amazon EMR on EKS 문제 해결
노드 배치
Using Kubernetes node selectors:single-az 및 기타 사용 사례에 대해 모범 사례.
성능
Using Dynamic Resource Allocation (DRA)
기본적으로 spark.dynamicAllocation.preallocateExecutors는 Amazon EMR Spark에서 활성화됩니다. spark.dynamicAllocation.initialExecutors 및 spark.dynamicAllocation.minExecutors가 설정되지 않은 경우 Spark는 소규모 워크로드의 경우에도 예상 작업 수를 기반으로 시작 시 많은 수의 실행기를 요청할 수 있습니다. 과도한 컨테이너 이탈을 방지하려면 다음 방법 중 하나를 사용합니다.
spark.dynamicAllocation.initialExecutors또는spark.dynamicAllocation.minExecutors를 워크로드 크기에 적합한 값으로 설정합니다.시작 시 요청
spark.dynamicAllocation.preallocateExecutors.maxEstimatedTasks된 실행기 수를 제한하려면 더 낮은 값으로 설정합니다.실행기 사전 할당을 완전히 비활성화
false하려면spark.dynamicAllocation.preallocateExecutors로 설정합니다.
EKS best practices:
비용 최적화
Using spot instances:
사용 AWS Outposts
를 사용하여 Amazon EMR on EKS 실행 AWS Outposts