View a markdown version of this page

AWS EKS의 Apache Spark 런타임(emr-spark-8.0.0) - Amazon EMR

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

AWS EKS의 Apache Spark 런타임(emr-spark-8.0.0)

이 페이지에서는 Amazon EMR on EKS 배포에 특정한 Amazon EMR의 신규 기능 및 업데이트된 기능을 설명합니다. Amazon EC2에서 실행되는 Amazon EMR과 일반적으로 Amazon EMR Spark 8.0.0 릴리스에 대한 자세한 내용은 Amazon EMR 릴리스 가이드AWS Apache Spark 런타임(emr-spark-8.0.0)을 참조하세요.

AWS EKS의 Apache Spark 런타임(emr-spark-8.0.0)

다음 emr-spark-8.0.0 릴리스는 EKS 기반 Apache Spark의 AWS 런타임에 사용할 수 있습니다.

  • spark/emr-spark-8.0.0-latest

  • spark/emr-spark-8.0.0-20260421

  • notebook-spark/emr-spark-8.0.0-latest

  • notebook-spark/emr-spark-8.0.0-20260421

  • notebook-python/emr-spark-8.0.0-latest

  • notebook-python/emr-spark-8.0.0-20260421

  • livy/emr-spark-8.0.0-latest

  • livy/emr-spark-8.0.0-20260421

릴리스 노트

EKS의 Apache Spark(emr-spark-8.0.0) AWS 런타임에 대한 릴리스 정보:

  • 지원되는 애플리케이션 ‐ AWS SDK for Java 2.41.32, Apache Spark 4.0.2-amzn-0, Apache Hudi 1.1.0-amzn-0, Apache Iceberg 1.10.1-amzn-0, Delta Lake 4.0.0-amzn-1-spark

  • 지원되는 구성 요소emr-ddb, emr-goodies, hadoop-client, hudi, hudi-spark, iceberg, . spark-kubernetes

  • 지원되는 구성 분류

    StartJobRun CreateManagedEndpoint API와 함께 사용하는 경우:

    분류 설명

    core-site

    Hadoop core-site.xml 파일에서 값을 변경합니다.

    spark-metrics

    Spark metrics.properties 파일에서 값을 변경합니다.

    spark-defaults

    Spark spark-defaults.conf 파일에서 값을 변경합니다.

    spark-env

    Spark 환경에서 값을 변경합니다.

    spark-hive-site

    Spark hive-site.xml 파일에서 값을 변경합니다.

    spark-log4j2

    Spark log4j2.properties 파일에서 값을 변경합니다.

    emr-job-submitter

    작업 제출자 포드 구성.

    특별히 CreateManagedEndpoint API와 함께 사용하는 경우:

    분류 설명

    jeg-config

    Jupyter Enterprise Gateway jupyter_enterprise_gateway_config.py 파일에서 값을 변경합니다.

    jupyter-kernel-overrides

    Jupyter 커널 사양 파일에서 커널 이미지 값을 변경합니다.

    구성 분류를 사용하면 애플리케이션을 사용자 지정할 수 있습니다. 이는 종종 spark-hive-site.xml과 같이 애플리케이션의 구성 XML 파일에 해당합니다. 자세한 내용은 애플리케이션 구성을 참조하세요.

변경 사항 및 기능

EKS 기반 Apache Spark AWS 런타임의 emr-spark-8.0.0 릴리스에는 다음 기능이 포함되어 있습니다.

  • Apache Spark 4.0.2 GA - ANSI SQL 모드, SQL PIPE 구문, VARIANT 데이터 유형, SQL 스크립팅 및 스트리밍 개선 사항을 갖춘 Amazon EMR on EKS 기반 Spark 4.x의 최초 프로덕션 지원 릴리스입니다.

  • Python 3.11 기본값 - Python 3.11은 PySpark 및 Spark 워크로드의 기본값입니다. Python 3.12 및 3.13도 사용할 수 있습니다.