Versionen von Amazon EMR in EKS 6.10.0 - Amazon EMR

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Versionen von Amazon EMR in EKS 6.10.0

Die folgenden Amazon-EMR-6.10.0-Versionen sind für Amazon EMR in EKS verfügbar. Wählen Sie eine bestimmte EMR-6.10.0-xxxx-Version aus, um weitere Details wie das zugehörige Container-Image-Tag anzuzeigen.

Versionshinweise für Amazon EMR 6.10.0

  • Unterstützte Anwendungen ‐ AWS SDK für Java 1.12.397, Spark 3.3.1-amzn-0, Hudi 0.12.2-amzn-0, Iceberg 1.1.0-amzn-0, Delta 2.2.0.

  • Unterstützte Komponenten – aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg, spark-kubernetes.

  • Unterstützte Konfigurationsklassifizierungen:

    StartJobRunZur Verwendung CreateManagedEndpoint APIsmit und:

    Klassifizierungen Beschreibungen

    core-site

    Ändern Sie die Werte in der core-site.xml-Hadoop-Datei.

    emrfs-site

    Ändert die EMRFS-Einstellungen.

    spark-metrics

    Ändern Sie die Werte in der metrics.properties-Spark-Datei.

    spark-defaults

    Ändern Sie die Werte in der spark-defaults.conf-Spark-Datei.

    spark-env

    Ändert die Werte in der Spark-Umgebung.

    spark-hive-site

    Ändern Sie die Werte in der hive-site.xml-Spark-Datei.

    spark-log4j

    Ändern Sie die Werte in der log4j.properties-Spark-Datei.

    Speziell zur Verwendung mit CreateManagedEndpoint APIs:

    Klassifizierungen Beschreibungen

    jeg-config

    Ändern Sie die Werte in der Jupyter-Enterprise-Gateway-Datei jupyter_enterprise_gateway_config.py.

    jupyter-kernel-overrides

    Ändern Sie den Wert für das Kernel-Image in der Jupyter-Kernel-Spec-Datei.

    Mithilfe von Konfigurationsklassifizierungen können Sie Anwendungen anpassen. Diese entsprechen häufig einer XML-Konfigurationsdatei für die Anwendung, z. B. spark-hive-site.xml Weitere Informationen finden Sie unter Konfigurieren von Anwendungen.

Bemerkenswerte Features

  • Spark-Operator – Mit Amazon EMR in EKS 6.10.0 und höher können Sie den Kubernetes-Operator für Apache Spark oder den Spark-Operator verwenden, um Spark-Anwendungen mit der Amazon-EMR-Versions-Laufzeit auf Ihren eigenen Amazon-EKS-Clustern bereitzustellen und zu verwalten. Weitere Informationen finden Sie unter Spark-Aufträge mit dem Spark-Operator ausführen.

  • Java 11 – Mit Amazon EMR in EKS 6.10 und höher können Sie Spark mit Java-11-Laufzeit starten. Geben Sie dazu emr-6.10.0-java11-latest als Versionskennung ein. Wir empfehlen, dass Sie Leistungstests validieren und ausführen, bevor Sie Ihre Produktionsworkloads vom Java-8-Image auf das Java-11-Image verschieben.

  • Für die Amazon-Redshift-Integration für Apache Spark entfernt Amazon EMR in EKS 6.10.0 die Abhängigkeit von minimal-json.jar und fügt die erforderlichen spark-redshift zugehörigen JAR-Dateien automatisch zum Ausführer-Klassenpfad für Spark hinzu: spark-redshift.jar, spark-avro.jar und RedshiftJDBC.jar.

Änderungen

  • Der für EMRFS S3 optimierte Committer ist jetzt standardmäßig für Parquet-, ORC- und textbasierte Formate (einschließlich CSV und JSON) aktiviert.