Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon EMR nelle versioni EKS 7.3.0
Questa pagina descrive la funzionalità nuova e aggiornata di Amazon EMR specifica per l'implementazione di Amazon EMR su EKS. Per dettagli su Amazon EMR in esecuzione su Amazon EC2 e sulla versione Amazon EMR 7.3.0 in generale, consulta Amazon EMR 7.3.0 nella Amazon EMR Release Guide.
Amazon EMR nelle versioni EKS 7.3
Le seguenti versioni di Amazon EMR 7.3.0 sono disponibili per Amazon EMR su EKS. Seleziona una versione specifica di EMR-7.3.0-xxxx per visualizzare ulteriori dettagli, come il relativo tag di immagine del contenitore.
Note di rilascio
Note di rilascio per Amazon EMR su EKS 7.3.0
-
Applicazioni supportate ‐ AWS SDK per Java 2.25.70 and 1.12.747, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.15.0-amzn-0, Apache Iceberg 1.5.2-amzn-0, Delta 3.2.0-amzn-0, Apache Spark RAPIDS 24.06.1-amzn-0, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-2, Flink Operator 1.9.0-amzn-0
-
Componenti supportati:
aws-sagemaker-spark-sdk
,emr-ddb
,emr-goodies
,emr-s3-select
,emrfs
,hadoop-client
,hudi
,hudi-spark
,iceberg
,spark-kubernetes
. -
Classificazioni di configurazione supportate
Da utilizzare con StartJobRune: CreateManagedEndpoint APIs
Classificazioni Descrizioni core-site
Modifica i valori nel file Hadoop
core-site.xml
.emrfs-site
Modifica le impostazioni EMRFS.
spark-metrics
Modifica i valori nel file Spark
metrics.properties
.spark-defaults
Modifica i valori nel file Spark
spark-defaults.conf
.spark-env
Modifica i valori nell'ambiente Spark.
spark-hive-site
Modifica i valori nel file Spark
hive-site.xml
.spark-log4j2
Modifica i valori nel file Spark
log4j2.properties
.emr-job-submitter
Configurazione per il pod del mittente di processi.
Da utilizzare specificamente con CreateManagedEndpoint APIs:
Classificazioni Descrizioni jeg-config
Modifica i valori nel file
jupyter_enterprise_gateway_config.py
Jupyter Enterprise Gateway.jupyter-kernel-overrides
Modifica il valore per l'immagine del kernel nel file Jupyter Kernel Spec.
Le classificazioni di configurazione consentono di personalizzare le applicazioni. Spesso corrispondono a un file XML di configurazione per l'applicazione, ad esempio
spark-hive-site.xml
. Per ulteriori informazioni, consulta la sezione Configurazione delle applicazioni.
Funzionalità significative
Le seguenti funzionalità sono incluse nella versione 7.3.0 di Amazon EMR su EKS.
-
Aggiornamenti delle applicazioni: Amazon EMR su EKS ora include Flink Operator 1.9.0. Oltre ad altre funzionalità, Flink Kubernetes ora consente di impostare quote di CPU e memoria per l'autoscaler.
-
Supporto Apache Iceberg per Apache Flink — Apache Iceberg è un formato open source ad alte prestazioni per grandi tabelle analitiche. A partire da Amazon EMR 7.3.0, puoi utilizzare le tabelle Apache Iceberg quando esegui Apache Flink su Amazon EMR su EKS. Per ulteriori informazioni, consulta Amazon EMR su EKS Using Apache Iceberg with Amazon EMR on EKS.
-
Supporto Delta Lake per Apache Flink: Delta Lake è un framework a livello di storage per architetture Lakehouse comunemente costruito su Amazon S3. Con Amazon EMR 7.3.0 e versioni successive, puoi usare le tabelle Delta quando esegui Apache Flink su Amazon EMR su EKS. Per ulteriori informazioni, consulta Usare Delta Lake con Amazon EMR su EKS.
Modifiche
Le seguenti modifiche sono incluse nella versione 7.3.0 di Amazon EMR su EKS.
-
Con Amazon EMR su EKS 7.3.0 e versioni successive, Apache Flink ora utilizza il runtime Java 17 per impostazione predefinita.