Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon EMR pada rilis EKS 7.2.0
Halaman ini menjelaskan fungsionalitas baru dan yang diperbarui untuk Amazon EMR yang khusus untuk EMR Amazon pada penerapan EKS. Untuk detail tentang Amazon EMR yang berjalan di Amazon EC2 dan tentang rilis Amazon EMR 7.2.0 secara umum, lihat Amazon EMR 7.2.0 di Panduan Rilis Amazon EMR.
Amazon EMR pada rilis EKS 7.2
Rilis Amazon EMR 7.2.0 berikut tersedia untuk Amazon EMR di EKS. Pilih rilis EMR-7.2.0-XXXX tertentu untuk melihat detail lebih lanjut seperti tag gambar kontainer terkait.
Catatan rilis
Catatan rilis untuk Amazon EMR di EKS 7.2.0
-
Aplikasi yang didukung - AWS SDK untuk Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
-
Komponen yang didukung -
aws-sagemaker-spark-sdkemr-ddb,emr-goodies,,emr-s3-select,emrfs,hadoop-client,hudi,hudi-spark,iceberg,spark-kubernetes. -
Klasifikasi konfigurasi yang didukung
Untuk digunakan dengan StartJobRundan CreateManagedEndpoint APIs:
Klasifikasi Deskripsi core-siteUbah nilai dalam file
core-site.xmlHadoop.emrfs-siteUbah pengaturan EMRFS.
spark-metricsUbah nilai dalam file
metrics.propertiesSpark.spark-defaultsUbah nilai dalam file
spark-defaults.confSpark.spark-envUbah nilai di lingkungan Spark.
spark-hive-siteUbah nilai dalam file
hive-site.xmlSpark.spark-log4j2Ubah nilai dalam file
log4j2.propertiesSpark.emr-job-submitterKonfigurasi untuk pod pengirim pekerjaan.
Untuk digunakan secara khusus dengan CreateManagedEndpoint APIs:
Klasifikasi Deskripsi jeg-configUbah nilai dalam file Jupyter Enterprise Gateway
jupyter_enterprise_gateway_config.py.jupyter-kernel-overridesUbah nilai untuk Gambar Kernel di file Spesifikasi Kernel Jupyter.
Klasifikasi konfigurasi memungkinkan Anda menyesuaikan aplikasi. Ini sering kali bersesuaian dengan file XML konfigurasi untuk aplikasi, seperti
spark-hive-site.xml. Untuk informasi selengkapnya, lihat Mengkonfigurasi Aplikasi.
Fitur penting
Fitur-fitur berikut disertakan dengan rilis 7.2.0 Amazon EMR di EKS.
-
Peningkatan aplikasi - Amazon EMR pada peningkatan aplikasi EKS 7.2.0 termasuk Spark 3.5.1, Flink 1.18.1, dan Flink Operator 1.8.0.
-
Autoscaler untuk pembaruan Flink - Rilis 7.2.0 menggunakan konfigurasi open source
job.autoscaler.restart.time-tracking.enableduntuk mengaktifkan estimasi waktu penskalaan ulang, jadi Anda tidak perlu lagi menetapkan nilai empiris secara manual untuk memulai ulang waktu. Jika Anda menjalankan 7.1.0 atau lebih rendah, Anda masih dapat menggunakan penskalaan otomatis Amazon EMR. -
Apache Hudi integrasi Apache Flink di Amazon EMR di EKS — Rilis ini menambahkan integrasi antara Apache Hudi dan Apache Flink, sehingga Anda dapat menggunakan operator Flink Kubernetes untuk menjalankan pekerjaan Hudi. Hudi memungkinkan Anda menggunakan operasi tingkat rekaman yang dapat Anda gunakan untuk menyederhanakan manajemen data dan pengembangan pipa data.
-
Integrasi Amazon S3 Express One Zone dengan Amazon EMR di EKS - Dengan 7.2.0 dan lebih tinggi, Anda dapat mengunggah data ke S3 Express One Zone dengan Amazon EMR di EKS. S3 Express One Zone adalah kelas penyimpanan Amazon S3 zona tunggal berkinerja tinggi yang memberikan akses data milidetik satu digit yang konsisten untuk sebagian besar aplikasi yang sensitif terhadap latensi. Pada saat rilis, S3 Express One Zone memberikan latensi terendah dan penyimpanan objek cloud kinerja tertinggi di Amazon S3.
-
Support untuk konfigurasi default di operator Spark - Operator Spark di Amazon EKS sekarang mendukung konfigurasi default yang sama dengan model start job run di Amazon EMR di EKS untuk 7.2.0 dan lebih tinggi. Ini berarti bahwa fitur seperti Amazon S3 dan EMRFS tidak lagi memerlukan konfigurasi manual dalam file yaml.