翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon EMR on EKS 7.3.0 リリース
このページでは、Amazon EMR on EKS デプロイに固有の Amazon EMR の新しい機能と更新された機能について説明します。Amazon EC2 で実行されている Amazon EMR の詳細と Amazon EMR 7.3.0 リリース全般の詳細については、「Amazon EMR リリースガイド」の「Amazon EMR 7.3.0」を参照してください。
Amazon EMR on EKS 7.3 リリース
Amazon EMR on EKS では、次の Amazon EMR 7.3.0 リリースを利用できます。特定の emr-7.3.0-XXXX リリースを選択すると、関連するコンテナイメージタグなどの詳細が表示されます。
リリースノート
Amazon EMR on EKS 7.3.0 のリリースノート
-
サポートされているアプリケーション - AWS SDK for Java 2.25.70 and 1.12.747, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.15.0-amzn-0, Apache Iceberg 1.5.2-amzn-0, Delta 3.2.0-amzn-0, Apache Spark RAPIDS 24.06.1-amzn-0, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-2, Flink Operator 1.9.0-amzn-0
-
サポートされているコンポーネント -
aws-sagemaker-spark-sdk、emr-ddb、emr-goodies、emr-s3-select、emrfs、hadoop-client、hudi、hudi-spark、iceberg、spark-kubernetes。 -
サポートされている設定分類
StartJobRun API と CreateManagedEndpoint API で使用する場合:
分類 説明 core-sitecore-site.xmlHadoop ファイル内の値を変更します。emrfs-siteEMRFS の設定を変更します。
spark-metricsmetrics.propertiesSpark ファイル内の値を変更します。spark-defaultsspark-defaults.confSpark ファイル内の値を変更します。spark-envSpark 環境の値を変更します。
spark-hive-sitehive-site.xmlSpark ファイル内の値を変更します。spark-log4j2log4j2.propertiesSpark ファイル内の値を変更します。emr-job-submitter特に CreateManagedEndpoint API で使用する場合:
分類 説明 jeg-configJupyter Enterprise Gateway
jupyter_enterprise_gateway_config.pyファイルの値を変更します。jupyter-kernel-overridesJupyter カーネル仕様ファイル内のカーネルイメージの値を変更します。
設定分類を使用すると、アプリケーションをカスタマイズできます。これらは多くの場合、
spark-hive-site.xmlなどのアプリケーションの構成 XML ファイルに対応します。詳細については、「アプリケーションの設定」を参照してください。
注目すべき機能
Amazon EMR on EKS の 7.3.0 リリースには、以下の機能が含まれています。
-
アプリケーションのアップグレード – Amazon EMR on EKS に Flink Operator 1.9.0 が追加されました。Flink Kubernetes では、他の機能に加えて、オートスケーラーの CPU クォータとメモリクォータを設定できるようになりました。
-
Apache Iceberg が Apache Flink をサポート – Apache Iceberg はオープンソースの高性能フォーマットの巨大な分析テーブルです。Amazon EMR 7.3.0 以降では、Amazon EMR on EKS で Apache Flink を実行するときに Apache Iceberg テーブルを使用できます。詳細については、Amazon EMR on EKS で「Amazon EMR on EKS での Apache Iceberg の使用」を参照してください。
-
Delta Lake が Apache Flink をサポート - Delta Lake は、レイクハウスアーキテクチャのストレージレイヤーフレームワークであり、一般的に、Amazon S3 上に構築されます。Amazon EMR 7.3.0 以降では、Amazon EMR on EKS で Apache Flink を実行するときに Delta テーブルを使用できます。詳細については、「Amazon EMR on EKS での Delta Lake の使用」を参照してください。
変更
Amazon EMR on EKS の 7.3.0 リリースでは、以下の変更が行われています。
-
Amazon EMR on EKS 7.3.0 以降では、Apache Flink がデフォルトで Java 17 ランタイムを使用するようになりました。