Versões 7.0.0 do Amazon EMR no EKS - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Versões 7.0.0 do Amazon EMR no EKS

Esta página descreve a funcionalidade nova e atualizada do Amazon EMR que é específica para a implantação do Amazon EMR no EKS. Para obter detalhes sobre o Amazon EMR em execução na Amazon EC2 e sobre a versão do Amazon EMR 7.0.0 em geral, consulte Amazon EMR 7.0.0 no Guia de lançamento do Amazon EMR.

Versões 7.0 do Amazon EMR no EKS

As versões 7.0.0 do Amazon EMR apresentadas a seguir estão disponíveis para o Amazon EMR no EKS. Selecione uma versão específica do emr-7.0.0-XXXX para visualizar mais detalhes, como a tag de imagem do contêiner relacionada.

Flink releases

As versões 7.0.0 do Amazon EMR apresentadas a seguir estão disponíveis para o Amazon EMR no EKS ao executar aplicações do Flink.

Spark releases

As versões 7.0.0 do Amazon EMR apresentadas a seguir estão disponíveis para o Amazon EMR no EKS ao executar aplicações do Spark.

  • emr-7.0.0-latest

  • emr-7.0.0-20231211

  • emr-7.0.0-spark-rapids-latest

  • emr-7.0.0-spark-rapids-20231211

  • emr-7.0.0-java11-latest

  • emr-7.0.0-java11-20231211

  • emr-7.0.0-java8-latest

  • emr-7.0.0-java8-20231211

  • emr-7.0.0-spark-rapids-java8-latest

  • emr-7.0.0-spark-rapids-java8-20231211

  • notebook-spark/emr-7.0.0-latest

  • notebook-spark/emr-7.0.0-20231211

  • notebook-spark/emr-7.0.0-spark-rapids-latest

  • notebook-spark/emr-7.0.0-spark-rapids-20231211

  • notebook-spark/emr-7.0.0-java11-latest

  • notebook-spark/emr-7.0.0-java11-20231211

  • notebook-spark/emr-7.0.0-java8-latest

  • notebook-spark/emr-7.0.0-java8-20231211

  • notebook-spark/emr-7.0.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.0.0-spark-rapids-java8-20231211

  • notebook-python/emr-7.0.0-latest

  • notebook-python/emr-7.0.0-20231211

  • notebook-python/emr-7.0.0-spark-rapids-latest

  • notebook-python/emr-7.0.0-spark-rapids-20231211

  • notebook-python/emr-7.0.0-java11-latest

  • notebook-python/emr-7.0.0-java11-20231211

  • notebook-python/emr-7.0.0-java8-latest

  • notebook-python/emr-7.0.0-java8-20231211

  • notebook-python/emr-7.0.0-spark-rapids-java8-latest

  • notebook-python/emr-7.0.0-spark-rapids-java8-20231211

Notas da versão

Notas da versão 7.0.0 do Amazon EMR no EKS

  • Aplicações compatíveis: AWS SDK para Java 2.20.160-amzn-0 and 1.12.595, Apache Spark 3.5.0-amzn-0, Apache Flink 1.18.0-amzn-0, Flink Operator 1.6.1, Apache Hudi 0.14.0-amzn-1, Apache Iceberg 1.4.2-amzn-0, Delta 3.0.0, Apache Spark RAPIDS 23.10.0-amzn-0, Jupyter Enterprise Gateway 2.6.0

  • Componentes com suporte: aws-sagemaker-spark-sdk, emr-ddb, emr-goodies, emr-s3-select, emrfs, hadoop-client, hudi, hudi-spark, iceberg e spark-kubernetes.

  • Classificações de configuração com suporte

    Para uso com StartJobRune CreateManagedEndpoint APIs:

    Classificações Descrições

    core-site

    Altera os valores no arquivo core-site.xml do Hadoop.

    emrfs-site

    Alterar as configurações do EMRFS.

    spark-metrics

    Altera os valores no arquivo metrics.properties do Spark.

    spark-defaults

    Altera os valores no arquivo spark-defaults.conf do Spark.

    spark-env

    Alterar os valores no ambiente do Spark.

    spark-hive-site

    Altera os valores no arquivo hive-site.xml do Spark.

    spark-log4j

    Altera os valores no arquivo log4j2.properties do Spark.

    emr-job-submitter

    Configuração para o pod de envio de trabalho.

    Para uso específico com CreateManagedEndpoint APIs:

    Classificações Descrições

    jeg-config

    Altera os valores no arquivo jupyter_enterprise_gateway_config.py do Jupyter Enterprise Gateway.

    jupyter-kernel-overrides

    Altera o valor da imagem do kernel no arquivo de um kernel do Jupyter especificado.

    As classificações de configuração permitem que você personalize aplicações. Elas geralmente correspondem a um arquivo XML de configuração da aplicação, como spark-hive-site.xml. Para obter mais informações, consulte Configure Applications.

Recursos notáveis

Os atributos apresentados a seguir estão inclusos na versão 7.0 do Amazon EMR no EKS.

  • Atualizações da aplicação: as atualizações da aplicação Amazon EMR no EKS 7.0.0 incluem Spark 3.5, Flink 1.18 e Flink Operator 1.6.1.

  • Ajuste automático de parâmetros do escalador automático do Flink: os parâmetros padrão que o escalador automático do Flink usa nos cálculos de ajuste de escala podem não ser o valor ideal para um determinado trabalho. A versão 7.0.0 do Amazon EMR no EKS usa tendências do histórico de métricas específicas capturadas para calcular o parâmetro ideal personalizado para o trabalho.

Alterações

A alterações a seguir estão inclusas na versão 7.0 do Amazon EMR no EKS.

  • Amazon Linux 2023: com as versões 7.0.0 e superiores do Amazon EMR no EKS, todas as imagens de contêiner são baseadas no Amazon Linux 2023.

  • O Spark usa o Java 17 como runtime padrão: o Spark da versão 7.0.0 do Amazon EMR no EKS usa o Java 17 como runtime padrão. Se precisar, você pode alternar para usar o Java 8 ou o Java 11 com o rótulo de versão correspondente, conforme fornecido na lista Versões 7.0 do Amazon EMR no EKS.