

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Liens vers les guides des meilleures pratiques d'Amazon EMR on EKS sur GitHub
<a name="best-practices"></a>

Nous avons élaboré le [guide des meilleures pratiques Amazon EMR on EKS](https://aws.github.io/aws-emr-containers-best-practices/) en utilisant la collaboration communautaire open source afin de pouvoir itérer rapidement et fournir des recommandations sur les aspects de la création et de l'exécution d'un cluster virtuel. Nous vous recommandons d'utiliser le [Guide des bonnes pratiques Amazon EMR on EKS](https://aws.github.io/aws-emr-containers-best-practices/) pour les sections concernées. Choisissez les liens dans chaque section pour accéder au GitHub site.

## Sécurité
<a name="security"></a>

**Note**  
Pour plus d'informations sur la sécurité avec Amazon EMR on EKS, consultez [Bonnes pratiques de sécurité pour Amazon EMR on EKS](security-best-practices.md).

[Bonnes pratiques en matière de chiffrement :](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/) comment utiliser le chiffrement pour les données au repos et en transit.

[Gestion de la sécurité du réseau](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/network-security/) : explique comment configurer les groupes de sécurité pour les pods d'Amazon EMR on EKS lorsque vous vous connectez à des sources de données hébergées dans des Services AWS comme Amazon RDS et Amazon Redshift.

[Utiliser le gestionnaire de AWS secrets pour stocker des secrets](https://aws.github.io/aws-emr-containers-best-practices/security/docs/spark/encryption/).

## Soumission de tâches PySpark
<a name="pyspark-job-submission"></a>

[Soumission de tâches PySpark :](https://aws.github.io/aws-emr-containers-best-practices/submit-applications/docs/spark/pyspark/) spécifie différents types d'empaquetage pour les applications PySpark en utilisant des formats d'empaquetage tels que zip, egg, wheel et pex.

## Stockage
<a name="storage"></a>

[Utilisation des volumes EBS :](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/ebs/) comment utiliser le provisionnement statique et dynamique pour les tâches nécessitant des volumes EBS.

[Utilisation d'Amazon FSx pour les volumes Lustre :](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/fsx-lustre/) comment utiliser le provisionnement statique et dynamique pour les tâches nécessitant des volumes Amazon FSx for Luster.

[Utilisation des volumes de stockage d'instances :](https://aws.github.io/aws-emr-containers-best-practices/storage/docs/spark/instance-store/) comment utiliser les volumes de stockage d'instances pour le traitement des tâches.

## Intégration de métastore
<a name="metastore-integration"></a>

[Utilisation du métastore Hive :](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/) propose différentes manières d'utiliser le métastore Hive.

[Utiliser AWS Glue :](https://aws.github.io/aws-emr-containers-best-practices/metastore-integrations/docs/hive-metastore/) propose différentes manières de configurer le catalogue AWS Glue.

## Débogage
<a name="debugging"></a>

[Utilisation du débogage Spark :](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/change-log-level/) comment modifier le niveau de journalisation.

[Connexion à l'interface utilisateur Spark sur le pod pilote](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/connect-spark-ui/).

[Utilisation du serveur d'historique Spark auto-hébergé avec Amazon EMR on EKS](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/self-hosted-shs/).

## Résolution des problèmes liés à Amazon EMR on EKS
<a name="troubleshooting"></a>

[Résolution des problèmes](https://aws.github.io/aws-emr-containers-best-practices/troubleshooting/docs/where-to-look-for-spark-logs/).

## Placement des nœuds
<a name="node-placement"></a>

[Utilisation des sélecteurs de nœuds Kubernetes](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/eks-node-placement/) pour `single-az` et d'autres cas d'utilisation.

[Utilisation du placement des nœuds Fargate](https://aws.github.io/aws-emr-containers-best-practices/node-placement/docs/fargate-node-placement/).

## Performance
<a name="performance"></a>

[Utilisation de l'allocation dynamique des ressources (DRA)](https://aws.github.io/aws-emr-containers-best-practices/performance/docs/dra/).

Par défaut, `spark.dynamicAllocation.preallocateExecutors` est activé dans Amazon EMR Spark. Lorsque ces `spark.dynamicAllocation.initialExecutors` paramètres ne `spark.dynamicAllocation.minExecutors` sont pas définis, Spark peut demander un grand nombre d'exécuteurs au démarrage en fonction du nombre de tâches estimé, même pour de petites charges de travail. Pour éviter un taux de désabonnement excessif des conteneurs, appliquez l'une des approches suivantes :
+ Définissez `spark.dynamicAllocation.initialExecutors` ou `spark.dynamicAllocation.minExecutors` sur une valeur adaptée à la taille de votre charge de travail.
+ Réglez `spark.dynamicAllocation.preallocateExecutors.maxEstimatedTasks` sur une valeur inférieure pour limiter le nombre d'exécuteurs demandés au démarrage.
+ Définissez sur `spark.dynamicAllocation.preallocateExecutors` `false` pour désactiver complètement la préallocation de l'exécuteur.

[Bonnes pratiques EKS](https://aws.github.io/aws-emr-containers-best-practices/best-practices-and-recommendations/eks-best-practices/) relatives au plug-in Amazon VPC Container Network Interface (CNI), Cluster Autoscaler et Core DNS.

## Optimisation des coûts
<a name="cost-optimization"></a>

[Utilisation d'instances Spot :](https://aws.github.io/aws-emr-containers-best-practices/cost-optimization/docs/cost-optimization/) bonnes pratiques relatives aux instances Spot d'Amazon EC2 et comment utiliser la fonctionnalité de mise hors service des nœuds Spark.

## En utilisant AWS Outposts
<a name="using-outposts"></a>

[Exécution d'Amazon EMR sur EKS à l'aide de AWS Outposts](https://aws.github.io/aws-emr-containers-best-practices/outposts/emr-containers-on-outposts/)