Aidez à améliorer cette page
Pour contribuer à ce guide de l’utilisateur, cliquez sur le lien Modifier cette page sur GitHub qui se trouve dans le volet droit de chaque page.
Exécuter un entraînement de machine learning sur Amazon EKS avec Elastic Fabric Adapter
Cette rubrique décrit comment intégrer Elastic Fabric Adapter (EFA) aux pods déployés dans votre cluster Amazon EKS. Elastic Fabric Adapter (EFA) est une interface réseau pour les instances Amazon EC2 qui vous permet d'exécuter des applications nécessitant des niveaux élevés de communications inter-nœuds à grande échelle sur AWS. Son interface matérielle sur mesure de contournement du système d'exploitation améliore les performances des communications entre instances, ce qui est essentiel à la mise à l'échelle de ces applications. Avec EFA, les applications de calcul haute performance (HPC) utilisant MPI (Message Passing Interface) et les applications de ML (Machine Learning) utilisant NVIDIA Collective Communications Library (NCCL) peuvent avoir une capacité de mise à l'échelle pouvant atteindre des milliers de CPU ou de GPU. Par conséquent, vous bénéficiez des performances applicatives des clusters HPC sur site grâce à l'élasticité et à la flexibilité à la demande du cloud AWS. L'intégration d'EFA aux applications exécutées sur des clusters Amazon EKS permet de réduire le temps nécessaire à l'exécution des applications d'entraînement distribué à grande échelle sans avoir à ajouter d'autres instances à votre cluster. Pour plus d'informations sur l'EFA, consultez Elastic Fabric Adapter
Types d’instances avec EFA
Le plug-in AWS EFA Kubernetes Device Plug-in prend en charge tous les types d’instances Amazon EC2 qui disposent d’EFA. Pour consulter la liste de tous les types d’instances qui disposent d’EFA, consultez Types d’instances pris en charge dans le Guide de l’utilisateur Amazon EC2. Toutefois, pour exécuter rapidement des applications ML, nous recommandons que l’instance dispose de puces d’accélération matérielle telles que les GPU nVidia, les puces AWS Inferentia
Lorsque vous comparez les types d’instance afin de faire votre choix, tenez compte du nombre de cartes réseau EFA disponibles pour ce type d’instance, ainsi que du nombre de cartes accélératrices, de la quantité de CPU et de la quantité de mémoire. Vous pouvez attribuer un EFA maximum par carte réseau. Une EFA compte comme une interface réseau. Pour connaître le nombre d’EFA disponibles pour chaque type d’instance disposant d’EFA, consultez la liste des cartes réseau dans le Guide de l’utilisateur Amazon EC2.
Interfaces EFA et EFA uniquement
Un Elastic Fabric Adapter (EFA) est une interface réseau qui combine les capacités d’un adaptateur réseau élastique (ENA) et d’une interface de contournement du système d’exploitation, alimentée par le protocole AWS Scalable Reliable Datagram (SRD). Les fonctionnalités EFA permettent aux applications de communiquer directement avec le matériel pour un transport à faible latence. Vous pouvez choisir d’accéder uniquement aux capacités EFA à l’aide d’interfaces EFA uniquement, limitant ainsi la communication aux interfaces au sein de la même zone de disponibilité.
Pour créer des nœuds pouvant disposer d’interfaces EFA uniquement, vous devez utiliser un modèle de lancement EC2 personnalisé et définir le InterfaceType sur efa-only. Dans votre modèle de lancement personnalisé, vous ne pouvez pas définir la carte réseau 0 comme interface EFA uniquement, car il s’agit de la carte réseau principale et de l’interface réseau de l’instance EC2. Vous devez disposer de la version 1.18.5 ou ultérieure de CNI VPC pour les interfaces EFA uniquement. Si vous utilisez Amazon Linux 2, la version ami doit être v20240928 ou ultérieure pour les interfaces EFA uniquement.
La procédure suivante vous guide dans la création d’un cluster EKS avec eksctl avec des nœuds dotés de GPU nVidia et d’interfaces EFA. Vous ne pouvez pas utiliser eksctl pour créer des nœuds et des groupes de nœuds qui utilisent des interfaces EFA uniquement.
Prérequis
-
Un cluster Amazon EKS existant. Si vous ne disposez pas d’un cluster existant, veuillez en créer un à l’aide de Mise en route avec Amazon EKS. Votre cluster doit être déployé dans un VPC disposant d'au moins un sous-réseau privé ayant suffisamment d'adresses IP disponibles dans lequel déployer des nœuds. Le sous-réseau privé doit disposer d'un accès Internet sortant fourni par un appareil externe, tel qu'une passerelle NAT.
Si vous prévoyez d'utiliser
eksctlpour créer votre groupe de nœuds,eksctlpeut également créer un cluster pour vous. -
Version
2.12.3ou ultérieure ou version1.27.160ou ultérieure de l’interface de la ligne de commande AWS (AWS CLI) installée et configurée sur votre appareil ou dans AWS CloudShell. Pour vérifier votre version actuelle, utilisezaws --version | cut -d / -f2 | cut -d ' ' -f1. Les gestionnaires de package tels queyum,apt-getou Homebrew pour macOS ont souvent plusieurs versions de retard par rapport à la dernière version de l’AWS CLI. Pour installer la dernière version, consultez les sections Installation et Configuration rapide avec aws configure du Guide de l’utilisateur de l’interface de la ligne de commande AWS. La version de l’AWS CLI installée dans AWS CloudShell peut également être plusieurs versions derrière la dernière version. Pour la mettre à jour, consultez la section Installation de l’AWS CLI dans votre répertoire personnel dans le Guide de l’utilisateur AWS CloudShell. -
L’outil de ligne de commande
kubectlest installé sur votre appareil ou dans AWS CloudShell. La version peut correspondre à celle utilisée par votre cluster Kubernetes, ou différer d’au plus une version mineure, qu’elle soit antérieure ou plus récente. Par exemple, si la version de votre cluster est1.29, vous pouvez utiliser la versionkubectl1.28,1.29ou1.30. Pour installer ou mettre à niveaukubectl, veuillez consulter Configuration de kubectl et eksctl. -
Vous devez avoir installé le plug-in CNI Amazon VPC pour Kubernetes version
1.7.10ou ultérieure avant de lancer des composants master qui prennent en charge plusieurs adaptateurs Elastic Fabric, tels quep4doup5. Pour plus d’informations sur la mise à jour de votre plug-in CNI Amazon VPC pour Kubernetes, consultez Attribuer des adresses IP aux pods avec Amazon VPC CNI. -
Pour les instances p6-b200, vous devez utiliser le plug-in périphérique EFA Device Plugin version v0.5.6 ou ultérieure.
Important
Une considération importante requise pour adopter EFA avec Kubernetes est la configuration et la gestion de Huge Pages en tant que ressource dans le cluster. Pour plus d'informations, consultez Gérer Huge Pages
Créer un groupe de nœuds
La procédure suivante vous aide à créer un groupe de nœuds avec un groupe de nœuds soutenu p4d.24xlarge en utilisant des interfaces EFA et GPUDirect RDMA. Elle permet aussi d'exécuter un exemple de test NVIDIA Collective Communications Library (NCCL) pour les performances NCCL multi-nœuds à l'aide des EFA. Cet exemple peut être utilisé comme modèle d'entraînement de deep learning distribué sur Amazon EKS à l'aide des EFA.
-
Déterminez quels types d’instances Amazon EC2 prenant en charge EFA sont disponibles dans la région AWS dans laquelle vous voulez déployer des nœuds. Remplacez
code-régionpar la région AWS dans laquelle vous voulez déployer votre groupe de nœuds.aws ec2 describe-instance-types --region region-code \ --filters Name=network-info.efa-supported,Values=true \ --query "InstanceTypes[*].[InstanceType]" --output textLorsque vous déployez des nœuds, le type d’instance que vous voulez déployer doit être disponible dans la région AWS où se trouve votre cluster.
-
Déterminez dans quelles zones de disponibilité le type d'instance que vous souhaitez déployer est disponible. Dans ce tutoriel, le type d’instance
p5.48xlargeest utilisé et doit être renvoyé dans la sortie pour la région AWS que vous avez spécifiée à l’étape précédente. Lorsque vous déployez des nœuds dans un cluster de production, remplacezp5.48xlargepar n’importe quel type d’instance renvoyé à l’étape précédente.aws ec2 describe-instance-type-offerings --region region-code \ --location-type availability-zone --filters Name=instance-type,Values=p4d.24xlarge,p5.48xlarge \ --query 'InstanceTypeOfferings[*].Location' --output textL'exemple qui suit illustre un résultat.
us-west-2a us-west-2c us-west-2bNotez les zones de disponibilité renvoyées pour une utilisation ultérieure. Lorsque vous déployez des nœuds sur un cluster, votre VPC doit disposer de sous-réseaux avec des adresses IP disponibles dans l'une des zones de disponibilité renvoyées dans la sortie.
-
Créez un groupe de nœuds à l’aide de
eksctl. Vous devez installer la version0.214.0ou ultérieure de l’outil de ligne de commandeeksctlsur votre appareil ou dans AWS CloudShell. Pour installer ou mettre à joureksctl, veuillez consulter Installationdans la documentation de eksctl.-
Copiez le contenu suivant dans un fichier nommé
efa-cluster.yaml. Remplacez lesexemples de valeurspar les vôtres. Vous pouvez remplacerp5.48xlargepar une autre instance, mais dans ce cas, assurez-vous que les valeurs deavailabilityZonescorrespondent aux zones de disponibilité renvoyées pour le type d’instance à l’étape 1.apiVersion: eksctl.io/v1alpha5 kind: ClusterConfig metadata: name: my-efa-cluster region: region-code version: "1.XX" iam: withOIDC: true availabilityZones: ["us-west-2a", "us-west-2c"] managedNodeGroups: - name: my-efa-ng instanceType: p5.48xlarge minSize: 1 desiredCapacity: 2 maxSize: 3 availabilityZones: ["us-west-2a"] volumeSize: 300 privateNetworking: true efaEnabled: true -
Créez un groupe de nœuds gérés dans un cluster existant.
eksctl create nodegroup -f efa-cluster.yamlSi vous ne disposez pas d’un cluster existant, vous pouvez exécuter la commande suivante pour créer un cluster et le groupe de nœuds.
eksctl create cluster -f efa-cluster.yamlNote
Étant donné que le type d’instance utilisé dans cet exemple dispose de GPU,
eksctlinstalle automatiquement le plug-in NVIDIA Kubernetes device sur chaque instance lorsque vous utilisez Amazon Linux 2. Cela n’est pas nécessaire pour Bottlerocket, car le plug-in NVIDIA device est créé dans la variante EKS NVIDIA de Bottlerocket. LorsqueefaEnabledest défini surtruedans la configuration du groupe de nœuds,eksctldéploie également automatiquement le plug-in de périphérique EFA sur les nœuds.
-
Utilisation de Bottlerocket avec EFA
La version 1.28.0 et les versions ultérieures de l’AMI Bottlerocket incluent la prise en charge officielle d’EFA. Pour utiliser Bottlerocket pour les nœuds compatibles EFA, spécifiez amiFamily: Bottlerocket dans votre configuration. Si vous devez utiliser un identifiant AMI personnalisé, vous devez utiliser des nodeGroups standard au lieu de managedNodeGroups.
Voici un exemple de configuration :
apiVersion: eksctl.io/v1alpha5 kind: ClusterConfig metadata: name: my-efa-bottlerocket-cluster region: region-code version: "1.XX" iam: withOIDC: true availabilityZones: ["us-west-2a", "us-west-2c"] managedNodeGroups: - name: my-efa-bottlerocket-ng instanceType: p5.48xlarge minSize: 1 desiredCapacity: 2 maxSize: 3 availabilityZones: ["us-west-2a"] volumeSize: 300 privateNetworking: true efaEnabled: true amiFamily: Bottlerocket bottlerocket: enableAdminContainer: true settings: kernel: sysctl: "vm.nr_hugepages": "3000" # Configures 3000 * 2Mi = 6000Mi hugepages
Le paramètre sysctl vm.nr_hugepages ci-dessus configure le nombre de pages géantes de 2 Mi. Dans cet exemple, 3000 signifie 3000 * 2 Mi = 6000 Mi de pages géantes.
Vérifier l’installation du plug-in de périphérique EFA
Lorsque vous créez un groupe de nœuds avec efaEnabled: true, eksctl déploie automatiquement le plug-in du périphérique Kubernetes EFA pour vous. Vous pouvez vérifier que le plug-in de périphérique est installé et fonctionne correctement :
-
Vérifiez l’état du DaemonSet :
kubectl get daemonsets -n kube-systemExemple de sortie :
NAME DESIRED CURRENT READY UP-TO-DATE AVAILABLE NODE SELECTOR AGE aws-efa-k8s-device-plugin-daemonset 2 2 2 2 2 <none> 6m16s ...Ici, le DaemonSet du plug-in de périphérique EFA s’exécute sur deux nœuds. Les deux sont READY et AVAILABLE.
-
Vérifiez ensuite les pods créés par le DaemonSet :
kubectl get pods -n kube-system -l name=aws-efa-k8s-device-pluginExemple de sortie :
NAME READY STATUS RESTARTS AGE aws-efa-k8s-device-plugin-daemonset-d68bs 1/1 Running 0 6m16s aws-efa-k8s-device-plugin-daemonset-w4l8t 1/1 Running 0 6m16sLes pods du plug-in de périphérique EFA sont dans un état Running, ce qui confirme que le plug-in est correctement déployé et opérationnel.
-
Vérifiez l’enregistrement des ressources :
Vous pouvez vérifier que la ressource
vpc.amazonaws.com/efaest enregistrée auprès du kubelet en décrivant les nœuds :kubectl describe nodesSi la ressource EFA est correctement enregistrée, elle apparaîtra dans la liste sous Capacity et Allocatable resources du nœud. Par exemple :
Capacity: ... vpc.amazonaws.com/efa: 4 Allocatable: ... vpc.amazonaws.com/efa: 4Cette sortie confirme que le nœud reconnaît la ressource EFA, la rendant disponible pour les pods qui la demandent.
(Facultatif) Tester les performances de l’EFA
Nous vous recommandons de tester la configuration EFA. Vous pouvez utiliser les tests NCCLaws-samples/awsome-distributed-training sur GitHub. Les tests NCCL
-
Déployez l’opérateur Kubeflow MPI :
Pour les tests NCCL, vous pouvez appliquer l'opérateur MPI Kubeflow. L'opérateur MPI facilite l'exécution d'un entraînement distribué de style AllReduce sur Kubernetes. Pour plus d'informations, consultez Opérateur MPI
sur GitHub. -
Exécutez le test de performances NCCL multi-nœuds pour vérifier GPUDirectRDMA/EFA :
Pour vérifier les performances NCCL avec GPUDirectRDMA sur EFA, exécutez le test de performances NCCL standard. Pour plus d'informations, consultez le référentiel officiel des tests NCCL
sur GitHub. Procédez comme indiqué ci-dessous pour exécuter un test de performance NCCL à deux nœuds. Dans l’exemple de tâche de test NCCL, chaque travailleur demande huit GPU, 5210 Mi de
hugepages-2Mi, quatre EFA et 8000 Mi de mémoire, ce qui signifie concrètement que chaque travailleur consomme toutes les ressources d’une instancep5.48xlarge.-
Créez le manifeste MPIJob :
Copiez ce qui suit dans un fichier nommé
nccl-tests.yaml:apiVersion: kubeflow.org/v2beta1 kind: MPIJob metadata: name: nccl-tests spec: runPolicy: cleanPodPolicy: Running backoffLimit: 20 slotsPerWorker: 8 mpiReplicaSpecs: Launcher: replicas: 1 template: spec: restartPolicy: OnFailure containers: - image: public.ecr.aws/hpc-cloud/nccl-tests:latest imagePullPolicy: IfNotPresent name: test-nccl-launcher env: - name: PATH value: $PATH:/opt/amazon/efa/bin:/usr/bin - name: LD_LIBRARY_PATH value: /opt/amazon/openmpi/lib:/opt/nccl/build/lib:/opt/amazon/efa/lib:/opt/aws-ofi-nccl/install/lib:/usr/local/nvidia/lib:$LD_LIBRARY_PATH - name: NCCL_DEBUG value: INFO - name: NCCL_BUFFSIZE value: '8388608' - name: NCCL_P2P_NET_CHUNKSIZE value: '524288' - name: NCCL_TUNER_PLUGIN value: /opt/aws-ofi-nccl/install/lib/libnccl-ofi-tuner.so command: - /opt/amazon/openmpi/bin/mpirun - --allow-run-as-root - --tag-output - -np - "16" - -N - "8" - --bind-to - none - -x - PATH - -x - LD_LIBRARY_PATH - -x - NCCL_DEBUG=INFO - -x - NCCL_BUFFSIZE - -x - NCCL_P2P_NET_CHUNKSIZE - -x - NCCL_TUNER_PLUGIN - --mca - pml - ^cm,ucx - --mca - btl - tcp,self - --mca - btl_tcp_if_exclude - lo,docker0,veth_def_agent - /opt/nccl-tests/build/all_reduce_perf - -b - "8" - -e - "16G" - -f - "2" - -g - "1" - -c - "1" - -n - "100" Worker: replicas: 2 template: spec: nodeSelector: node.kubernetes.io/instance-type: "p5.48xlarge" containers: - image: public.ecr.aws/hpc-cloud/nccl-tests:latest imagePullPolicy: IfNotPresent name: nccl-tests-worker volumeMounts: - name: shmem mountPath: /dev/shm resources: limits: nvidia.com/gpu: 8 hugepages-2Mi: 5120Mi vpc.amazonaws.com/efa: 32 memory: 32000Mi requests: nvidia.com/gpu: 8 hugepages-2Mi: 5120Mi vpc.amazonaws.com/efa: 32 memory: 32000Mi volumes: - name: shmem hostPath: path: /dev/shm -
Appliquez le MPIJob NCCL-tests :
Soumettez le
MPIJoben appliquant le manifeste. Cela créera deux instances Amazon EC2p5.48xlarge.kubectl apply -f nccl-tests.yamlL'exemple qui suit illustre un résultat.
mpijob.kubeflow.org/nccl-tests created -
Vérifiez que la tâche a démarré les pods :
Affichez vos pods en cours d’exécution.
kubectl get podsL'exemple qui suit illustre un résultat.
NAME READY STATUS RESTARTS AGE nccl-tests-launcher-nbql9 0/1 Init:0/1 0 2m49s nccl-tests-worker-0 1/1 Running 0 2m49s nccl-tests-worker-1 1/1 Running 0 2m49sL’opérateur MPI crée un pod de lancement et deux pods de travail (un sur chaque nœud).
-
Vérifiez que la tâche s’exécute correctement avec les journaux :
Consultez le journal du pod
nccl-tests-launcher. Remplaceznbql9par la valeur de votre sortie.kubectl logs -f nccl-tests-launcher-nbql9
-
Si le test s’est terminé avec succès, vous pouvez déployer vos applications qui utilisent la bibliothèque Nvidia Collective Communication Library.