Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra. # J'ai configuré des réservations de capacité à la demande (ODCRs) ou des instances réservées zonales ## ODCRs qui incluent des instances dotées de plusieurs interfaces réseau, telles que P4d, P4de et AWS Trainium (Trn) Dans le fichier de configuration du cluster, vérifiez que le `HeadNode` se trouve dans un sous-réseau public et que les nœuds de calcul se trouvent dans un sous-réseau privé. ## ODCRs sont des ODCRS ciblés ### `Unable to read file '/opt/slurm/etc/pcluster/run_instances_overrides.json'.`Même si je l'ai déjà mis `/opt/slurm/etc/pcluster/run_instances_overrides.json` en place, en suivant les instructions données dans [Lancez des instances avec des réservations de capacité à la demande (ODCR)](launch-instances-odcr-v3.md) Si vous utilisez AWS ParallelCluster les versions 3.1.1 à 3.2.1 avec targeted ODCRs et que vous utilisez également le fichier JSON [run instances override, il est possible que le fichier JSON](launch-instances-odcr-v3.md) ne soit pas correctement formaté. Une erreur peut s'afficher`clustermgtd.log`, telle que la suivante : ``` Unable to read file '/opt/slurm/etc/pcluster/run_instances_overrides.json'. Using default: {} in /var/log/parallelcluster/clustermgtd. ``` Vérifiez que le format de fichier JSON est correct en exécutant ce qui suit : ``` $ echo /opt/slurm/etc/pcluster/run_instances_overrides.json | jq ``` ### Voir `Found RunInstances parameters override.` en `clustermgtd.log` cas d'échec de la création du cluster ou en `slurm_resume.log` cas d'échec de la tâche d'exécution Si vous utilisez le [fichier Run Instances Override JSON](launch-instances-odcr-v3.md), vérifiez que vous avez correctement défini le nom de la file d'attente et le nom des ressources de calcul dans le `/opt/slurm/etc/pcluster/run_instances_overrides.json` fichier. ### Voir `An error occurred (InsufficientInstanceCapacity)` `slurm_resume.log` quand je ne parviens pas à exécuter une tâche, ou `clustermgtd.log` quand je ne parviens pas à créer un cluster #### Utilisation du PG-ODCR (groupe de placement ODCR) Lors de la création d'un ODCR avec un groupe de placement associé, le même nom de groupe de placement doit être utilisé dans le fichier de configuration. Définissez le [nom du groupe de placement](Scheduling-v3.md#yaml-Scheduling-SlurmQueues-Networking-PlacementGroup) correspondant dans la configuration du cluster. #### Utilisation d'instances réservées zonales Si vous utilisez des instances réservées zonales avec`PlacementGroup`/`Enabled`to `true` dans la configuration du cluster, une erreur peut s'afficher, telle que la suivante : ``` We currently do not have sufficient trn1.32xlarge capacity in the Availability Zone you requested (us-east-1d). Our system will be working on provisioning additional capacity. You can currently get trn1.32xlarge capacity by not specifying an Availability Zone in your request or choosing us-east-1a, us-east-1b, us-east-1c, us-east-1e, us-east-1f. ``` Cela peut être dû au fait que les instances réservées zonales ne sont pas placées dans le même UC (ou épine dorsale), ce qui peut entraîner des erreurs de capacité insuffisantes (ICEs) lors de l'utilisation de groupes de placement. Vous pouvez vérifier ce cas en désactivant le paramètre `PlacementGroup` Groupe dans la configuration du cluster afin de déterminer si le cluster peut allouer les instances.