Liste de contrôle à exécuter à grande échelle

Avant d'exécuter une charge de travail importante sur 50 000 vCPU ou plus, considérez la liste de contrôle suivante.

Note

Si vous prévoyez d'exécuter une charge de travail importante sur un million de vCPU ou plus ou si vous avez besoin de conseils pour exécuter une charge de travail à grande échelle, contactez votre AWS équipe.

Vérifiez vos quotas Amazon EC2 — Vérifiez vos quotas Amazon EC2 (également appelés limites) dans le panneau Service Quotas du. AWS Management Console Si nécessaire, demandez une augmentation du quota pour votre nombre maximal d'instances Amazon EC2. N'oubliez pas que les On-Demand instances Amazon EC2 Spot et Amazon ont des quotas distincts. Pour plus d'informations, consultez Getting started with Service Quotas.
Vérifiez votre quota Amazon Elastic Block Store pour chaque région : chaque instance utilise un volume GP2 ou GP3 pour le système d'exploitation. Par défaut, le quota pour chacun Région AWS est de 300 TiB. Cependant, chaque instance utilise des nombres dans le cadre de ce quota. Assurez-vous donc d'en tenir compte lorsque vous vérifiez votre quota Amazon Elastic Block Store pour chaque région. Si votre quota est atteint, vous ne pouvez pas créer d'autres instances. Pour plus d'informations, consultez la section Points de terminaison et quotas Amazon Elastic Block Store
Utilisez Amazon S3 pour le stockage : Amazon S3 fournit un débit élevé et permet d'éliminer les incertitudes quant à la quantité de stockage à allouer en fonction du nombre de tâches et d'instances dans chaque zone de disponibilité. Pour plus d'informations, consultez la section Modèles de conception des meilleures pratiques : optimisation des performances d'Amazon S3.
Évoluez progressivement pour identifier rapidement les goulots d'étranglement : pour une tâche exécutée sur un million de vCPU ou plus, commencez par une baisse puis augmentez progressivement afin de pouvoir identifier les goulots d'étranglement à un stade précoce. Par exemple, commencez par exécuter sur 50 000 vCPU. Ensuite, augmentez le nombre à 200 000 vCPU, puis à 500 000 vCPU, etc. En d'autres termes, continuez à augmenter progressivement le nombre de vCPU jusqu'à atteindre le nombre de vCPU souhaité.
Surveillez pour identifier rapidement les problèmes potentiels : pour éviter les pannes et les problèmes potentiels lors de l'exécution à grande échelle, veillez à surveiller à la fois votre application et votre architecture. Des interruptions peuvent se produire même lors du passage de 1 000 à 5 000 vCPU. Vous pouvez utiliser Amazon CloudWatch Logs pour consulter les données des journaux ou utiliser des métriques CloudWatch intégrées à l'aide d'une bibliothèque cliente. Pour plus d'informations, consultez les sections Référence de l'agent CloudWatch Logs et aws-embedded-metrics

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Quand utiliser AWS Batch

Optimisez les conteneurs et les AMI