PERF02-BP05 Mettre à l’échelle vos ressources de calcul de manière dynamique

Utilisez l’élasticité du cloud pour mettre à l’échelle vos ressources de calcul de manière dynamique afin de répondre à vos besoins et d’éviter de surprovisionner ou de sous-provisionner la capacité de votre charge de travail.

Anti-modèles courants :

Vous réagissez aux alertes en augmentant manuellement la capacité.
Vous utilisez les mêmes recommandations de dimensionnement (généralement, infrastructure statique) que sur site.
Vous conservez une capacité accrue après un événement de mise à l’échelle au lieu de la réduire.

Avantages liés au respect de cette bonne pratique : En configurant et en testant l’élasticité des ressources de calcul, vous pouvez économiser de l’argent, maintenir les points de référence des performances et améliorer la fiabilité en fonction de l’évolution du trafic.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : Élevé

Directives d’implémentation

AWS apporte la flexibilité nécessaire pour mettre à l’échelle vos ressources de manière dynamique grâce à divers mécanismes de mise à l’échelle afin de répondre à l’évolution de la demande. Combinée aux métriques liées au calcul, la mise à l’échelle dynamique permet aux charges de travail de réagir automatiquement aux changements et d’utiliser l’ensemble optimal de ressources de calcul pour atteindre son objectif.

Vous pouvez utiliser plusieurs approches pour adapter l’offre de ressources à la demande.

Approche visant à suivre les cibles: surveillez votre métrique de capacité de mise à l’échelle et augmentez ou réduisez automatiquement votre capacité selon vos besoins.
Mise à l’échelle prédictive: mettez à l’échelle en prévision des tendances quotidiennes et hebdomadaires.
Approche basée sur un calendrier: planifiez votre propre calendrier de mise à l’échelle en fonction de changements de charge prévisibles.
Mise à l’échelle des services: choisissez des services (sans serveur, par exemple) conçus pour se mettre à l’échelle automatiquement.

Vous devez vous assurer que les déploiements de charge de travail peuvent gérer les événements de mise à l’échelle ascendante et descendante.

Étapes d’implémentation

Les instances de calcul, les conteneurs et les fonctions fournissent des mécanismes d’élasticité, soit en combinaison avec l’autoscaling, soit en tant que fonctionnalité du service. Voici des exemples de mécanismes d’autoscaling :

Mécanisme d’autoscaling	Où utiliser
Amazon EC2 Auto Scaling	Pour vous assurer que vous disposez du nombre adéquat d’instances Amazon EC2 disponibles pour gérer la charge utilisateur de votre application.
Application Auto Scaling	Pour mettre à l’échelle automatiquement les ressources pour les services AWS individuels au-delà d’Amazon EC2, tels que les fonctions AWS Lambda ou les services Amazon Elastic Container Service (Amazon ECS) .
Kubernetes Cluster Autoscaler/Karpenter	Pour mettre à l’échelle automatiquement les clusters Kubernetes.

La mise à l’échelle est souvent abordée pour les services de calcul, tels que les instances Amazon EC2 ou les fonctions AWS Lambda. Assurez-vous également de prendre en compte la configuration des services non liés au calcul tels que AWS Glue afin de répondre à la demande.
Vérifiez que les métriques de mise à l’échelle correspondent aux caractéristiques de la charge de travail en cours de déploiement. Si vous déployez une application de transcodage vidéo, une utilisation de 100 % du processeur est attendue. N’en faites pas votre métrique principale. Utilisez plutôt la profondeur de la file d’attente des tâches de transcodage. Vous pouvez utiliser une métrique personnalisée pour votre politique de mise à l’échelle si nécessaire. Pour choisir les bonnes métriques, tenez compte des conseils suivants pour Amazon EC2 :
- La métrique doit être une métrique d’utilisation valide et décrire à quel point l’instance est occupée.
- La valeur de la métrique doit augmenter ou diminuer proportionnellement au nombre d’instances dans le groupe Auto Scaling.
Assurez-vous d’utiliser la mise à l’échelle dynamique plutôt que la mise à l’échelle manuelle pour votre groupe Auto Scaling. Nous vous recommandons également d’utiliser des politiques de mise à l’échelle du suivi des cibles dans votre mise à l’échelle dynamique.
Vérifiez que les déploiements de charges de travail peuvent gérer les deux événements de mise à l’échelle (augmentation et diminution des charges de travail). À titre d’exemple, vous pouvez utiliser l’historique d’activité pour vérifier une activité de mise à l’échelle pour un groupe Auto Scaling.
Évaluez votre charge de travail pour les modèles prédictifs et mettez-la à l’échelle de manière proactive pour anticiper les changements prévisibles et prévus de la demande. Avec la mise à l’échelle prédictive, vous pouvez supprimer le besoin de surprovisionner de la capacité. Pour en savoir plus, consultez Mise à l’échelle prédictive avec Amazon EC2 Auto Scaling.

Ressources

Documents connexes :

Vidéos connexes :

Exemples connexes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

PERF02-BP04 Configurer et dimensionner correctement les ressources de calcul

PERF02-BP06 Utiliser des accélérateurs de calcul matériels optimisés