Réserve de capacité à la demande et blocs de capacité pour ML (machine learning) - Amazon Elastic Compute Cloud

Réserve de capacité à la demande et blocs de capacité pour ML (machine learning)

La réserve de capacité à la demande vous permet de réserver de la capacité de calcul pour les instances Amazon EC2 dans une zone de disponibilité spécifique. Il existe deux types de réserve de capacité qui répondent à différents cas d’utilisation.

Voici quelques cas d’utilisation courants de la réserve de capacité à la demande :

  • Événements de mise à l’échelle : créez une réserve de capacité avant les événements stratégiques afin de pouvoir effectuer une mise à l’échelle lorsque vous en avez besoin.

  • Exigences réglementaires et reprise après sinistre : utilisez la réservation de capacité à la demande pour satisfaire aux exigences réglementaires en matière de haute disponibilité, et effectuez une réserve de capacité dans une zone de disponibilité ou une région différente pour la reprise après sinistre.

Voici quelques cas d’utilisation courants des blocs de capacité pour ML :

  • Entraînement et optimisation du modèle de machine learning (ML) : bénéficiez d’un accès ininterrompu aux instances GPU que vous avez réservées pour terminer l’entraînement et l’optimisation du modèle de machine learning.

  • Expérimentations et prototypes de machine learning : exécutez des expériences et créez des prototypes qui nécessitent des instances de GPU pendant de courtes durées.

Quand utiliser la réserve de capacité à la demande

Utilisez la réserve de capacité à la demande si vous avez des exigences strictes en matière de capacité et si vos charges de travail critiques actuelles ou futures nécessitent une garantie en termes de capacité. Avec la réserve de capacité à la demande, vous pouvez vous assurer d’avoir toujours accès à la capacité Amazon EC2 que vous avez réservée, pendant aussi longtemps que nécessaire.

Quand utiliser les blocs de capacité pour ML

Utilisez les blocs de capacité pour ML lorsque vous devez vous assurer de disposer d’un accès ininterrompu aux instances GPU pendant une période définie à compter d’une date ultérieure. Les blocs de capacité conviennent parfaitement à l’entraînement et à l’optimistion des modèles de machine learning, aux expérimentations de courte durée et à la gestion des augmentations temporaires de la demande d’inférence à avenir. Avec les blocs de capacité, vous pouvez vous assurer d’avoir accès aux ressources GPU à une date spécifique pour exécuter vos charges de travail de machine learning.