Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Options de point de terminaison avancées pour l’inférence avec Amazon SageMaker AI
L'inférence en temps réel vous permet d'optimiser davantage les performances et les coûts grâce aux options d'inférence avancées suivantes :
-
Points de terminaison multimodèles : choisissez cette option si vous possédez plusieurs modèles qui utilisent le même cadre et peuvent partager un conteneur. Cette option vous permet d'optimiser les coûts en améliorant l'utilisation des points de terminaison et en réduisant les frais de déploiement.
-
Points de terminaison multi-conteneurs : choisissez cette option si vous possédez plusieurs modèles qui utilisent des cadres différents et nécessitent leurs propres conteneurs. Vous bénéficierez des nombreux avantages des points de terminaison multimodèles et pourrez déployer divers cadres et modèles.
-
Pipelines d’inférence en série : utilisez cette option si vous souhaitez héberger des modèles avec une logique de prétraitement et de post-traitement derrière un point de terminaison. Les pipelines d’inférence sont entièrement gérés par SageMaker AI et offrent une latence réduite, car tous les conteneurs sont hébergés sur les mêmes instances Amazon EC2.