Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Recommandations d’inférence
Les tâches de recommandation d’inférence exécutent un ensemble de tests de charge sur les types d’instance recommandés ou un point de terminaison sans serveur. Les tâches de recommandation d’inférence utilisent des métriques de performance basées sur des tests de charge utilisant les exemples de données que vous avez fournis lors de l’enregistrement de la version du modèle.
Note
Avant de créer une tâche de recommandation Inference Recommender, assurez-vous que les Conditions préalables pour utiliser Amazon SageMaker Inference Recommender sont satisfaits.
Ce qui suit montre comment utiliser Amazon SageMaker Inference Recommender pour créer une recommandation d’inférence basée sur votre type de modèle à l’aide du kit AWS SDK pour Python (Boto3), de l’AWS CLI, d’Amazon SageMaker Studio Classic et de la console SageMaker AI.