En savoir plus sur les cas d’utilisation des différentes méthodes d’inférence de modèle - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

En savoir plus sur les cas d’utilisation des différentes méthodes d’inférence de modèle

Vous pouvez exécuter directement l’inférence de modèle via les approches suivantes :

Méthode Cas d’utilisation
Terrains de jeu sur console Amazon Bedrock Exécutez l’inférence dans une interface graphique conviviale. Pratique pour l’exploration.
Converse ou ConverseStream Implémentez des applications conversationnelles avec une API unifiée pour l’entrée de modèles.
InvokeModel ou InvokeModelWithResponseStream Soumettez une seule invite et générez une réponse de manière synchrone. Utile pour générer des réponses en temps réel ou pour des requêtes de recherche.
StartAsyncInvoke Soumettez une seule invite et générez une réponse de manière asynchrone. Utile pour générer des réponses à grande échelle.
CreateModelInvocationJob Préparez un jeu de données d’invites et générez des réponses par lots.

Les fonctionnalités Amazon Bedrock suivantes utilisent également l’inférence de modèle comme étape d’un flux de travail plus vaste :

  • L’évaluation des modèles utilise le processus d’invocation de modèle pour évaluer les performances des différents modèles après avoir soumis une demande CreateEvaluationJob.

  • Lebases de connaissances utilisent l’invocation de modèles lors de l’utilisation de l’API RetrieveAndGenerate pour générer une réponse basée sur les résultats extraits d’une base de connaissances.

  • Les agents utilisent un modèle d’invocation pour générer des réponses à différentes étapes d’une demande InvokeAgent.

  • Les flux incluent les ressources Amazon Bedrock, telles que les invites, les bases de connaissances et les agents, qui utilisent l’invocation de modèles.

Après avoir testé différents modèles de fondation avec des invites et des paramètres d’inférence différents, vous pouvez configurer votre application pour appeler ces API avec les spécifications souhaitées.