Découvrez les cas d'utilisation des différentes méthodes d'inférence de modèles - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Découvrez les cas d'utilisation des différentes méthodes d'inférence de modèles

Vous pouvez exécuter directement l'inférence de modèle de la manière suivante :

Méthode Cas d’utilisation
Terrains de jeu sur console Amazon Bedrock Exécutez l'inférence dans une interface graphique conviviale. Pratique pour l'exploration.
Converse ou ConverseStream Implémentez des applications conversationnelles avec une API unifiée pour la saisie de modèles.
InvokeModel ou InvokeModelWithResponseStream Soumettez une seule invite et générez une réponse de manière synchrone. Utile pour générer des réponses en temps réel ou pour des requêtes de recherche.
StartAsyncInvoke Soumettez une seule invite et générez une réponse de manière asynchrone. Utile pour générer des réponses à grande échelle.
CreateModelInvocationJob Préparez un ensemble de données d'invites et générez des réponses par lots.

Les fonctionnalités Amazon Bedrock suivantes utilisent également l'inférence de modèles comme étape d'un flux de travail plus vaste :

  • L'évaluation des modèles utilise le processus d'invocation des modèles pour évaluer les performances des différents modèles une fois que vous avez soumis une CreateEvaluationJobdemande.

  • Les bases de connaissances utilisent l'invocation de modèles lors de l'utilisation de l'RetrieveAndGenerateAPI pour générer une réponse basée sur les résultats extraits d'une base de connaissances.

  • Les agents utilisent un modèle d'invocation pour générer des réponses à différentes étapes d'une InvokeAgentdemande.

  • Les flux incluent les ressources Amazon Bedrock, telles que les invites, les bases de connaissances et les agents, qui utilisent l'invocation de modèles.

Après avoir testé différents modèles de base avec des instructions et des paramètres d'inférence différents, vous pouvez configurer votre application pour qu'elle les appelle APIs avec les spécifications souhaitées.