En savoir plus sur les cas d’utilisation des différentes méthodes d’inférence de modèle

Vous pouvez exécuter directement l’inférence de modèle via les approches suivantes :

Method	Cas d’utilisation
Terrains de jeu sur console Amazon Bedrock	Exécutez l’inférence dans une interface graphique conviviale. Pratique pour l’exploration.
Converse ou ConverseStream	Implémentez des applications conversationnelles avec une API unifiée pour l’entrée de modèles.
InvokeModel ou InvokeModelWithResponseStream	Soumettez une seule invite et générez une réponse de manière synchrone. Utile pour générer des réponses en temps réel ou pour des requêtes de recherche.
StartAsyncInvoke	Soumettez une seule invite et générez une réponse de manière asynchrone. Utile pour générer des réponses à grande échelle.
CreateModelInvocationJob	Préparez un jeu de données d’invites et générez des réponses par lots.
API de réponses	Utilisez l'API Responses pour les applications agentiques modernes nécessitant l'utilisation d'outils intégrés (recherche, interpréteur de code), des entrées multimodales et des conversations dynamiques.
Achèvement du chat	Utilisez l'API Chat Completions pour des tâches légères, apatrides et axées sur le texte, pour lesquelles vous avez besoin d'un contrôle total sur la gestion de l'historique des discussions et d'une latence réduite.

Les fonctionnalités Amazon Bedrock suivantes utilisent également l’inférence de modèle comme étape d’un flux de travail plus vaste :

L'évaluation des modèles utilise le processus d'invocation des modèles pour évaluer les performances des différents modèles une fois que vous avez soumis une CreateEvaluationJobdemande.
Lebases de connaissances utilisent l’invocation de modèles lors de l’utilisation de l’API RetrieveAndGenerate pour générer une réponse basée sur les résultats extraits d’une base de connaissances.
Les agents utilisent un modèle d’invocation pour générer des réponses à différentes étapes d’une demande InvokeAgent.
Les flux incluent les ressources Amazon Bedrock, telles que les invites, les bases de connaissances et les agents, qui utilisent l’invocation de modèles.

Après avoir testé différents modèles de base avec des instructions et des paramètres d'inférence différents, vous pouvez configurer votre application pour qu'elle les appelle APIs avec les spécifications souhaitées.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Inférence : générer des réponses

Fonctionnement de l’inférence