En savoir plus sur les cas d’utilisation des différentes méthodes d’inférence de modèle - Amazon Bedrock

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

En savoir plus sur les cas d’utilisation des différentes méthodes d’inférence de modèle

Vous pouvez exécuter directement l’inférence de modèle via les approches suivantes :

Method Cas d’utilisation
Terrains de jeu sur console Amazon Bedrock Exécutez l’inférence dans une interface graphique conviviale. Pratique pour l’exploration.
Converse ou ConverseStream Implémentez des applications conversationnelles avec une API unifiée pour l’entrée de modèles.
InvokeModel ou InvokeModelWithResponseStream Soumettez une seule invite et générez une réponse de manière synchrone. Utile pour générer des réponses en temps réel ou pour des requêtes de recherche.
StartAsyncInvoke Soumettez une seule invite et générez une réponse de manière asynchrone. Utile pour générer des réponses à grande échelle.
CreateModelInvocationJob Préparez un jeu de données d’invites et générez des réponses par lots.
API de réponses Utilisez l'API Responses pour les applications agentiques modernes nécessitant l'utilisation d'outils intégrés (recherche, interpréteur de code), des entrées multimodales et des conversations dynamiques.
Achèvement du chat Utilisez l'API Chat Completions pour des tâches légères, apatrides et axées sur le texte, pour lesquelles vous avez besoin d'un contrôle total sur la gestion de l'historique des discussions et d'une latence réduite.

Les fonctionnalités Amazon Bedrock suivantes utilisent également l’inférence de modèle comme étape d’un flux de travail plus vaste :

  • L'évaluation des modèles utilise le processus d'invocation des modèles pour évaluer les performances des différents modèles une fois que vous avez soumis une CreateEvaluationJobdemande.

  • Lebases de connaissances utilisent l’invocation de modèles lors de l’utilisation de l’API RetrieveAndGenerate pour générer une réponse basée sur les résultats extraits d’une base de connaissances.

  • Les agents utilisent un modèle d’invocation pour générer des réponses à différentes étapes d’une demande InvokeAgent.

  • Les flux incluent les ressources Amazon Bedrock, telles que les invites, les bases de connaissances et les agents, qui utilisent l’invocation de modèles.

Après avoir testé différents modèles de base avec des instructions et des paramètres d'inférence différents, vous pouvez configurer votre application pour qu'elle les appelle APIs avec les spécifications souhaitées.