Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Évaluez les performances des sources RAG à l'aide des évaluations d'Amazon Bedrock
Vous pouvez utiliser des métriques calculées pour évaluer l'efficacité avec laquelle un système RAG (Retrieval Augmented Generation) extrait les informations pertinentes de vos sources de données, ainsi que l'efficacité des réponses générées pour répondre aux questions. Les résultats d'une évaluation RAG vous permettent de comparer différentes bases de connaissances Amazon Bedrock et d'autres sources RAG, puis de choisir la base de connaissances ou le meilleur système RAG pour votre application.
Vous pouvez configurer deux types différents de tâches d'évaluation RAG.
-
Extraction uniquement : dans une tâche d'évaluation RAG uniquement à extraction, le rapport est basé sur les données extraites de votre source RAG. Vous pouvez soit évaluer une base de connaissances Amazon Bedrock, soit apporter vos propres données de réponse d'inférence à partir d'une source RAG externe.
-
Récupérer et générer : dans une tâche d'évaluation retrieve-and-generateRAG, le rapport est basé sur les données extraites de votre base de connaissances et sur les résumés générés par le modèle de générateur de réponses. Vous pouvez soit utiliser une base de connaissances Amazon Bedrock et un modèle de générateur de réponses, soit apporter vos propres données de réponse par inférence à partir d'une source RAG externe.
Modèles pris en charge
Pour créer une tâche d'évaluation RAG, vous devez accéder à au moins un des modèles d'évaluateur figurant dans les listes suivantes. Pour créer une retrieve-and-generate tâche qui utilise un modèle Amazon Bedrock pour générer les réponses, vous devez également accéder à au moins l'un des modèles de réponse du générateur répertoriés.
Pour en savoir plus sur l'accès aux modèles et la disponibilité des régions, consultezAccédez aux modèles de fondations Amazon Bedrock.
Modèles d'évaluateur pris en charge (métriques intégrées)
-
Amazon Nova Pro –
amazon.nova-pro-v1:0
-
AnthropicClaude 3.5 Sonnetv1 —
anthropic.claude-3-5-sonnet-20240620-v1:0
-
AnthropicClaude 3.5 Sonnetv2 —
anthropic.claude-3-5-sonnet-20241022-v2:0
-
Anthropic Claude 3.7 Sonnet –
anthropic.claude-3-7-sonnet-20250219-v1:0
-
Anthropic Claude 3 Haiku –
anthropic.claude-3-haiku-20240307-v1:0
-
Anthropic Claude 3.5 Haiku –
anthropic.claude-3-5-haiku-20241022-v1:0
-
Meta Llama 3.1 70B Instruct –
meta.llama3-1-70b-instruct-v1:0
-
Mistral Large –
mistral.mistral-large-2402-v1:0
Les profils d'inférence interrégionaux sont pris en charge pour les modèles répertoriés. Pour en savoir plus, veuillez consulter la section Profils d'inférence interrégionaux pris en charge.
Modèles d'évaluateur pris en charge (métriques personnalisées)
-
Mistral Large24,02 —
mistral.mistral-large-2402-v1:0
-
Mistral Large24,07 —
mistral.mistral-large-2407-v1:0
-
AnthropicClaude 3.5 Sonnetv1 —
anthropic.claude-3-5-sonnet-20240620-v1:0
-
AnthropicClaude 3.5 Sonnetv2 —
anthropic.claude-3-5-sonnet-20241022-v2:0
-
Anthropic Claude 3.7 Sonnet –
anthropic.claude-3-7-sonnet-20250219-v1:0
-
AnthropicClaude 3 Haiku3 —
anthropic.claude-3-haiku-20240307-v1:0
-
AnthropicClaude 3 Haiku3,5 —
anthropic.claude-3-5-haiku-20241022-v1:0
-
Meta Llama 3.1 70B Instruct –
meta.llama3-1-70b-instruct-v1:0
-
Meta Llama 3.3 70B Instruct –
meta.llama3-3-70b-instruct-v1:0
-
Amazon Nova Pro –
amazon.nova-pro-v1:0
Les profils d'inférence interrégionaux sont pris en charge pour les modèles répertoriés. Pour en savoir plus, veuillez consulter la section Profils d'inférence interrégionaux pris en charge.
Modèles de générateurs de réponses pris en charge
Vous pouvez utiliser les types de modèles suivants dans Amazon Bedrock comme modèle de générateur de réponses dans une tâche d'évaluation. Vous pouvez également apporter vos propres données de réponse d'inférence provenant de modèles autres qu'Amazon Bedrock.
-
Modèles de fondation — Informations sur le modèle de fondation Amazon Bedrock
-
Modèles Amazon Bedrock Marketplace — Amazon Bedrock Marketplace
-
Modèles de fondation personnalisés — Personnalisez votre modèle pour améliorer ses performances en fonction de votre cas d'utilisation
-
Modèles de fondation importés — Importer un modèle personnalisé dans Amazon Bedrock
-
Routeurs rapides — Comprendre le routage rapide intelligent dans Amazon Bedrock
-
Modèles pour lesquels vous avez acheté Provisioned Throughput — Augmentez la capacité d'invocation des modèles grâce au débit provisionné dans Amazon Bedrock