Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Evalúe el rendimiento de las fuentes RAG mediante las evaluaciones de Amazon Bedrock
Puede utilizar métricas calculadas para evaluar la eficacia con la que un sistema de generación aumentada de recuperación (RAG) recupera la información relevante de sus fuentes de datos y la eficacia de las respuestas generadas a la hora de responder a las preguntas. Los resultados de una evaluación de RAG le permiten comparar diferentes bases de conocimiento de Amazon Bedrock y otras fuentes de RAG y, a continuación, elegir la base de conocimientos o el mejor sistema de RAG para su aplicación.
Puede configurar dos tipos diferentes de trabajos de evaluación de RAG.
-
Recuperar solo: en un trabajo de evaluación de RAG solo de recuperación, el informe se basa en los datos recuperados de su fuente de RAG. Puede evaluar una base de conocimientos de Amazon Bedrock o puede traer sus propios datos de respuesta a inferencias de una fuente RAG externa.
-
Recuperar y generar: en un trabajo de evaluación de retrieve-and-generateRAG, el informe se basa en los datos recuperados de su base de conocimientos y en los resúmenes generados por el modelo generador de respuestas. Puede utilizar una base de conocimientos de Amazon Bedrock y un modelo generador de respuestas, o puede traer sus propios datos de respuesta a inferencias desde una fuente RAG externa.
Modelos compatibles
Para crear un trabajo de evaluación de RAG, necesita acceder al menos a uno de los modelos de evaluador de las siguientes listas. Para crear un retrieve-and-generate trabajo que utilice un modelo de Amazon Bedrock para generar las respuestas, también necesita acceder al menos a uno de los modelos de respuesta del generador enumerados.
Para obtener más información sobre cómo acceder a los modelos y la disponibilidad regional, consulteAcceso a los modelos fundacionales de Amazon Bedrock.
Modelos de evaluación compatibles (métricas integradas)
-
Amazon Nova Pro –
amazon.nova-pro-v1:0
-
AnthropicClaude 3.5 Sonnetv1 —
anthropic.claude-3-5-sonnet-20240620-v1:0
-
AnthropicClaude 3.5 Sonnetv2 —
anthropic.claude-3-5-sonnet-20241022-v2:0
-
Anthropic Claude 3.7 Sonnet –
anthropic.claude-3-7-sonnet-20250219-v1:0
-
Anthropic Claude 3 Haiku –
anthropic.claude-3-haiku-20240307-v1:0
-
Anthropic Claude 3.5 Haiku –
anthropic.claude-3-5-haiku-20241022-v1:0
-
Meta Llama 3.1 70B Instruct –
meta.llama3-1-70b-instruct-v1:0
-
Mistral Large –
mistral.mistral-large-2402-v1:0
Los perfiles de inferencia entre regiones son compatibles con los modelos enumerados. Para obtener más información, consulte Perfiles de inferencia interregional compatibles.
Modelos de evaluación compatibles (métricas personalizadas)
-
Mistral Large24.02 —
mistral.mistral-large-2402-v1:0
-
Mistral Large24.07 —
mistral.mistral-large-2407-v1:0
-
AnthropicClaude 3.5 Sonnetv1 —
anthropic.claude-3-5-sonnet-20240620-v1:0
-
AnthropicClaude 3.5 Sonnetv2 —
anthropic.claude-3-5-sonnet-20241022-v2:0
-
Anthropic Claude 3.7 Sonnet –
anthropic.claude-3-7-sonnet-20250219-v1:0
-
AnthropicClaude 3 Haiku3 —
anthropic.claude-3-haiku-20240307-v1:0
-
AnthropicClaude 3 Haiku3.5 —
anthropic.claude-3-5-haiku-20241022-v1:0
-
Meta Llama 3.1 70B Instruct –
meta.llama3-1-70b-instruct-v1:0
-
Meta Llama 3.3 70B Instruct –
meta.llama3-3-70b-instruct-v1:0
-
Amazon Nova Pro –
amazon.nova-pro-v1:0
Los perfiles de inferencia entre regiones son compatibles con los modelos enumerados. Para obtener más información, consulte Perfiles de inferencia interregional compatibles.
Modelos de generadores de respuestas compatibles
Puede utilizar los siguientes tipos de modelos en Amazon Bedrock como modelo generador de respuestas en un trabajo de evaluación. También puede traer sus propios datos de respuesta a inferencias de modelos que no sean de Amazon Bedrock.
-
Modelos básicos: Información del modelo fundacional de Amazon Bedrock
-
Modelos de Amazon Bedrock Marketplace — Amazon Bedrock Marketplace
-
Modelos de bases personalizados — Personalización del modelo para mejorar su rendimiento según su caso de uso
-
Modelos de cimentación importados — Utilice la importación de modelos personalizados para importar un modelo de código abierto personalizado a Amazon Bedrock
-
Enrutadores rápidos: Cómo entender el enrutamiento rápido inteligente en Amazon Bedrock
-
Modelos para los que ha adquirido Provisioned Throughput: Aumento de la capacidad de invocación de modelos con el rendimiento aprovisionado en Amazon Bedrock