Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Cree una base de conocimientos conectándose a una fuente de datos en Amazon Bedrock Knowledge Bases
Al crear una base de conocimientos conectándose a una fuente de datos, debe configurar o especificar lo siguiente:
-
Información general que define e identifica la base de conocimientos
-
El rol de servicio con permisos para acceder a la base de conocimientos.
-
Configuraciones para la base de conocimientos, incluido el modelo de incrustaciones que se utilizará al convertir los datos de la fuente de datos, las configuraciones de almacenamiento del servicio en el que se almacenan las incrustaciones y, opcionalmente, una ubicación S3 para almacenar datos multimodales.
nota
No puede crear una base de conocimientos con un usuario raíz. Inicie sesión con un usuario de IAM antes de realizar estos pasos.
Amplíe la sección que se corresponda con su caso de uso:
Para configurar una base de conocimientos
-
Inicie sesión AWS Management Console con una identidad de IAM que tenga permisos para usar la consola Amazon Bedrock. A continuación, abra la consola Amazon Bedrock en https://console.aws.amazon.com/bedrock/
. -
En el panel de navegación izquierdo, elija Bases de conocimiento.
-
En la sección Bases de conocimiento, pulse el botón de creación y seleccione crear una base de conocimientos con un almacén vectorial.
-
(Opcional) Cambie el nombre predeterminado y proporcione una descripción para su base de conocimientos.
-
Elija un rol AWS Identity and Access Management (IAM) que otorgue permiso a Amazon Bedrock para acceder a otros servicios necesarios AWS . Puede dejar que Amazon Bedrock cree el rol de servicio o elegir usar el rol personalizado que creó para Neptune Analytics.
-
Elija una fuente de datos a la que conectar su base de conocimientos.
-
(Opcional) Añada etiquetas a la base de conocimientos. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock.
-
(Opcional) Configure los servicios para entregar registros de actividad para su base de conocimientos.
-
Vaya a la siguiente sección y siga los pasos que se indican Conecta una fuente de datos a tu base de conocimientos para configurar una fuente de datos.
-
En la sección del modelo de incrustaciones, haga lo siguiente:
-
Elija un modelo de incrustaciones para convertir los datos en incrustaciones vectoriales.
-
(Opcional) Amplíe la sección Configuraciones adicionales para ver las siguientes opciones de configuración (no todos los modelos admiten todas las configuraciones):
-
Tipo de incrustaciones: si se deben convertir los datos en incrustaciones vectoriales de punto flotante (float32) (más precisas, pero más costosas) o en incrustaciones vectoriales binarias (menos precisas, pero menos costosas). Para obtener información sobre qué modelos de incrustaciones admiten vectores binarios, consulte los modelos de incrustaciones compatibles.
-
Dimensiones vectoriales: los valores más altos mejoran la precisión, pero aumentan el coste y la latencia.
-
-
-
En la sección Base de datos vectorial, haga lo siguiente:
-
Elija un almacén de vectores para almacenar las incrustaciones de vectores que se utilizarán en la consulta. Dispone de las opciones siguientes:
-
Cree rápidamente una nueva tienda de vectores: elija una de las tiendas de vectores disponibles para que Amazon Bedrock la cree. Si lo desea, también puede configurar el cifrado de AWS KMS claves para su almacén de vectores.
nota
Al utilizar esta opción, Amazon Bedrock gestiona automáticamente la ubicación de los metadatos de cada almacén de vectores.
-
Amazon OpenSearch Serverless — Amazon Bedrock Knowledge Bases crea un índice y una colección de búsquedas vectoriales de Amazon OpenSearch Serverless y los configura automáticamente con los campos obligatorios.
-
Amazon Aurora PostgreSQL Serverless: Amazon Bedrock configura un almacén vectorial Amazon Aurora PostgreSQL Serverless. Este proceso toma datos de texto no estructurados de un bucket de Amazon S3, los transforma en fragmentos de texto y vectores y, a continuación, los almacena en una base de datos PostgreSQL. Para obtener más información, consulte Creación rápida de una base de conocimiento de Aurora PostgreSQL para Amazon Bedrock.
-
Amazon Neptune Analytics: Amazon Bedrock utiliza técnicas de generación aumentada de recuperación (RAG) combinadas con gráficos para mejorar las aplicaciones de IA generativa, de modo que los usuarios finales puedan obtener respuestas más precisas y completas.
-
Amazon S3 Vectors: Amazon Bedrock Knowledge Bases crea un depósito vectorial S3 y un índice vectorial que almacenarán las incrustaciones generadas a partir de sus fuentes de datos.
importante
La integración de Amazon S3 Vectors con las bases de conocimiento de Amazon Bedrock se encuentra en versión preliminar y está sujeta a cambios.
Puede crear una base de conocimientos para Amazon S3 Vectors en todos los sitios en Región de AWS los que estén disponibles Amazon Bedrock y Amazon S3 Vectors. Para obtener información sobre la disponibilidad regional, consulte Amazon S3 Vectors en la Guía del usuario de Amazon S3.
nota
Cuando Amazon Bedrock Knowledge Bases crea un índice vectorial para usted, puede adjuntar hasta un máximo de 40 KB de metadatos para cada vector. Dentro de estos 40 KB, se pueden utilizar hasta un máximo de 2 KB como metadatos filtrables.
Amazon Bedrock almacenará el texto en el espacio no filtrable como clave.
AMAZON_BEDROCK_TEXT
Los metadatos que añade Amazon Bedrock se almacenan en el espacio de metadatos filtrable. Para obtener más información sobre las limitaciones de los metadatos de los cubos vectoriales de S3, consulte Requisitos previos para usar Amazon S3 Vectors con las bases de conocimiento de Amazon Bedrock.
-
-
Elija un almacén vectorial que haya creado: seleccione un almacén vectorial compatible e identifique los nombres de los campos vectoriales y los nombres de los campos de metadatos en el índice vectorial. Para obtener más información, consulte Requisitos previos para usar un almacén de vectores que haya creado para una base de conocimientos.
nota
Si tu fuente de datos es una instancia de Confluence SharePoint, Microsoft o Salesforce, el único servicio de almacén vectorial compatible es Amazon OpenSearch Serverless.
-
-
(Opcional) Amplíe la sección de configuraciones adicionales y modifique las configuraciones relevantes.
-
-
Si su fuente de datos contiene imágenes, especifique un URI de Amazon S3 en el que almacenar las imágenes que el analizador extraerá de los datos en el destino de almacenamiento multimodal. Las imágenes se pueden devolver durante la consulta. Si lo desea, también puede elegir una clave gestionada por el cliente en lugar de la predeterminada Clave administrada de AWS para cifrar los datos.
nota
Los datos multimodales solo se admiten con Amazon S3 y las fuentes de datos personalizadas.
-
Seleccione Siguiente y revise los detalles de su base de conocimientos. Puede editar cualquier sección antes de continuar con la creación de la base de conocimientos.
nota
El tiempo que tarde en crearse la base de conocimientos dependerá de las configuraciones específicas. Una vez finalizada la creación de la base de conocimientos, su estado cambiará a Lista o Disponible.
Cuando la base de conocimientos esté lista y disponible, sincronice el origen de datos por primera vez y siempre que desee mantener el contenido actualizado. Seleccione la base de conocimientos en la consola y Sincronizar en la sección de información general del origen de datos.
Para crear una base de conocimientos, envíe una CreateKnowledgeBasesolicitud con un punto final de tiempo de compilación de Agents for Amazon Bedrock.
nota
Si prefieres dejar que Amazon Bedrock cree y administre una tienda de vectores por ti, usa la consola. Para obtener más información, amplíe la sección Uso de la consola en este tema.
Los siguientes campos son obligatorios:
Campo | Descripción básica |
---|---|
nombre | Un nombre para la base de conocimientos |
roleArn | El ARN de un rol de servicio de Amazon Bedrock Knowledge Bases. |
knowledgeBaseConfiguration | Contiene configuraciones para la base de conocimientos. Consulte los detalles a continuación. |
Configuración de almacenamiento | (Solo es necesario si se conecta a una fuente de datos no estructurada).Contiene las configuraciones para el servicio de fuente de datos que elija. |
Los siguientes campos son opcionales:
Campo | Caso de uso |
---|---|
description | Una descripción de la base de conocimientos. |
clientToken | Para garantizar que la solicitud de la API se complete solo una vez. Para obtener más información, consulte Ensuring idempotency. |
etiquetas | Para asociar etiquetas con el flujo. Para obtener más información, consulte Etiquetado de los recursos de Amazon Bedrock. |
En el knowledgeBaseConfiguration
campo, que se asigna a un KnowledgeBaseConfigurationobjeto, especifique VECTOR
en el type
campo e incluya un VectorKnowledgeBaseConfigurationobjeto. En el objeto, incluya los siguientes campos:
-
embeddingModelArn
— El ARN del modelo de incrustación que se va a utilizar. -
embeddingModelConfiguration
— Configuraciones del modelo de incrustación. Para ver los valores posibles que puede especificar para cada modelo compatible, consulteModelos y regiones compatibles con las bases de conocimiento de Amazon Bedrock. -
(Si planea incluir datos multimodales, que incluyen imágenes, figuras, gráficos o tablas, en su base de conocimientos)
supplementalDataStorageConfiguration
: se mapea un SupplementalDataStorageLocationobjeto, en el que se especifica la ubicación de S3 en la que se almacenarán los datos extraídos. Para obtener más información, consulte Opciones de análisis para su fuente de datos.
En el storageConfiguration
campo, que se asigna a un StorageConfigurationobjeto, especifique el almacén de vectores al que se va a conectar en el type
campo e incluya el campo que corresponda a ese almacén de vectores. Consulte cada tipo de configuración de almacén de vectores en StorageConfigurationpara obtener detalles sobre la información que debe proporcionar.
A continuación, se muestra un ejemplo de solicitud para crear una base de conocimientos conectada a una colección de Amazon OpenSearch Serverless. Los datos de las fuentes de datos conectadas se convertirán en incrustaciones de vectores binarios con Amazon Titan Text Embeddings V2 y los datos multimodales extraídos por el analizador se configurarán para almacenarse en un depósito llamado. MyBucket
PUT /knowledgebases/ HTTP/1.1 Content-type: application/json { "name": "MyKB", "description": "My knowledge base", "roleArn": "arn:aws:iam::111122223333:role/service-role/AmazonBedrockExecutionRoleForKnowledgeBase_123", "knowledgeBaseConfiguration": { "type": "VECTOR", "vectorKnowledgeBaseConfiguration": { "embeddingModelArn": "arn:aws:bedrock:us-east-1::foundation-model/amazon.titan-embed-text-v2:0", "embeddingModelConfiguration": { "bedrockEmbeddingModelConfiguration": { "dimensions": 1024, "embeddingDataType": "BINARY" } }, "supplementalDataStorageConfiguration": { "storageLocations": [ { "s3Location": { "uri": "arn:aws:s3:::MyBucket" }, "type": "S3" } ] } } }, "storageConfiguration": { "opensearchServerlessConfiguration": { "collectionArn": "arn:aws:aoss:us-east-1:111122223333:collection/abcdefghij1234567890", "fieldMapping": { "metadataField": "metadata", "textField": "text", "vectorField": "vector" }, "vectorIndexName": "MyVectorIndex" } } }