Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Sincronización de los datos con la base de conocimientos de Amazon Bedrock
Tras crear la base de conocimientos, puede ingerir o sincronizar los datos para poder consultarlos. La ingesta convierte los datos sin procesar del origen de datos en incrustaciones vectoriales, según el modelo de incrustaciones vectoriales y las configuraciones que haya especificado.
Antes de iniciar la ingesta, compruebe que el origen de datos cumpla las siguientes condiciones:
-
Se ha configurado la información de conexión del origen de datos. Para configurar un conector de origen de datos para que rastree los datos del repositorio de orígenes de datos, consulte Supported data source connectors. Se ha configurado el origen de datos como parte de los pasos de creación de la base de conocimientos.
-
Se ha configurado el modelo de incrustación vectorial y el almacén vectorial elegidos. Consulte los modelos de incrustaciones vectoriales compatibles y los almacenes vectoriales para bases de conocimientos. Se han configurado las incrustaciones vectoriales como parte de los pasos de creación de la base de conocimientos.
-
Los archivos son del formato admitido. Para obtener más información, consulte Formatos de documentos admitidos.
-
Los archivos no deben superar el Tamaño del archivo de trabajo de ingesta especificado en los Amazon Bedrock endpoints and quotas en la Referencia general de AWS.
-
Si el origen de datos contiene archivos de metadatos, compruebe las siguientes condiciones para asegurarse de que no se omitan los archivos de metadatos:
-
Cada archivo
.metadata.jsoncomparte el mismo nombre y extensión que el archivo de origen al que está asociado. -
Si el índice vectorial de la base de conocimientos se encuentra en un almacén vectorial de Amazon OpenSearch sin servidor, compruebe que el índice vectorial esté configurado con el motor
faiss. Si el índice vectorial está configurado con el motornmslib, deberá realizar una de las siguientes acciones:-
Crear una nueva base de conocimientos en la consola y dejar que Amazon Bedrock cree automáticamente un índice vectorial en Amazon OpenSearch sin servidor por usted.
-
Crear otro índice vectorial en el almacén vectorial y seleccionar
faisscomo el motor. A continuación, cree una nueva base de conocimientos y especifique el nuevo índice vectorial.
-
-
Si el índice vectorial de la base de conocimiento se encuentra en un clúster de bases de datos de Amazon Aurora, le recomendamos que utilice el campo de metadatos personalizado para almacenar todos los metadatos en una sola columna y crear un índice en esa columna. Si no proporciona el campo de metadatos personalizado, compruebe que la tabla del índice contenga una columna para cada propiedad de metadatos de los archivos de metadatos antes de iniciar la ingesta. Para obtener más información, consulte Requisitos previos para usar un almacén de vectores que haya creado para una base de conocimiento.
-
Cada vez que añada, modifique o elimine archivos del origen de datos, debe sincronizar el origen de datos para volver a indexarlo en la base de conocimientos. La sincronización es incremental, por lo que Amazon Bedrock solo procesa los documentos añadidos, modificados o eliminados desde la última sincronización.
Para obtener más información sobre cómo ingerir los datos en la base de conocimiento y sincronizarlos con los datos más recientes, seleccione la pestaña correspondiente al método que prefiera y siga estos pasos: