Creación rápida de una base de conocimiento de Amazon Bedrock para Aurora PostgreSQL
El flujo de trabajo de generación aumentada por recuperación (RAG) de Amazon Bedrock se basa en datos vectoriales almacenados en una base de datos de Aurora PostgreSQL para impulsar la recuperación de contenido. Anteriormente, configurar Aurora PostgreSQL como almacén de datos vectoriales para las bases de conocimiento de Bedrock era un proceso de varios pasos que requería numerosas acciones manuales en diferentes interfaces de usuario. Esto dificultaba que los científicos de datos y los desarrolladores pudieran aprovechar Aurora para sus proyectos de Bedrock.
Para mejorar la experiencia del usuario, AWS ha creado una nueva opción de creación rápida basada en CloudFormation que simplifica el proceso de configuración. La creación rápida de Aurora le permite aprovisionar un clúster de base de datos de Aurora PostgreSQL configurado previamente como almacén vectorial para sus bases de conocimiento de Amazon Bedrock con un solo clic.
Temas
Regiones compatibles y versiones de Aurora PostgreSQL
La opción de creación rápida de Aurora está disponible en todas las regiones de AWS que admiten las bases de conocimiento de Amazon Bedrock. De forma predeterminada, crea un clúster de base de datos de Aurora PostgreSQL con la versión 15.7. Para obtener más información sobre las regiones compatibles, consulte Supported models and regions for Amazon Bedrock Knowledge Bases.
Comprensión del proceso de creación rápida
El proceso de creación rápida aprovisiona automáticamente los siguientes recursos para configurar una base de datos de Amazon Aurora PostgreSQL como almacén de datos vectoriales para su base de conocimiento de Bedrock:
Un clúster de base de datos de Aurora PostgreSQL en su cuenta, configurado con los ajustes predeterminados.
-
Las ACU (unidades de capacidad de Aurora) están configuradas entre 0 y 16. Esto permite que su almacén vectorial se reduzca verticalmente hasta cero cuando no se use, lo que ahorra costos de computación. Las ACU se pueden ajustar posteriormente en la consola de Amazon RDS.
-
Índice HNSW (mundo pequeño navegable jerárquico) que utiliza la distancia euclidiana como medida de similitud para las incrustaciones vectoriales de Bedrock almacenadas en Aurora.
-
La instancia de base de datos es una instancia de versión 2 sin servidor.
-
El clúster está asociado a la VPC y las subredes predeterminadas, y tiene habilitada la API de datos de RDS.
-
AWS Secrets Manager administra las credenciales de administrador del clúster.
Además de los ajustes predeterminados, se configuran los siguientes ajustes para usted. A medida que avance en el proceso, verá pantallas que explican el flujo de trabajo.
-
Alimentar el clúster de Aurora con los objetos de base de datos necesarios:
-
Cree la extensión, el esquema, el rol y las tablas de pgvector necesarios para la base de conocimiento de Bedrock.
-
Registre un usuario de base de datos con privilegios limitados para que Bedrock interactúe con el clúster.
-
-
Aparecerá un banner de progreso durante todo el proceso de aprovisionamiento de recursos, que le permitirá realizar un seguimiento del estado de los siguientes subeventos:
Creación de clústeres de Aurora
Alimentación del clúster de Aurora
Creación de bases de conocimiento
El banner permanece visible hasta que la base de conocimiento se haya creado por completo, incluso si sale y vuelve a la página.
-
Puede hacer clic en
View details
en el banner de progreso para ver el estado de cada paso. Para obtener más información sobre los eventos durante la creación de la base de conocimiento, elija el enlace de CloudFormation en la pantalla de visualización de detalles. Cuando se haya completado el proceso, podrá empezar a utilizarse la nueva base de conocimiento de Bedrock. -
Los ID de pila de todos los recursos de creación rápida se encuentran en las etiquetas de la base de conocimiento de Bedrock, por si necesita consultarlos.
Una base de conocimiento de Bedrock, con la configuración del clúster de Aurora recién aprovisionado al crear el almacén de vectores.
Beneficios del uso de la creación rápida de Aurora
-
El proceso de creación rápida basado en CloudFormation reduce considerablemente el tiempo y la complejidad que supone utilizar Aurora como almacén de vectores.
-
Aurora ofrece un rendimiento excelente, escalabilidad vectorial y ventajas económicas, además de permitir escalar hasta cero cargos de computación cuando no se usa.
-
El proceso de creación rápida agiliza la experiencia integral, lo que le permite crear y configurar fácilmente sus bases de conocimiento de Bedrock con Aurora.
-
Los clientes pueden crear una plantilla de CloudFormation para personalizar el aprovisionamiento con sus propias configuraciones.
Limitaciones del proceso de creación rápida de Aurora
Con la opción de creación rápida de Aurora, el clúster de base de datos se aprovisiona con las configuraciones predeterminadas. Sin embargo, es posible que esta configuración predeterminada no cumpla con sus requisitos específicos o su caso de uso previsto. La creación rápida no ofrece opciones para modificar las configuraciones durante el proceso de aprovisionamiento. Las configuraciones se definen automáticamente para agilizar la experiencia de implementación. Si necesita personalizar la configuración del clúster de base de datos de Aurora, puede hacerlo después de la implementación inicial mediante la creación rápida en la consola de Amazon RDS.
Si bien el flujo de creación rápida simplifica el proceso de configuración, el tiempo necesario para crear el clúster de base de datos de Aurora sigue siendo de aproximadamente diez minutos, igual que en una implementación manual. Esto se debe al tiempo necesario para aprovisionar la infraestructura de Aurora.
La opción de creación rápida está diseñada para experimentar y realizar una configuración rápida. Es posible que los recursos creados mediante la creación rápida no sean adecuados para su uso en producción y no pueda migrarlos directamente a un entorno de producción en su VPC.