Criar rapidamente uma Base de Conhecimento para Amazon Bedrock do Aurora PostgreSQL
O fluxo de trabalho de geração aumentada via recuperação (RAG) do Amazon Bedrock depende de dados vetoriais armazenados em um banco de dados do Aurora PostgreSQL para potencializar a recuperação de conteúdo. Anteriormente, configurar o Aurora PostgreSQL como armazenamento de dados vetoriais para as bases de conhecimento do Bedrock era um processo de várias etapas, exigindo numerosas ações manuais em diferentes interfaces de usuário. Isso tornava difícil para cientistas de dados e desenvolvedores aproveitarem o Aurora em seus projetos do Bedrock.
Para melhorar a experiência do usuário, a AWS criou uma nova opção de criação rápida baseada no CloudFormation que simplifica o processo de configuração. Com a criação rápida do Aurora, agora é possível provisionar um cluster de banco de dados do Aurora PostgreSQL pré-configurado como armazenamento de vetores para suas bases de conhecimento do Amazon Bedrock com um único clique.
Tópicos
Regiões e versões compatíveis do Aurora PostgreSQL
A opção de criação rápida do Aurora está disponível em todas as regiões da AWS que oferecem suporte às bases de conhecimento do Amazon Bedrock. Por padrão, ela cria um cluster de banco de dados do Aurora PostgreSQL com a versão 15.7. Para obter mais informações sobre as regiões compatíveis, consulte Supported models and regions for Amazon Bedrock Knowledge Bases.
Noções básicas sobre o processo de criação rápida
O processo de criação rápida provisiona automaticamente os seguintes recursos para configurar um banco de dados do Amazon Aurora PostgreSQL como armazenamento de dados vetoriais para sua base de conhecimento do Bedrock:
Um cluster de banco de dados do Aurora PostgreSQL em sua conta, configurado com configurações padrão.
-
As unidades de capacidade do Aurora (ACUs) são definidas de 0 a 16. Isso permite que o armazenamento de vetores seja reduzido verticalmente a zero quando não estiver em uso, reduzindo os custos computacionais. As ACUs podem ser ajustadas posteriormente no console do Amazon RDS.
-
Índice Hierarchical Navigable Small World (HNSW) usando a distância euclidiana como medida de similaridade para as incorporações de vetores do Bedrock armazenadas no Aurora.
-
A instância de banco de dados é uma instância com tecnologia sem servidor v2.
-
O cluster está associado à VPC e às sub-redes padrão e tem a API de dados do RDS habilitada.
-
As credenciais de administrador do cluster são gerenciadas pelo AWS Secrets Manager.
Além das configurações padrão, as configurações a seguir são definidas para você. Ao passar pelo processo, você verá telas que explicam o fluxo de trabalho.
-
Propagando o cluster do Aurora com os objetos de banco de dados necessários:
-
Crie a extensão pgvector, o esquema, a função e as tabelas necessárias para a base de conhecimento do Bedrock.
-
Registre um usuário de banco de dados com privilégios limitados para que o Bedrock interaja com o cluster.
-
-
Um banner de progresso será exibido durante todo o processo de provisionamento de recursos, permitindo que você acompanhe o status dos seguintes subeventos:
Criação do cluster do Aurora
Propagação do cluster do Aurora
Criação da base de conhecimento
O banner permanece visível até que a base de conhecimento seja totalmente criada, mesmo que você navegue para fora da página e retorne.
-
Você pode clicar em
View details
no banner de progresso para ver o status de cada etapa. Para obter mais informações sobre eventos durante a criação da base de conhecimento, escolha o link do CloudFormation na tela de exibição de detalhes. Quando o processo estiver concluído, sua nova base de conhecimento do Bedrock estará pronta para uso. -
Os IDs de pilha de todos os recursos de criação rápida podem ser encontrados nas tags da base de conhecimento do Bedrock, caso você precise referenciá-los.
Uma base de conhecimento do Bedrock, com a configuração para o cluster do Aurora recém-provisionado como armazenamento de vetores, é criada.
Benefícios do uso da criação rápida do Aurora
-
O processo de criação rápida baseado no CloudFormation reduz significativamente o tempo e a complexidade necessários para usar o Aurora como armazenamento de vetores.
-
O Aurora oferece excelente desempenho, escalabilidade de vetores e benefícios de custo com a capacidade de escalar para zero custos computacionais quando não está em uso.
-
O processo de criação rápida simplifica a experiência de ponta a ponta, permitindo que você crie e configure facilmente suas bases de conhecimento do Bedrock usando o Aurora.
-
Os clientes podem criar com base no modelo do CloudFormation para personalizar o provisionamento com suas próprias configurações.
Limitações do processo de criação rápida do Aurora
Com a opção de criação rápida do Aurora, o cluster de banco de dados é provisionado com configurações padrão. No entanto, essas configurações padrão podem não atender aos seus requisitos específicos ou ao caso de uso pretendido. A criação rápida não oferece opções para modificar as configurações durante o processo de provisionamento. As configurações são definidas automaticamente para agilizar a experiência de implantação. Se você precisar personalizar a configuração do cluster de banco de dados do Aurora, poderá fazer isso após a implantação inicial por criação rápida no console do Amazon RDS.
Embora o fluxo de criação rápida simplifique o processo de configuração, o tempo para criar o cluster de banco de dados do Aurora ainda é de aproximadamente 10 minutos, o mesmo de uma implantação manual. Isso se deve ao tempo necessário para provisionar a infraestrutura do Aurora.
A opção de criação rápida foi projetada para experimentação e configuração rápida. Os recursos criados por meio da criação rápida podem não ser adequados para uso em produção, e você não poderá migrá-los diretamente para um ambiente de produção na VPC.