Creazione rapida di una Knowledge Base per Amazon Bedrock di Aurora PostgreSQL - Amazon Aurora

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione rapida di una Knowledge Base per Amazon Bedrock di Aurora PostgreSQL

Il flusso di lavoro della generazione potenziata da recupero dati (RAG) di Amazon Bedrock si basa su dati vettoriali memorizzati in un database Aurora PostgreSQL per potenziare il recupero dei contenuti. In precedenza, la configurazione di Aurora PostgreSQL come archivio dati vettoriale per le Knowledge Base per Bedrock era un processo in più fasi, che richiedeva numerose azioni manuali su diverse interfacce utente. Ciò ha reso difficile per i data scientist e gli sviluppatori sfruttare Aurora per i progetti Bedrock.

Per migliorare l’esperienza utente, AWS ha creato una nuova opzione di creazione rapida basata su CloudFormation che semplifica il processo di configurazione. Con la creazione rapida di, ora è possibile effettuare il provisioning di un cluster di database Aurora PostgreSQL preconfigurato come archivio vettoriale per le Knowledge Base per Amazon Bedrock con un solo clic.

Regioni e versioni supportate di Aurora PostgreSQL

L’opzione di creazione rapida di Aurora è disponibile in tutte le Regioni AWS che supportano le Knowledge Base per Amazon Bedrock. Per impostazione predefinita, crea un cluster di database Aurora PostgreSQL con versione 15.7. Per ulteriori informazioni sulle Regioni supportate, consulta Supported models and regions for Amazon Bedrock Knowledge Bases.

Informazioni sul processo di creazione rapida

Il processo di creazione rapida effettua automaticamente il provisioning delle seguenti risorse per configurare un database Amazon Aurora PostgreSQL come archivio dati vettoriale per la Knowledge Base per Amazon Bedrock:

Un cluster di database Aurora PostgreSQL nel proprio account, configurato con impostazioni predefinite.

  • Le unità di capacità Aurora (ACU, Aurora Capacity Units) sono impostate da 0 a 16. Ciò consente di ridurre verticalmente fino a zero l’archivio vettoriale quando non è in uso, risparmiando sui costi di elaborazione. Le ACU possono essere modificate in un secondo momento nella console Amazon RDS.

  • Indice HNSW (Hierarchical Navigable Small World) che utilizza la distanza euclidea come misura di somiglianza per gli embedding vettoriali Bedrock memorizzati in Aurora.

  • L’istanza database è un’istanza serverless v2.

  • Il cluster è associato al VPC e alle sottoreti predefiniti e ha l’API dati RDS abilitata.

  • Le credenziali di amministratore del cluster sono gestite da AWS Secrets Manager.

Oltre alle impostazioni predefinite, vengono configurate automaticamente le seguenti impostazioni. Durante il processo, verranno visualizzate delle schermate che spiegano il flusso di lavoro.

  • L’inizializzazione del cluster Aurora con gli oggetti di database necessari:

    • Creare l’estensione pgvector, lo schema, il ruolo e le tabelle necessari per la Knowledge Base per Bedrock.

    • Registra un utente del database con privilegi limitati per consentire a Bedrock di interagire con il cluster.

  • Durante tutto il processo di provisioning delle risorse verrà visualizzato un banner di avanzamento, che consente di tenere traccia dello stato dei seguenti eventi secondari:

    • Creazione dei cluster Aurora

    • Inizializzazione del cluster Aurora

    • Creazione della Knowledge Base

    Il banner rimane visibile fino alla creazione completa della knowledge base, anche se si esce dalla pagina e si torna indietro.

  • È possibile fare clic su View details nel banner di avanzamento per visualizzare lo stato di ogni passaggio. Per ulteriori informazioni sugli eventi durante la creazione della knowledge base, scegliere il link CloudFormation nella schermata di visualizzazione dei dettagli. Una volta completato il processo, la nuova Knowledge Base per Bedrock sarà pronta per l’uso.

  • Gli ID dello stack per tutte le risorse di creazione rapida sono disponibili nei tag della Knowledge Base per Bedrock, nel caso in cui fosse necessario farvi riferimento.

Viene creata una Knowledge Base per Bedrock, con la configurazione del cluster Aurora di cui è stato appena effettuato il provisioning come archivio vettoriale.

Vantaggi dell’utilizzo della creazione rapida Aurora

  • Il processo di creazione rapida basato su CloudFormation riduce significativamente il tempo e la complessità necessari per utilizzare Aurora come archivio vettoriale.

  • Aurora offre prestazioni eccellenti, scalabilità vettoriale e vantaggi in termini di costi con la possibilità di scalare fino a zero i costi di elaborazione quando non viene utilizzato.

  • Il processo di creazione rapida semplifica l’esperienza end-to-end, consentendo di creare e configurare facilmente le Knowledge Base per Bedrock utilizzando Aurora.

  • I clienti possono basarsi sul modello CloudFormation per personalizzare il provisioning con le proprie configurazioni.

Limitazioni del processo di creazione rapida Aurora

  • Con l’opzione di creazione rapida Aurora, viene effettuato il provisioning del cluster di database con le configurazioni predefinite. Tuttavia, queste impostazioni predefinite potrebbero non soddisfare i requisiti specifici o il caso d’uso previsto. La creazione rapida non offre opzioni per modificare le configurazioni durante il processo di provisioning. Le configurazioni vengono impostate automaticamente per semplificare l’esperienza di implementazione. Se è necessario personalizzare la configurazione del cluster di database Aurora, è possibile farlo dopo l’implementazione iniziale tramite la creazione rapida nella console Amazon RDS.

  • Sebbene il flusso di creazione rapida semplifica il processo di configurazione, il tempo necessario per creare il cluster di database Aurora è ancora di circa 10 minuti, lo stesso di un’implementazione manuale. Ciò è dovuto al tempo necessario per effettuare il provisioning dell’infrastruttura Aurora.

  • L’opzione di creazione rapida è progettata per la sperimentazione e la configurazione rapida. Le risorse create tramite la creazione rapida potrebbero non essere adatte all’uso in produzione e non sarà possibile migrarle direttamente in un ambiente di produzione nel proprio VPC.