Prerequisiti per l'utilizzo di un archivio vettoriale creato per una knowledge base - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Prerequisiti per l'utilizzo di un archivio vettoriale creato per una knowledge base

Per memorizzare gli incorporamenti vettoriali in cui vengono convertiti i tuoi documenti, utilizzi un archivio vettoriale. Amazon Bedrock Knowledge Bases supporta un flusso di creazione rapida per alcuni archivi vettoriali, quindi se preferisci che Amazon Bedrock crei automaticamente un indice vettoriale per te in uno di questi archivi vettoriali, salta questo prerequisito e procedi con. Crea una knowledge base collegandoti a una fonte di dati in Amazon Bedrock Knowledge Bases

Se desideri archiviare incorporamenti vettoriali binari anziché incorporamenti vettoriali standard a virgola mobile (float32), devi utilizzare un archivio vettoriale che supporti i vettori binari.

Nota

I cluster Amazon OpenSearch Serverless e Amazon OpenSearch Managed sono gli unici archivi vettoriali che supportano l'archiviazione di vettori binari.

Puoi configurare il tuo archivio vettoriale supportato per indicizzare la rappresentazione degli incorporamenti vettoriali dei tuoi dati. Crei campi per i seguenti dati:

  • Un campo per i vettori generati dal testo nella fonte di dati dal modello di incorporamento scelto.

  • Un campo per i blocchi di testo estratti dai file nella fonte di dati.

  • Campi per i metadati dei file di origine gestiti da Amazon Bedrock.

  • (Se utilizzi un database Amazon Aurora e desideri configurare il filtro sui metadati) Campi per i metadati che associ ai tuoi file sorgente. Se prevedi di configurare il filtro in altri archivi vettoriali, non devi configurare questi campi per il filtraggio.

Puoi crittografare gli archivi vettoriali di terze parti con una chiave KMS. Per ulteriori informazioni, vedere Crittografia delle risorse della knowledge base.

Seleziona la scheda corrispondente al servizio di archivio vettoriale che utilizzerai per creare il tuo indice vettoriale.

Nota

La scelta del modello di incorporamento e delle dimensioni vettoriali può influire sulle scelte disponibili negli archivi vettoriali. Se non riesci a utilizzare il tuo archivio vettoriale preferito, scegli le opzioni compatibili: il modello di incorporamento e le dimensioni vettoriali.

Amazon OpenSearch Serverless
  1. Per configurare le autorizzazioni e creare una raccolta di ricerca vettoriale in Amazon OpenSearch Serverless in AWS Management Console, segui i passaggi 1 e 2 in Lavorare con le raccolte di ricerca vettoriale nella Amazon OpenSearch Service Developer Guide. Tieni presente le seguenti considerazioni durante la configurazione della raccolta:

    1. Assegna alla collezione un nome e una descrizione a tua scelta.

    2. Per rendere privata la tua raccolta, seleziona Creazione standard nella sezione Sicurezza. Quindi, nella sezione Impostazioni di accesso alla rete, seleziona VPC come tipo di accesso e scegli un endpoint VPC. Per ulteriori informazioni sulla configurazione di un endpoint VPC per una raccolta Amazon Serverless, consulta Access Amazon OpenSearch OpenSearch Serverless using an interface endpoint ()AWS PrivateLink nella Amazon Service Developer Guide. OpenSearch

  2. Una volta creata la raccolta, prendi nota dell'ARN della collezione per quando crei la knowledge base.

  3. Nel riquadro di navigazione a sinistra, seleziona Raccolte in Serverless. Quindi seleziona la tua raccolta di ricerca vettoriale.

  4. Seleziona la scheda Indici. Quindi scegli Crea indice vettoriale.

  5. Nella sezione Dettagli dell'indice vettoriale, inserisci un nome per l'indice nel campo Nome dell'indice vettoriale.

  6. Nella sezione Campi vettoriali, scegli Aggiungi campo vettoriale. Amazon Bedrock memorizza gli incorporamenti vettoriali per la tua fonte di dati in questo campo. Fornisci le seguenti configurazioni:

    • Nome campo vettoriale: fornisci un nome per il campo (ad esempio,embeddings).

    • Motore: il motore vettoriale utilizzato per la ricerca. Seleziona faiss.

    • Dimensioni: il numero di dimensioni nel vettore. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore:

      Modello Dimensioni
      TitanIncorporamenti G1 - Testo 1.536
      TitanIncorporamenti V2 - Testo 1.024, 512 e 256
      CohereEmbedInglese 1,024
      CohereEmbedMultilingue 1,024
    • Metrica di distanza: la metrica utilizzata per misurare la similarità tra i vettori. Ti consigliamo di usare Euclidean per gli incorporamenti vettoriali a virgola mobile.

  7. Espandi la sezione Gestione dei metadati e aggiungi due campi per configurare l'indice vettoriale per archiviare metadati aggiuntivi che una knowledge base può recuperare con i vettori. La tabella seguente descrive i campi e i valori da specificare per ogni campo:

    Descrizione del campo Campo di mappatura Tipo di dati Filtrabile
    Amazon Bedrock suddividerà il testo non elaborato dai tuoi dati e li archivia in questo campo. Nome a tua scelta (ad esempio,) text Stringa True
    Amazon Bedrock archivia i metadati relativi alla tua knowledge base in questo campo. Nome a tua scelta (ad esempio,) bedrock-metadata Stringa False
  8. Prendi nota dei nomi che scegli per il nome dell'indice vettoriale, il nome del campo vettoriale e i nomi dei campi di mappatura per la gestione dei metadati per la creazione della knowledge base. Quindi, scegli Crea.

Dopo aver creato l'indice vettoriale, puoi procedere con la creazione della tua knowledge base. La tabella seguente riassume dove inserirete ogni informazione di cui avete preso nota.

Campo Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
ARN raccolta ARN raccolta Collezione ARN L'Amazon Resource Name (ARN) della raccolta di ricerca vettoriale.
Nome dell'indice vettoriale Nome dell'indice vettoriale vectorIndexName Il nome dell'indice vettoriale.
Nome del campo vettoriale Campo vettoriale Campo vettoriale Il nome del campo in cui archiviare gli incorporamenti vettoriali per le fonti di dati.
Gestione dei metadati (primo campo di mappatura) Campo di testo Campo di testo Il nome del campo in cui memorizzare il testo non elaborato dalle fonti di dati.
Gestione dei metadati (secondo campo di mappatura) Campo di metadati gestito da Bedrock Campo di metadati Il nome del campo in cui archiviare i metadati gestiti da Amazon Bedrock.

Per una documentazione più dettagliata sulla configurazione di un archivio vettoriale in Amazon OpenSearch Serverless, consulta Working with vector search collections nella Amazon OpenSearch Service Developer Guide.

Amazon OpenSearch Service Managed Clusters
Importante
  1. Per creare un dominio e un indice vettoriale in OpenSearch Cluster in the AWS Management Console, segui i passaggi descritti in Creazione e gestione dei domini di OpenSearch servizio nella Amazon OpenSearch Service Developer Guide.

    Tieni presente le seguenti considerazioni durante la configurazione del dominio:

    1. Assegna al dominio un nome a tua scelta.

    2. Ti consigliamo di utilizzare l'opzione Easy create per iniziare rapidamente a creare il tuo dominio.

      Nota

      Questa opzione ti offre un dominio con un throughput ridotto. Se hai carichi di lavoro più grandi che richiedono un throughput più elevato, scegli l'opzione Standard Create. Puoi regolare la capacità in un secondo momento, se necessario. Con questa opzione, puoi iniziare con la capacità più bassa, che può poi essere modificata in seguito, se necessario.

    3. Per Rete, devi scegliere Accesso pubblico. OpenSearch i domini che si trovano dietro un VPC non sono supportati per la tua Knowledge Base.

    4. Per la versione, se utilizzi incorporamenti vettoriali binari, Amazon Bedrock Knowledge Bases richiede una versione del motore 2.16 o successiva. Inoltre, è necessaria una versione 2.13 o successiva per creare un indice k-nn. Per ulteriori informazioni, consulta K-NN Search nella guida per sviluppatori di Amazon OpenSearch Service.

    5. Ti consigliamo di utilizzare la modalità Dual-stack.

    6. Ti consigliamo di abilitare il controllo granulare degli accessi per proteggere i dati del tuo dominio e di controllare ulteriormente le autorizzazioni che consentono al tuo ruolo di servizio della Knowledge Base di accedere al dominio ed effettuare richieste. OpenSearch

    7. Lascia tutte le altre impostazioni ai valori predefiniti e scegli Crea per creare il tuo dominio.

  2. Una volta creato il dominio, fai clic su di esso per prendere nota dell'ARN del dominio e dell'endpoint del dominio per quando crei la knowledge base.

  3. Dopo aver creato il dominio, puoi creare un indice vettoriale eseguendo i seguenti comandi su una OpenSearch dashboard o utilizzando i comandi curl. Per ulteriori informazioni, consulta la documentazione relativa ad OpenSearch .

    Quando si esegue il comando:

    • Fornisci un nome per il campo vettoriale (ad esempio,embeddings).

    • Assicurati che il vettore usato per la ricerca sia falso. nmslib non è supportato.

    • Per il numero di dimensioni nel vettore, fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore:

      Nota

      Il modello Titan V2 Embeddings - Text supporta più dimensioni. Può anche essere 256 o 512.

      Modello Dimensioni
      TitanIncorporamenti G1 - Testo 1.536
      TitanIncorporamenti V2 - Testo 1.024, 512 e 256
      CohereEmbedInglese 1,024
      CohereEmbedMultilingue 1,024
    • È possibile aggiungere due campi per configurare l'indice vettoriale per memorizzare metadati aggiuntivi che una knowledge base può recuperare con i vettori. La tabella seguente descrive i campi e i valori da specificare per ciascuno di essi.

      Descrizione del campo Campo di mappatura
      Amazon Bedrock suddividerà il testo non elaborato dai tuoi dati e li archivia in questo campo. Specificato come oggetto, ad esempio,. AMAZON_BEDROCK_TEXT_CHUNK
      Amazon Bedrock archivia i metadati relativi alla tua knowledge base in questo campo. Specificato come oggetto, ad esempio,. AMAZON_BEDROCK_METADATA
    PUT /<index-name> { "settings": { "index": { "knn": true } }, "mappings": { "properties": { "<vector-name>": { "type": "knn_vector", "dimension": <embedding-dimension>, "data_type": "binary", # Only needed for binary embeddings "space_type": "l2" | "hamming", # Use l2 for float embeddings and hamming for binary embeddings "method": { "name": "hnsw", "engine": "faiss", "parameters": { "ef_construction": 128, "m": 24 } } }, "AMAZON_BEDROCK_METADATA": { "type": "text", "index": "false" }, "AMAZON_BEDROCK_TEXT_CHUNK": { "type": "text", "index": "true" } } } }
  4. Prendi nota dell'ARN e dell'endpoint del dominio e dei nomi che scegli per il nome dell'indice vettoriale, il nome del campo vettoriale e i nomi dei campi di mappatura per la gestione dei metadati per quando crei la tua knowledge base.

Dopo aver creato l'indice vettoriale, puoi procedere con la creazione della tua knowledge base. La tabella seguente riassume dove inserirete ogni informazione di cui avete preso nota.

Campo Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
ARN del dominio ARN del dominio Dominio ARN L'Amazon Resource Name (ARN) del OpenSearch dominio.
Endpoint di dominio Endpoint di dominio DomainEndpoint L'endpoint per connettersi al dominio. OpenSearch
Nome dell'indice vettoriale Nome dell'indice vettoriale vectorIndexName Il nome dell'indice vettoriale.
Nome del campo vettoriale Campo vettoriale Campo vettoriale Il nome del campo in cui archiviare gli incorporamenti vettoriali per le fonti di dati.
Gestione dei metadati (primo campo di mappatura) Campo di testo Campo di testo Il nome del campo in cui memorizzare il testo non elaborato dalle fonti di dati.
Gestione dei metadati (secondo campo di mappatura) Campo di metadati gestito da Bedrock Campo di metadati Il nome del campo in cui archiviare i metadati gestiti da Amazon Bedrock.
Amazon S3 Vectors

Amazon S3 Vectors offre uno storage vettoriale conveniente in Amazon S3 che può essere utilizzato per archiviare e interrogare dati vettoriali. Fornisce uno storage durevole ed elastico di set di dati vettoriali di grandi dimensioni con prestazioni di query inferiori al secondo. Amazon S3 Vectors è ideale per carichi di lavoro di interrogazione poco frequenti e può aiutare a ridurre i costi se utilizzato in applicazioni di generazione aumentata di recupero (RAG) e di ricerca semantica.

Importante

L'integrazione di Amazon S3 Vectors con Amazon Bedrock Knowledge Bases è in versione di anteprima ed è soggetta a modifiche.

Amazon S3 Vectors introduce i bucket vettoriali S3, che possono essere interrogati in base al significato semantico e alla somiglianza. Può essere utilizzato per fornire tempi di risposta alle query inferiori al secondo e ridurre i costi archiviando, accedendo e interrogando dati vettoriali su larga scala senza dover fornire alcuna infrastruttura. All'interno di un bucket vettoriale, puoi organizzare i dati vettoriali all'interno di indici vettoriali. Il tuo bucket vettoriale può avere più indici vettoriali e ogni indice vettoriale può contenere milioni di vettori. Per ulteriori informazioni, consulta Amazon S3 Vectors nella Amazon S3 User Guide.

Nota

Puoi creare una knowledge base per Amazon S3 Vectors in tutti gli Regione AWS ambienti in cui sono disponibili sia Amazon Bedrock che Amazon S3 Vectors. Per informazioni sulla disponibilità regionale di Amazon S3 Vectors, consulta Amazon S3 Vectors nella Amazon S3 User Guide.

Supporto per i metadati

Dopo aver creato un indice vettoriale, quando si aggiungono dati vettoriali all'indice, è possibile allegare i metadati come coppie chiave-valore a ciascun vettore. Per impostazione predefinita, tutti i metadati allegati a un vettore sono filtrabili e possono essere utilizzati come filtri in una query di ricerca per similarità. I metadati filtrabili possono essere utilizzati per filtrare le query in entrata in base a una serie di condizioni, come date, categorie o preferenze dell'utente.

Puoi anche configurare i metadati in modo che non siano filtrabili durante la creazione dell'indice vettoriale. Gli indici vettoriali di Amazon S3 supportano i tipi di stringa, booleano e numero. Può supportare fino a un massimo di 40 KB di metadati per ogni vettore. All'interno di questi 40 KB di metadati, i metadati filtrabili possono contenere fino a un massimo di 2 KB per ogni vettore. Lo spazio filtrabile dei metadati può essere utilizzato per archiviare gli incorporamenti dopo la creazione della knowledge base.

Se i metadati superano uno di questi limiti, si verifica un errore durante la creazione dell'indice vettoriale. Per ulteriori informazioni, consulta Amazon S3 Vectors nella Amazon S3 User Guide.

Autorizzazioni richieste

Assicurati che la tua policy IAM consenta ad Amazon Bedrock di accedere al tuo indice vettoriale nel bucket vettoriale S3. Per ulteriori informazioni sulle autorizzazioni richieste, consulta Crea un ruolo di servizio per Amazon Bedrock Knowledge Bases.

Crea un bucket e un indice vettoriali S3

Per utilizzare Amazon S3 Vectors con la tua knowledge base, devi creare un bucket vettoriale S3 e un indice vettoriale. Puoi creare un bucket vettoriale e un indice utilizzando la console AWS CLI Amazon S3 o l'SDK. AWS Per istruzioni dettagliate, consulta Creare un indice vettoriale nella Guida per l'utente di Amazon S3.

Tieni presente le seguenti considerazioni quando crei il bucket vettoriale e l'indice nella console Amazon S3.

  1. Quando crei il tuo bucket vettoriale S3, prendi nota delle seguenti considerazioni.

    • Fornisci un nome univoco per il bucket Vector.

    • (Facoltativo) Amazon S3 crittograferà automaticamente i dati utilizzando la crittografia lato server predefinita con chiavi gestite di Amazon S3 (SSE-S3). Puoi scegliere se utilizzare invece questa crittografia predefinita o la crittografia lato server con chiavi del servizio di gestione delle chiavi (SSE-KMS). AWS

      Nota

      Il tipo di crittografia non può essere modificato una volta creato il bucket vettoriale.

      Per step-by-step istruzioni, consulta Crittografia con chiavi AWS KMS.

  2. Dopo aver creato il bucket vettoriale S3, prendi nota dell'Amazon Resource Name (ARN) del bucket vettoriale per quando crei la knowledge base.

  3. Scegli il bucket vettoriale che hai creato, quindi crea un indice vettoriale. Quando crei l'indice vettoriale, prendi nota delle seguenti considerazioni.

    • Nome dell'indice vettoriale: fornite un nome per il campo (ad esempio,). embeddings

    • Dimensione: il numero di dimensioni nel vettore. Le dimensioni devono avere un valore compreso tra 1 e 4096. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore in base alla selezione del modello di incorporamento:

      Modello Dimensioni
      TitanIncorporamenti G1 - Testo 1.536
      TitanIncorporamenti V2 - Testo 1.024, 512 e 256
      CohereEmbedInglese 1,024
      CohereEmbedMultilingue 1,024
    • Nota

      Amazon S3 Vectors supporta solo gli incorporamenti a virgola mobile. Gli incorporamenti binari non sono supportati.

      Metrica di distanza: la metrica utilizzata per misurare la similarità tra i vettori. Puoi usare Cosine o Euclidean.

  4. Espandi le impostazioni aggiuntive e fornisci tutti i metadati non filtrabili nel campo Metadati non filtrabili.

    Nota

    Se prevedi che i blocchi di testo superino lo spazio di metadati di 2 KB, ti consigliamo di aggiungere il campo di testo come chiave di metadati non filtrabile. AMAZON_BEDROCK_TEXT La tua knowledge base utilizzerà questo campo per memorizzare i blocchi di testo.

    Puoi configurare fino a un massimo di 10 chiavi di metadati non filtrabili. Scegli Aggiungi chiave, quindi aggiungi AMAZON_BEDROCK_TEXT come chiave.

  5. Crea l'indice vettoriale e prendi nota dell'Amazon Resource Name (ARN) dell'indice vettoriale per quando crei la knowledge base.

Crea una knowledge base per il bucket vettoriale S3

Dopo aver raccolto queste informazioni, puoi procedere con la creazione della tua knowledge base. Quando crei la tua knowledge base con il bucket vettoriale S3, dovrai fornire l'ARN del bucket vettoriale e l'indice vettoriale. L'indice vettoriale memorizzerà gli incorporamenti generati dalle tue fonti di dati. La tabella seguente riassume dove inserire ogni informazione:

Campo Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
Secchio vettoriale ARN Secchio vettoriale S3 ARN vectorBucketArn L'Amazon Resource Name (ARN) del tuo bucket vettoriale S3.
Indice vettoriale ARN Indice vettoriale S3 ARN Indice vettoriale ARN L'Amazon Resource Name (ARN) dell'indice vettoriale per il tuo bucket vettoriale S3.
Amazon Aurora (RDS)
  1. Crea un cluster, uno schema e una tabella di database Amazon Aurora (DB) seguendo i passaggi descritti in Usare Aurora PostgreSQL come knowledge base. Quando crei la tabella, configurala con le seguenti colonne e tipi di dati. Puoi utilizzare i nomi delle colonne che preferisci anziché quelli elencati nella tabella seguente. Prendi nota dei nomi delle colonne che scegli in modo da poterli fornire durante la configurazione della knowledge base.

    È necessario fornire questi campi prima di creare la knowledge base. Non possono essere aggiornati una volta creata la knowledge base.

    Importante

    Il cluster Aurora deve risiedere nello stesso in cui viene Account AWS creata la knowledge base per Amazon Bedrock.

    Nome colonna Tipo di dati Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
    id UUID (chiave primaria) Chiave primaria primaryKeyField Contiene identificatori univoci per ogni record.
    incorporamento Vettore Campo vettoriale vectorField Contiene gli incorporamenti vettoriali delle origini dati.
    pezzi Testo Campo di testo textField Contiene i blocchi di testo non elaborato provenienti dalle origini dati.
    metadata JSON campo di metadati gestito da Bedrock metadataField Contiene i metadati necessari per eseguire l'attribuzione dell'origine e per consentire l'importazione dei dati e l'interrogazione
    metadati personalizzati JSONB Campo di metadati personalizzato customMetadataField Campo facoltativo che indica la colonna in cui Amazon Bedrock scriverà tutte le informazioni di qualsiasi file di metadati dalle tue fonti di dati.
  2. È necessario creare un indice sulle colonne, sul vettore e sul testo per i campi di testo e di incorporamento. Se utilizzi il campo di metadati personalizzato, devi anche creare un indice GIN su questa colonna. Gli indici GIN possono essere utilizzati per cercare in modo efficiente coppie chiave-valore nei documenti jsonb per il filtraggio dei metadati. Per ulteriori informazioni, consulta l'indicizzazione jsonb nella documentazione di PostgreSQL.

    Nome colonna Crea indice su Obbligatorio?
    vettoriale CREATE INDEX ON bedrock_integration.bedrock_kb USING hnsw (embedding vector_cosine_ops);
    text CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (to_tsvector('simple', chunks));
    metadati personalizzati CREATE INDEX ON bedrock_integration.bedrock_kb USING gin (custom_metadata); Solo se hai creato la colonna di metadati personalizzata.
  3. (Facoltativo) Se hai aggiunto metadati ai tuoi file per filtrarli, ti consigliamo di fornire il nome della colonna nel campo dei metadati personalizzato per archiviare tutti i metadati in un'unica colonna. Durante l'inserimento dei dati, questa colonna verrà popolata con tutte le informazioni contenute nei file di metadati delle tue fonti di dati. Se scegli di fornire questo campo, devi creare un indice GIN su questa colonna.

    Nota

    Se utilizzi spesso filtri di intervallo sui metadati numerici, per ottimizzare le prestazioni, crea un indice per la chiave specifica. Ad esempio, se utilizzi filtri come"lessThan": { "key": "year", "value": 1989 }, crea un indice di espressione sulla year chiave. Per ulteriori informazioni, consulta Indici sulle espressioni nella documentazione di PostgreSQL.

    CREATE INDEX ON your_table ((custom_metadata->>'year')::double precision

    In alternativa, se non fornisci questo nome di campo, puoi creare una colonna per ogni attributo di metadati nei tuoi file e specificare il tipo di dati (testo, numero o booleano). Ad esempio, se l'attributo genre esiste nell'origine dati, è necessario aggiungere una colonna denominata genre e specificare text come tipo di dati. Durante l'inserimento dei dati, queste colonne separate verranno popolate con i valori degli attributi corrispondenti.

  4. Configura un AWS Secrets Manager segreto per il tuo cluster Aurora DB seguendo i passaggi descritti in Gestione delle password con Amazon Aurora e. AWS Secrets Manager

  5. Prendi nota delle seguenti informazioni dopo aver creato il cluster di database e impostato il segreto.

    Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
    Cluster di database Amazon Aurora resourceArn L'ARN del cluster di database.
    Nome del database databaseName Il nome del tuo database
    Nome tabella tableName Il nome della tabella nel cluster di database
    ARN del segreto credentialsSecretArn L'ARN della AWS Secrets Manager chiave per il tuo cluster DB
Neptune Analytics graphs (GraphRAG)
  1. Per creare un grafico e un archivio vettoriale in Neptune Analytics in, segui i passaggi descritti in AWS Management ConsoleIndicizzazione vettoriale in Neptune Analytics nella Guida per l'utente di Neptune Analytics.

    Nota

    Per utilizzare Neptune GraphRag, crea un grafico di Neptune Analytics vuoto con un indice di ricerca vettoriale. L'indice di ricerca vettoriale può essere creato solo quando viene creato il grafico. Quando crei un grafico di Neptune Analytics nella console, specifichi la dimensione dell'indice nelle impostazioni di ricerca vettoriale verso la fine del processo.

    Tieni presente le seguenti considerazioni durante la creazione del grafico:

    1. Assegna al grafico un nome a tua scelta.

    2. In Origine dati, scegli Crea grafico vuoto e specifica il numero di m- NCUs da allocare. Ogni m-NCU dispone di circa un GiB di capacità di memoria e di elaborazione e rete corrispondenti.

      Nota

      La capacità del grafico può essere modificata in un secondo momento. Ti consigliamo di iniziare con l'istanza più piccola e successivamente di sceglierne un'altra, se necessario.

    3. Puoi lasciare le impostazioni di connettività di rete predefinite. Amazon Bedrock creerà una connessione di rete al grafico di Neptune Analytics a cui associ la knowledge base. Non è necessario configurare la connettività pubblica o gli endpoint privati per il grafico.

    4. In Impostazioni di ricerca vettoriale, scegli Usa dimensione vettoriale e specifica il numero di dimensioni in ogni vettore.

      Nota

      Il numero di dimensioni in ogni vettore deve corrispondere alle dimensioni vettoriali nel modello di incorporamento. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore:

      Modello Dimensioni
      TitanIncorporamenti G1 - Testo 1.536
      TitanIncorporamenti V2 - Testo 1.024, 512 e 256
      CohereEmbedInglese 1,024
      CohereEmbedMultilingue 1,024
    5. Lascia tutte le altre impostazioni ai valori predefiniti e crea il grafico.

  2. Una volta creato il grafico, fate clic su di esso per prendere nota delle dimensioni Resource ARN e Vector per quando create la knowledge base. Quando scegli il modello di incorporamento in Amazon Bedrock, assicurati di scegliere un modello con le stesse dimensioni delle dimensioni vettoriali che hai configurato sul tuo grafico di Neptune Analytics.

Dopo aver creato l'indice vettoriale, puoi procedere con la creazione della tua knowledge base. La tabella seguente riassume dove inserirete ogni informazione di cui avete preso nota.

Campo Campo corrispondente nella configurazione della knowledge base (Console) Campo corrispondente nella configurazione della knowledge base (API) Descrizione
Grafico ARN Grafico di Neptune Analytics (ARN) Grafico ARN L'Amazon Resource Name (ARN) del grafico di Neptune Analytics.
Gestione dei metadati (primo campo di mappatura) Nome del campo di testo Campo di testo Il nome del campo in cui memorizzare il testo non elaborato dalle fonti di dati. Puoi fornire qualsiasi valore per questo campo, ad esempio testo.
Gestione dei metadati (secondo campo di mappatura) Campo di metadati gestito da Bedrock Campo di metadati Il nome del campo in cui archiviare i metadati gestiti da Amazon Bedrock. Puoi fornire qualsiasi valore per questo campo, ad esempio metadati.
Pinecone
Nota

Se lo utilizziPinecone, accetti di autorizzare l'accesso AWS alla fonte di terze parti designata per tuo conto al fine di fornirti i servizi di archiviazione vettoriale. Sei responsabile di rispettare tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale inPinecone, consulta Pinecone come knowledge base per Amazon Bedrock.

Mentre configuri l'archivio vettoriale, prendi nota delle informazioni seguenti, da inserire al momento della creazione di una knowledge base:

  • URL dell'endpoint: l'URL dell'endpoint per la pagina di gestione dell'indice.

  • ARN segreto delle credenziali: l'Amazon Resource Name (ARN) del segreto che hai creato AWS Secrets Manager e che contiene il nome utente e la password per un utente del database.

  • (Facoltativo) Chiave KMS gestita dal cliente per l'ARN segreto delle credenziali: se hai crittografato l'ARN segreto delle credenziali, fornisci la chiave KMS in modo che Amazon Bedrock possa decrittografarla.

  • Spazio dei nomi: (Facoltativo) Lo spazio dei nomi da utilizzare per scrivere nuovi dati nel database. Per ulteriori informazioni, consulta Utilizzo degli spazi dei nomi.

Esistono configurazioni aggiuntive che è necessario fornire durante la creazione di un indice: Pinecone

  • Nome del campo di testo: il nome del campo in cui Amazon Bedrock deve archiviare il testo non elaborato.

  • Nome del campo di metadati: il nome del campo in cui Amazon Bedrock deve archiviare i metadati di attribuzione di origine.

Per accedere al tuo Pinecone indice, devi fornire la tua chiave Pinecone API ad Amazon Bedrock tramite. AWS Secrets Manager

Per impostare un segreto per la tua Pinecone configurazione
  1. Segui la procedura descritta in Crea un AWS Secrets Manager segreto, impostando la chiave come chiave apiKey e il valore come chiave API per accedere all'Pineconeindice.

  2. Per trovare la chiave API, apri la console Pinecone e seleziona API Keys.

  3. Dopo aver creato il segreto, prendi nota dell'ARN della chiave KMS.

  4. Allega le autorizzazioni al tuo ruolo di servizio per decrittare l'ARN della chiave KMS seguendo la procedura riportata in Autorizzazioni per decrittografare un AWS Secrets Manager segreto per l'archivio vettoriale contenente la tua knowledge base.

  5. Successivamente, quando crei la knowledge base, inserisci l'ARN nel campo ARN del segreto delle credenziali.

Redis Enterprise Cloud
Nota

Se utilizziRedis Enterprise Cloud, accetti di autorizzare l'accesso AWS alla fonte di terze parti designata per tuo conto al fine di fornirti i servizi di vector store. Sei responsabile del rispetto di tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale inRedis Enterprise Cloud, consulta Integrazione con Redis Enterprise Cloud Amazon Bedrock.

Mentre configuri l'archivio vettoriale, prendi nota delle informazioni seguenti, da inserire al momento della creazione di una knowledge base:

  • URL dell'endpoint: l'URL pubblico dell'endpoint per il tuo database.

  • Nome dell'indice vettoriale: il nome dell'indice vettoriale del database.

  • Campo vettoriale: il nome del campo in cui verranno archiviati gli incorporamenti vettoriali. Fate riferimento alla tabella seguente per determinare quante dimensioni deve contenere il vettore.

    Modello Dimensioni
    TitanIncorporamenti G1 - Testo 1.536
    TitanIncorporamenti V2 - Testo 1.024, 512 e 256
    CohereEmbedInglese 1,024
    CohereEmbedMultilingue 1,024
  • Campo di testo: il nome del campo in cui Amazon Bedrock archivia i blocchi di testo non elaborato.

  • Campo di metadati gestito da Bedrock: il nome del campo in cui Amazon Bedrock archivia i metadati relativi alla tua knowledge base.

Per accedere al tuo Redis Enterprise Cloud cluster, devi fornire la tua configurazione Redis Enterprise Cloud di sicurezza ad Amazon Bedrock tramite. AWS Secrets Manager

Per impostare un segreto per la tua Redis Enterprise Cloud configurazione
  1. Consenti al protocollo TLS di utilizzare il tuo database con Amazon Bedrock seguendo i passaggi descritti in Transport Layer Security (TLS).

  2. Segui la procedura descritta in Creare un AWS Secrets Manager segreto. Imposta le seguenti chiavi con i valori appropriati della tua Redis Enterprise Cloud configurazione nel segreto:

    • username— Il nome utente per accedere al Redis Enterprise Cloud database. Per trovare il nome utente, consulta la sezione Security del tuo database nella console Redis.

    • password— La password per accedere al Redis Enterprise Cloud database. Per trovare la password, consulta la sezione Security del tuo database nella console Redis.

    • serverCertificate: i contenuti del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

    • clientPrivateKey: la chiave privata del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

    • clientCertificate: la chiave pubblica del certificato rilasciato dall'autorità di certificazione Redis Cloud. Scarica il certificato del server dalla console di amministrazione Redis seguendo i passaggi in Download dei certificati.

  3. Dopo aver creato il segreto, prendi nota del relativo ARN. Successivamente, quando crei la knowledge base, inserisci l'ARN nel campo ARN del segreto delle credenziali.

MongoDB Atlas
Nota

Se utilizzi MongoDB Atlas, accetti di AWS autorizzare l'accesso alla fonte di terze parti designata per tuo conto al fine di fornirti servizi di archiviazione vettoriale. Sei responsabile di rispettare tutti i termini di terze parti applicabili all'uso e al trasferimento dei dati dal servizio di terze parti.

Per una documentazione dettagliata sulla configurazione di un archivio vettoriale in MongoDB Atlas, consulta Avvio di un flusso di lavoro RAG completamente gestito con MongoDB Atlas e Amazon Bedrock.

Quando configuri il vector store, prendi nota delle seguenti informazioni che aggiungerai quando creerai una knowledge base:

  • URL dell'endpoint: l'URL dell'endpoint del cluster MongoDB Atlas.

  • Nome del database: il nome del database nel cluster MongoDB Atlas.

  • Nome della raccolta: il nome della raccolta nel database.

  • ARN segreto delle credenziali: l'Amazon Resource Name (ARN) del segreto che hai creato AWS Secrets Manager e che contiene il nome utente e la password per un utente del database nel tuo cluster MongoDB Atlas.

  • (Facoltativo) Chiave KMS gestita dal cliente per l'ARN segreto delle credenziali: se hai crittografato l'ARN segreto delle credenziali, fornisci la chiave KMS in modo che Amazon Bedrock possa decrittografarla.

Esistono configurazioni aggiuntive per la mappatura dei campi che è necessario fornire durante la creazione di un indice MongoDB Atlas:

  • Nome dell'indice vettoriale: il nome dell'indice di ricerca vettoriale MongoDB Atlas nella tua raccolta.

  • Nome campo vettoriale: il nome del campo in cui Amazon Bedrock deve archiviare gli incorporamenti vettoriali.

  • Nome del campo di testo: il nome del campo in cui Amazon Bedrock deve archiviare il testo non elaborato.

  • Nome del campo di metadati: il nome del campo in cui Amazon Bedrock deve archiviare i metadati di attribuzione di origine.

  • (Facoltativo) Nome dell'indice di ricerca testuale: il nome dell'indice MongoDB Atlas Search nella tua raccolta.

(Facoltativo) Per connettere Amazon Bedrock al tuo cluster MongoDB Atlas, consulta il flusso di lavoro RAG AWS PrivateLink con MongoDB Atlas utilizzando Amazon Bedrock.