Amazon RDS/Aurora - Amazon Kendra

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon RDS/Aurora

È possibile indicizzare i documenti archiviati in un database utilizzando un'origine dati del database. Dopo aver fornito le informazioni di connessione per il database, Amazon Kendra collega e indicizza i documenti.

Amazon Kendra supporta i seguenti database:

  • Amazon Aurora MySQL

  • Amazon Aurora PostgreSQL

  • Amazon RDS per MySQL

  • Amazon RDS per PostgreSQL

Nota

I database Aurora serverless non sono supportati.

Importante

È previsto che questo RDS/Aurora connettore Amazon diventi obsoleto entro la fine del 2023.

Amazon Kendra ora supporta nuovi connettori per sorgenti dati del database. Per una migliore esperienza, ti consigliamo di scegliere tra i seguenti nuovi connettori per il tuo caso d'uso:

Puoi connetterti Amazon Kendra alla fonte di dati del tuo database utilizzando la Amazon Kendra console e l'DatabaseConfigurationAPI.

Per la risoluzione dei problemi relativi al connettore di origine dati del Amazon Kendra database, consultaRisoluzione dei problemi relativi alle origini dati.

Funzionalità supportate

Amazon Kendra il connettore di origine dati del database supporta le seguenti funzionalità:

  • mappature dei campi

  • Filtraggio del contesto utente

  • Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare l'origine dati del database, apporta queste modifiche al database e AWS agli account.

Nel tuo database, assicurati di avere:

  • Hai annotato le credenziali di autenticazione di base relative al nome utente e alla password per il database.

  • Ha copiato il nome host, il numero di porta, l'indirizzo host, il nome del database e il nome della tabella di dati che contiene i dati del documento. Per PostgreSQL, la tabella dati deve essere una tabella pubblica o uno schema pubblico.

    Nota

    L'host e la porta indicano Amazon Kendra dove trovare il server del database su Internet. Il nome del database e il nome della tabella indicano Amazon Kendra dove trovare i dati del documento sul server del database.

  • Ha copiato i nomi delle colonne nella tabella di dati che contengono i dati del documento. È necessario includere l'ID del documento, il corpo del documento, le colonne per rilevare se un documento è stato modificato (ad esempio, l'ultima colonna aggiornata) e le colonne facoltative della tabella di dati mappate a campi indice personalizzati. È inoltre possibile mappare qualsiasi nome di campo Amazon Kendra riservato a una colonna della tabella.

  • Ha copiato le informazioni sul tipo di motore di database, ad esempio se si utilizza Amazon RDS per MySQL o un altro tipo.

  • Selezionato, ogni documento è unico nel database e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che desideri utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. IDs I documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuo Account AWS, assicurati di avere:

  • Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.

  • Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

    Nota

    Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.

  • Ha archiviato le credenziali di autenticazione del database in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti l'origine dati del database a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connettersi Amazon Kendra all'origine dati del database, è necessario fornire i dettagli necessari sull'origine dati del database in modo che sia Amazon Kendra possibile accedere ai dati. Se non hai ancora configurato il database per Amazon Kendra, vediPrerequisiti.

Console

Per connettersi Amazon Kendra a un database

  1. Accedere a AWS Management Console e aprire la Amazon Kendra console.

  2. Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

    Nota

    Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.

  3. Nella pagina Guida introduttiva, scegli Aggiungi origine dati.

  4. Nella pagina Aggiungi origine dati, scegli Connettore database, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il connettore del database con il tag «V2.0".

  5. Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:

    1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.

    2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per la tua fonte di dati.

    3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.

    4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS

    5. Scegli Next (Successivo).

  6. Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:

    1. Endpoint: un nome host DNS, un IPv4 indirizzo o un indirizzo. IPv6

    2. Porta: un numero di porta.

    3. Database: nome del database.

    4. Nome della tabella: nome della tabella.

    5. Per Tipo di autenticazione, scegli tra Esistente e Nuovo per memorizzare le credenziali di autenticazione del database. Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.

      1. Inserisci le seguenti informazioni nella finestra Crea un AWS Secrets Manager segreto:

        1. Nome segreto: un nome per il tuo segreto. Il prefisso 'AmazonKendra-database-' viene aggiunto automaticamente al nome segreto.

        2. Per nome utente e password: inserisci i valori delle credenziali di autenticazione dal tuo account di database.

        3. Scegli Salva autenticazione.

    6. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.

      Nota

      È necessario utilizzare una sottorete privata. Se l'istanza RDS si trova in una sottorete pubblica del VPC, è possibile creare una sottorete privata con accesso in uscita a un gateway NAT nella sottorete pubblica. Le sottoreti fornite nella configurazione VPC devono trovarsi negli Stati Uniti occidentali (Oregon), negli Stati Uniti orientali (Virginia settentrionale) e nell'UE (Irlanda).

    7. IAM ruolo: scegli un IAM ruolo esistente o creane uno nuovo per accedere alle credenziali del IAM repository e indicizzare il contenuto.

      Nota

      IAM i ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.

    8. Scegli Next (Successivo).

  7. Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:

    1. Scegli tra Aurora MySQL, MySQL, Aurora PostgreSQL e PostgreSQL in base al tuo caso d'uso.

    2. Racchiudi gli identificatori SQL tra virgolette: seleziona per racchiudere gli identificatori SQL tra virgolette doppie. Ad esempio, «columnName».

    3. Colonna ACL e colonne di rilevamento delle modifiche: configura le colonne Amazon Kendra utilizzate per il rilevamento delle modifiche (ad esempio, l'ultima colonna aggiornata) e l'elenco di controllo degli accessi.

    4. In Sync run schedule, per Frequenza: scegli la frequenza con cui eseguire la sincronizzazione con la Amazon Kendra tua fonte di dati.

    5. Scegli Next (Successivo).

  8. Nella pagina Imposta mappature dei campi, inserisci le seguenti informazioni:

    1. Amazon Kendra mappature di campo predefinite: seleziona uno dei campi di origine dati predefiniti Amazon Kendra generati che desideri mappare all'indice. È necessario aggiungere i valori delle colonne del database per e document_id document_body

    2. Mappature personalizzate dei campi: per aggiungere campi di origine dati personalizzati per creare un nome di campo indice a cui mappare e il tipo di dati del campo.

    3. Scegli Next (Successivo).

  9. Nella pagina Rivedi e crea, verifica che le informazioni inserite siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a un database

È necessario specificare quanto segue l'DatabaseConfigurationAPI:

  • ColumnConfiguration—Informazioni su dove l'indice deve ottenere le informazioni sul documento dal database. Per ulteriori dettagli, consulta ColumnConfiguration. È necessario specificare i campi DocumentDataColumnName (corpo del documento o testo principale) eDocumentIdColumnName, e ChangeDetectingColumn (ad esempio, ultima colonna aggiornata). La colonna mappata al DocumentIdColumnName campo deve essere una colonna intera. L'esempio seguente mostra una semplice configurazione di colonne per un'origine dati del database:

    "ColumnConfiguration": { "ChangeDetectingColumns": [ "LastUpdateDate", "LastUpdateTime" ], "DocumentDataColumnName": "TextColumn", "DocumentIdColumnName": "IdentifierColumn", "DocoumentTitleColumnName": "TitleColumn", "FieldMappings": [ { "DataSourceFieldName": "AbstractColumn", "IndexFieldName": "Abstract" } ] }
  • ConnectionConfiguration—Informazioni di configurazione necessarie per connettersi a un database. Per ulteriori dettagli, consulta ConnectionConfiguration.

  • DatabaseEngineType—Il tipo di motore di database che esegue il database. Il DatabaseHost campo per ConnectionConfiguration deve essere l'endpoint dell'istanza Amazon Relational Database Service (Amazon RDS) per il database. Non utilizzare l'endpoint del cluster.

  • Secret Amazon Resource Name (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione per il tuo account di database. Il segreto è archiviato in una struttura JSON con le seguenti chiavi:

    { "username": "user name", "password": "password" }

    L'esempio seguente mostra una configurazione del database, incluso l'ARN segreto.

    "DatabaseConfiguration": { "ConnectionConfiguration": { "DatabaseHost": "host.subdomain.domain.tld", "DatabaseName": "DocumentDatabase", "DatabasePort": 3306, "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name", "TableName": "DocumentTable" } }
    Nota

    Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. Fornisci solo il livello di accesso necessario per la tua sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

  • IAM ruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare il pubblico richiesto APIs per il connettore del database e. Amazon Kendra Per ulteriori informazioni, consulta IAM i ruoli per le fonti di dati del database.

Puoi anche aggiungere le seguenti funzionalità opzionali:

  • Virtual Private Cloud (VPC): specifica VpcConfiguration come parte della configurazione dell'origine dati. Vedi Configurazione Amazon Kendra per l'uso di un VPC.

    Nota

    È necessario utilizzare solo una sottorete privata. Se l'istanza RDS si trova in una sottorete pubblica del VPC, è possibile creare una sottorete privata con accesso in uscita a un gateway NAT nella sottorete pubblica. Le sottoreti fornite nella configurazione VPC devono trovarsi negli Stati Uniti occidentali (Oregon), negli Stati Uniti orientali (Virginia settentrionale) e nell'UE (Irlanda).

  • Mappature dei campi: scegli di mappare i campi delle sorgenti dati del database ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

    Nota

    Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra eseguire la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.

  • Filtraggio del contesto utente e controllo degli accessi:Amazon Kendra esegue la scansione dell'elenco di controllo degli accessi (ACL) dei documenti, se disponi di un ACL per i documenti. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.