Funzionalità supportate Prerequisiti Istruzioni di connessione

Amazon RDS/Aurora

È possibile indicizzare i documenti archiviati in un database utilizzando un'origine dati del database. Dopo aver fornito le informazioni di connessione per il database, Amazon Kendra collega e indicizza i documenti.

Amazon Kendrasupporta i seguenti database:

Amazon Aurora MySQL
Amazon Aurora PostgreSQL
Amazon RDSper MySQL
Amazon RDSper PostgreSQL

Nota

I database Aurora serverless non sono supportati.

Importante

È previsto che questo RDS/Aurora connettore Amazon diventi obsoleto entro la fine del 2023.

Amazon Kendraora supporta nuovi connettori per sorgenti dati del database. Per una migliore esperienza, ti consigliamo di scegliere tra i seguenti nuovi connettori per il tuo caso d'uso:

Puoi connetterti Amazon Kendra alla fonte di dati del tuo database utilizzando la Amazon Kendraconsole e l'DatabaseConfigurationAPI.

Per la risoluzione dei problemi relativi al connettore di origine dati del Amazon Kendra database, consultaRisoluzione dei problemi relativi alle origini dati.

Funzionalità supportate

Amazon Kendrail connettore di origine dati del database supporta le seguenti funzionalità:

Mappature dei campi
filtraggio del contesto utente
Virtual Private Cloud (VPC) (Cloud privato virtuale (VPC)

Prerequisiti

Prima di poterla utilizzare Amazon Kendra per indicizzare l'origine dati del database, apporta queste modifiche al database e AWS agli account.

Nel tuo database, assicurati di avere:

Hai annotato le credenziali di autenticazione di base relative al nome utente e alla password per il database.
Ha copiato il nome host, il numero di porta, l'indirizzo host, il nome del database e il nome della tabella di dati che contiene i dati del documento. Per PostgreSQL, la tabella dati deve essere una tabella pubblica o uno schema pubblico.

Nota
L'host e la porta indicano Amazon Kendra dove trovare il server del database su Internet. Il nome del database e il nome della tabella indicano Amazon Kendra dove trovare i dati del documento sul server del database.
Ha copiato i nomi delle colonne nella tabella di dati che contengono i dati del documento. È necessario includere l'ID del documento, il corpo del documento, le colonne per rilevare se un documento è stato modificato (ad esempio, l'ultima colonna aggiornata) e le colonne facoltative della tabella di dati mappate a campi indice personalizzati. È inoltre possibile mappare qualsiasi nome di campo Amazon Kendra riservato a una colonna della tabella.
Ha copiato le informazioni sul tipo di motore di database, ad esempio se si utilizza Amazon RDS per MySQL o un altro tipo.
Selezionato, ogni documento è unico nel database e tra le altre fonti di dati che intendi utilizzare per lo stesso indice. Ogni fonte di dati che desideri utilizzare per un indice non deve contenere lo stesso documento in tutte le fonti di dati. IDs I documenti sono globali rispetto a un indice e devono essere univoci per indice.

Nel tuoAccount AWS, assicurati di avere:

Ha creato un Amazon Kendra indice e, se si utilizza l'API, ha annotato l'ID dell'indice.
Hai creato un IAM ruolo per la tua origine dati e, se utilizzi l'API, hai annotato l'ARN del IAM ruolo.

Nota
Se modifichi il tipo di autenticazione e le credenziali, devi aggiornare il IAM ruolo per accedere all'ID AWS Secrets Manager segreto corretto.
Ha archiviato le credenziali di autenticazione del database in un AWS Secrets Manager segreto e, se si utilizza l'API, ha annotato l'ARN del segreto.

Nota
Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. e fornire solo il livello di accesso necessario per motivi di sicurezza. Non è consigliabile riutilizzare credenziali e segreti tra diverse fonti di dati e versioni dei connettori 1.0 e 2.0 (ove applicabile).

Se non disponi di un IAM ruolo o di un segreto esistente, puoi utilizzare la console per creare un nuovo IAM ruolo e un Secrets Manager segreto quando connetti l'origine dati del database a. Amazon Kendra Se utilizzi l'API, devi fornire l'ARN di un IAM ruolo e di un Secrets Manager segreto esistenti e un ID di indice.

Istruzioni di connessione

Per connettersi Amazon Kendra all'origine dati del database, è necessario fornire i dettagli necessari sull'origine dati del database in modo che sia Amazon Kendra possibile accedere ai dati. Se non hai ancora configurato il database perAmazon Kendra, vediPrerequisiti.

Console

Per connettersi Amazon Kendra a un database

Accedere a Console di gestione AWS e aprire la Amazon Kendraconsole.
Dal riquadro di navigazione a sinistra, scegli Indici, quindi scegli l'indice che desideri utilizzare dall'elenco degli indici.

Nota
Puoi scegliere di configurare o modificare le impostazioni del controllo dell'accesso degli utenti in Impostazioni dell'indice.
Nella pagina Guida introduttiva, scegli Aggiungi origine dati.
Nella pagina Aggiungi origine dati, scegli connettore di database, quindi scegli Aggiungi connettore. Se utilizzi la versione 2 (se applicabile), scegli il connettore del database con il tag «V2.0".
Nella pagina Specificare i dettagli dell'origine dati, inserisci le seguenti informazioni:
1. In Nome e descrizione, per Nome dell'origine dati, inserisci un nome per l'origine dati. Puoi includere trattini ma non spazi.
2. (Facoltativo) Descrizione: immetti una descrizione facoltativa per la tua fonte di dati.
3. In Lingua predefinita: scegli una lingua per filtrare i documenti per l'indice. Se non diversamente specificato, la lingua predefinita è l'inglese. La lingua specificata nei metadati del documento ha la precedenza sulla lingua selezionata.
4. In Tag, per Aggiungi nuovo tag, includi tag opzionali per cercare e filtrare le risorse o tenere traccia dei costi. AWS
5. Scegli Next (Successivo).
Nella pagina Definisci accesso e sicurezza, inserisci le seguenti informazioni:
1. Endpoint: un nome host DNS, un IPv4 indirizzo o un indirizzo. IPv6
2. Porta: un numero di porta.
3. Database: nome del database.
4. Nome della tabella: nome della tabella.
5. Per Tipo di autenticazione, scegli tra Esistente e Nuovo per memorizzare le credenziali di autenticazione del database. Se scegli di creare un nuovo segreto, si apre una finestra AWS Secrets Manager segreta.
  1. Inserisci le seguenti informazioni nella finestra Crea un AWS Secrets Manager segreto:
    1. Nome segreto: un nome per il segreto. Il prefisso 'AmazonKendra-database-' viene aggiunto automaticamente al tuo nome segreto.
    2. Per nome utente e password: inserisci i valori delle credenziali di autenticazione dal tuo account di database.
    3. Scegli Salva autenticazione.
6. Virtual Private Cloud (VPC): puoi scegliere di utilizzare un VPC. In tal caso, è necessario aggiungere sottoreti e gruppi di sicurezza VPC.
  
  Nota
  È necessario utilizzare una sottorete privata. Se l'istanza RDS si trova in una sottorete pubblica del VPC, è possibile creare una sottorete privata con accesso in uscita a un gateway NAT nella sottorete pubblica. Le sottoreti fornite nella configurazione VPC devono trovarsi negli Stati Uniti occidentali (Oregon), negli Stati Uniti orientali (Virginia settentrionale) e nell'UE (Irlanda).
7. IAMruolo: scegli un IAM ruolo esistente o creane uno nuovo per accedere alle credenziali del IAM repository e indicizzare il contenuto.
  
  Nota
  IAMi ruoli utilizzati per gli indici non possono essere utilizzati per le fonti di dati. Se non sei sicuro che un ruolo esistente venga utilizzato per un indice o una FAQ, scegli Crea un nuovo ruolo per evitare errori.
8. Scegli Next (Successivo).
Nella pagina Configura le impostazioni di sincronizzazione, inserisci le seguenti informazioni:
1. Scegli tra Aurora MySQL, MySQL, Aurora PostgreSQL e PostgreSQL in base al tuo caso d'uso.
2. Racchiudi gli identificatori SQL tra virgolette: seleziona per racchiudere gli identificatori SQL tra virgolette doppie. Ad esempio, «columnName».
3. Colonna ACL e colonne di rilevamento delle modifiche: configura le colonne Amazon Kendra utilizzate per il rilevamento delle modifiche (ad esempio, l'ultima colonna aggiornata) e l'elenco di controllo degli accessi.
4. In Sync run schedulation, per Frequenza: scegli la frequenza con cui eseguire la sincronizzazione con la Amazon Kendra tua fonte di dati.
5. Scegli Next (Successivo).
Nella pagina Imposta le mappature dei campi, inserisci le seguenti informazioni:
1. Amazon Kendramappature di campo predefinite: seleziona uno dei campi di origine dati predefiniti Amazon Kendra generati che desideri mappare all'indice. È necessario aggiungere i valori delle colonne del database per e document_id document_body
2. Mappature personalizzate dei campi: per aggiungere campi di origine dati personalizzati per creare un nome di campo indice a cui mappare e il tipo di dati del campo.
3. Scegli Next (Successivo).
Nella pagina Rivedi e crea, verifica che le informazioni inserite siano corrette, quindi seleziona Aggiungi origine dati. Puoi anche scegliere di modificare le tue informazioni da questa pagina. L'origine dati verrà visualizzata nella pagina Origini dati dopo che l'origine dati sarà stata aggiunta correttamente.

API

Per connettersi Amazon Kendra a un database

È necessario specificare quanto segue l'DatabaseConfigurationAPI:

ColumnConfiguration—Informazioni su dove l'indice deve ottenere le informazioni sul documento dal database. Per ulteriori dettagli, consultare ColumnConfiguration. È necessario specificare i campi DocumentDataColumnName (corpo del documento o testo principale) eDocumentIdColumnName, e ChangeDetectingColumn (ad esempio, ultima colonna aggiornata). La colonna mappata al DocumentIdColumnName campo deve essere una colonna intera. L'esempio seguente mostra una semplice configurazione di colonne per un'origine dati del database:
```
"ColumnConfiguration": {
    "ChangeDetectingColumns": [
        "LastUpdateDate",
        "LastUpdateTime"
    ],
    "DocumentDataColumnName": "TextColumn",
    "DocumentIdColumnName": "IdentifierColumn",
    "DocoumentTitleColumnName": "TitleColumn",
    "FieldMappings": [
        {
            "DataSourceFieldName": "AbstractColumn",
            "IndexFieldName": "Abstract"
        }
    ]
}
```
ConnectionConfiguration—Informazioni di configurazione necessarie per connettersi a un database. Per ulteriori dettagli, consultare ConnectionConfiguration.
DatabaseEngineType—Il tipo di motore di database che esegue il database. Il DatabaseHost campo per ConnectionConfiguration deve essere l'endpoint dell'istanza Amazon Relational Database Service (Amazon RDS) per il database. Non utilizzare l'endpoint del cluster.
Secret Amazon Resource Name (ARN): fornisci l'Amazon Resource Name (ARN) di un Secrets Manager segreto che contiene le credenziali di autenticazione per il tuo account di database. Il segreto è archiviato in una struttura JSON con le seguenti chiavi:
```
{
    "username": "user name",
    "password": "password"
}
```
L'esempio seguente mostra una configurazione del database, incluso l'ARN segreto.
```
"DatabaseConfiguration": {
"ConnectionConfiguration": {
"DatabaseHost": "host.subdomain.domain.tld",
        "DatabaseName": "DocumentDatabase",
        "DatabasePort": 3306,
        "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name",
        "TableName": "DocumentTable"
    }
}
```
Nota
Ti consigliamo di aggiornare o ruotare regolarmente le credenziali e il segreto. e fornire solo il livello di accesso necessario per motivi di sicurezza. Non è consigliabile riutilizzare le credenziali e i segreti tra le fonti di dati e le versioni 1.0 e 2.0 dei connettori (ove applicabile).
IAMruolo: specifica RoleArn quando chiami CreateDataSource per fornire a un IAM ruolo le autorizzazioni per accedere al tuo Secrets Manager segreto e per chiamare il pubblico richiesto APIs per il connettore del database e. Amazon Kendra Per ulteriori informazioni, consulta IAMi ruoli per le fonti di dati del database.

Puoi anche aggiungere le seguenti funzionalità opzionali:

Virtual Private Cloud (VPC): specifica VpcConfiguration come parte della configurazione dell'origine dati. Vedi Configurazione Amazon Kendra per l'uso di un VPC.

Nota
È necessario utilizzare solo una sottorete privata. Se l'istanza RDS si trova in una sottorete pubblica del VPC, è possibile creare una sottorete privata con accesso in uscita a un gateway NAT nella sottorete pubblica. Le sottoreti fornite nella configurazione VPC devono trovarsi negli Stati Uniti occidentali (Oregon), negli Stati Uniti orientali (Virginia settentrionale) e nell'UE (Irlanda).
Mappature dei campi: scegli di mappare i campi delle sorgenti dati del database ai campi indice. Amazon Kendra Per ulteriori informazioni, consulta la sezione Mappatura dei campi di origine dei dati.

Nota
Il campo del corpo del documento o l'equivalente del corpo del documento per i documenti è necessario per Amazon Kendra eseguire la ricerca nei documenti. È necessario mappare il nome del campo del corpo del documento nella fonte dati al nome del campo indice_document_body. Tutti gli altri campi sono facoltativi.
Filtraggio del contesto utente e controllo degli accessi: Amazon Kendra esegue la scansione dell'elenco di controllo degli accessi (ACL) dei documenti, se disponi di un ACL per i documenti. Le informazioni ACL vengono utilizzate per filtrare i risultati della ricerca in base all'accesso dell'utente o del relativo gruppo ai documenti. Per ulteriori informazioni, consulta Filtraggio del contesto utente.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Amazon FSx(NetApp SU TAP)

Amazon RDS(Microsoft SQL Server)