Amazon RDS/Aurora - Amazon Kendra

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Amazon RDS/Aurora

Sie können Dokumente, die in einer Datenbank gespeichert sind, mithilfe einer Datenbankdatenquelle indizieren. Nachdem Sie Verbindungsinformationen für die Datenbank angegeben haben, Amazon Kendra verbindet und indexiert Dokumente.

Amazon Kendra unterstützt die folgenden Datenbanken:

  • Amazon Aurora MySQL

  • Amazon Aurora PostgreSQL

  • Amazon RDS für MySQL

  • Amazon RDS für PostgreSQL

Anmerkung

Serverlose Aurora-Datenbanken werden nicht unterstützt.

Wichtig

Dieser Amazon RDS/Aurora-Connector wird voraussichtlich Ende 2023 nicht mehr unterstützt.

Amazon Kendra unterstützt jetzt neue Konnektoren für Datenbank-Datenquellen. Für eine bessere Benutzererfahrung empfehlen wir Ihnen, für Ihren Anwendungsfall aus den folgenden neuen Konnektoren zu wählen:

Sie können über Amazon Kendra die Amazon Kendra Konsole und die DatabaseConfigurationAPI eine Verbindung zu Ihrer Datenbank-Datenquelle herstellen.

Informationen zur Problembehandlung Ihres Amazon Kendra Datenbank-Datenquellen-Connectors finden Sie unterProblembehandlung bei Datenquellen.

Unterstützte Features

Amazon Kendra Der Datenbank-Datenquellen-Connector unterstützt die folgenden Funktionen:

  • Feldzuordnungen

  • Filterung des Benutzerkontextes

  • Virtual Private Cloud (VPC)

Voraussetzungen

Bevor Sie Ihre Datenbankdatenquelle Amazon Kendra zum Indizieren verwenden können, müssen Sie diese Änderungen an Ihrer Datenbank und Ihren AWS Konten vornehmen.

Stellen Sie sicher, dass Sie in Ihrer Datenbank Folgendes haben:

  • Notieren Sie sich Ihre grundlegenden Authentifizierungsdaten mit Benutzername und Passwort für Ihre Datenbank.

  • Der Hostname, die Portnummer, die Hostadresse, der Name der Datenbank und der Name der Datentabelle, die die Dokumentdaten enthält, wurden kopiert. Für PostgreSQL muss die Datentabelle eine öffentliche Tabelle oder ein öffentliches Schema sein.

    Anmerkung

    Der Host und der Port geben an Amazon Kendra , wo der Datenbankserver im Internet zu finden ist. Der Datenbankname und der Tabellenname geben an, Amazon Kendra wo sich die Dokumentdaten auf dem Datenbankserver befinden.

  • Die Namen der Spalten in der Datentabelle, die die Dokumentdaten enthalten, wurden kopiert. Sie müssen die Dokument-ID, den Hauptteil des Dokuments, Spalten, um festzustellen, ob sich ein Dokument geändert hat (z. B. die Spalte mit der letzten Aktualisierung), und optionale Spalten in der Datentabelle angeben, die benutzerdefinierten Indexfeldern zugeordnet sind. Sie können auch jeden der Amazon Kendra reservierten Feldnamen einer Tabellenspalte zuordnen.

  • Die Typinformationen der Datenbank-Engine wurden kopiert, z. B. ob Sie sie Amazon RDS für MySQL oder einen anderen Typ verwenden.

  • Aktiviert, dass jedes Dokument in der Datenbank und in anderen Datenquellen, die Sie für denselben Index verwenden möchten, eindeutig ist. Jede Datenquelle, die Sie für einen Index verwenden möchten, darf nicht dasselbe Dokument in allen Datenquellen enthalten. Dokumente IDs gelten für einen Index global und müssen für jeden Index eindeutig sein.

Stellen Sie in Ihrem sicher AWS-Konto, dass Sie Folgendes haben:

  • Hat einen Amazon Kendra Index erstellt und bei Verwendung der API die Index-ID notiert.

  • Sie haben eine IAM Rolle für Ihre Datenquelle erstellt und, falls Sie die API verwenden, den ARN der IAM Rolle notiert.

    Anmerkung

    Wenn Sie Ihren Authentifizierungstyp und Ihre Anmeldeinformationen ändern, müssen Sie Ihre IAM Rolle aktualisieren, um auf die richtige AWS Secrets Manager geheime ID zugreifen zu können.

  • Ihre Anmeldeinformationen für die Datenbankauthentifizierung AWS Secrets Manager geheim gespeichert und, falls Sie die API verwenden, den ARN des Geheimnisses notiert.

    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihr Geheimnis regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

Wenn Sie noch keine IAM Rolle oder keinen Schlüssel haben, können Sie die Konsole verwenden, um eine neue IAM Rolle und ein neues Secrets Manager Geheimnis zu erstellen, wenn Sie Ihre Datenbankdatenquelle mit verbinden. Amazon Kendra Wenn Sie die API verwenden, müssen Sie den ARN einer vorhandenen IAM Rolle und eines Secrets Manager Geheimnisses sowie eine Index-ID angeben.

Anweisungen zur Verbindung

Um eine Verbindung Amazon Kendra zu Ihrer Datenbankdatenquelle herzustellen, müssen Sie die erforderlichen Details zu Ihrer Datenbankdatenquelle angeben, damit auf Ihre Daten zugegriffen werden Amazon Kendra kann. Wenn Sie die Datenbank für noch nicht konfiguriert haben Amazon Kendra, finden Sie weitere Informationen unterVoraussetzungen.

Console

So stellen Sie eine Verbindung Amazon Kendra zu einer Datenbank her

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Kendra Konsole.

  2. Wählen Sie im linken Navigationsbereich Indizes und dann den Index, den Sie verwenden möchten, aus der Indexliste aus.

    Anmerkung

    Sie können Ihre Einstellungen für die Benutzerzugriffskontrolle unter Indexeinstellungen konfigurieren oder bearbeiten.

  3. Wählen Sie auf der Seite Erste Schritte die Option Datenquelle hinzufügen aus.

  4. Wählen Sie auf der Seite Datenquelle hinzufügen die Option Datenbank-Connector und dann Connector hinzufügen aus. Wenn Sie Version 2 verwenden (falls zutreffend), wählen Sie den Datenbank-Connector mit dem Tag „V2.0".

  5. Geben Sie auf der Seite „Datenquellendetails angeben“ die folgenden Informationen ein:

    1. Geben Sie im Feld Name und Beschreibung für Datenquellenname einen Namen für Ihre Datenquelle ein. Sie können Bindestriche, aber keine Leerzeichen verwenden.

    2. (Optional) Beschreibung — Geben Sie eine optionale Beschreibung für Ihre Datenquelle ein.

    3. In Standardsprache — Wählen Sie eine Sprache aus, um Ihre Dokumente nach dem Index zu filtern. Sofern Sie nichts anderes angeben, ist die Standardsprache Englisch. Die in den Metadaten des Dokuments angegebene Sprache hat Vorrang vor der ausgewählten Sprache.

    4. Unter Tags für Neues Tag hinzufügen — Fügen Sie optionale Tags hinzu, um Ihre Ressourcen zu durchsuchen und zu filtern oder Ihre Kosten nachzuverfolgen. AWS

    5. Wählen Sie Weiter.

  6. Geben Sie auf der Seite Zugriff und Sicherheit definieren die folgenden Informationen ein:

    1. Endpunkt — Ein DNS-Hostname, eine IPv4 Adresse oder eine IPv6 Adresse.

    2. Port — Eine Portnummer.

    3. Datenbank — Datenbankname.

    4. Tabellenname —Tabellenname.

    5. Wählen Sie für Authentifizierungstyp zwischen Existiert und Neu, um Ihre Anmeldeinformationen für die Datenbankauthentifizierung zu speichern. Wenn Sie sich dafür entscheiden, ein neues Geheimnis zu erstellen, wird ein AWS Secrets Manager geheimes Fenster geöffnet.

      1. Geben Sie die folgenden Informationen in das Fenster Create an AWS Secrets Manager Secret ein:

        1. Geheimer Name — Ein Name für Ihr Geheimnis. Das Präfix 'AmazonKendra-database' wird automatisch zu Ihrem geheimen Namen hinzugefügt.

        2. Für Benutzername und Passwort — Geben Sie die Authentifizierungsdaten aus Ihrem Datenbankkonto ein.

        3. Wählen Sie Authentifizierung speichern aus.

    6. Virtual Private Cloud (VPC) — Sie können wählen, ob Sie eine VPC verwenden möchten. In diesem Fall müssen Sie Subnetze und VPC-Sicherheitsgruppen hinzufügen.

      Anmerkung

      Sie müssen ein privates Subnetz verwenden. Wenn sich Ihre RDS-Instance in einem öffentlichen Subnetz in Ihrer VPC befindet, können Sie ein privates Subnetz erstellen, das ausgehenden Zugriff auf ein NAT-Gateway im öffentlichen Subnetz hat. Die in der VPC-Konfiguration bereitgestellten Subnetze müssen sich entweder in USA West (Oregon), USA Ost (Nord-Virginia) oder EU (Irland) befinden.

    7. IAM Rolle — Wählen Sie eine bestehende IAM Rolle oder erstellen Sie eine neue IAM Rolle, um auf Ihre Repository-Anmeldeinformationen und Indexinhalte zuzugreifen.

      Anmerkung

      IAM Rollen, die für Indizes verwendet werden, können nicht für Datenquellen verwendet werden. Wenn Sie sich nicht sicher sind, ob eine vorhandene Rolle für einen Index oder eine häufig gestellte Frage verwendet wird, wählen Sie Neue Rolle erstellen, um Fehler zu vermeiden.

    8. Wählen Sie Weiter.

  7. Geben Sie auf der Seite „Synchronisierungseinstellungen konfigurieren“ die folgenden Informationen ein:

    1. Wählen Sie je nach Anwendungsfall zwischen Aurora MySQL , MySQL, Aurora PostgreSQL und PostgreSQL.

    2. SQL-Bezeichner in doppelte Anführungszeichen einschließen — Wählen Sie diese Option, um SQL-Bezeichner in doppelte Anführungszeichen zu setzen. Zum Beispiel „ColumnName“.

    3. ACL-Spalte und Spalten mit Änderungserkennung — Konfigurieren Sie die Spalten, die für die Änderungserkennung Amazon Kendra verwendet werden (z. B. die Spalte mit der letzten Aktualisierung), und Ihre Zugriffskontrollliste.

    4. Wählen Sie im Synchronisierungslaufplan für Häufigkeit aus, wie oft die Synchronisierung mit Ihrer Datenquelle erfolgen Amazon Kendra soll.

    5. Wählen Sie Weiter.

  8. Geben Sie auf der Seite Feldzuordnungen festlegen die folgenden Informationen ein:

    1. Amazon Kendra Standard-Feldzuordnungen — Wählen Sie eines der Amazon Kendra generierten Standard-Datenquellenfelder aus, die Sie Ihrem Index zuordnen möchten. Sie müssen die Datenbankspaltenwerte für und hinzufügen document_id document_body

    2. Benutzerdefinierte Feldzuordnungen — Um benutzerdefinierte Datenquellenfelder hinzuzufügen, um einen Indexfeldnamen für die Zuordnung und den Felddatentyp zu erstellen.

    3. Wählen Sie Weiter.

  9. Überprüfen Sie auf der Seite Überprüfen und erstellen, ob die von Ihnen eingegebenen Informationen korrekt sind, und wählen Sie dann Datenquelle hinzufügen aus. Sie können Ihre Informationen auch auf dieser Seite bearbeiten. Ihre Datenquelle wird auf der Seite Datenquellen angezeigt, nachdem die Datenquelle erfolgreich hinzugefügt wurde.

API

Um eine Verbindung Amazon Kendra zu einer Datenbank herzustellen

Sie müssen die folgende DatabaseConfigurationAPI angeben:

  • ColumnConfiguration— Informationen darüber, wo der Index die Dokumentinformationen aus der Datenbank abrufen soll. Weitere Details finden Sie unter ColumnConfiguration. Sie müssen die Felder DocumentDataColumnName (Hauptteil des Dokuments oder Haupttext) und DocumentIdColumnName und ChangeDetectingColumn (z. B. Spalte mit der letzten Aktualisierung) angeben. Die dem DocumentIdColumnName Feld zugeordnete Spalte muss eine Ganzzahlspalte sein. Das folgende Beispiel zeigt eine einfache Spaltenkonfiguration für eine Datenbankdatenquelle:

    "ColumnConfiguration": { "ChangeDetectingColumns": [ "LastUpdateDate", "LastUpdateTime" ], "DocumentDataColumnName": "TextColumn", "DocumentIdColumnName": "IdentifierColumn", "DocoumentTitleColumnName": "TitleColumn", "FieldMappings": [ { "DataSourceFieldName": "AbstractColumn", "IndexFieldName": "Abstract" } ] }
  • ConnectionConfiguration— Konfigurationsinformationen, die für die Verbindung mit einer Datenbank erforderlich sind. Weitere Details finden Sie unter ConnectionConfiguration.

  • DatabaseEngineType— Der Typ der Datenbank-Engine, die die Datenbank ausführt. Das DatabaseHost Feld für ConnectionConfiguration muss der Instanzendpunkt Amazon Relational Database Service (Amazon RDS) für die Datenbank sein. Verwenden Sie nicht den Cluster-Endpunkt.

  • Geheimer Amazon-Ressourcenname (ARN) — Geben Sie den Amazon-Ressourcennamen (ARN) eines Secrets Manager Geheimnisses ein, das die Authentifizierungsdaten für Ihr Datenbankkonto enthält. Das Geheimnis wird in einer JSON-Struktur mit den folgenden Schlüsseln gespeichert:

    { "username": "user name", "password": "password" }

    Das folgende Beispiel zeigt eine Datenbankkonfiguration, einschließlich des geheimen ARN.

    "DatabaseConfiguration": { "ConnectionConfiguration": { "DatabaseHost": "host.subdomain.domain.tld", "DatabaseName": "DocumentDatabase", "DatabasePort": 3306, "SecretArn": "arn:aws:secretmanager:region:account ID:secret/secret name", "TableName": "DocumentTable" } }
    Anmerkung

    Wir empfehlen Ihnen, Ihre Anmeldeinformationen und Ihren geheimen Schlüssel regelmäßig zu aktualisieren oder zu wechseln. Stellen Sie zu Ihrer eigenen Sicherheit nur die Zugriffsebene bereit, die erforderlich ist. Wir raten davon ab, Anmeldeinformationen und geheime Daten für alle Datenquellen und Connector-Versionen 1.0 und 2.0 (sofern zutreffend) wiederzuverwenden.

  • IAM Rolle — Geben Sie anRoleArn, wann Sie anrufenCreateDataSource, um einer IAM Rolle Berechtigungen für den Zugriff auf Ihr Secrets Manager Geheimnis und für den Aufruf der erforderlichen Öffentlichkeit APIs für den Datenbank-Connector und zu erteilen. Amazon Kendra Weitere Informationen finden Sie unter IAM Rollen für Datenbankdatenquellen.

Sie können auch die folgenden optionalen Funktionen hinzufügen:

  • Virtual Private Cloud (VPC) — Geben Sie dies VpcConfiguration als Teil der Datenquellenkonfiguration an. Siehe Konfiguration Amazon Kendra für die Verwendung einer VPC.

    Anmerkung

    Sie dürfen nur ein privates Subnetz verwenden. Wenn sich Ihre RDS-Instance in einem öffentlichen Subnetz in Ihrer VPC befindet, können Sie ein privates Subnetz erstellen, das ausgehenden Zugriff auf ein NAT-Gateway im öffentlichen Subnetz hat. Die in der VPC-Konfiguration bereitgestellten Subnetze müssen sich entweder in USA West (Oregon), USA Ost (Nord-Virginia) oder EU (Irland) befinden.

  • Feldzuordnungen — Wählen Sie diese Option, um Ihre Datenbank-Datenquellenfelder Ihren Indexfeldern zuzuordnen. Amazon Kendra Weitere Informationen finden Sie unter Zuweisen von Datenquellenfeldern.

    Anmerkung

    Das Textfeld oder das entsprechende Textfeld für Ihre Dokumente ist erforderlich, um Ihre Dokumente durchsuchen Amazon Kendra zu können. Sie müssen den Feldnamen Ihres Dokumenthauptteils in Ihrer Datenquelle dem Namen des Indexfeldes zuordnen_document_body. Alle anderen Felder sind optional.

  • Benutzerkontextfilterung und ZugriffskontrolleAmazon Kendra — durchsucht die Zugriffskontrollliste (ACL) für Ihre Dokumente, sofern Sie über eine ACL für Ihre Dokumente verfügen. Die ACL-Informationen werden verwendet, um Suchergebnisse nach dem Benutzer- oder Gruppenzugriff auf Dokumente zu filtern. Weitere Informationen finden Sie unter Benutzerkontextfilterung.