Redshift-Datenkataloge in Athena registrieren
Athena kann Daten lesen und schreiben, die in Redshift-Clustern oder Serverless Namespaces gespeichert sind, die in AWS Glue Data Catalog registriert wurden. Dies funktioniert in Verbindung mit AWS Lake Formation, das zentralisierte Sicherheit und Governance bietet und sicherstellt, dass der Datenzugriff über verschiedene Abfrage-Engines hinweg konsistent verwaltet wird und eine differenziertere Zugriffskontrolle für die gemeinsam genutzten Redshift-Daten aufrechterhalten wird.
Überlegungen und Einschränkungen
-
Materialisierte Ansichten – Materialisierte Ansichten von Amazon Redshift können von Athena abgefragt werden, aber das Erstellen materialisierter Ansichten mit Athena oder Spark wird nicht unterstützt.
-
DDL-Operationen, einschließlich der Einstellung von AWS Glue Data Catalog-Konfigurationen und -Operationen in verwalteten Amazon-Redshift-Speichertabellen, werden nicht unterstützt.
Voraussetzungen
Bevor Sie einen AWS Glue-Datenkatalog von Athena abfragen können, führen Sie die folgenden Aufgaben aus:
-
Erstellen und registrieren Sie einen Amazon-Redshift-Cluster oder einen Serverless Namespace für AWS Glue Data Catalog. Weitere Informationen finden Sie unter Registrierung eines Clusters auf AWS Glue Data Catalog oder Registrierung von Namespaces auf AWS Glue Data Catalog im Amazon Redshift Management-Handbuch.
-
Erstellen Sie einen Datenkatalog in AWS Lake Formation vom registrierten Namespace. Weitere Informationen finden Sie unter Erstellen von Amazon-Redshift-Verbundkatalogen im AWS Lake Formation Entwicklerhandbuch.
-
(Optional) Verwenden Sie Lake Formation, um differenzierte Zugriffskontrollen für den Katalog festzulegen. Weitere Informationen finden Sie unter Integrieren Ihrer Daten in AWS Glue Data Catalog, im AWS Lake Formation-Entwicklerhandbuch.
Einen Redshift-Datenkatalog in der Athena-Konsole registrieren
Um einen Redshift-Datenkatalog in der Athena-Konsole zu registrieren, führen Sie die folgenden Schritte aus.
-
Öffnen Sie die Athena-Konsole unter https://console.aws.amazon.com/athena/
. -
Wählen Sie im Navigationsbereich Datenquellen und Kataloge aus.
-
Wählen Sie auf der Seite Datenquellen und Kataloge die Option Datenquellen erstellen aus.
-
Wählen Sie für Eine Datenquelle auswählen die Option Amazon S3 - AWS Glue Data Catalog.
-
Wählen Sie im AWS Glue Data Catalog-Abschnitt für Datenquellenkonto die Option AWS Glue Data Catalog in diesem Konto.
-
Wählen Sie für Tabelle erstellen oder Katalog registrieren die Option Neuen AWS Glue-Katalog registrieren.
-
Geben Sie im Abschnitt Datenquellendetails für Datenquellenname den Namen ein, den Sie verwenden möchten, um die Datenquelle in Ihren SQL-Abfragen anzugeben, oder verwenden Sie den generierten Standardnamen.
-
Wählen Sie für Katalog die Option Durchsuchen aus, um nach einer Liste von AWS Glue-Katalogen im selben Konto zu suchen. Wenn Ihnen keine Kataloge angezeigt werden, erstellen Sie einen in der AWS Glue-Konsole
. -
Wählen Sie im Dialogfeld AWS Glue-Kataloge durchsuchen den gewünschten Katalog aus und klicken Sie dann auf Auswählen.
-
(Optional) Geben Sie für Tags beliebige Schlüssel-Wert-Paare ein, die Sie mit der Datenquelle verknüpfen möchten.
-
Wählen Sie Weiter aus.
-
Überprüfen Sie auf der Seite Überprüfen und erstellen die Richtigkeit der eingegebenen Informationen und wählen Sie dann Datenquelle erstellen.