Grundlegendes zu Tabellen, Datenbanken und Datenkataloge in Athena - Amazon Athena

Grundlegendes zu Tabellen, Datenbanken und Datenkataloge in Athena

In Athena fungieren Kataloge, Tabellen und Datenbanken als Container für Metadatendefinitionen, die das Schema für zugrunde liegende Quelldaten definieren.

Athena verwendet die folgenden Begriffe, um sich auf Hierarchien von Datenobjekten zu beziehen:

  • Datenquelle – eine Gruppe von Datenbanken

  • Datenbank – eine Gruppe von Tabellen

  • Tabelle – Daten, die als Gruppe von Zeilen oder Spalten organisiert sind

Manchmal werden diese Objekte auch mit alternativen, aber gleichwertigen Namen bezeichnet, z. B. den folgenden:

  • Eine Datenquelle wird manchmal auch als Katalog bezeichnet.

  • Eine Datenbank wird manchmal auch als Schema bezeichnet.

Anmerkung

Diese Terminologie kann in den verbundenen Datenquellen, die Sie mit Athena verwenden, variieren. Weitere Informationen finden Sie unter Grunlegendes über Qualifikatoren für verbundene Tabellennamen.

Für jeden Datensatz muss in Athena eine Tabelle vorhanden sein. Aus den Metadaten in der Tabelle entnimmt Athena den Speicherort der Daten in Amazon S3 und die Struktur der Daten, z. B. Spaltennamen, Datentypen und Tabellenname. Bei Datenbanken handelt es sich um eine logische Gruppe von Tabellen; sie enthalten daher auch nur Metadaten und Schemainformationen für ein Dataset.

Für jedes Dataset, für das Sie eine Abfrage ausführen möchten, muss in Athena eine zugrunde liegende Tabelle vorhanden sein, die zum Abruf und zur Rückgabe der Abfrageergebnisse verwendet wird. Daher muss die Tabelle vor einer Datenabfrage in Athena registriert werden. Die Registrierung erfolgt bei der automatischen oder manuellen Tabellenerstellung.

Sie können mithilfe eines AWS Glue-Crawlers automatisch eine Tabelle erstellen. Weitere Informationen zu AWS Glue und Crawlers finden Sie unter Verwenden Sie AWS Glue Data Catalog, um eine Verbindung zu Ihren Daten herzustellen. Wird eine Tabelle in AWS Glue erstellt, erfolgt die Registrierung im eigenen AWS Glue-Datenkatalog. Athena nutzt den AWS Glue-Datenkatalog zum Speichern und Abrufen der enthaltenen Metadaten, die bei der Abfrageausführung für die Analyse des zugrunde liegenden Datensatzes verwendet werden.

Unabhängig davon, wie die Tabellen erstellt werden, wird der Datensatz im Rahmen der Tabellenerstellung in Athena registriert. Diese Registrierung erfolgt im AWS Glue Data Catalog und ermöglicht Athena die Ausführung von Abfragen für die Daten. Im Athena-Abfrage-Editor wird auf diesen Katalog (oder diese Datenquelle) mit der Bezeichnung AwsDataCatalog verwiesen.

Nachdem Sie eine Tabelle erstellt haben, können Sie sie mit SQL-SELECT-Anweisungen abfragen, einschließlich des Abrufens bestimmter Dateispeicherorte für Ihre Quelldaten. Ihre Abfrageergebnisse werden in Amazon S3 an dem von Ihnen angegebenen Abfrageergebnisspeicherort gespeichert.

Der AWS Glue-Datenkatalog ist über Ihr Amazon-Web-Services-Konto zugänglich. Auch andere AWS-Services können den AWS Glue-Datenkatalog nutzen, sodass Sie alle in der Organisation erstellten Datenbanken und Tabellen in Athena sehen können – und umgekehrt.

  • So erstellen Sie eine Tabelle manuell

    • Rufen Sie in der Athena-Konsole den Assistenten „Tabelle erstellen“ auf.

    • Schreiben Sie in der Athena-Konsole Hive-DDL-Anweisungen in den Abfrage-Editor.

    • Führen Sie mithilfe der Athena-API oder der CLI eine SQL-Abfragezeichenfolge mit DDL-Anweisungen aus.

    • Verwenden Sie den JDBC- oder ODBC-Treiber von Athena.

Wenn Sie Tabellen und Datenbanken manuell erstellen, verwendet Athena HiveQL-Data-Definition-Language (DDL)-Anweisungen wie CREATE TABLE, CREATE DATABASE und DROP TABLE im Hintergrund, um Tabellen und Datenbanken im AWS Glue Data Catalog zu erstellen.

Für den Einstieg können Sie ein Tutorial in der Athena-Konsole verwenden oder eine schrittweise Anleitung in der Athena-Dokumentation durcharbeiten.

  • Um das Tutorial in der Athena-Konsole zu verwenden, wählen Sie das Informationssymbol oben rechts in der Konsole und dann die Registerkarte Tutorial.

  • Eine Schritt-für-Schritt-Anleitung zum Erstellen einer Tabelle und zum Schreiben von Abfragen im Athena Query Editor finden Sie unter Erste Schritte.