Schritt 1: Erstellen Sie einen Tabellen-Bucket und integrieren Sie ihn in AWS Analysedienste Schritt 2: Erstellen eines Tabellen-Namespace und einer Tabelle Schritt 3: Daten mit SQL in Athena abfragen

Tutorial: Erste Schritte mit S3 Tables

In diesem Tutorial erstellen Sie einen Tabellen-Bucket und integrieren Tabellen-Buckets in Ihrer Region mit AWS Analysediensten. Als Nächstes verwenden Sie die AWS CLI OR-Konsole, um Ihren ersten Namespace und Ihre erste Tabelle in Ihrem Table-Bucket zu erstellen. Dann können Sie beginnen, Ihre Tabelle mit Athena abzufragen.

Tipp

Wenn Sie tabellarische Daten von Allzweck-Buckets in Tabellen-Buckets migrieren, bietet Ihnen die AWS -Lösungsportfolio eine Anleitung, die Sie dabei unterstützt. Diese Lösung automatisiert das Verschieben Apache Iceberg von Apache Hive Tabellen, die in Allzweck-Buckets registriert AWS Glue Data Catalog und dort gespeichert sind, in Tabellen-Buckets mithilfe AWS Step Functions von Amazon EMR mit. Apache Spark Weitere Informationen finden Sie unter Anleitung zur Migration von Tabellendaten von Amazon S3 zu S3 Tables in der AWS Lösungsportfolio.

Themen

Schritt 1: Erstellen Sie einen Tabellen-Bucket und integrieren Sie ihn in AWS Analysedienste
Schritt 2: Erstellen eines Tabellen-Namespace und einer Tabelle
Schritt 3: Daten mit SQL in Athena abfragen

Schritt 1: Erstellen Sie einen Tabellen-Bucket und integrieren Sie ihn in AWS Analysedienste

In diesem Schritt verwenden Sie die Amazon-S3-Konsole, um Ihren ersten Tabellen-Bucket zu erstellen. Weitere Möglichkeiten zum Erstellen eines Tabellen-Buckets finden Sie unter Tabellen-Bucket erstellen.

Anmerkung

Standardmäßig integriert die Amazon S3 S3-Konsole Ihre Tabellen-Buckets automatisch in AWS Glue Data Catalog, sodass AWS Analysedienste Ihre S3-Tables-Daten automatisch erkennen und darauf zugreifen können. Wenn Sie Ihren ersten Tabellen-Bucket programmgesteuert mithilfe der AWS Command Line Interface (AWS CLI), AWS SDKs oder der REST-API erstellen, müssen Sie die Integration der AWS Analysedienste manuell abschließen. Weitere Informationen finden Sie unter Integration von Amazon S3 S3-Tabellen mit AWS Analysedienste.

Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/.
Wählen Sie in der Navigationsleiste oben auf der Seite den Namen der aktuell angezeigten Datei aus AWS-Region. Wählen Sie anschließend die Region aus, in der Sie den Tabellen-Bucket erstellen möchten.
Wählen Sie im linken Navigationsbereich Tabellen-Buckets aus.
Wählen Sie Tabellen-Bucket erstellen aus.
Geben Sie unter Allgemeine Konfiguration einen Namen für Ihren Tabellen-Bucket ein.

Anforderungen an den Namen des Tabellen-Buckets:
- Seien Sie einzigartig für Sie AWS-Konto in der aktuellen Region.
- Muss zwischen 3 und 63 Zeichen lang sein.
- Besteht nur aus Kleinbuchstaben, Zahlen und Bindestrichen (). -
- Muss mit einer Zahl oder einem Buchstaben beginnen und enden.
Der Name eines einmal erstellten Tabellen-Buckets kann nicht nachträglich geändert werden. Derjenige AWS-Konto , der den Tabellen-Bucket erstellt, besitzt ihn. Weitere Informationen zur Benennung von Tabellen-Buckets finden Sie unter Regeln für die Benennung von Tabellen-Buckets.
Vergewissern Sie sich, dass im Abschnitt Integration mit AWS Analysediensten das Kontrollkästchen Integration aktivieren aktiviert ist.

Wenn Integration aktivieren ausgewählt ist, wenn Sie Ihren ersten Tabellen-Bucket mithilfe der Konsole erstellen, versucht Amazon S3, Ihren Tabellen-Bucket mit AWS Analysediensten zu integrieren. Diese Integration ermöglicht es Ihnen, mithilfe von AWS Analysediensten auf alle Tabellen in der aktuellen Region zuzugreifen. Weitere Informationen finden Sie unter Integration von Amazon S3 S3-Tabellen mit AWS Analysedienste.
Wählen Sie Create Bucket (Bucket erstellen) aus.

Schritt 2: Erstellen eines Tabellen-Namespace und einer Tabelle

Für diesen Schritt erstellen Sie einen Namespace in Ihrem Tabellen-Bucket und erstellen anschließend eine neue Tabelle unter diesem Namespace. Sie können einen Tabellen-Namespace und eine Tabelle entweder über die Konsole oder die AWS CLI erstellen.

Wichtig

Achten Sie beim Erstellen von Tabellen darauf, dass Sie in Ihren Tabellennamen und Tabellendefinitionen ausschließlich Kleinbuchstaben verwenden. Stellen Sie beispielsweise sicher, dass Ihre Spaltennamen ausschließlich in Kleinbuchstaben geschrieben sind. Wenn Ihr Tabellenname oder Ihre Tabellendefinition Großbuchstaben enthält, wird die Tabelle von AWS Lake Formation oder der nicht unterstützt AWS Glue Data Catalog. In diesem Fall ist Ihre Tabelle für AWS Analysedienste wie Amazon Athena nicht sichtbar, auch wenn Ihre Tabellen-Buckets in AWS Analysedienste integriert sind.

Wenn Ihre Tabellendefinition Großbuchstaben enthält, erhalten Sie beim Ausführen einer SELECT Abfrage in Athena die folgende Fehlermeldung: „GENERIC_INTERNAL_ERROR: Get table request failed: com.amazonaws.services.glue.model. ValidationException: Nicht unterstützte Verbundressource — Ungültige Tabellen- oder Spaltennamen.“

Das folgende Verfahren erstellt mithilfe der Amazon-S3-Konsole einen Namespace und eine Tabelle mit Amazon Athena.

So erstellen Sie einen Tabellen-Namespace und eine Tabelle

Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/.
Wählen Sie im linken Navigationsbereich Tabellen-Buckets aus.
Wählen Sie auf der Seite Tabellen-Buckets den Tabellen-Bucket aus, in dem Sie eine Tabelle erstellen wollen.
Wählen Sie auf der Detailseite des Tabellen-Bucket die Option Tabelle mit Athena erstellen.
Wählen Sie im Dialogfeld Tabelle mit Athena erstellen die Option Namespace erstellen aus, und geben Sie dann einen Namen in das Feld Namespace-Name ein. Namespace-Namen müssen 1 bis 255 Zeichen lang sein und innerhalb des Tabellen-Buckets eindeutig sein. Gültige Zeichen sind a–z, 0–9 und Unterstriche (_). Unterstriche sind am Anfang von Namespace-Namen nicht zulässig.
Wählen Sie Create namespace (Namespace erstellen) aus.
Wählen Sie Tabelle mit Athena erstellen.
Die Amazon-Athena-Athena-Konsole wird geöffnet und der Athena-Abfrage-Editor wird angezeigt. Der Abfrage-Editor enthält eine Beispielabfrage, mit der Sie eine Tabelle erstellen können. Ändern Sie die Abfrage, um den Tabellennamen und die Spalten anzugeben, die Ihre Tabelle haben soll.
Wenn Sie mit dem Ändern der Abfrage fertig sind, wählen Sie Ausführen, um Ihre Tabelle zu erstellen.

Wenn Ihre Tabellenerstellung erfolgreich war, erscheint der Name Ihrer neuen Tabelle in der Tabellenliste in Athena. Wenn Sie zurück zur Amazon-S3-Konsole navigieren, erscheint Ihre neue Tabelle in der Tabellenliste auf der Detailseite für Ihren Tabellen-Bucket, nachdem Sie die Liste aktualisiert haben.

Um die folgenden AWS CLI Beispielbefehle zu verwenden, um einen Namespace in Ihrem Tabellen-Bucket zu erstellen und dann eine neue Tabelle mit einem Schema unter diesem Namespace zu erstellen, ersetzen Sie die user input placeholder Werte durch Ihre eigenen.

Voraussetzungen

Fügen Sie die AmazonS3TablesFullAccess-Richtlinie Ihrer IAM-Identität hinzu.
Installieren Sie AWS CLI Version 2.23.10 oder höher. Weitere Informationen finden Sie unter Installieren oder Aktualisieren auf die neueste Version von AWS CLI im AWS Command Line Interface -Benutzerhandbuch.

Erstellen Sie einen neuen Namespace in Ihrem Tabellen-Bucket, indem Sie den folgenden Befehl ausführen:


aws s3tables create-namespace \
--table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket \
--namespace my_namespace

Bestätigen Sie, dass Ihr Namespace erfolgreich erstellt wurde, indem Sie den folgenden Befehl ausführen:


aws s3tables list-namespaces \
--table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket

Erstellen Sie eine neue Tabelle mit einem Tabellenschema, indem Sie den folgenden Befehl ausführen:


aws s3tables create-table --cli-input-json file://mytabledefinition.json

Verwenden Sie für die mytabledefinition.json-Datei die folgende Beispieltabellendefinition:


{
    "tableBucketARN": "arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket",
    "namespace": "my_namespace",
    "name": "my_table",
    "format": "ICEBERG",
    "metadata": {
        "iceberg": {
            "schema": {
                "fields": [
                     {"name": "id", "type": "int","required": true},
                     {"name": "name", "type": "string"},
                     {"name": "value", "type": "int"}
                ]
            }
        }
    }
}

Schritt 3: Daten mit SQL in Athena abfragen

Sie können Ihre Tabelle mit SQL in Athena abfragen. Athena unterstützt Abfragen in Data Definition Language (DDL), Data Manipulation Language (DML) und Data Query Language (DQL) für S3 Tables.

Sie können auf die Athena-Abfrage entweder über die Amazon-S3-Konsole oder über die Amazon Athena-Konsole zugreifen.

Das folgende Verfahren verwendet die Amazon-S3-Konsole, um auf den Athena-Abfrage-Editor zuzugreifen, sodass Sie eine Tabelle mit Amazon Athena abfragen können.

So fragen Sie eine Tabelle ab

Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die Amazon S3 S3-Konsole unter https://console.aws.amazon.com/s3/.
Wählen Sie im linken Navigationsbereich Tabellen-Buckets aus.
Wählen Sie auf der Seite Tabellen-Buckets den Tabellen-Bucket aus, der die Tabelle enthält, die Sie abfragen möchten.
Wählen Sie auf der Seite Tabellen-Bucket-Details das Optionsfeld neben dem Namen der Tabelle aus, die Sie abfragen möchten.
Wählen Sie Tabelle mit Athena abfragen.
Die Amazon Athena-Konsole wird geöffnet und der Athena-Abfrageeditor wird mit einer für Sie geladenen SELECT-Beispielabfrage angezeigt. Ändern Sie diese Abfrage nach Bedarf für Ihren Anwendungsfall.
Wählen Sie dann Run (Ausführen) aus, um die Abfrage auszuführen.

So fragen Sie eine Tabelle ab

Öffnen Sie die Athena-Konsole unter https://console.aws.amazon.com/athena/.
Fragen Sie Ihre Tabelle ab. Nachfolgend finden Sie eine Musterabfrage, die Sie ändern können. Ersetzen Sie user input placeholders durch Ihre eigenen Informationen.
```
SELECT * FROM "s3tablescatalog/amzn-s3-demo-table-bucket"."my_namespace"."my_table" LIMIT 10
```
Wählen Sie dann Run (Ausführen) aus, um die Abfrage auszuführen.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Arbeiten mit Amazon S3 Tables und Tabellen-Buckets

Tabellen-Buckets