Schemaaktualisierungen vornehmen - Amazon Athena

Schemaaktualisierungen vornehmen

In diesem Thema werden einige der Änderungen beschrieben, die Sie in CREATE TABLE-Anweisungen am Schema vornehmen können, ohne Ihre Daten tatsächlich zu ändern. Um ein Schema zu aktualisieren, können Sie in einigen Fällen einen ALTER TABLE-Befehl verwenden, in anderen Fällen ändern Sie jedoch nicht wirklich eine vorhandene Tabelle. Stattdessen erstellen Sie eine Tabelle mit einem neuen Namen, der das Schema ändert, das Sie in Ihrer ursprünglichen CREATE TABLE-Anweisung verwendet haben.

Je nachdem, wie sich Ihre Schemata voraussichtlich weiterentwickeln, verwenden Sie ein kompatibles Datenformat, um weiterhin Athena-Abfragen verwenden zu können.

Untersuchen wir als Erstes eine Anwendung, in der Bestellinformationen aus einer orders-Tabelle gelesen werden, die in zwei Formaten existiert: CSV und Parquet.

Mit dem folgenden Beispiel wird eine Tabelle in Parquet erstellt:

CREATE EXTERNAL TABLE orders_parquet ( `orderkey` int, `orderstatus` string, `totalprice` double, `orderdate` string, `orderpriority` string, `clerk` string, `shippriority` int ) STORED AS PARQUET LOCATION 's3://amzn-s3-demo-bucket/orders_ parquet/';

Mit dem folgenden Beispiel wird die gleiche Tabelle in CSV erstellt:

CREATE EXTERNAL TABLE orders_csv ( `orderkey` int, `orderstatus` string, `totalprice` double, `orderdate` string, `orderpriority` string, `clerk` string, `shippriority` int ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LOCATION 's3://amzn-s3-demo-bucket/orders_csv/';

Folgende Themen zeigen wie sich Aktualisierungen für diese Tabellen auf Athena-Abfragen auswirken.