Datentypen in Amazon Athena
Wenn Sie CREATE TABLE ausführen, geben Sie Spaltennamen und den Datentyp an, den jede Spalte enthalten kann. Die Tabellen, die Sie erstellen, werden in AWS Glue Data Catalog gespeichert.
Um die Interoperabilität mit anderen Abfrage-Engines zu erleichtern, verwendet Athena Apache HiveCREATE TABLE. Für DML-Abfragen wie SELECT, CTAS und INSERT INTO verwendet Athena Trino
| DDL | DML | Beschreibung |
|---|---|---|
| BOOLEAN | Die Werte sind true und false. |
|
| TINYINT | Eine 8-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -27 und einem Höchstwert von 27-1. | |
| SMALLINT | Eine 16-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -215 und einem Höchstwert von 215-1. | |
| INT, INTEGER | Ein 32-Bit signierter Wert im Zweierkomplement-Format mit einem Mindestwert von -231 und einem Höchstwert von 231-1. | |
| BIGINT | Eine 64-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -263 und einem Höchstwert von 263-1. | |
| FLOAT | REAL | Eine 32-Bit signierte Gleitkommazahl mit einfacher Genauigkeit. Der Bereich liegt zwischen 1,40129846432481707e-45 und 3,40282346638528860e+38, positiv oder negativ. Entspricht dem IEEE-Standard für Gleitkomma-Arithmetik (IEEE 754). |
| DOUBLE | Eine 64-Bit signierte Gleitkommazahl mit doppelter Genauigkeit. Der Bereich liegt zwischen 4,94065645841246544e-324d und 1,79769313486231570e+308d, positiv oder negativ. Entspricht dem IEEE-Standard für Gleitkomma-Arithmetik (IEEE 754). | |
DECIMAL(Genauigkeit, Skalierung) |
ist die Gesamtanzahl der Stellen. (optional) ist die Anzahl der Nachkommastellen mit einem Standardwert von 0. Verwenden Sie z. B. diese Definitionen: decimal(11,5), decimal(15). Die maximale Wert der Genauigkeit ist 38 und der maximale Wert für die Skalierung beträgt 38. |
|
CHAR, CHAR (Länge) |
Zeichendaten mit fester Länge, die zwischen 1 und 255 Zeichen liegen muss, z. B. char(10). Wenn die Weitere Informationen finden Sie unter CHAR-Hive-Datentyp |
|
| STRING | VARCHAR | Zeichendaten mit variabler Länge. |
VARCHAR (Länge) |
Zeichendaten variabler Länge mit einer maximalen Leselänge. Zeichenfolgen werden beim Lesen auf die angegebene Länge gekürzt. Wenn die zugrunde liegende Datenzeichenfolge länger ist, bleibt die zugrunde liegende Datenzeichenfolge unverändert. | |
| BINARY | VARBINARY | Binärdaten mit variabler Länge. |
| Nicht verfügbar | TIME | Eine Tageszeit mit Millisekundengenauigkeit. |
| Nicht verfügbar | Zeit(genauigkeit) |
Eine Tageszeit mit einer bestimmten Genauigkeit. TIME(3) ist gleichwertig mit TIME. |
| Nicht verfügbar | TIME WITH TIME ZONE | Eine Tageszeit in einer Zeitzone. Zeitzonen sollten als Offsets von UTC angegeben werden. |
| DATUM | Ein Kalenderdatum mit Jahr, Monat und Tag. | |
| TIMESTAMP (ZEITSTEMPEL) | TIMESTAMP, TIMESTAMP WITHOUT TIME ZONE | Ein Kalenderdatum und eine Uhrzeit mit Millisekundengenauigkeit. |
| Nicht verfügbar | TIMESTAMP(Genauigkeit), TIMESTAMP(Genauigkeit) WITHOUT TIME ZONE |
Ein Kalenderdatum und eine Uhrzeit mit einer bestimmten Genauigkeit. TIMESTAMP(3) ist gleichwertig mitTIMESTAMP. |
| Nicht verfügbar | TIMESTAMP WITH TIME ZONE | Ein Kalenderdatum und eine Uhrzeit in einer Zeitzone. Zeitzonen können als Abweichungen von UTC, als IANA-Zeitzonennamen oder mit UTC, UT, Z oder GMT angegeben werden. |
| Nicht verfügbar | TIMESTAMP(Genauigkeit) WITH TIME ZONE |
Ein Kalenderdatum und eine Uhrzeit mit einer bestimmten Genauigkeit in einer Zeitzone. |
| Nicht verfügbar | INTERVAL YEAR TO MONTH | Ein Zeitraum von einem oder mehreren ganzen Monaten |
| Nicht verfügbar | INTERVAL DAY TO SECOND | Ein Zeitraum von einer oder mehreren Sekunden, Minuten, Stunden oder Tagen |
ARRAY<element_type> |
ARRAY[element_type] |
Ein Array von Werten. Alle Werte müssen denselben Datentyp haben. |
MAP<key_type, value_type> |
MAP(key_type, value_type) |
Eine Karte, in der Werte nach Schlüsseln gesucht werden können. Alle Schlüssel müssen denselben Datentyp haben und alle Werte müssen denselben Datentyp haben. Beispiel, map<string, integer>. |
STRUCT<field_name_1:field_type_1, field_name_2:field_type_2, …> |
ROW(field_name_1 field_type_1, field_name_2 field_type_2, …) |
Eine Datenstruktur mit benannten Feldern und deren Werten. |
| Nicht verfügbar | JSON | JSON-Wertetyp, bei dem es sich um ein JSON-Objekt, ein JSON-Array, eine JSON-Nummer, eine JSON-Zeichenfolge, , true, false oder null handeln kann. |
| Nicht verfügbar | UUID | Eine UUID (universell eindeutige ID). |
| Nicht verfügbar | IPADDRESS | Eine IPv4- oder IPv6-Adresse. |
| Nicht verfügbar | HyperLogLog |
Diese Datentypen unterstützen ungefähre Funktionsinterna. Weitere Informationen zu jedem Typ finden Sie unter dem Link zum entsprechenden Eintrag in der Trino-Dokumentation. |
| P4HyperLogLog |
||
| SetDigest |
||
| QDigest |
||
| TDigest |
||