Datentypen in Amazon Athena - Amazon Athena

Datentypen in Amazon Athena

Wenn Sie CREATE TABLE ausführen, geben Sie Spaltennamen und den Datentyp an, den jede Spalte enthalten kann. Die Tabellen, die Sie erstellen, werden in AWS Glue Data Catalog gespeichert.

Um die Interoperabilität mit anderen Abfrage-Engines zu erleichtern, verwendet Athena Apache Hive-Datentypnamen für DDL-Anweisungen wie CREATE TABLE. Für DML-Abfragen wie SELECT, CTAS und INSERT INTO verwendet Athena Trino-Datentypnamen. Die folgende Tabelle zeigt die Datentypen, die in Athena unterstützt werden. Wenn sich DDL- und DML-Typen in Bezug auf Namen, Verfügbarkeit oder Syntax unterscheiden, werden sie in separaten Spalten angezeigt.

DDL DML Beschreibung
BOOLEAN Die Werte sind true und false.
TINYINT Eine 8-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -27 und einem Höchstwert von 27-1.
SMALLINT Eine 16-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -215 und einem Höchstwert von 215-1.
INT, INTEGER Ein 32-Bit signierter Wert im Zweierkomplement-Format mit einem Mindestwert von -231 und einem Höchstwert von 231-1.
BIGINT Eine 64-Bit signierte Ganzzahl im Zweierkomplement-Format mit einem Mindestwert von -263 und einem Höchstwert von 263-1.
FLOAT REAL Eine 32-Bit signierte Gleitkommazahl mit einfacher Genauigkeit. Der Bereich liegt zwischen 1,40129846432481707e-45 und 3,40282346638528860e+38, positiv oder negativ. Entspricht dem IEEE-Standard für Gleitkomma-Arithmetik (IEEE 754).
DOUBLE Eine 64-Bit signierte Gleitkommazahl mit doppelter Genauigkeit. Der Bereich liegt zwischen 4,94065645841246544e-324d und 1,79769313486231570e+308d, positiv oder negativ. Entspricht dem IEEE-Standard für Gleitkomma-Arithmetik (IEEE 754).
DECIMAL(Genauigkeit, Skalierung) precision ist die Gesamtanzahl der Stellen. scale (optional) ist die Anzahl der Nachkommastellen mit einem Standardwert von 0. Verwenden Sie z. B. diese Definitionen: decimal(11,5), decimal(15). Die maximale Wert der Genauigkeit ist 38 und der maximale Wert für die Skalierung beträgt 38.
CHAR, CHAR (Länge)

Zeichendaten mit fester Länge, die zwischen 1 und 255 Zeichen liegen muss, z. B. char(10). Wenn die Länge angegeben ist, werden Zeichenfolgen beim Lesen auf die angegebene Länge gekürzt. Wenn die zugrunde liegende Datenzeichenfolge länger ist, bleibt die zugrunde liegende Datenzeichenfolge unverändert.

Weitere Informationen finden Sie unter CHAR-Hive-Datentyp.

STRING VARCHAR Zeichendaten mit variabler Länge.
VARCHAR (Länge) Zeichendaten variabler Länge mit einer maximalen Leselänge. Zeichenfolgen werden beim Lesen auf die angegebene Länge gekürzt. Wenn die zugrunde liegende Datenzeichenfolge länger ist, bleibt die zugrunde liegende Datenzeichenfolge unverändert.
BINARY VARBINARY Binärdaten mit variabler Länge.
Nicht verfügbar TIME Eine Tageszeit mit Millisekundengenauigkeit.
Nicht verfügbar Zeit(genauigkeit) Eine Tageszeit mit einer bestimmten Genauigkeit. TIME(3) ist gleichwertig mit TIME.
Nicht verfügbar TIME WITH TIME ZONE Eine Tageszeit in einer Zeitzone. Zeitzonen sollten als Offsets von UTC angegeben werden.
DATUM Ein Kalenderdatum mit Jahr, Monat und Tag.
TIMESTAMP (ZEITSTEMPEL) TIMESTAMP, TIMESTAMP WITHOUT TIME ZONE Ein Kalenderdatum und eine Uhrzeit mit Millisekundengenauigkeit.
Nicht verfügbar TIMESTAMP(Genauigkeit), TIMESTAMP(Genauigkeit) WITHOUT TIME ZONE Ein Kalenderdatum und eine Uhrzeit mit einer bestimmten Genauigkeit. TIMESTAMP(3) ist gleichwertig mitTIMESTAMP.
Nicht verfügbar TIMESTAMP WITH TIME ZONE Ein Kalenderdatum und eine Uhrzeit in einer Zeitzone. Zeitzonen können als Abweichungen von UTC, als IANA-Zeitzonennamen oder mit UTC, UT, Z oder GMT angegeben werden.
Nicht verfügbar TIMESTAMP(Genauigkeit) WITH TIME ZONE Ein Kalenderdatum und eine Uhrzeit mit einer bestimmten Genauigkeit in einer Zeitzone.
Nicht verfügbar INTERVAL YEAR TO MONTH Ein Zeitraum von einem oder mehreren ganzen Monaten
Nicht verfügbar INTERVAL DAY TO SECOND Ein Zeitraum von einer oder mehreren Sekunden, Minuten, Stunden oder Tagen
ARRAY<element_type> ARRAY[element_type] Ein Array von Werten. Alle Werte müssen denselben Datentyp haben.
MAP<key_type, value_type> MAP(key_type, value_type) Eine Karte, in der Werte nach Schlüsseln gesucht werden können. Alle Schlüssel müssen denselben Datentyp haben und alle Werte müssen denselben Datentyp haben. Beispiel, map<string, integer>.
STRUCT<field_name_1:field_type_1, field_name_2:field_type_2, …> ROW(field_name_1 field_type_1, field_name_2 field_type_2, …) Eine Datenstruktur mit benannten Feldern und deren Werten.
Nicht verfügbar JSON JSON-Wertetyp, bei dem es sich um ein JSON-Objekt, ein JSON-Array, eine JSON-Nummer, eine JSON-Zeichenfolge, , true, false oder null handeln kann.
Nicht verfügbar UUID Eine UUID (universell eindeutige ID).
Nicht verfügbar IPADDRESS Eine IPv4- oder IPv6-Adresse.
Nicht verfügbar HyperLogLog Diese Datentypen unterstützen ungefähre Funktionsinterna. Weitere Informationen zu jedem Typ finden Sie unter dem Link zum entsprechenden Eintrag in der Trino-Dokumentation.
P4HyperLogLog
SetDigest
QDigest
TDigest