Wählen Sie eine SerDe für Ihre Daten

In der folgenden Tabelle sind die in Athena unterstützten Datenformate und die entsprechenden SerDe Bibliotheken aufgeführt.

Unterstützte Datenformate und SerDes
Data format (Datenformat)	Description	SerDe Typen, die in Athena unterstützt werden
Amazon Ion	Amazon Ion ist ein reich typisiertes, selbstbeschreibendes Datenformat, das eine Obermenge von JSON darstellt, das von Amazon entwickelt und Open Source entwickelt wurde.	Verwenden Sie die Amazon Ion Hive SerDe.
Apache Avro	Ein Format zum Speichern von Daten in Hadoop, bei dem JSON-basierte Schemas zum Erfassen von Werten verwendet werden.	Verwenden Sie Avro SerDe.
Apache Parquet	Ein Format für die spaltenbasierte Speicherung von Daten in Hadoop.	Verwenden Sie die Parkett SerDe und SNAPPY-Komprimierung.
Apache-Protokolle WebServer	Ein Format zum Speichern von Protokollen in Apache WebServer.	Verwenden Sie die Grok SerDe oder Regex SerDe.
CloudTrail Logs	Ein Format zum Speichern von Protokollen CloudTrail.	Verwenden Sie die Hive-JSON SerDe. Weitere Informationen finden Sie unter AWS CloudTrail Logs abfragen.
CSV (Comma Separated Values, durch Komma getrennte Werte)	Für Daten im CSV-Format stellt jede Zeile einen Datensatz dar und jeder Datensatz besteht aus mehreren durch Kommata getrennten Feldern.	Verwenden Sie das Lazy Simple SerDe für CSV-, TSV- und benutzerdefinierte Dateien, wenn Ihre Daten keine in Anführungszeichen eingeschlossenen Werte enthalten oder das Format `java.sql.Timestamp` verwendet wird. Verwenden Sie das CSV SerDe für die Verarbeitung von CSV öffnen, wenn Ihre Daten Anführungszeichen in Werten enthalten oder das numerische UNIX-Format für `TIMESTAMP` verwendet (z. B. `1564610311`).
Benutzerdefiniert, durch Trennzeichen getrennt	Bei Daten in diesem Format stellt jede Zeile einen Datensatz dar. Die Datensätze sind durch benutzerdefinierte aus einem Zeichen bestehende Trennzeichen getrennt.	Verwenden Sie die Lazy Simple SerDe für CSV-, TSV- und benutzerdefinierte Dateien und geben Sie ein einzelnes benutzerdefiniertes Trennzeichen an.
JSON (JavaScript Objektnotation)	Bei JSON-Daten stellt jede Zeile einen Datensatz dar und jeder Datensatz besteht aus Attribut/Werte-Paaren und Arrays, die durch Komma getrennt sind.	Verwenden Sie Hive-JSON SerDe. Verwenden Sie OpenX JSON SerDe.
Logstash-Protokolle	Ein Format zum Speichern von Protokollen in Logstash.	Verwenden Sie Grok SerDe.
ORC (Optimized Row Columnar)	Ein Format für die optimierte spaltenbasierte Speicherung von Hive-Daten.	Verwenden Sie die ORK SerDe und ZLIB-Komprimierung.
TSV (Tab-Separated Values, tabulatorgetrennte Werte)	Bei Daten im TSV-Format stellt jede Zeile einen Datensatz dar und jeder Datensatz besteht aus mehreren durch Tabulatoren getrennten Feldern.	Verwenden Sie die Lazy Simple SerDe für CSV-, TSV- und benutzerdefinierte Dateien und geben Sie das Trennzeichen als `FIELDS TERMINATED BY '\t'` an.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Benutzen SerDes

Verwenden Sie a SerDe , um eine Tabelle zu erstellen