Utilisation d’un SerDe pour créer une table
Pour utiliser un SerDe lors de la création d'une table dans Athena, utilisez l'une des méthodes suivantes :
-
Spécifiez
ROW FORMAT DELIMITED, puis utilisez des instructions DDL pour spécifier des délimiteurs de champs, comme dans l'exemple suivant. Lorsque vous spécifiezROW FORMAT DELIMITED, Athena utilise le SerDe LazySimpleSerDe par défaut.ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' ESCAPED BY '\\' COLLECTION ITEMS TERMINATED BY '|' MAP KEYS TERMINATED BY ':'Pour des exemples de
ROW FORMAT DELIMITED, consultez les rubriques suivantes :SerDe Lazy Simple pour les fichiers CSV, TSV et avec séparateur personnalisé
Interrogation des journaux Amazon CloudFront
Interrogation des journaux Amazon EMR
Interrogation des journaux de flux Amazon VPC
Utilisation de CTAS et INSERT INTO pour les opérations ETL et l’analyse des données
-
Utilisez
ROW FORMAT SERDEpour spécifier explicitement le type de SerDe que le service Athena doit utiliser lors de la lecture et de l'écriture de données dans la table. L'exemple suivant spécifie le SerDe LazySimpleSerDe. Pour spécifier les délimiteurs, utilisezWITH SERDEPROPERTIES. Les propriétés spécifiées parWITH SERDEPROPERTIEScorrespondent aux instructions séparées (commeFIELDS TERMINATED BY) dans l'exempleROW FORMAT DELIMITED.ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' WITH SERDEPROPERTIES ( 'serialization.format' = ',', 'field.delim' = ',', 'collection.delim' = '|', 'mapkey.delim' = ':', 'escape.delim' = '\\' )Pour des exemples de
ROW FORMAT SERDE, consultez les rubriques suivantes :