产品和服务集成 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

产品和服务集成

阅读本节,了解哪些产品和服务可与 DataBrew 集成。

DataBrew 可使用以下 AWS 服务进行联网、管理和治理:

DataBrew 可使用以下 AWS 数据湖和数据存储:

DataBrew 支持使用以下文件格式和扩展名上传数据。

格式 文件扩展名(可选) 压缩文件的扩展名(必需)

逗号分隔的值

.csv

.gz

.snappy

.lz4

.bz2

.deflate

Microsoft Excel 工作簿

.xlsx

不支持压缩

JSON(JSON 文档和 JSON Lines)

.json, .jsonl

.gz

.snappy

.lz4

.bz2

.deflate

Apache ORC

.orc

.zlib

.snappy

Apache Parquet

.parquet

.gz

.snappy

.lz4

DataBrew 将输出文件写入 Amazon S3,并支持以下文件格式和扩展名。

格式 文件扩展名(未压缩) 文件扩展名(压缩)

逗号分隔的值

.csv .csv.snappy, .csv.gz, .csv.lz4, csv.bz2, .csv.deflate, csv.br

制表符分隔值

.csv .tsv.snappy, .tsv.gz, .tsv.lz4, tsv.bz2, .tsv.deflate, tsv.br
Apache Parquet .parquet .parquet.snappy, .parquet.gz, .parquet.lz4, .parquet.lzo, .parquet.br
AWS Glue Parquet 不支持 .glue.parquet.snappy
Apache Avro .avro .avro.snappy, .avro.gz, .avro.lz4, .avro.bz2, .avro.deflate, .avro.br
Apache ORC .orc .orc.snappy, .orc.lzo, .orc.zlib
XML .xml .xml.snappy, .xml.gz, .xml.lz4, .xml.bz2, .xml.deflate, .xml.br
JSON(仅限 JSON Lines 格式) .json .json.snappy, .json.gz, .json.lz4, json.bz2, .json.deflate, .json.br
Tableau Hyper 不支持 不适用