本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
限制
在將資料湖架構與 AWS Glue 搭配使用之前,請考量下列限制。
-
下列適用於 DynamicFrame 的 AWS Glue
GlueContext方法不支援讀取和寫入資料湖架構資料表。改用適用於 DataFrame 或 Spark DataFrame API 的GlueContext方法。-
create_dynamic_frame.from_catalog -
write_dynamic_frame.from_catalog -
getDynamicFrame -
writeDynamicFrame
-
-
下列適用於 DataFrame 的
GlueContext方法支援 Lake Formation 權限控制:-
create_data_frame.from_catalog -
write_data_frame.from_catalog -
getDataFrame -
writeDataFrame
-
-
不支援將小型檔案分組。
-
不支援任務書籤。
-
AWS Glue 3.0 的 Apache Hudi 0.10.1 不支援在 Hudi 讀取時合併 (MoR) 資料表。
-
ALTER TABLE … RENAME TO不適用於 AWS Glue 3.0 的 Apache Iceberg 0.13.1。
由 Lake Formation 權限管理的資料湖格式資料表的限制
資料湖格式會透過 Lake Formation 權限與 AWS Glue ETL 整合。不支援使用 create_dynamic_frame 建立 DynamicFrame。如需詳細資訊,請參閱下列範例:
注意
僅在 AWS Glue 第 4.0 版中支援透過適用於 Apache Hudi、Apache Iceberg 和 Delta Lake 的 Lake Formation 許可與 AWS Glue ETL 整合。
Apache Iceberg 可透過 Lake Formation 權限與 AWS Glue ETL 適當整合。其支援幾乎所有操作 (包含 SQL 支援)。
Hudi 支援大多數基本操作 (除管理操作外)。這是因為這些選項通常會透過 DataFrame 寫入完成,並透過 additional_options 指定。由於系統不支援 SparkSQL,因此您需要使用 AWS Glue API 針對操作建立 DataFrame。
Delta Lake 僅支援讀取、附加及覆寫資料表資料。Delta Lake 需要使用自有的程式庫才可執行不同任務 (例如,更新)。
下列功能不適用於 Lake Formation 權限管理的 Iceberg 資料表。
使用 AWS Glue ETL 壓縮
Spark SQL 透過 AWS Glue ETL 支援
下列為 Lake Formation 權限管理的 Hudi 資料表限制:
移除遺棄的檔案
下列為 Lake Formation 權限管理的 Delta Lake 資料表限制:
插入 Delta Lake 資料表和從其中讀取以外的所有功能。