維護任務的考量和限制 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

維護任務的考量和限制

Amazon S3 可提供維護操作,以增強 S3 資料表或資料表儲存貯體的效能。這些選項包括檔案壓縮、快照管理和未參考檔案移除。下列是這些管理選項的限制和考量。

壓縮的考量事項

您應該為壓縮作業考量下列注意事項。如需壓縮的詳細資訊,請參閱S3 Tables 維護

  • 壓縮僅支援 Apache Parquet 檔案類型。

  • 壓縮不支援資料類型:已修正。

  • 壓縮不支援壓縮類型:brotlilz4

快照管理的考量事項

您應該為快照管理考量下列注意事項。如需快照管理的詳細資訊,請參閱S3 Tables 維護

  • 只有在滿足兩個條件時,系統才會保留快照:要保留的快照數量下限和指定的保留期間。

  • 快照管理會從 Apache Iceberg 刪除過期的快照中繼資料,以防止進行過期快照的時間歷程查詢,並選擇性地刪除相關聯的資料檔案。

  • 快照管理不支援您在 metadata.json 檔案中或透過 ALTER TABLE SET TBLPROPERTIES SQL 命令設定作為 Iceberg 資料表屬性的保留值,包括分支或標籤型保留。在設定分支或標籤型保留政策時,或在 metadata.json 檔案上設定的保留政策比透過 PutTableMaintenanceConfiguration API 設定之值還長時,系統會停用快照管理。在這些情況下,S3 不會讓快照過期或加以移除,而且您將需要手動刪除快照,或從您的 Iceberg 資料表移除屬性,以避免產生儲存費用。

移除未參考檔案的考量事項

您應該為移除未參考檔案考量下列注意事項。如需移除未參考檔案的詳細資訊,請參閱Amazon S3 資料表儲存貯體維護

  • 如果不再由 Iceberg 中繼資料參考之資料和中繼資料檔案的建立時間早於保留期間,則未參考檔案移除會將其刪除。

S3 資料表和資料表儲存貯體維護的限制

維護操作 屬性 是否可在資料表儲存貯體層級進行設定? 是否可在資料表層級進行設定? 預設值 最小值
壓縮 targetFileSizeMB 512 MB 64 MB
快照管理 minimumSnapshots 1 1
快照管理 maximumSnapshotAge 120 小時 1 小時
未參考檔案移除 unreferencedDays 3 天 1 天
未參考檔案移除 nonCurrentDays 10 天 1 天
注意

S3 Tables 會套用 128 MB 的 parquets row-group-default 大小。