複寫 S3 資料表 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

複寫 S3 資料表

Amazon S3 Tables 支援自動複寫存放在 Amazon S3 資料表儲存貯體中的 Apache Iceberg 資料表。複寫目的地可以位於相同 AWS 區域內、跨多個 AWS 區域、相同帳戶或其他 AWS 帳戶。透過設定資料表的複寫,您可以跨多個位置維護資料的唯讀複本。您可以使用複本來增強資料可用性、符合合規要求,並提高分散式應用程式的存取效能。

S3 Tables 複寫會透過將所有資料表更新,包括快照、中繼資料和資料檔案,以與來源資料表相同的順序遞交至目的地資料表,來維護資料一致性。

何時使用 S3 Tables 複寫

您可以將 S3 Tables 複寫用於下列目的:

  • 將延遲降至最低 – 如果您的客戶位於兩個地理位置,您可以透過在地理位置上更接近使用者的 AWS 區域中維護僅供讀取複本,將存取資料表時的延遲降至最低。

  • 法規合規 – 您可以在特定地理位置或 AWS 帳戶中維護僅供讀取複本,這可協助您符合特定的法規或合規要求。您可以設定複寫目的地資料表儲存貯體,以使用與來源不同的 AWS KMS 金鑰來加密資料表。

  • 集中式分析 – 如果您的資料分散在多個 AWS 區域,您可以將區域特定的資料集複寫到集中式區域,以進行統一的報告、跨區域分析和機器學習模型訓練。這不需要跨區域查詢或建置自訂資料彙總管道。

  • 測試和開發環境 – 您可以在個別 AWS 帳戶 或資料表儲存貯體中建立生產資料表的僅供讀取複本,為開發和 QA 團隊提供逼真的測試資料。這會將測試工作負載與生產系統隔離,同時確保測試環境具有目前、類似生產的資料,而不需要手動匯出或資料同步程序。

功能

S3 Tables 複寫提供下列功能。

S3 資料表的唯讀複本

S3 Tables 複寫會在資料表儲存貯體之間建立 Apache Iceberg 資料表的唯讀複本。您可以使用任何 Iceberg 相容引擎來獨立查詢複本。

自動維護的複本

S3 Tables 複寫服務會自動維護複本資料表。複寫通常會在來源更新後的幾分鐘內更新複本。S3 Tables 會以與來源資料表相同的順序遞交所有更新,以維持一致性。

複寫到多個目的地

您可以將相同的資料表複寫到多個目的地資料表儲存貯體。複寫目的地可以位於相同、 AWS 區域跨多個 AWS 區域、相同 AWS 帳戶或其他 AWS 帳戶中。

獨立快照保留

複本資料表的快照過期與來源資料表無關,可讓您視需要在複本資料表上設定不同的保留期間。例如,您可以將來源資料表設定為保留快照 30 天,同時設定複本資料表的 90 天保留期。如果您在複本上設定更長的保留期間,在來源過期的快照仍可在複本中查詢。此組態為歷史分析提供延長的時間歷程功能。

在成本較低的儲存層中維護複本資料表

您可以設定目的地資料表儲存貯體以使用 S3 Intelligent-Tiering 儲存類別,根據存取模式自動最佳化儲存成本,而不會影響效能或營運開銷。S3 Intelligent-Tiering 非常適合可能不常存取的複本資料表。

如需 S3 Tables 複寫的詳細資訊,請參閱下列主題。