本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
具有 Intelligent-Tiering 之資料表的成本最佳化
您可以使用 S3 Intelligent-Tiering 自動最佳化資料表的儲存成本。當存取模式變更時,S3 Tables Intelligent-Tiering 儲存類別會自動將資料移至最具成本效益的存取層。當您使用 S3 Intelligent-Tiering 時,存取頻率較低的資料會自動移至成本較低的層,並在每次再次存取時移回經常存取層。
所有資料都會在層之間移動,而不會產生擷取費用、效能影響或可用性變更。此外,壓縮等資料表維護操作會根據存取模式進行最佳化,僅處理經常存取層中的主動存取資料,同時降低低成本層中存取頻率較低之資料的維護成本。
主題
S3 Tables Intelligent-Tiering 存取層
當您的資料表存放在 S3 Intelligent-Tiering 儲存類別時,Amazon S3 會持續監控存取模式,並在存取層之間自動移動資料表資料。
分層發生在個別檔案層級,因此單一資料表可以根據存取模式在不同層中具有檔案。資料表資料會根據存取模式自動移至下列其中一個存取層:
-
經常存取:所有檔案的預設層。其他層中的檔案會在存取時自動移回經常存取層。
-
不常存取:如果您連續 30 天未存取檔案,則會移至不常存取層。
-
封存即時存取:如果您連續 90 天未存取檔案,則會移至封存即時存取層。
所有層都提供毫秒延遲、高輸送量效能,專為 99.9% 可用性和 99.999999999% 耐用性而設計。
使用 S3 Intelligent-Tiering 的自動分層行為
下列動作會構成存取,自動將檔案從不常存取層或 Archive Instant Access 層移回經常存取層:
-
使用
PutObject、 或GetObjectCompleteMultipartUpload動作對資料表資料或中繼資料檔案進行任何讀取或寫入操作 -
LoadTable使用 Iceberg REST API 操作的 或UpdateTable動作 -
S3 Tables 複寫操作
其他動作不會構成自動將檔案從不常存取層或 Archive Instant Access 層移回經常存取層的存取。
注意
小於 128 KB 的檔案不符合自動分層的資格,並保留在經常存取層中。壓縮可能會將這些檔案合併為較少、較大的物件,並將其遞交回資料表做為新的快照。如果新檔案為 128 KB 或更大,則新壓縮的檔案符合自動分層的資格。
資料表維護行為
Amazon S3 執行的自動資料表維護操作,例如快照管理、未參考的檔案移除和記錄過期,無論層為何,都會繼續在您的資料表上執行。壓縮只會對經常存取層中的檔案執行,最佳化經常存取資料的效能,同時降低成本較低的層資料維護成本。
維護操作不會影響您資料表中檔案的存取層。維護操作執行的讀取不會導致檔案變更層。不過,如果壓縮或記錄過期等維護操作寫入新的檔案,則該檔案會在經常存取層中建立。
注意
由於壓縮只會處理經常存取層中的檔案,因此低成本層中的資料刪除操作會建立不會自動壓縮的刪除檔案。當存取相關聯的資料檔案並移回經常存取層時,這些刪除檔案符合壓縮資格。對於不常存取的資料表,您可以使用 Amazon EMR 手動執行壓縮,以將這些刪除檔案與其相關聯的資料檔案壓縮。如需詳細資訊,請參閱使用壓縮來維護資料表。您可以使用 Amazon CloudWatch 指標監控資料表中的檔案成長,以判斷手動壓縮可能有何好處。
將 S3 Intelligent-Tiering 指定為您的儲存類別
根據預設,所有資料表都會在 S3 標準儲存類別中建立,無法移至 S3 Intelligent-Tiering。若要使用 S3 Intelligent-Tiering,您必須在建立資料表時指定它。您也可以將 S3 Intelligent-Tiering 設定為資料表儲存貯體的預設儲存體方案,以自動儲存在 S3 Intelligent-Tiering 儲存體方案中建立的任何新資料表。
指定資料表儲存貯體的 S3 Intelligent-Tiering
您可以使用 storage-class-configuration標頭搭配 CreateTableBucket操作,將 S3 Intelligent-Tiering 指定為建立新資料表儲存貯體時的預設儲存體方案。
若要檢查現有資料表儲存貯體上的預設儲存類別,請使用 GetTableBucketStorageClass操作。若要修改現有資料表儲存貯體的預設儲存體方案,請使用 PutTableBucketStorageClass操作。
注意
當您修改資料表儲存貯體上的預設儲存類別時,該設定僅適用於在該儲存貯體中建立的新資料表。預先存在資料表的儲存體方案不會變更。
指定資料表的 S3 Intelligent-Tiering
您可以在使用 storage-class-configuration標頭搭配 CreateTable操作建立新資料表時,將 S3 Intelligent-Tiering 指定為儲存體方案。
如果您在建立資料表時未指定儲存體方案,則會在當時在資料表儲存貯體上設定的預設儲存體方案中建立資料表。建立資料表後,您就無法修改其儲存類別。
若要檢查現有資料表儲存貯體上的預設儲存類別,請使用 GetTableBucketStorageClass操作。
監控儲存體用量
您可以在帳戶的 AWS 成本和用量報告中,依存取層檢視儲存體用量明細。如需詳細資訊,請參閱《AWS 資料匯出使用者指南》中的建立成本和用量報告。
帳單報告中提供下列用量類型:
| 用量類型 | 單位 | 精細程度 | Description |
|---|---|---|---|
|
GB-月 | 每日 | S3 Intelligent-Tiering 經常存取 S3 Intelligent-Tiering 儲存體中存放資料的 GB 月數 |
|
GB-月 | 每日 | S3 Intelligent-Tiering 不常存取 S3 Intelligent-Tiering 儲存體中存放資料的 GB 月數 |
|
GB-月 | 每日 | S3 Intelligent-Tiering Archive Instant Access of S3 Intelligent-Tiering Storage 中存放資料的 GB 月數 |
|
計數 | 每小時 | S3 Tables Intelligent-Tiering 物件上的 PUTCOPY、 或 POST請求數目 |
|
計數 | 每小時 | S3 Tables Intelligent-Tiering 物件的 GET和所有其他非 Tier1 請求數量 non-Tier1 |