本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
將資料庫叢集快照資料匯出至 Amazon S3
您可將資料庫叢集快照資料匯出至 Amazon S3 儲存貯體。匯出程序會在背景中執行,不會影響您作用中資料庫叢集的效能。
當您匯出資料庫叢集快照時,Amazon Aurora 會從快照擷取資料,並將其存放於 Amazon S3 儲存貯體中。您可以匯出手動快照和自動化系統快照。根據預設會匯出快照中的所有資料。但是,您可以選擇匯出特定資料庫、結構描述或資料表集。
注意
從資料庫叢集快照匯出資料需要還原快照。還原時間會受到各種因素的影響,例如 AWS 區域 接收相對於其可用頻寬的網路流量。當流量突然增加時,您可能會遇到比預期更長的完成時間。
降低 Aurora 資料庫 S3 匯出時間的替代方案是將實際資料庫叢集匯出至 S3。資料庫叢集匯出的開始時間比資料庫快照匯出更短,因為不需要還原快照。如需更多詳細資訊,請參閱 將資料庫叢集資料匯出至 Amazon S3。
資料會以壓縮且一致的 Apache Parquet 格式存放。個別 Parquet 檔案的大小通常約為 1–10 MB。
匯出資料後,您可以直接透過 Amazon Athena 或 Amazon Redshift Spectrum 等工具分析匯出後的資料。有關使用 Athena 來讀取 Parquet 資料的詳細資訊,請參閱Amazon Athena 使用者指南中的 Parquet SerDe。如需有關使用 Redshift Spectrum 來讀取 Parquet 資料的詳細資訊,請參閱《Amazon Redshift 資料庫開發人員指南》中的從單欄式資料格式的 COPY。
功能可用性和支援會因每個資料庫引擎的特定版本以及 AWS 區域 而有所不同。如需將資料庫叢集快照資料匯出至 S3 功能之版本和區域可用性的詳細資訊,請參閱 將快照資料匯出至 Amazon S3 的支援區域和 Aurora 資料庫引擎。
您可以使用下列程序,將資料庫快照資料匯出至 Amazon S3 儲存貯體。如需詳細資訊,請參閱下列各節。
匯出快照資料概觀
-
識別要匯出的快照
使用現有的自動化或手動快照,或是建立資料庫執行個體的手動快照。
-
設定對 Amazon S3 儲存貯體的存取。
「儲存貯體」是 Amazon S3 物件或檔案的容器。如要提供存取儲存貯體的資訊,請採取下列步驟:
-
識別要匯出快照的目標 S3 儲存貯體。S3 儲存貯體必須位於和快照相同的 AWS 區域。如需更多詳細資訊,請參閱 識別要匯出的 Amazon S3 儲存貯體。
-
建立 AWS Identity and Access Management (IAM) 角色,授予快照會出任務對 S3 儲存貯體的存取權限。如需更多詳細資訊,請參閱 使用 IAM 角色提供對 Amazon S3 儲存貯體的存取權。
-
-
建立用於伺服器端加密的對稱式加密 AWS KMS key。快照匯出任務會在將匯出資料寫入 S3 時,使用 KMS 金鑰來設定 AWS KMS 伺服器端加密。
KMS 金鑰政策必須同時包含
kms:CreateGrant和kms:DescribeKey許可。如需在 Amazon Aurora 中使用 KMS 金鑰的詳細資訊,請參閱 AWS KMS key管理。如果您的 KMS 金鑰政策中有拒絕陳述式,請務必明確排除 AWS 服務主體
export.rds.amazonaws.com。您可以使用 AWS 帳戶內的 KMS 金鑰,或使用跨帳戶 KMS 金鑰。如需更多詳細資訊,請參閱 使用跨帳戶 AWS KMS key。
-
使用主控台或
start-export-taskCLI 命令將快照匯出至 Amazon S3。如需更多詳細資訊,請參閱 建立快照匯出任務。 -
若要存取 Amazon S3 儲存貯體中您匯出的資料,請參閱《Amazon Simple Storage Service 使用者指南》中的上傳、下載及管理物件。
在以下各節中了解如何設定、匯出、監控、取消和故障診斷資料庫叢集快照匯出任務。