本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
資料庫叢集匯出的考量事項
使用下列各節,來了解將資料庫叢集資料匯出至 Amazon S3 時的限制、檔案命名慣例,以及資料轉換和儲存。
限制
將資料庫叢集資料匯出至 Amazon S3 時有下列限制:
-
您無法同時針對相同的資料庫叢集執行多個匯出任務。這同時適用於完整和部分匯出。
-
您每個 AWS 帳戶最多可以有五個正在同時進行的資料庫快照匯出任務。
-
Aurora Serverless v1 資料庫叢集不支援匯出至 S3。
-
對於已佈建引擎模式,Aurora MySQL 和 Aurora PostgreSQL 僅支援匯出至 S3。
-
匯出至 S3 不支援內含冒號 (:) 的 S3 字首。
-
在匯出過程中,S3 檔案路徑中的以下字元將轉換為底線 (_):
\ ` " (space) -
如果資料庫、結構描述或資料表的名稱中包含下列字元以外的字元,則不支援部分匯出。不過,您可以匯出整個資料庫叢集。
-
拉丁字母 (A–Z)
-
數字 (0–9)
-
美元符號 ($)
-
底線 (_)
-
-
資料庫資料表資料欄名稱不支援空格 ( ) 和某些字元。資料行名稱中具備下列字元的資料表會在匯出時跳過:
, ; { } ( ) \n \t = (space) -
匯出時會略過名稱中具備斜線 (/) 的表格。
-
匯出期間,系統會略過 Aurora PostgreSQL 的暫存和未記錄資料表。
-
若資料包含接近或超過 500 MB 的大型物件 (例如 BLOB 或 CLOB),則匯出會失敗。
-
如果資料表包含接近或大於 2 GB 的大型資料列,則在匯出期間會略過該資料表。
-
對於部分匯出,
ExportOnly清單的大小上限為 200 KB。 -
強烈建議您對每個匯出任務使用唯一的名稱。如果不使用唯一的任務名稱,可能會收到下列錯誤訊息:
ExportTaskAlreadyExistsFault:呼叫 StartExportTask 操作時出現錯誤 (ExportTaskAlreadyExists):IDxxxxx的匯出任務已存在。 -
由於某些資料表可能會略過,因此建議您在匯出之後驗證資料中的資料列和資料表計數。
檔案命名慣例
特定表格的匯出資料會以 的格式儲存,其中基本前綴如下:base_prefix/files
export_identifier/database_name/schema_name.table_name/
例如:
export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/
輸出檔案使用下列命名慣例,其中 partition_index 是英數字元:
partition_index/part-00000-random_uuid.format-based_extension
例如:
1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet
檔案命名慣例可能會有所變更。因此,在讀取目標資料表時,建議您讀取資料表基本字首內的所有內容。
資料轉換和存放格式
當您將資料庫叢集匯出至 Amazon S3 儲存貯體時,Amazon Aurora 會以 Parquet 格式轉換、匯出以及存放資料。如需更多詳細資訊,請參閱 匯出至 Amazon S3 儲存貯體時的資料轉換。