資料庫叢集匯出的考量事項 - Amazon Aurora

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

資料庫叢集匯出的考量事項

使用下列各節,來了解將資料庫叢集資料匯出至 Amazon S3 時的限制、檔案命名慣例,以及資料轉換和儲存。

限制

將資料庫叢集資料匯出至 Amazon S3 時有下列限制:

  • 您無法同時針對相同的資料庫叢集執行多個匯出任務。這同時適用於完整和部分匯出。

  • 您每個 AWS 帳戶最多可以有五個正在同時進行的資料庫快照匯出任務。

  • Aurora Serverless v1 資料庫叢集不支援匯出至 S3。

  • 對於已佈建引擎模式,Aurora MySQL 和 Aurora PostgreSQL 僅支援匯出至 S3。

  • 匯出至 S3 不支援內含冒號 (:) 的 S3 字首。

  • 在匯出過程中,S3 檔案路徑中的以下字元將轉換為底線 (_):

    \ ` " (space)
  • 如果資料庫、結構描述或資料表的名稱中包含下列字元以外的字元,則不支援部分匯出。不過,您可以匯出整個資料庫叢集。

    • 拉丁字母 (A–Z)

    • 數字 (0–9)

    • 美元符號 ($)

    • 底線 (_)

  • 資料庫資料表資料欄名稱不支援空格 ( ) 和某些字元。資料行名稱中具備下列字元的資料表會在匯出時跳過:

    , ; { } ( ) \n \t = (space)
  • 匯出時會略過名稱中具備斜線 (/) 的表格。

  • 匯出期間,系統會略過 Aurora PostgreSQL 的暫存和未記錄資料表。

  • 若資料包含接近或超過 500 MB 的大型物件 (例如 BLOB 或 CLOB),則匯出會失敗。

  • 如果資料表包含接近或大於 2 GB 的大型資料列,則在匯出期間會略過該資料表。

  • 對於部分匯出,ExportOnly 清單的大小上限為 200 KB。

  • 強烈建議您對每個匯出任務使用唯一的名稱。如果不使用唯一的任務名稱,可能會收到下列錯誤訊息:

    ExportTaskAlreadyExistsFault:呼叫 StartExportTask 操作時出現錯誤 (ExportTaskAlreadyExists):ID xxxxx 的匯出任務已存在。

  • 由於某些資料表可能會略過,因此建議您在匯出之後驗證資料中的資料列和資料表計數。

檔案命名慣例

特定表格的匯出資料會以 base_prefix/files 的格式儲存,其中基本前綴如下:

export_identifier/database_name/schema_name.table_name/

例如:

export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/

輸出檔案使用下列命名慣例,其中 partition_index 是英數字元:

partition_index/part-00000-random_uuid.format-based_extension

例如:

1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet

檔案命名慣例可能會有所變更。因此,在讀取目標資料表時,建議您讀取資料表基本字首內的所有內容。

資料轉換和存放格式

當您將資料庫叢集匯出至 Amazon S3 儲存貯體時,Amazon Aurora 會以 Parquet 格式轉換、匯出以及存放資料。如需更多詳細資訊,請參閱 匯出至 Amazon S3 儲存貯體時的資料轉換