資料庫叢集匯出的考量事項

使用下列各節，來了解將資料庫叢集資料匯出至 Amazon S3 時的限制、檔案命名慣例，以及資料轉換和儲存。

主題

限制
檔案命名慣例
資料轉換和存放格式

限制

將資料庫叢集資料匯出至 Amazon S3 時有下列限制：

您無法同時針對相同的資料庫叢集執行多個匯出任務。這同時適用於完整和部分匯出。
每個最多可以有五個同時進行的資料庫快照匯出任務 AWS 帳戶。
對於已佈建引擎模式，Aurora MySQL 和 Aurora PostgreSQL 僅支援匯出至 S3。
匯出至 S3 不支援內含冒號 (:) 的 S3 字首。
在匯出過程中，S3 檔案路徑中的以下字元將轉換為底線 (_)：
```
\ ` " (space)
```
如果資料庫、結構描述或資料表的名稱中包含下列字元以外的字元，則不支援部分匯出。不過，您可以匯出整個資料庫叢集。
- 拉丁字母 (A–Z)
- 數字 (0–9)
- 美元符號 ($)
- 底線 (_)
資料庫資料表資料欄名稱不支援空格 ( ) 和某些字元。資料行名稱中具備下列字元的資料表會在匯出時跳過：
```
, ; { } ( ) \n \t = (space)
```
匯出時會略過名稱中具備斜線 (/) 的表格。
匯出期間，系統會略過 Aurora PostgreSQL 的暫存和未記錄資料表。
若資料包含接近或超過 500 MB 的大型物件 (例如 BLOB 或 CLOB)，則匯出會失敗。
如果資料表包含接近或大於 2 GB 的大型資料列，則在匯出期間會略過該資料表。
對於部分匯出，ExportOnly 清單的大小上限為 200 KB。
強烈建議您對每個匯出任務使用唯一的名稱。如果不使用唯一的任務名稱，可能會收到下列錯誤訊息：

ExportTaskAlreadyExistsFault：呼叫 StartExportTask 操作時出現錯誤 (ExportTaskAlreadyExists)：ID xxxxx 的匯出任務已存在。
由於某些資料表可能會略過，因此建議您在匯出之後驗證資料中的資料列和資料表計數。

檔案命名慣例

特定表格的匯出資料會以 base_prefix/files 的格式儲存，其中基本前綴如下：


export_identifier/database_name/schema_name.table_name/

例如：


export-1234567890123-459/rdststcluster/mycluster.DataInsert_7ADB5D19965123A2/

輸出檔案使用下列命名慣例，其中 partition_index 是英數字元：


partition_index/part-00000-random_uuid.format-based_extension

例如：


1/part-00000-c5a881bb-58ff-4ee6-1111-b41ecff340a3-c000.gz.parquet
    a/part-00000-d7a881cc-88cc-5ab7-2222-c41ecab340a4-c000.gz.parquet

檔案命名慣例可能會有所變更。因此，在讀取目標資料表時，建議您讀取資料表基本字首內的所有內容。

資料轉換和存放格式

當您將資料庫叢集匯出至 Amazon S3 儲存貯體時，Amazon Aurora 會以 Parquet 格式轉換、匯出以及存放資料。如需詳細資訊，請參閱匯出至 Amazon S3 儲存貯體時的資料轉換。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

將資料庫叢集資料匯出至 Amazon S3

設定對 S3 儲存貯體的存取權