

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 AWS 資料管道
<a name="pipeline"></a>

**Notice (注意)**  
AWS Data Pipeline 不再提供給新客戶。的現有客戶 AWS Data Pipeline 可以繼續正常使用服務。[進一步了解](https://aws.amazon.com/blogs/big-data/migrate-workloads-from-aws-data-pipeline/)

[AWS Data Pipeline](https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/what-is-datapipeline.html) 是一種 Web 服務，可用來自動化資料移動和轉換。您可以使用資料管道建立管道，從來源帳戶匯出資料表資料。匯出的資料會存放在目標帳戶中的 Amazon Simple Storage Service (Amazon S3) 儲存貯體中。目標帳戶中的 S3 儲存貯體必須可從來源帳戶存取。若要允許此跨帳戶存取，請更新目標 S3 儲存貯體中的存取控制清單 (ACL)。

在目標帳戶中建立另一個管道 (Account-B)，將資料從 S3 儲存貯體匯入目標帳戶中的資料表。

這是將 Amazon DynamoDB 資料表備份至 Amazon S3 的傳統方法，並從 Amazon S3 還原，直到 AWS Glue 引入原生讀取 DynamoDB 資料表的支援。

## 優點
<a name="adv-dp"></a>
+ 這是無伺服器解決方案。
+ 不需要新的程式碼。
+ AWS Data Pipeline 會在任務的場景後方使用 Amazon EMR 叢集，因此此方法非常有效率，可以處理大型資料集。

## 缺點
<a name="disadv-dp"></a>
+ 需要 AWS 其他服務 （資料管道和 Amazon S3)。
+ 程序會在來源資料表和涉及的目標資料表上耗用佈建的輸送量，因此可能會影響效能和可用性。
+ 此方法會產生額外的成本，超過 DynamoDB 讀取容量單位 (RCUs) 和寫入容量單位 WCUs) 的成本。