使用命令列將資料複製到 Amazon Redshift - AWS Data Pipeline

AWS Data Pipeline 不再提供給新客戶。的現有客戶 AWS Data Pipeline 可以繼續正常使用服務。進一步了解

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用命令列將資料複製到 Amazon Redshift

本教學課程示範如何將資料從 Amazon S3 複製到 Amazon Redshift。您將在 Amazon Redshift 中建立新的資料表,然後使用 從公有 Amazon S3 儲存貯體 AWS Data Pipeline 傳輸資料至此資料表,其中包含 CSV 格式的範例輸入資料。日誌會儲存到您擁有的 Amazon S3 儲存貯體。

Amazon S3 是一種 Web 服務,可讓您將資料存放在雲端。如需詳細資訊,請參閱 Amazon Simple Storage Service 使用者指南。Amazon Redshift 是雲端中的資料倉儲服務。如需詳細資訊,請參閱 Amazon Redshift 管理指南

先決條件

開始之前,您必須完成下列步驟:

  1. 安裝和設定命令列界面 (CLI)。如需詳細資訊,請參閱存取 AWS Data Pipeline

  2. 確保名為 DataPipelineDefaultRoleDataPipelineDefaultResourceRole 的 IAM 角色存在。 AWS Data Pipeline 主控台會自動為您建立這些角色。如果您至少尚未使用 AWS Data Pipeline 主控台一次,則必須手動建立這些角色。如需詳細資訊,請參閱的 IAM 角色 AWS Data Pipeline

  3. 在 Amazon Redshift 中設定 COPY命令,因為當您在其中執行複製時,需要讓這些相同的選項運作 AWS Data Pipeline。如需相關資訊,請參閱在您開始之前:設定 COPY 選項並載入資料

  4. 設定 Amazon Redshift 資料庫。如需詳細資訊,請參閱設定管道、建立安全群組和建立 Amazon Redshift 叢集