本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
設定零 ETL 整合目標
設定零 ETL 整合的目標 AWS 時, 提供多種選項。目標可以是加密 Amazon Redshift 的資料倉儲或 Amazon SageMaker Lakehouse 目錄。
在選取零 ETL 整合的目標之前,需要設定下列其中一個目標資源。
零 ETL 整合中目標的組態選項包括:
使用一般 Amazon S3 儲存體來設定的 Amazon SageMaker 資料湖倉型錄和資料庫。請參閱 使用一般 S3 儲存體設定 Amazon SageMaker 資料湖倉型錄。
使用 Amazon S3 Tables 儲存貯體來設定的 Amazon SageMaker 資料湖倉型錄。請參閱 將 Amazon S3 Tables 設定為目標。
使用 Amazon Redshift 受管儲存體來設定的 Amazon SageMaker 資料湖倉型錄。請參閱 使用 Amazon Redshift 受管儲存設定 Amazon SageMaker Lakehouse 目錄。
由 Redshift 命名空間識別的 Amazon Redshift 資料倉儲。請參閱 設定 Amazon Redshift 資料倉儲目標。
注意
無法在建立後修改零 ETL 整合的目標。
使用一般 S3 儲存體設定 Amazon SageMaker 資料湖倉型錄
本節說明在零 ETL 整合中將一般 Amazon S3 儲存貯體設定為 Amazon SageMaker 資料湖倉型錄目標儲存體的先決條件和設定步驟。
設定整合的先決條件
使用一般 S3 儲存體建立與 Amazon SageMaker 資料湖倉型錄的零 ETL 整合之前,需要完成下列設定任務:
設定 AWS Glue 資料庫
提供型錄 RBAC 政策
建立目標 IAM 角色
使用一般 Amazon S3 儲存體設定 Amazon SageMaker 資料湖倉型錄之後,可以繼續進行設定與您的目標的整合以完成整合設定。
將 Amazon S3 Tables 設定為目標
本節說明將 Amazon S3 Tables 設定為零 ETL 整合目標的先決條件和設定步驟。
設定整合的先決條件
在建立以 Amazon S3 Tables 作為目標的零 ETL 整合之前,需要完成下列設定任務:
設定 Amazon S3 Tables 儲存貯體
提供型錄 RBAC 政策
建立目標 IAM 角色
設定 Amazon S3 Tables 儲存貯體
遵循 Amazon S3 Tables 入門中的指示,在您的帳戶中建立 S3 Tables 儲存貯體。
遵循下列指示來啟用 Analytics 與 S3-Table 儲存貯體的整合:整合 AWS 服務與 Amazon S3 Tables。
提供型錄 RBAC 政策
必須將下列許可新增至型錄 RBAC 政策,以允許來源和 Amazon S3 Tables 型錄目標之間的整合。
Target AWS Glue Catalog 資源政策需要包含 AuthorizeInboundIntegration 的 Glue Service 許可。此外,建立整合的來源主體或目標 AWS Glue 資源政策中需要 CreateInboundIntegration 許可。
注意
對於跨帳戶案例,來源主體和目標 AWS Glue 目錄資源政策都需要在資源上包含 glue:CreateInboundIntegration 許可。
注意
將 <s3tablescatalog> 取代為 S3 Tables 的型錄名稱。
建立目標 IAM 角色
建立具有下列許可和信任關係的目標 IAM 角色:
IAM 政策範例:
在目標 IAM 角色中新增下列信任政策,以允許 AWS Glue Service 擔任該角色:
注意
請確保 S3-Tables 儲存貯體資源政策中沒有此目標 IAM 角色的明確 DENY 陳述式。明確的 DENY 會覆寫所有 ALLOW 許可,並防止整合正常運作。
使用 Amazon Redshift 受管儲存設定 Amazon SageMaker Lakehouse 目錄
本節說明設定具有 Amazon Redshift 受管儲存 (RMS) 的 Amazon SageMaker Lakehouse 目錄做為零 ETL 整合目標的先決條件和設定步驟。
設定整合的先決條件
使用 Redshift 管理的儲存體建立與 Amazon SageMaker 資料湖倉型錄的零 ETL 整合之前,需要完成下列設定任務:
設定 Amazon Redshift 叢集或 Serverless 工作群組
註冊與 Lake Formation 的 Amazon Redshift 整合
在 Lake Formation 中建立受管型錄
設定 IAM 許可
設定 Amazon Redshift 受管儲存
若要設定零 ETL 整合的 Amazon Redshift受管儲存:
建立或使用現有的 Amazon Redshift 叢集或無伺服器工作群組。確定目標 Amazon Redshift 工作群組或叢集已開啟
enable_case_sensitive_identifier參數,以使整合成功。如需啟用區分大小寫的詳細資訊,請參閱《Amazon Redshift 管理指南》中的為您的資料倉儲開啟區分大小寫。將整合從 Redshift 註冊到 AWS Lake Formation中的型錄。請參閱將 Amazon Redshift 叢集和命名空間註冊至 AWS Glue Data Catalog。
在 中建立聯合或受管目錄 AWS Lake Formation。如需詳細資訊,請參閱:
設定目標角色的 IAM 許可。此角色需要用於存取 Redshift 和 Lake Formation 資源的許可。角色至少應擁有:
存取 Redshift 叢集或工作群組的許可
存取 Lake Formation 型錄的許可
在型錄中建立和管理資料表的許可
CloudWatch 和 CloudWatch Logs 監控許可
使用 Amazon Redshift 受管儲存體設定 Amazon SageMaker 資料湖倉型錄之後,可以繼續進行設定與您的目標的整合以完成整合設定。
設定 Amazon Redshift 資料倉儲目標
本節說明將 Amazon Redshift 資料倉儲設定為零 ETL 整合目標的先決條件和設定步驟。
設定整合的先決條件
在建立與 Amazon Redshift 資料倉儲目標的零 ETL 整合之前,您需要完成下列設定任務:
設定 Amazon Redshift 叢集或 Serverless 工作群組
設定區分大小寫功能
設定 IAM 許可
設定 Amazon Redshift 資料倉儲
若要設定零 ETL 整合 Amazon Redshift 的資料倉儲:
導覽至 Amazon Redshift 主控台
,然後按一下建立叢集或使用現有的叢集。對於 Amazon Redshift Serverless,按一下建立工作群組。 如果建立新的叢集,請選擇適當的叢集大小,並確保叢集已加密。對於 Serverless,根據您的需求設定工作群組設定。
確定目標 Amazon Redshift 工作群組或叢集已開啟
enable_case_sensitive_identifier參數,以使整合成功。如需啟用區分大小寫的詳細資訊,請參閱《Amazon Redshift 管理指南》中的為您的資料倉儲開啟區分大小寫。設定 IAM 許可以允許零 ETL 整合存取 Amazon Redshift 您的資料倉儲。您將需要建立具備下列許可的 IAM 角色:
存取 Amazon Redshift 叢集或工作群組的許可
在 中建立和管理資料庫和資料表的許可 Amazon Redshift
CloudWatch 和 Amazon CloudWatch Logs 監控許可
Amazon Redshift 工作群組或叢集設定完成後,您需要為零 ETL 整合設定資料倉儲。如需詳細資訊,請參閱《Amazon Redshift 管理指南》中的零 ETL 整合入門。
注意
使用 Amazon Redshift 資料倉儲做為目標時,整合會在指定的資料庫中建立結構描述,以存放複寫的資料。結構描述名稱衍生自整合名稱。
設定 Amazon Redshift 資料倉儲之後,您可以繼續設定與您的目標的整合完成整合設定。
設定與您的目標的整合
在設定目標資源並選取連線以及指定來源 IAM 角色之後,請依照下列步驟完成整合設定:
指定在先前步驟中設定的目標。
選取 AWS Glue 為我固定選項。對於 Amazon Redshift 目標,這將:
在 Amazon Redshift 叢集或 Serverless 工作群組上套用授權的服務主體。
將授權的 AWS Glue 來源 ARN 套用至 Amazon Redshift 叢集或 Serverless 工作群組。
將新的參數群組與
enable_case_sensitive_identifier = true建立關聯。
提供整合名稱,然後選擇建立並啟動整合。
整合處於作用中狀態後,請導覽至整合詳細資訊頁面,然後選擇從整合中建立資料庫。
最後,可以導覽至 Redshift 查詢編輯器,並連線至資料庫以驗證快照和增量資料。
注意
命名空間或型錄名稱中只能使用小寫英數字元和底線。這與 AWS Glue Data Catalog 允許建立任何名稱的資料庫不同 (包括特殊字元)。