本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
自动化和访问控制
自动化
管线自动化是现代以数据为中心的架构设计的重要组成部分。为了成功运行您的生产系统,我们建议您使用一个数据管线,该管线具有启动触发器、连接步骤以及用于分离失败和通过阶段的机制。记录故障也很重要,但不能妨碍 ETL 流程的其余部分。
您可以使用 AWS Glue 工作流程来创建管线。该管道支持所有 AWS Glue 任务、Amazon EventBridge 触发器和爬虫。您也可以从头开始创建工作流程,也可以使用 AWS Glue 蓝图创建工作流程。蓝图提供了一个框架,可帮助您开始使用可重复使用的使用案例。例如,这可能是用于将 Amazon S3 中的数据导入到 DynamoDB 表的工作流程。您甚至可以使用参数使蓝图可重复使用。
如果数据管线涉及 AWS Glue 之外的更多服务,那么我们建议您使用 AWS Step Functions
最后,我们建议使用EventBridge
访问控制
我们建议您使用 AWS Identity and Access Management(IAM)