本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在中管理零 ETL 集成 Oracle Database@AWS
创建 Zero-ETL 集成后,您可以执行各种管理操作,包括修改和删除集成。本节介绍零ETL集成的持续管理。
修改零 ETL 集成
您只能在受支持的数据仓库中修改零 ETL 集成的名称、描述和数据筛选选项。您无法修改用于加密集成、源数据库或目标数据库的密 AWS 钥管理服务密钥。
修改集成的先决条件
在修改零 ETL 集成之前,请确保满足以下条件:
必需权限-除了标准
odb:UpdateOutboundIntegration权限外,您的 IAM 用户或角色还必须拥有该 AWS Glue 权限。处于活动状态的集成-集成必须处于
ACTIVE状态,而不是处于CREATINGMODIFYING、DELETING、或FAILED。有效的数据筛选器语法-新的数据筛选器必须遵循支持的 include/exclude 模式语法。
修改数据筛选器
您可以通过修改数据筛选器来更改要复制的表或架构。通过这种方式,您无需重新创建整个集成,即可在复制中添加或移除数据库对象。
要修改集成的数据筛选器,请使用modify-integration命令。
aws glue modify-integration \ --integration-identifierintegration-id\ --data-filter "include:pdb1.new_schema.*"
您也可以同时修改集成名称和描述。在以下示例中,您将修改中两个架构的集成名称、描述和过滤器。pdb1
aws glue modify-integration \ --integration-identifierintegration-id\ --data-filter "include:pdb1.schema1.*, pdb1.schema2.*" \ --integration-name "Updated Integration Name" \ --description "Updated integration description"
重要
修改数据筛选器时,集成会进入modifying状态并对数据执行重新同步。该集成会停止复制,应用新的筛选器设置,并通过重新加载目标操作恢复复制。监控集成状态以确保修改成功完成。
将数据筛选器修改为零 ETL 集成的注意事项
修改数据筛选器时,请考虑以下几点:
单个 PDB 限制-每个集成只能指定一个可插拔数据库 (PDB)。
include: pdb1.*.*, include: pdb2.*.*不支持诸如此类的数据过滤器复制中断 — 数据复制在修改过程中停止,并在应用新筛选器后恢复。
数据重新加载-集成会对符合新筛选条件的数据进行完全重新加载。
性能影响-大型数据筛选器更改可能需要很长时间才能完成,并且可能会在重装期间影响源数据库的性能。
修改零 ETL 集成设置的限制
在创建零 ETL 集成后,您无法修改以下设置:
S@@ ecret ARN — 包含数据库凭据的 Secrets Manager AWS 密钥
KMS 密钥-用于加密的客户托管密钥
来源 ARN — Or acle Databas AWS e@ 虚拟机集群
目标 ARN — 亚马逊 Redshift 集群或命名空间
要更改这些设置,请删除现有的 Zero-ETL 集成并创建一个新的集成。
删除零 ETL 集成
当您不再需要零 ETL 集成时,可以将其删除以停止复制并清理关联的资源。
使用 AWS Glue 进行删除
使用 Glue API 删除零 ETL 集成 AWS 。
aws glue delete-integration \ --integration-identifierintegration-id
您可以删除处于以下状态的集成:
-
处于活动状态
-
需要注意
-
failed
-
正在同步
删除的影响
删除零 ETL 集成时,请考虑以下影响:
- 复制停止。
-
Oracle Database@AWS 不会复制亚马逊 Redshift 中的新更改。
- 现有数据会被保留。
-
已经复制到亚马逊 Redshift 的数据仍然可用。
- 目标数据库仍然存在。
-
通过集成创建的 Amazon Redshift 数据库不会自动删除。
重要
删除是不可逆的。如果您需要在删除后恢复复制,请创建一个新的集成,该集成将执行完整的初始加载。
零 ETL 管理的最佳实践
遵循这些最佳实践,确保零ETL集成具有最佳性能、安全性和成本效益。
运营最佳实践
这些操作实践有助于保持可靠、高效的零 ETL 集成。
- 定期监测
-
设置 CloudWatch 警报以监控集成运行状况和性能指标。
- 凭证轮换
-
定期轮换数据库密码并在 S AWS ecrets Manager 中更新密码。
- Backup 验证
-
定期验证您的 Oracle 数据库备份是否包含灾难恢复所需的组件。
- 性能测试
-
测试零 ETL 集成对 Oracle 数据库性能的影响,尤其是在使用高峰期。
- 架构变更计划
-
在将架构更改应用于生产环境之前,在开发环境中对其进行规划和测试。
安全最佳实践
实施这些安全措施来保护您的零 ETL 集成和数据。
- 最低权限访问
-
仅向复制用户和 AWS IAM 角色授予必要的最低权限。
- 网络安全
-
使用安全组和 NACLs 将网络访问限制为仅限所需的端口和源。
- 静态加密
-
确保 Oracle 数据库和 Amazon Redshift 集群都使用静态加密。
- 审计日志记录
-
在 Oracle 和 Amazon Redshift 上启用审计日志以跟踪数据访问和更改。
- 密钥管理
-
尽可能使用 S AWS ecrets Manager 的自动轮换功能。
成本优化
应用这些策略来优化成本,同时保持有效的零 ETL 集成性能。
- 数据筛选
-
使用精确的数据筛选器仅复制您需要的数据,从而降低存储和计算成本。
- 亚马逊 Redshift 优化
-
使用适当的 Amazon Redshift 节点类型并实施数据压缩以优化成本。
- 监控使用情况
-
通过 AWS Cost Explorer 定期查看您的零 ETL 集成使用情况和成本。
- 清理未使用的集成
-
删除不再需要的集成,以避免持续收费。