在中管理零 ETL 集成 Oracle Database@AWS - Oracle Database@AWS

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中管理零 ETL 集成 Oracle Database@AWS

创建 Zero-ETL 集成后,您可以执行各种管理操作,包括修改和删除集成。本节介绍零ETL集成的持续管理。

修改零 ETL 集成

您只能在受支持的数据仓库中修改零 ETL 集成的名称、描述和数据筛选选项。您无法修改用于加密集成、源数据库或目标数据库的密 AWS 钥管理服务密钥。

修改集成的先决条件

在修改零 ETL 集成之前,请确保满足以下条件:

  • 必需权限-除了标准odb:UpdateOutboundIntegration权限外,您的 IAM 用户或角色还必须拥有该 AWS Glue 权限。

  • 处于活动状态的集成-集成必须处于ACTIVE状态,而不是处于CREATINGMODIFYINGDELETING、或FAILED

  • 有效的数据筛选器语法-新的数据筛选器必须遵循支持的 include/exclude 模式语法。

修改数据筛选器

您可以通过修改数据筛选器来更改要复制的表或架构。通过这种方式,您无需重新创建整个集成,即可在复制中添加或移除数据库对象。

要修改集成的数据筛选器,请使用modify-integration命令。

aws glue modify-integration \ --integration-identifier integration-id \ --data-filter "include: pdb1.new_schema.*"

您也可以同时修改集成名称和描述。在以下示例中,您将修改中两个架构的集成名称、描述和过滤器。pdb1

aws glue modify-integration \ --integration-identifier integration-id \ --data-filter "include: pdb1.schema1.*, pdb1.schema2.*" \ --integration-name "Updated Integration Name" \ --description "Updated integration description"
重要

修改数据筛选器时,集成会进入modifying状态并对数据执行重新同步。该集成会停止复制,应用新的筛选器设置,并通过重新加载目标操作恢复复制。监控集成状态以确保修改成功完成。

将数据筛选器修改为零 ETL 集成的注意事项

修改数据筛选器时,请考虑以下几点:

  • 单个 PDB 限制-每个集成只能指定一个可插拔数据库 (PDB)。include: pdb1.*.*, include: pdb2.*.*不支持诸如此类的数据过滤器

  • 复制中断 — 数据复制在修改过程中停止,并在应用新筛选器后恢复。

  • 数据重新加载-集成会对符合新筛选条件的数据进行完全重新加载。

  • 性能影响-大型数据筛选器更改可能需要很长时间才能完成,并且可能会在重装期间影响源数据库的性能。

修改零 ETL 集成设置的限制

在创建零 ETL 集成后,您无法修改以下设置:

  • S@@ ecret ARN — 包含数据库凭据的 Secrets Manager AWS 密钥

  • KMS 密钥-用于加密的客户托管密钥

  • 来源 ARN — Or acle Databas AWS e@ 虚拟机集群

  • 目标 ARN — 亚马逊 Redshift 集群或命名空间

要更改这些设置,请删除现有的 Zero-ETL 集成并创建一个新的集成。

删除零 ETL 集成

当您不再需要零 ETL 集成时,可以将其删除以停止复制并清理关联的资源。

使用 AWS Glue 进行删除

使用 Glue API 删除零 ETL 集成 AWS 。

aws glue delete-integration \ --integration-identifier integration-id

您可以删除处于以下状态的集成:

  • 处于活动状态

  • 需要注意

  • failed

  • 正在同步

删除的影响

删除零 ETL 集成时,请考虑以下影响:

复制停止。

Oracle Database@AWS 不会复制亚马逊 Redshift 中的新更改。

现有数据会被保留。

已经复制到亚马逊 Redshift 的数据仍然可用。

目标数据库仍然存在。

通过集成创建的 Amazon Redshift 数据库不会自动删除。

重要

删除是不可逆的。如果您需要在删除后恢复复制,请创建一个新的集成,该集成将执行完整的初始加载。

零 ETL 管理的最佳实践

遵循这些最佳实践,确保零ETL集成具有最佳性能、安全性和成本效益。

运营最佳实践

这些操作实践有助于保持可靠、高效的零 ETL 集成。

定期监测

设置 CloudWatch 警报以监控集成运行状况和性能指标。

凭证轮换

定期轮换数据库密码并在 S AWS ecrets Manager 中更新密码。

Backup 验证

定期验证您的 Oracle 数据库备份是否包含灾难恢复所需的组件。

性能测试

测试零 ETL 集成对 Oracle 数据库性能的影响,尤其是在使用高峰期。

架构变更计划

在将架构更改应用于生产环境之前,在开发环境中对其进行规划和测试。

安全最佳实践

实施这些安全措施来保护您的零 ETL 集成和数据。

最低权限访问

仅向复制用户和 AWS IAM 角色授予必要的最低权限。

网络安全

使用安全组和 NACLs 将网络访问限制为仅限所需的端口和源。

静态加密

确保 Oracle 数据库和 Amazon Redshift 集群都使用静态加密。

审计日志记录

在 Oracle 和 Amazon Redshift 上启用审计日志以跟踪数据访问和更改。

密钥管理

尽可能使用 S AWS ecrets Manager 的自动轮换功能。

成本优化

应用这些策略来优化成本,同时保持有效的零 ETL 集成性能。

数据筛选

使用精确的数据筛选器仅复制您需要的数据,从而降低存储和计算成本。

亚马逊 Redshift 优化

使用适当的 Amazon Redshift 节点类型并实施数据压缩以优化成本。

监控使用情况

通过 AWS Cost Explorer 定期查看您的零 ETL 集成使用情况和成本。

清理未使用的集成

删除不再需要的集成,以避免持续收费。