排查 RDS for Db2 复制问题
本主题介绍常见的 RDS for Db2 复制问题,并提供只读副本和备用副本的故障排除指导。除了查看以下故障排查信息外,还要确保在创建 Db2 副本之前遵守要求和注意事项并完成准备步骤。
副本创建失败
副本创建失败可能是由于以下几个原因:
-
非活跃数据库 - 在创建副本之前,源数据库实例上的所有数据库都必须处于活跃状态。
有关激活数据库的信息,请参阅用于管理 RDS for Db2 数据库的存储过程。
-
缺少自动备份 - 源数据库实例必须启用自动备份。
有关启用备份的更多信息,请参阅为 RDS for Db2 副本启用自动备份。
-
参数组问题 - 副本需要自定义参数组。对于 BYOL 许可,参数组必须包含 IBM Site ID 和 IBM Customer ID。
有关更多信息,请参阅 Db2 自带许可的 IBM ID。
监控 Db2 复制滞后
要监控 Amazon CloudWatch 中的复制滞后,请查看 Amazon RDS ReplicaLag 指标。有关复制滞后时间的信息,请参阅监控只读复制和Amazon RDS 的 Amazon CloudWatch 指标。有关设置 CloudWatch 副本滞后警报的信息,请参阅使用 Amazon CloudWatch 监控 Amazon RDS 指标。
对于只读副本,如果滞后时间过长,请查询 MON_GET_HADR 表以了解副本数据库实例的状态。
对于备用副本,如果滞后时间过长,请查询 MON_GET_HADR 表以了解源数据库实例的状态。请勿查询副本数据库实例,因为副本数据库实例不接受用户连接。
复制滞后较长的常见原因包括:
-
副本上的计算资源不足
-
源和副本之间的网络连接问题
-
源数据库的写入活动频繁
-
副本的存储性能限制
如果复制滞后仍然很长,请考虑扩展副本资源。有关更多信息,请参阅 修改 Amazon RDS 数据库实例。
Db2 复制错误
由于多种原因,Db2 复制可能处于错误状态。执行以下操作之一:
-
监控事件和数据库实例状态,以确保数据库实例正在复制。
有关更多信息,请参阅 使用 Amazon RDS 事件通知。
-
在 Amazon RDS 控制台中查看 Db2 副本的诊断日志。在日志中,在 HADR 消息中查找错误。将日志序列号与主序列号进行比较。
有关访问和解释 Db2 诊断日志的信息,请参阅Amazon RDS for Db2 数据库日志文件。有关 Db2 HADR 配置和故障排除的信息,请参阅使用适用于 Amazon RDS for Db2 的副本。
如果复制错误仍然存在,则可能需要重新创建副本。
连接问题
如果您无法连接到副本,请查看有关副本模式的以下信息:
-
备用副本 – 从设计上讲,它们不接受用户连接。对读取工作负载使用只读副本。
-
只读副本 - 检查您的安全组设置、网络 ACL 和参数组配置。
有关更多信息,请参阅《Amazon VPC 用户指南》中的使用安全组控制到 AWS 资源的流量、《Amazon VPC 用户指南》中的使用网络访问控制列表控制子网流量和Amazon RDS 的参数组。
性能问题
如果副本性能不佳,请查看以下建议:
-
确保副本具有足够的计算和存储资源。
-
在 Amazon CloudWatch 中监控
ReplicaLag指标。 -
考虑扩展副本数据库实例类。
有关修改资源和实例类的信息,请参阅修改 Amazon RDS 数据库实例。
有关监控复制滞后的更多信息,请参阅监控复制滞后和Amazon RDS 的 Amazon CloudWatch 指标。有关设置 CloudWatch 副本滞后警报的信息,请参阅使用 Amazon CloudWatch 监控 Amazon RDS 指标。