本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
故障診斷零 ETL 整合
本節提供解決零 ETL 整合常見問題的指引。
零 ETL 整合設定失敗
- 身分驗證失敗
-
-
驗證複寫使用者是否存在,並在 AWS Secrets Manager 中具有正確的密碼。
-
確定所有必要的許可都已授予複寫使用者。
-
檢查秘密 ARN 是否正確且可由 Oracle Database@ 存取AWS。
-
確認 CMK 資源政策允許 Oracle Database@AWS service 主體存取。
-
- 網路連線問題
-
-
請確定您的 ODB 網路已啟用零 ETL 整合。
-
確認連接埠 2484 上已正確設定 SSL (僅限 Exadata)。
-
檢查 Oracle 資料庫接聽程式是否正在執行並接受連線。
-
確保網路安全群組和 NACLs連接埠 2484 上的流量。
-
確認秘密中的服務名稱符合實際的 Oracle 服務名稱。
-
- 許可錯誤
-
-
檢查您的 IAM 使用者或角色是否具有整合操作的必要許可 AWS Glue 。
-
確認 Amazon Redshift 資源政策允許來自 VM 叢集的傳入整合。
-
確保 Oracle Database@s AWS 已獲得存取您的秘密和 AWS Key Management Service 金鑰的權限。
-
複寫問題
- 初始載入失敗
-
-
確認 Oracle 資料庫有足夠的資源來支援完整載入操作。
-
確定已在來源資料庫上啟用補充記錄。
-
檢查是否有任何資料表層級鎖定或限制,可能阻止資料擷取。
-
- 變更資料擷取問題
-
-
確認 Oracle 資料庫有足夠的重做日誌空間和保留。
-
檢查複寫使用者是否有權存取封存的重做日誌。
-
對於啟用 ASM 的系統,請確保 ASM 使用者已正確設定。
-
監控 Oracle 資料庫效能,以確保 CDC 不會造成資源爭用。
-
- 高複寫延遲
-
-
在 CloudWatch 中監控複寫延遲指標。
-
檢查來源資料庫中是否有高交易量或大型交易。
-
確認 Amazon Redshift 叢集有足夠的容量來處理傳入的資料。
-
資料一致性問題
- 資料遺失或不完整
-
-
確認資料篩選條件包含所有必要的結構描述和資料表。
-
檢查可能導致複寫失敗的不支援資料類型。
-
確定複寫使用者具有所有必要資料表的 SELECT 許可。
-
- 資料類型轉換錯誤
-
-
檢閱 Oracle 和 Redshift 之間支援的資料類型映射。
-
檢查是否需要自訂處理的 Oracle 特定資料類型。
-
請考慮修改 Oracle 結構描述,以使用更相容的資料類型。
-
監控與除錯
使用下列方法來監控和偵錯零 ETL 整合問題:
-
整合狀態監控 – 使用 定期檢查整合狀態
aws glue describe-integrations。 -
CloudWatch 指標 – 監控可用的 CloudWatch 指標是否有複寫效能和錯誤。
-
Oracle 資料庫監控 – 監控 Oracle 資料庫效能和資源使用率。
-
Redshift 監控 – 監控 Amazon Redshift 叢集效能和儲存使用率。
對於無法使用此故障診斷指南解決的複雜問題,請聯絡 AWS 支援 並提供下列資訊:
-
整合 ARN 和目前狀態。
-
整合的錯誤訊息說明 操作。
-
Oracle 資料庫和 Amazon Redshift 叢集組態。
-
問題開始發生的時間表。