故障診斷零 ETL 整合 - Oracle Database@AWS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

故障診斷零 ETL 整合

本節提供解決零 ETL 整合常見問題的指引。

零 ETL 整合設定失敗

身分驗證失敗
  • 驗證複寫使用者是否存在,並在 AWS Secrets Manager 中具有正確的密碼。

  • 確定所有必要的許可都已授予複寫使用者。

  • 檢查秘密 ARN 是否正確且可由 Oracle Database@ 存取AWS。

  • 確認 CMK 資源政策允許 Oracle Database@AWS service 主體存取。

網路連線問題
  • 請確定您的 ODB 網路已啟用零 ETL 整合。

  • 確認連接埠 2484 上已正確設定 SSL (僅限 Exadata)。

  • 檢查 Oracle 資料庫接聽程式是否正在執行並接受連線。

  • 確保網路安全群組和 NACLs連接埠 2484 上的流量。

  • 確認秘密中的服務名稱符合實際的 Oracle 服務名稱。

許可錯誤
  • 檢查您的 IAM 使用者或角色是否具有整合操作的必要許可 AWS Glue 。

  • 確認 Amazon Redshift 資源政策允許來自 VM 叢集的傳入整合。

  • 確保 Oracle Database@s AWS 已獲得存取您的秘密和 AWS Key Management Service 金鑰的權限。

複寫問題

初始載入失敗
  • 確認 Oracle 資料庫有足夠的資源來支援完整載入操作。

  • 確定已在來源資料庫上啟用補充記錄。

  • 檢查是否有任何資料表層級鎖定或限制,可能阻止資料擷取。

變更資料擷取問題
  • 確認 Oracle 資料庫有足夠的重做日誌空間和保留。

  • 檢查複寫使用者是否有權存取封存的重做日誌。

  • 對於啟用 ASM 的系統,請確保 ASM 使用者已正確設定。

  • 監控 Oracle 資料庫效能,以確保 CDC 不會造成資源爭用。

高複寫延遲
  • 在 CloudWatch 中監控複寫延遲指標。

  • 檢查來源資料庫中是否有高交易量或大型交易。

  • 確認 Amazon Redshift 叢集有足夠的容量來處理傳入的資料。

資料一致性問題

資料遺失或不完整
  • 確認資料篩選條件包含所有必要的結構描述和資料表。

  • 檢查可能導致複寫失敗的不支援資料類型。

  • 確定複寫使用者具有所有必要資料表的 SELECT 許可。

資料類型轉換錯誤
  • 檢閱 Oracle 和 Redshift 之間支援的資料類型映射。

  • 檢查是否需要自訂處理的 Oracle 特定資料類型。

  • 請考慮修改 Oracle 結構描述,以使用更相容的資料類型。

監控與除錯

使用下列方法來監控和偵錯零 ETL 整合問題:

  • 整合狀態監控 – 使用 定期檢查整合狀態aws glue describe-integrations

  • CloudWatch 指標 – 監控可用的 CloudWatch 指標是否有複寫效能和錯誤。

  • Oracle 資料庫監控 – 監控 Oracle 資料庫效能和資源使用率。

  • Redshift 監控 – 監控 Amazon Redshift 叢集效能和儲存使用率。

對於無法使用此故障診斷指南解決的複雜問題,請聯絡 AWS 支援 並提供下列資訊:

  • 整合 ARN 和目前狀態。

  • 整合的錯誤訊息說明 操作。

  • Oracle 資料庫和 Amazon Redshift 叢集組態。

  • 問題開始發生的時間表。