Amazon Redshift 自 2025 年 11 月 1 日起不再支援建立新的 Python UDF。如果您想要使用 Python UDF,請在該日期之前建立 UDF。現有 Python UDF 將繼續正常運作。如需詳細資訊,請參閱部落格文章
本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Redshift 中的資料共用
透過 Amazon Redshift,您可以安全地跨 Amazon Redshift 叢集或其他 AWS服務共用資料。資料共用可讓您共用即時資料,而不需建立副本或移動資料。資料庫管理員和資料工程師可以使用資料共用來提供安全、唯讀的資料存取,以供分析之用,同時維持對資料的控制。資料分析師、商業智慧專業人員和資料科學家可以利用共用的資料來獲得深入分析,而不需複寫或移動資料。常見的使用案例包括與合作夥伴共用資料、啟用跨職能分析,以及在組織內促進資料普及。下列各節涵蓋在 Amazon Redshift 中設定和管理資料共用的詳細資訊。
透過 Amazon Redshift 資料共用,您可以安全地跨 Amazon Redshift 叢集、工作群組共用即時資料的存取權AWS 帳戶,AWS 區域而無需手動移動或複製資料。由於資料是即時的,一旦更新,所有使用者都可以在 Amazon Redshift 中看到最新且一致的資訊。
您可以在佈建的叢集、無伺服器工作群組、可用區域、AWS 帳戶 和 AWS 區域 之間共用資料。您可以在叢集類型之間共用,也可以在佈建的叢集和無伺服器之間共用。
您可以在相同 內的不同 Amazon Redshift 叢集或 Amazon Redshift Serverless 工作群組之間共用讀取和寫入的資料庫物件AWS 帳戶,或彼此共用AWS 帳戶。您也可以跨區域讀取和寫入資料。您可以針對不同的資料表授予 SELECT、INSERT 和 UPDATE 等權限,並針對不同的結構描述授予 USAGE 和 CREATE 權限。一旦確認寫入交易,資料即可供所有倉儲使用。
Amazon Redshift 的資料共用使用案例
Amazon Redshift 資料共用對於下列使用案例特別有用:
-
支援不同類型的關鍵業務工作負載 — 使用與多個商業智慧 (BI) 或分析叢集共用資料的中央擷取、轉換和載入 (ETL) 叢集。此方法可為個別工作負載提供讀取工作負載隔離和計費。您可以根據工作負載的特定價格和效能需求調整個別工作負載運算的大小和規模。
-
實現跨群組協同合作 — 實現跨團隊和業務群組的無縫協作,以實現更廣泛的分析、資料科學和跨產品影響分析。
-
以服務形式提供資料 — 在整個組織中共用資料即服務。
-
在環境之間共用資料 — 在開發、測試和生產環境之間共用資料。您可以透過分享精細層級不同的資料來提高團隊敏捷性。
-
授權存取 Amazon Redshift 中的資料 – 在AWS Data Exchange目錄中列出客戶可以在幾分鐘內找到、訂閱和查詢的 Amazon Redshift 資料集。
資料共用寫入存取使用案例
用於寫入的資料共用有幾個重要的使用案例:
-
更新生產者上的業務來源資料 - 您可以將資料作為服務在整個組織中共用,不過這樣一來,取用者也可以對來源資料執行動作。例如,他們可以反向傳達最新的值或確認收到資料。這裡僅列出少數可能的商業使用案例。
-
在生產者上插入其他記錄 - 取用者可以將記錄新增至原始來源資料。如有需要,這些記錄可以標記為來自取用者。
如需如何對資料共用執行寫入操作的具體資訊,請參閱共用資料的寫入存取。
Amazon Redshift 中不同層級的資料共用
您可以使用 Amazon Redshift 在不同層級上共用資料。這些層次包括資料庫、結構描述、資料表、檢視 (包括一般、近期繫結和具體化視觀表),以及 SQL 使用者定義函數 (UDF)。您可以為指定資料庫建立多個資料庫。在建立共用的資料庫中,資料共用可以包含多個結構描述的物件。
透過共用資料的這個彈性,您可以獲得精細存取控制。您可以針對需要存取 Amazon Redshift 資料的不同使用者和企業量身打造此控制項。
Amazon Redshift 中資料共用的一致性管理
Amazon Redshift 為所有生產者和取用者叢集提供交易一致性,並與所有取費者共用最新且一致的資料檢視。
您可以持續更新生產者叢集上的資料。交易中取用者叢集上的所有查詢都會讀取共用資料的相同狀態。Amazon Redshift 不會考慮由生產者叢集上的另一個交易所變更的資料,這些資料是在取用者叢集上的交易開始之後遞交的。在生產者叢集上遞交資料變更之後,取用者叢集上的新交易可以立即查詢更新的資料。
強大的一致性消除了在共用資料期間低保真報告可能包含無效結果的風險。若是財務分析或結果可能用於準備機器學習模型訓練資料集的情況,此要素尤其重要。