建立設定的資料表 – Amazon S3 資料來源 - AWS Clean Rooms

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立設定的資料表 – Amazon S3 資料來源

在此程序中,成員會執行下列任務:

  • 設定現有 AWS Glue 資料表以供 使用 AWS Clean Rooms。(此步驟可在加入協同合作之前或之後完成,除非使用適用於 的加密運算Clean Rooms。)

    注意

    AWS Clean Rooms 支援 AWS Glue 資料表。如需在 中取得資料的詳細資訊 AWS Glue,請參閱 步驟 3:將資料表上傳至 Amazon S3

  • 設定的資料表命名,並選擇要在協同合作中使用的資料欄。

下列程序假設:

您可以使用 提供的統計資料產生 AWS Glue 來計算 AWS Glue Data Catalog 資料表的資料欄層級統計資料。在 AWS Glue 產生 Data Catalog 中資料表的統計資料後,Amazon Redshift Spectrum 會自動使用這些統計資料來最佳化查詢計劃。如需使用 運算資料欄層級統計資料的詳細資訊 AWS Glue,請參閱AWS Glue 《 使用者指南》中的使用資料欄統計資料最佳化查詢效能。如需 的詳細資訊 AWS Glue,請參閱 AWS Glue 開發人員指南

建立設定的資料表 – Amazon S3 資料來源
  1. 登入 AWS Management Console ,並在 https://https://console.aws.amazon.com/cleanrooms 開啟 AWS Clean Rooms 主控台。

  2. 在左側導覽窗格中,選擇 Tables (資料表)

  3. 在右上角,選擇設定新資料表

  4. 對於資料來源,在AWS 資料來源下,選擇 Amazon S3

  5. Amazon S3 資料表下:

    1. 從下拉式清單中選擇資料庫

    2. 從下拉式清單中選擇您要設定的資料表

    注意

    若要驗證這是正確的資料表,請執行下列其中一項操作:

    • 選擇檢視 AWS Glue

    • 開啟從 檢視結構描述 AWS Glue以檢視結構描述。

    重要

    對於資料為 CSV 格式的 AWS Glue 資料表,Glue 結構描述中的資料欄名稱和順序必須完全符合 CSV 資料。如果不相符,可能無法正確強制執行已設定資料表的允許資料欄清單。

  6. 對於協同合作中允許的資料欄和分析方法

    1. 對於您希望在協同合作中允許哪些資料欄?

      • 選擇所有資料欄,以允許在協同合作中查詢所有資料欄。

      • 選擇自訂清單,以允許在協同合作中查詢指定允許的資料欄下拉式清單中的一或多個資料欄

    2. 對於允許的分析方法

      1. 選擇直接查詢以允許 SQL 查詢直接在此資料表上執行

      2. 選擇直接任務以允許 PySpark 任務直接在此資料表上執行。

    範例

    例如,如果您想要允許協同合作成員在所有資料欄上執行直接 SQL 查詢和 PySpark 任務,請選擇所有資料欄直接查詢直接任務

  7. 對於已設定的資料表詳細資訊

    1. 輸入已設定資料表的名稱

      您可以使用預設名稱或重新命名此資料表。

    2. 輸入資料表的描述

      描述有助於區分具有類似名稱的其他已設定資料表。

  8. 如果您想要為設定的資料表資源啟用標籤,請選擇新增標籤,然後輸入金鑰對。

  9. 選擇設定新資料表

現在您已建立已設定的資料表,您就可以: