

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 建立 SQL 分析範本
<a name="create-sql-analysis-template"></a>

**先決條件**

 建立 SQL 分析範本之前，您必須擁有：
+ 主動 AWS Clean Rooms 協同合作
+ 在協同合作中存取至少一個已設定的資料表

  如需在 中設定資料表的詳細資訊 AWS Clean Rooms，請參閱 [在 中建立設定的資料表 AWS Clean Rooms](create-configured-table.md)。
+ 建立分析範本的許可
+ SQL 查詢語法的基本知識

下列程序說明使用 [AWS Clean Rooms 主控台](https://console.aws.amazon.com/cleanrooms/home)建立 SQL 分析範本的程序。

如需有關如何使用 AWS SDKs建立 SQL 分析範本的資訊，請參閱 [AWS Clean Rooms API 參考](https://docs.aws.amazon.com/clean-rooms/latest/apireference/Welcome.html)。

**建立 SQL 分析範本**

1. 登入 AWS 管理主控台 ，並使用 開啟 [AWS Clean Rooms 主控台](https://console.aws.amazon.com/cleanrooms/home) AWS 帳戶 ，以做為協作建立者。

1. 在左側導覽窗格中，選擇**協同合作**。

1. 選擇協同合作。

1. 在**範本**索引標籤上，前往**您建立的分析範本**區段。

1. 選擇**建立分析範本**。

1. 在**建立分析範本**頁面上，如需**詳細資訊**，

   1. 輸入分析範本**的名稱**。

   1. （選用） 輸入**描述**。

   1. 對於**格式**，保留選取 **SQL** 選項。

1. 對於**資料表**，檢視與協同合作相關聯的已設定資料表。

1. 對於**定義**，

   1. 輸入分析範本的定義。

   1. 選擇**從 **匯入以匯入定義。

   1. (*選用*) 在 SQL 編輯器中指定參數，方法是在參數名稱前面輸入冒號 (`:`)。

      例如：

      `WHERE table1.date + :date_period > table1.date`

1. 如果您先前已新增參數，請在**參數 - 選用**下，為每個**參數名稱**選擇**類型**和**預設值 **（選用）。

1. 對於**合成資料**，如果您想要為模型訓練產生合成資料，請選取**需要分析範本輸出為合成**核取方塊。

   如需詳細資訊，請參閱[隱私權增強合成資料集產生](synthetic-data-generation.md)。

   1. 對於**資料欄分類**，請從下拉式清單中選擇資料**欄**。至少需要五個資料欄。

      1. 從下拉式清單中選擇**分類**。這會識別每個資料欄的資料類型。

         分類類型包括：
         + **數值** – 連續數值，例如測量或計數
         + **分類** – 離散值或類別，例如標籤或類型

      1. 若要移除資料欄，請選取**移除**。

      1. 若要新增另一個資料欄，請選取**新增另一個資料欄**。從下拉式清單中選擇資料**欄**和**分類**。

      1. 對於**預測值**，請從下拉式清單中選擇資料**欄**。這是自訂模型在訓練合成資料集之後用於預測的資料欄。

   1. **進階設定**可讓您設定**隱私權層級**和**隱私權閾值**。調整設定以符合您的需求。

      1. 針對**隱私權層級**，輸入 epsilon 值，以判斷合成模型為保護所產生資料集的隱私權所新增的雜訊。值必須介於 0.0001 和 10 之間。
        + 較低的值會增加更多雜訊，提供更強大的隱私權保護，但可能會降低對此資料訓練的下游自訂模型的公用程式。
        + 較高的值會加入較少雜訊，提供較高的準確性，但可能會降低隱私權保護的強度。

        針對**隱私權閾值**，輸入成員資格推論攻擊可以識別原始資料集成員的最高允許機率。值必須介於 50.0 和 100 之間。
        + 分數為 50% 表示成員推論攻擊無法成功區分成員與非成員，比隨機猜測更好。
        + 對於沒有隱私權限制，請輸入 100%。

        最佳值取決於您的特定使用案例和隱私權需求。如果超過隱私權閾值，ML 輸入通道建立會失敗，而且您無法使用合成資料集來訓練模型。
**警告**  
合成資料產生可防止推斷個別屬性，無論原始資料集中是否存在特定個人，或是否存在這些個人的學習屬性。不過，它不會阻止原始資料集的常值出現，包括個人身分識別資訊 (PII) 出現在合成資料集中。  
建議您避免輸入資料集中僅與一個資料主體相關聯的值，因為這些值可能會重新識別資料主體。例如，如果只有一個使用者住在郵遞區號中，則合成資料集中是否存在該郵遞區號，會確認使用者位於原始資料集中。可以使用截斷高精確度值或將不常見目錄取代為*其他* 等技術來降低此風險。這些轉換可以是用來建立 ML 輸入通道之查詢的一部分。

1. 如果您想要為資源啟用**標籤**，請選擇**新增標籤**，然後輸入**金鑰**和**值**對。

1. 選擇**建立**。

1. 您現在可以通知協同合作成員，他們可以[檢閱分析範本](review-analysis-template.md)。（如果您想要查詢自己的資料，則為選用。)