在 AWS Clean Rooms ML 中關聯設定的模型演算法 - AWS Clean Rooms

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 AWS Clean Rooms ML 中關聯設定的模型演算法

設定模型演算法之後,您就可以將模型演算法與協同合作建立關聯。關聯模型演算法可讓協同合作的所有成員使用模型演算法。

下圖顯示建立容器訓練映像和設定模型演算法之後,將設定的模型演算法關聯為最後一個步驟。

如何貢獻自訂 ML 模型的概觀。
Console
注意

模型演算法建立關聯後,就無法編輯。若要進行變更,您可以刪除相關聯的模型演算法,並關聯新的模型演算法。

建立自訂 ML 模型演算法的關聯 (主控台)
  1. 登入 AWS Management Console ,並在 https://https://console.aws.amazon.com/cleanrooms 開啟 AWS Clean Rooms 主控台。

  2. 在左側導覽窗格中,選擇自訂 ML 模型

  3. 自訂 ML 模型頁面上,選擇您要與協同合作建立關聯的已設定模型演算法,然後選擇與協同合作建立關聯

  4. 關聯設定的模型演算法視窗中,選擇您要關聯的協同合作。

  5. 選擇選擇協同合作

  6. 關聯模型演算法頁面上,針對模型演算法關聯詳細資訊,輸入名稱和選用的描述

  7. 針對模型演算法,選擇已設定的模型演算法

  8. 對於訓練過的模型匯出隱私權組態

    1. 若要匯出模型檔案,請選取模型檔案核取方塊。

    2. 若要匯出輸出檔案,請選取輸出檔案核取方塊。

    3. 輸入匯出資料的最大值。值必須介於 0.01 和 10 之間。

  9. (選用) 如果您想要傳送完整的錯誤日誌或較短的錯誤摘要給成員,請在經過訓練的模型推論任務隱私權組態下,

    1. 完整日誌下,從下拉式清單中選取一或多個帳戶 IDs

    2. (選用) 如果您想要傳送符合篩選條件模式的日誌,請輸入篩選條件模式

    3. (選用) 如果您想要新增另一個帳戶和選用篩選條件模式,請選擇新增日誌政策

    4. 錯誤摘要下,從下拉式清單中選取一或多個帳戶 IDs

    5. (選用) 選取要修訂的一或多個實體,以指定要從錯誤日誌或錯誤摘要中修訂哪些實體。

      • PII – 修訂個人身分識別資訊

      • 數字 – 編輯數字

      • 自訂 – 根據自訂修訂模式進行修訂

      1. 如果您在上一個步驟中選擇自訂,請輸入自訂修訂模式。這會記錄與此模式相符的資訊。

      2. (選用) 如果您想要新增另一個自訂修訂模式,請選擇新增另一個自訂模式

  10. (選用) 如果您想要設定訓練模型指標,請在訓練模型指標組態下,從下拉式清單中選取雜訊層級

    您可以選擇

  11. (選用) 如果您想要設定成品大小上限,請在成品組態下輸入成品大小上限值。值必須介於 0.01 和 10 之間。

  12. (選用) 如果您想要啟用標籤,請選擇新增標籤,然後輸入金鑰對。

  13. 選擇關聯

API

建立自訂 ML 模型演算法 (API) 的關聯

使用特定參數執行下列程式碼。

您也可以提供隱私權政策,定義可存取不同日誌的人員、允許客戶定義 regex,以及可以從訓練模型輸出或推論結果匯出的資料量。

注意

設定的模型演算法關聯是不可變的。

import boto3 acr_ml_client= boto3.client('cleanroomsml') acr_ml_client.create_configured_model_algorithm_association( name='configured_model_algorithm_association_name', description='purpose of the association', configuredModelAlgorithmArn='arn:aws:cleanrooms-ml:region:account:membership/membershipIdentifier/configured-model-algorithm/identifier', privacyConfiguration={ "policies": { "trainedModelExports": { "filesToExport": ['files to export'], "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "containerMetrics": { "noiseLevel": 'noise value' }, "maxArtifactSize": { "unit": 'unit', "value": 'number' } }, "trainedModelInferenceJobs": { "containerLogs": [ { "allowedAccountIds": ['member_account_id'], "filterPattern": ['filter pattern'], "logRedactionConfiguration": { "entitiesToRedact": [ 'ALL_PERSONALLY_IDENTIFIABLE_INFORMATION', 'NUMBERS', 'CUSTOM' ], "customEntityConfig": { "customDataIdentifiers": [ 'custom_regex_1', 'custom_regex_2' ] } } } ], "maxOutputSize": { "unit": 'unit', "value": 'number' } } } }, tags={ 'tag': 'tag' } )

在設定的模型演算法與協同合作相關聯後,訓練資料提供者必須將協同合作分析規則新增至其資料表。此規則允許設定的模型演算法關聯存取其設定的資料表。所有貢獻的訓練資料提供者都必須執行下列程式碼:

import boto3 acr_client= boto3.client('cleanrooms') acr_client.create_configured_table_association_analysis_rule( membershipIdentifier= 'membership_id', configuredTableAssociationIdentifier= 'configured_table_association_id', analysisRuleType= 'CUSTOM', analysisRulePolicy = { 'v1': { 'custom': { 'allowedAdditionalAnalyses': ['arn:aws:cleanrooms-ml:region:*:membership/*/configured-model-algorithm-association/*''], 'allowedResultReceivers': [] } } } )
注意

由於設定的模型演算法關聯不可變,我們建議訓練想要允許列出模型的資料提供者,以便在自訂模型組態的前幾次反覆運算allowedAdditionalAnalyses期間,使用 中的萬用字元。這可讓模型提供者在其程式碼上反覆運算,而不需要其他訓練提供者在訓練更新後的模型程式碼與資料之前重新建立關聯。