翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
前提条件:
-
にアクセスできる AWS アカウント 。 AWS Clean Rooms
-
ML 入力チャネルを作成する AWS Clean Rooms にセットアップされたコラボレーション
-
コラボレーションでデータをクエリし、ML 入力チャネルを作成するアクセス許可。
-
(オプション) ML 入力チャネルに関連付ける既存のモデルアルゴリズム、または新しい入力チャネルを作成するアクセス許可
-
(オプション) 指定したモデルに対して実行できる分析ルールを含むテーブル。
-
(オプション) データセットの生成に使用する既存の SQL クエリまたは分析テンプレート
-
(オプション) 適切なアクセス許可、または新しいサービスロールを作成するためのアクセス許可を持つ既存のサービスロール
-
(オプション) 独自の暗号化 AWS KMS キーを使用する場合のカスタムキー
-
コラボレーションで ML モデルを作成および管理するための適切なアクセス許可
ML 入力チャネルは、特定のデータクエリから作成されるデータセットです。データをクエリできるメンバーは、ML 入力チャネルを作成することで、トレーニングと推論のためにデータを準備できます。ML 入力チャネルを作成すると、そのデータを同じコラボレーション内のさまざまなトレーニングモデルで使用できます。トレーニングと推論用に個別の ML 入力チャネルを作成する必要があります。
ML 入力チャネルを作成するには、入力データのクエリと ML 入力チャネルの作成に使用される SQL クエリを指定する必要があります。このクエリの結果はメンバーと共有されることはなく、Clean Rooms ML の境界内にとどまります。リファレンス Amazon リソースネーム (ARN) は、次のステップでモデルのトレーニングや推論の実行に使用されます。
- Console
-
ML 入力チャネルを作成するには (コンソール)
-
にサインイン AWS マネジメントコンソール し、https://console.aws.amazon.com/cleanrooms で AWS Clean Rooms コンソールを開きます。
-
左のナビゲーションペインで、[コラボレーション] を選択します。
-
コラボレーションページで、ML 入力チャネルを作成するコラボレーションを選択します。
-
コラボレーションが開いたら、ML モデルタブを選択します。
-
カスタム ML モデル の ML 入力チャネル セクションで、ML 入力チャネルの作成 を選択します。
-
ML 入力チャネルの作成ページで、ML 入力チャネルの詳細について、次の操作を行います。
-
名前 に、チャネルの一意の名前を入力します。
-
(オプション) 説明 に、チャネルの説明を入力します。
-
関連付けられたモデルアルゴリズムで、使用するアルゴリズムを選択します。
モデルアルゴリズムを関連付けを選択して新しいアルゴリズムを追加します。
-
データセット で、トレーニングデータセットを生成する方法を選択します。
-
SQL クエリを選択して、SQL クエリの結果をトレーニングデータセットとして使用します。
SQL クエリを選択した場合は、SQL クエリフィールドにクエリを入力します。
(オプション) 最近使用したクエリをインポートするには、最近のクエリからインポートを選択します。
-
分析テンプレートを選択して、分析テンプレートの結果をトレーニングデータセットとして使用します。
合成データ生成は、特定の個人が元のデータセットに存在するか、それらの個人の学習属性が存在するかにかかわらず、個々の属性を推測するのを防ぎます。ただし、個人を特定できる情報 (PII) を含む元のデータセットのリテラル値が合成データセットに表示されるのを防ぐことはできません。
1 つのデータセットのみに関連付けられている入力データセット内の値は、データセットを再識別する可能性があるため、避けることをお勧めします。たとえば、郵便番号にユーザーが 1 人しかいない場合、合成データセットにその郵便番号が存在すると、そのユーザーが元のデータセットに属していたことが確認されます。高精度値の切り捨てや、まれなカタログを他のカタログに置き換えるなどの手法を使用して、このリスクを軽減できます。これらの変換は、ML 入力チャネルの作成に使用されるクエリの一部にすることができます。
-
テーブルが関連付けられていない場合は、テーブルを関連付けて、指定されたモデルに対して実行できる分析ルールでテーブルを追加します。
-
ワーカータイプで、使用するワーカーのタイプを選択します。デフォルトは CR.1X です。
-
ワーカー数 では、このデータチャネルを作成するときに使用するワーカーの数を選択します。デフォルトは 16 です。
-
データ保持日数には、データを保持する日数を入力します。
-
結果形式では、ML 入力チャネルが使用するデータ形式として CSV または Parquet を選択します。
-
サービスアクセスでは、このテーブルへのアクセスに使用する既存のサービスロール名を選択するか、新しいサービスロールを作成して使用します。
-
暗号化では、カスタム KMS キーを使用して Encrypt シークレットを選択し、独自の KMS キーと関連情報を指定します。それ以外の場合、Clean Rooms ML が暗号化を管理します。
-
ML 入力チャネルの作成 を選択します。
ML 入力チャネルの作成には数分かかります。ML 入力チャネルのリストは、ML モデルタブで確認できます。
ML 入力チャネルを作成した後は、編集できません。
- API
-
ML 入力チャネルを作成するには (API)
特定のパラメータを使用して次のコードを実行します。
import boto3
acr_client = boto3.client('cleanroomsml')
acr_client.create_ml_input_channel(
name="ml_input_channel_name",
membershipIdentifier='membership_id',
configuredModelAlgorithmAssociations=[configured_model_algorithm_association_arn],
retentionInDays=1,
inputChannel={
"dataSource": {
"protectedQueryInputParameters": {
"sqlParameters": {
"queryString": "select * from table"
"computeConfiguration": {
"worker": {
"type": "CR.1X",
"number": 16
}
},
"resultFormat": "PARQUET"
}
}
},
"roleArn": "arn:aws:iam::111122223333:role/ezcrc-ctm-role"
}
)
channel_arn = resp['ML Input Channel ARN']