

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon SageMaker AI でデータのプライバシー
<a name="data-privacy"></a>

Amazon SageMaker AI は、トレーニング中に使用される AWS所有ライブラリとオープンソースライブラリの使用に関する集計情報を収集します。SageMaker AI は、この集約されたメタデータを使用して、サービスとカスタマーエクスペリエンスを向上させます。

以降のセクションでは、SageMaker AI が収集するメタデータのタイプと、メタデータ収集をオプトアウトする方法について説明します。

## 収集される情報のタイプ
<a name="data-privacy-info-types"></a>

**使用状況の情報**  
分散トレーニング、コンパイル、量子化など、SageMaker トレーニングで使用される AWS所有ライブラリとオープンソースライブラリからのメタデータ。

**エラー**  
SageMaker トレーニングプラットフォームの操作に起因する障害、クラッシュ、カスケード、失敗など、予期しない動作によるエラー

## メタデータの収集をオプトアウトする方法
<a name="data-privacy-opt-out"></a>

`CreateTrainingJob` API を使用してトレーニングジョブを作成する際に、集約されたメタデータを SageMaker トレーニングと共有することをオプトアウトできます。コンソールを使用してトレーニングジョブを作成する場合、メタデータの収集はデフォルトで無効になっています。

**重要**  
送信するトレーニングジョブごとにメタデータ収集をオプトアウトすることを選択する必要があります。次の例で示されるとおり、オプトアウトの選択は API コールで行う必要があります。トレーニングスクリプト内でオプトアウトすることはできません。

次のセクションでは、 AWS CLI、 AWS SDK for Python (Boto3)、または SageMaker Python SDK を使用してメタデータ収集をオプトアウトする方法を示します。

### AWS Command Line Interface (AWS CLI) を使用してメタデータコレクションをオプトアウトする
<a name="data-privacy-opt-out-cli"></a>

を使用してメタデータ収集をオプトアウトするには AWS CLI、次のコード例に示すように、 `create-training-job` API `OPT_OUT_TRACKING` `1` で 環境変数を に設定します。

```
aws sagemaker create-training-job \
--training-job-name {{your_job_name}} \
--algorithm-specification AlgorithmName={{your_algorithm_name}}\
--output-data-config S3OutputPath={{s3://bucket-name/key-name-prefix}} \
--resource-config InstanceType={{ml.c5.xlarge}}, InstanceCount={{1}} \
--stopping-condition MaxRuntimeInSeconds={{100}} \
--environment OPT_OUT_TRACKING=1
```

### を使用してメタデータ収集をオプトアウトする AWS SDK for Python (Boto3)
<a name="data-privacy-opt-out-boto3"></a>

SDK for Python (Boto3) を使用してメタデータの収集をオプトアウトするには、次のコード例で示されるとおり、`create_training_job` API で環境変数 `OPT_OUT_TRACKING` を `1` に設定します。

```
boto3.client('sagemaker').create_training_job(
    TrainingJobName='{{your_training_job}}',
    AlgorithmSpecification={
        'AlgorithmName': '{{your_algorithm_name}}',
        'TrainingInputMode': 'File',
    },
    RoleArn='{{your_arn}}',
    OutputDataConfig={
        'S3OutputPath': 's3:{{//bucket-name/key-name-prefix}}',
    },
    ResourceConfig={
        'InstanceType': '{{ml.m4.xlarge}}',
        'InstanceCount': {{1}},
        'VolumeSizeInGB': {{123}},
    },
    StoppingCondition={
        'MaxRuntimeInSeconds': {{123}},
    },
    Environment={
        'OPT_OUT_TRACKING': '1'
    },
)
```

### SageMaker Python SDK を使用してメタデータの収集をオプトアウトする
<a name="data-privacy-opt-out-sdk"></a>

SageMaker Python SDK を使用してメタデータの収集をオプトアウトするには、次のコード例で示されるとおり、SageMaker AI 推定ツール内で環境変数 `OPT_OUT_TRACKING` を `1` に設定します。

```
sagemaker.estimator(
    image_uri='{{path_to_container}}',
    role='{{rolearn}}',
    instance_count={{1}}, 
    instance_type='{{ml.c5.xlarge}}', 
    environment={
        'OPT_OUT_TRACKING': '1'
    }, 
)
```

### アカウント単位でメタデータの収集をオプトアウトする
<a name="data-privacy-opt-out-account-wide"></a>

複数のアカウントのメタデータ収集をオプトアウトする場合は、アカウント単位の追跡をオプトアウトするように環境変数を設定できます。アカウントレベルでメタデータ収集をオプトアウトするには、SageMaker AI Python SDK を使用する必要があります。

次のコード例は、アカウント全体で追跡をオプトアウトする方法を説明しています。

```
SchemaVersion: '1.0'
SageMaker:
  TrainingJob:
    Environment:
      'OPT_OUT_TRACKING': '1'
```

アカウント単位で追跡をオプトアウトする方法の詳細については、「[Configuring and using defaults with the SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/overview.html#id22)」を参照してください。

## 追加情報
<a name="data-privacy-added-info"></a>

**ダウンストリームサービスが SageMaker AI トレーニングに依存している場合**

SageMaker トレーニングに依存するサービスを運用している場合は、SageMaker トレーニングプラットフォームでの集約メタデータ収集について顧客に通知して、オプトアウトの選択肢を提示することを強くお勧めします。別の方法としては、顧客に代わってメタデータ収集をオプトアウトすることもできます。

**SageMaker AI トレーニングを使用するサービスのクライアントまたはお客様の場合**

SageMaker トレーニングを使用するサービスのクライアントまたは顧客の場合は、前のセクションのいずれかの方法を使用してメタデータ収集をオプトアウトしてください。