

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# Amazon SageMaker AI 中的資料隱私權
<a name="data-privacy"></a>

Amazon SageMaker AI 會收集有關訓練期間使用 AWS自有和開放原始碼程式庫的彙總資訊。SageMaker AI 會使用此彙總中繼資料來改善服務和客戶體驗。

下列各節說明 SageMaker AI 收集的中繼資料類型，以及如何選擇退出中繼資料收集。

## 收集的資訊類型
<a name="data-privacy-info-types"></a>

**用量資訊**  
用於 SageMaker 訓練的 AWS擁有和開放原始碼程式庫中繼資料，例如用於分散式訓練、編譯和量化的中繼資料。

**錯誤**  
來自意外行為的錯誤，包括與 SageMaker 訓練平台互動所造成的失敗、當機、串聯和失敗。

## 如何選擇退出中繼資料收集
<a name="data-privacy-opt-out"></a>

使用 `CreateTrainingJob` API 建立訓練任務時，您可以選擇退出與 SageMaker 訓練共用彙總的中繼資料。如果您使用主控台建立訓練任務，預設會停用中繼資料收集。

**重要**  
您必須為您提交的每個訓練任務選擇退出中繼資料收集。您還必須選擇退出 API 呼叫，如下列範例所示。您無法選擇在訓練指令碼內退出。

下一節說明如何使用 AWS CLI 適用於 Python (Boto3) 的 AWS SDK、 或 SageMaker Python SDK 選擇退出中繼資料收集。

### 使用 AWS Command Line Interface (AWS CLI) 選擇不收集中繼資料
<a name="data-privacy-opt-out-cli"></a>

若要使用 選擇退出中繼資料收集 AWS CLI，請在 `create-training-job` API `1` 中將環境變數設定為 `OPT_OUT_TRACKING` ，如下列程式碼範例所示。

```
aws sagemaker create-training-job \
--training-job-name {{your_job_name}} \
--algorithm-specification AlgorithmName={{your_algorithm_name}}\
--output-data-config S3OutputPath={{s3://bucket-name/key-name-prefix}} \
--resource-config InstanceType={{ml.c5.xlarge}}, InstanceCount={{1}} \
--stopping-condition MaxRuntimeInSeconds={{100}} \
--environment OPT_OUT_TRACKING=1
```

### 使用 選擇退出中繼資料收集 適用於 Python (Boto3) 的 AWS SDK
<a name="data-privacy-opt-out-boto3"></a>

若要使用 SDK for Python (Boto3) 選擇退出中繼資料收集，請在 `create_training_job` API 中將環境變數 `1` 設定為 `OPT_OUT_TRACKING`，如下列程式碼範例所示。

```
boto3.client('sagemaker').create_training_job(
    TrainingJobName='{{your_training_job}}',
    AlgorithmSpecification={
        'AlgorithmName': '{{your_algorithm_name}}',
        'TrainingInputMode': 'File',
    },
    RoleArn='{{your_arn}}',
    OutputDataConfig={
        'S3OutputPath': 's3:{{//bucket-name/key-name-prefix}}',
    },
    ResourceConfig={
        'InstanceType': '{{ml.m4.xlarge}}',
        'InstanceCount': {{1}},
        'VolumeSizeInGB': {{123}},
    },
    StoppingCondition={
        'MaxRuntimeInSeconds': {{123}},
    },
    Environment={
        'OPT_OUT_TRACKING': '1'
    },
)
```

### 使用 SageMaker Python SDK 選擇退出中繼資料收集
<a name="data-privacy-opt-out-sdk"></a>

若要使用 SageMaker Python SDK 選擇退出中繼資料收集，請在 SageMaker AI 估算器內將環境變數 `OPT_OUT_TRACKING` 設定為 `1`，如下列程式碼範例所示。

```
sagemaker.estimator(
    image_uri='{{path_to_container}}',
    role='{{rolearn}}',
    instance_count={{1}}, 
    instance_type='{{ml.c5.xlarge}}', 
    environment={
        'OPT_OUT_TRACKING': '1'
    }, 
)
```

### 選擇退出整個帳戶的中繼資料收集
<a name="data-privacy-opt-out-account-wide"></a>

如果您想要選擇退出多個帳戶的中繼資料收集，您可以設定環境變數，以選擇退出整個帳戶追蹤。您必須使用 SageMaker AI Python SDK 在帳戶層級選擇退出中繼資料收集。

下列程式碼範例展示如何退出整個帳戶追蹤。

```
SchemaVersion: '1.0'
SageMaker:
  TrainingJob:
    Environment:
      'OPT_OUT_TRACKING': '1'
```

如需如何退出整個帳戶追蹤的詳細資訊，請參閱[設定和使用預設值搭配 SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/overview.html#id22)。

## 其他資訊
<a name="data-privacy-added-info"></a>

**如果您的下游服務依賴 SageMaker AI 訓練**

如果您操作依賴 SageMaker 訓練的服務，強烈建議您通知客戶 SageMaker Training 平台中進行彙總中繼資料收集，並讓他們可以選擇退出。或者，您可以代表客戶選擇退出中繼資料收集。

**如果您是使用 SageMaker AI 訓練的服務用戶端或客戶**

如果您是使用 SageMaker 訓練的服務用戶端或客戶，請使用上一節中您偏好的方法來選擇退出中繼資料收集。