Amazon SageMaker AI 中的資料隱私權 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 中的資料隱私權

Amazon SageMaker AI 會收集有關訓練期間使用 AWS自有和開放原始碼程式庫的彙總資訊。SageMaker AI 會使用此彙總中繼資料來改善服務和客戶體驗。

下列各節說明 SageMaker AI 收集的中繼資料類型,以及如何選擇退出中繼資料收集。

收集的資訊類型

用量資訊

用於 SageMaker 訓練的 AWS擁有和開放原始碼程式庫中繼資料,例如用於分散式訓練、編譯和量化的中繼資料。

錯誤

來自意外行為的錯誤,包括與 SageMaker 訓練平台互動所造成的失敗、當機、串聯和失敗。

如何選擇退出中繼資料收集

使用 CreateTrainingJob API 建立訓練任務時,您可以選擇退出與 SageMaker 訓練共用彙總的中繼資料。如果您使用主控台建立訓練任務,預設會停用中繼資料收集。

重要

您必須為您提交的每個訓練任務選擇退出中繼資料收集。您還必須選擇退出 API 呼叫,如下列範例所示。您無法選擇在訓練指令碼內退出。

下一節說明如何使用 AWS CLI 適用於 Python (Boto3) 的 AWS SDK、 或 SageMaker Python SDK 選擇退出中繼資料收集。

使用 AWS Command Line Interface (AWS CLI) 選擇退出中繼資料收集

若要使用 選擇退出中繼資料收集 AWS CLI,請在 create-training-job API 1 中將環境變數設定為 OPT_OUT_TRACKING ,如下列程式碼範例所示。

aws sagemaker create-training-job \ --training-job-name your_job_name \ --algorithm-specification AlgorithmName=your_algorithm_name\ --output-data-config S3OutputPath=s3://bucket-name/key-name-prefix \ --resource-config InstanceType=ml.c5.xlarge, InstanceCount=1 \ --stopping-condition MaxRuntimeInSeconds=100 \ --environment OPT_OUT_TRACKING=1

使用 選擇退出中繼資料收集 適用於 Python (Boto3) 的 AWS SDK

若要使用 SDK for Python (Boto3) 選擇退出中繼資料收集,請在 create_training_job API 中將環境變數 1 設定為 OPT_OUT_TRACKING,如下列程式碼範例所示。

boto3.client('sagemaker').create_training_job( TrainingJobName='your_training_job', AlgorithmSpecification={ 'AlgorithmName': 'your_algorithm_name', 'TrainingInputMode': 'File', }, RoleArn='your_arn', OutputDataConfig={ 'S3OutputPath': 's3://bucket-name/key-name-prefix', }, ResourceConfig={ 'InstanceType': 'ml.m4.xlarge', 'InstanceCount': 1, 'VolumeSizeInGB': 123, }, StoppingCondition={ 'MaxRuntimeInSeconds': 123, }, Environment={ 'OPT_OUT_TRACKING': '1' }, )

使用 SageMaker Python SDK 選擇退出中繼資料收集

若要使用 SageMaker Python SDK 選擇退出中繼資料收集,請在 SageMaker AI 估算器內將環境變數 OPT_OUT_TRACKING 設定為 1,如下列程式碼範例所示。

sagemaker.estimator( image_uri='path_to_container', role='rolearn', instance_count=1, instance_type='ml.c5.xlarge', environment={ 'OPT_OUT_TRACKING': '1' }, )

選擇退出整個帳戶的中繼資料收集

如果您想要選擇退出多個帳戶的中繼資料收集,您可以設定環境變數,以選擇退出整個帳戶追蹤。您必須使用 SageMaker AI Python SDK 在帳戶層級選擇退出中繼資料收集。

下列程式碼範例展示如何退出整個帳戶追蹤。

SchemaVersion: '1.0' SageMaker: TrainingJob: Environment: 'OPT_OUT_TRACKING': '1'

如需如何退出整個帳戶追蹤的詳細資訊,請參閱設定和使用預設值搭配 SageMaker Python SDK

其他資訊

如果您的下游服務依賴 SageMaker AI 訓練

如果您操作依賴 SageMaker 訓練的服務,強烈建議您通知客戶 SageMaker Training 平台中進行彙總中繼資料收集,並讓他們可以選擇退出。或者,您可以代表客戶選擇退出中繼資料收集。

如果您是使用 SageMaker AI 訓練的服務用戶端或客戶

如果您是使用 SageMaker 訓練的服務用戶端或客戶,請使用上一節中您偏好的方法來選擇退出中繼資料收集。