

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Amazon SageMaker AI의 데이터 개인 정보 보호
<a name="data-privacy"></a>

Amazon SageMaker AI는 훈련 중에 사용되는 AWS소유 및 오픈 소스 라이브러리 사용에 대한 집계 정보를 수집합니다. SageMaker AI는 이 집계 메타데이터를 사용하여 서비스와 고객 경험을 개선합니다.

다음 섹션에서는 SageMaker AI가 수집하는 메타데이터 유형과 메타데이터 수집을 옵트아웃하는 방법에 대한 설명을 제공합니다.

## 수집되는 정보의 유형
<a name="data-privacy-info-types"></a>

**사용 정보**  
분산 훈련, 컴파일 및 양자화에 사용되는 라이브러리와 같이 SageMaker 훈련에 사용되는 AWS소유 및 오픈 소스 라이브러리의 메타데이터입니다.

**오류**  
SageMaker 훈련 플랫폼과의 상호 작용으로 인한 장애, 충돌, 캐스케이드를 포함한 예상치 못한 동작으로 인한 오류입니다.

## 메타데이터 수집을 옵트아웃하는 방법
<a name="data-privacy-opt-out"></a>

`CreateTrainingJob` API를 사용하여 훈련 작업을 만들 때 집계된 메타데이터를 SageMaker 훈련과 공유하지 않도록 옵트아웃할 수 있습니다. 콘솔을 사용하여 훈련 작업을 만드는 경우 메타데이터 수집은 기본적으로 비활성화됩니다.

**중요**  
제출하는 각 훈련 작업에 대한 메타데이터 수집을 옵트아웃하도록 선택해야 합니다. 또한 다음 예시와 같이 API 직접 호출에서 옵트아웃하도록 선택해야 합니다. 훈련 스크립트 내에서는 옵트아웃을 선택할 수 없습니다.

다음 섹션에서는 AWS CLI AWS SDK for Python (Boto3), 또는 SageMaker Python SDK를 사용하여 메타데이터 수집을 옵트아웃하는 방법을 보여줍니다.

### AWS Command Line Interface (AWS CLI)를 사용하여 메타데이터 수집 옵트아웃
<a name="data-privacy-opt-out-cli"></a>

를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예제와 같이 환경 변수를 `create-training-job` API`OPT_OUT_TRACKING``1`에서 로 AWS CLI설정합니다.

```
aws sagemaker create-training-job \
--training-job-name {{your_job_name}} \
--algorithm-specification AlgorithmName={{your_algorithm_name}}\
--output-data-config S3OutputPath={{s3://bucket-name/key-name-prefix}} \
--resource-config InstanceType={{ml.c5.xlarge}}, InstanceCount={{1}} \
--stopping-condition MaxRuntimeInSeconds={{100}} \
--environment OPT_OUT_TRACKING=1
```

### 를 사용하여 메타데이터 수집 옵트아웃 AWS SDK for Python (Boto3)
<a name="data-privacy-opt-out-boto3"></a>

SDK for Python(Boto3)을 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예시와 같이 `create_training_job` API에서 환경 변수 `OPT_OUT_TRACKING`을 `1`로 설정합니다.

```
boto3.client('sagemaker').create_training_job(
    TrainingJobName='{{your_training_job}}',
    AlgorithmSpecification={
        'AlgorithmName': '{{your_algorithm_name}}',
        'TrainingInputMode': 'File',
    },
    RoleArn='{{your_arn}}',
    OutputDataConfig={
        'S3OutputPath': 's3:{{//bucket-name/key-name-prefix}}',
    },
    ResourceConfig={
        'InstanceType': '{{ml.m4.xlarge}}',
        'InstanceCount': {{1}},
        'VolumeSizeInGB': {{123}},
    },
    StoppingCondition={
        'MaxRuntimeInSeconds': {{123}},
    },
    Environment={
        'OPT_OUT_TRACKING': '1'
    },
)
```

### SageMaker Python SDK를 사용하여 메타데이터 수집 옵트아웃
<a name="data-privacy-opt-out-sdk"></a>

SageMaker Python SDK를 사용하여 메타데이터 수집을 옵트아웃하려면 다음 코드 예시와 같이 SageMaker AI 예측기 내에서 환경 변수 `OPT_OUT_TRACKING`을 `1`로 설정합니다.

```
sagemaker.estimator(
    image_uri='{{path_to_container}}',
    role='{{rolearn}}',
    instance_count={{1}}, 
    instance_type='{{ml.c5.xlarge}}', 
    environment={
        'OPT_OUT_TRACKING': '1'
    }, 
)
```

### 계정 전체에서 메타데이터 수집 옵트아웃
<a name="data-privacy-opt-out-account-wide"></a>

여러 계정을 메타데이터 수집을 옵트아웃하려면 계정 전체 추적에서 옵트아웃하도록 환경 변수를 설정할 수 있습니다. 계정 수준에서 메타데이터 수집을 옵트아웃하려면 SageMaker AI Python SDK를 사용해야 합니다.

다음 코드 예시는 계정 전체 추적을 옵트아웃하는 방법을 보여줍니다.

```
SchemaVersion: '1.0'
SageMaker:
  TrainingJob:
    Environment:
      'OPT_OUT_TRACKING': '1'
```

계정 전체 추적을 옵트아웃하는 방법에 대한 자세한 내용은 [Configuring and using defaults with the SageMaker Python SDK](https://sagemaker.readthedocs.io/en/stable/overview.html#id22)를 참조하세요.

## 추가 정보
<a name="data-privacy-added-info"></a>

**다운스트림 서비스가 SageMaker AI 훈련에 의존하는 경우**

SageMaker 훈련에 의존하는 서비스를 운영하는 경우 고객에게 SageMaker 훈련 플랫폼의 집계 메타데이터 수집에 대해 알리고 옵트아웃할 수 있는 선택권을 제시하는 것이 좋습니다. 또는 고객을 대신하여 메타데이터 수집을 옵트아웃할 수 있습니다.

**SageMaker AI 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우**

SageMaker 훈련을 사용하는 서비스의 클라이언트 또는 고객인 경우 이전 섹션에서 선호하는 방법을 사용하여 메타데이터 수집을 옵트아웃합니다.