기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
데이터 보호
ML 워크로드를 설계하기 전에, 보안에 영향을 미치는 기본적인 방법들을 준비해야 합니다. 예를 들어, 데이터 분류는 민감도 수준에 따라 데이터를 분류하는 방법을 제공하며, 암호화는 무단 액세스를 할 경우 데이터를 이해할 수 없게 만들어 데이터를 보호합니다. 이러한 방법이 중요한 이유는, 조작 부주의 방지 또는 규제 의무 사항 준수와 같은 목표의 달성을 지원하기 때문입니다.
SageMaker AI Studio는 저장 및 전송 중 데이터를 보호하기 위한 여러 기능을 제공합니다. 그러나 AWS 공동 책임 모델에
저장 데이터 보호
모델 구축 데이터 및 모델 아티팩트와 함께 SageMaker AI Studio 노트북을 보호하기 위해 SageMaker AI는 노트북과 훈련 및 배치 변환 작업의 출력을 암호화합니다. SageMaker AI는 기본적으로 AWS Amazon S3용 관리형 키를 사용하여 노트북을 암호화합니다. 이 Amazon S3용 AWS 관리형 키는 교차 계정 액세스를 위해 공유할 수 없습니다. 교차 계정 액세스의 경우 교차 계정 액세스를 위해 공유할 수 있도록 SageMaker AI 리소스를 생성하는 동안 고객 관리형 키를 지정합니다.
SageMaker AI Studio를 사용하면 데이터를 다음 위치에 저장할 수 있습니다.
-
S3 버킷 - 공유 가능한 노트북이 활성화되면 SageMaker AI Studio는 S3 버킷에서 노트북 스냅샷과 메타데이터를 공유합니다.
-
EFS 볼륨 - SageMaker AI Studio는 노트북 및 데이터 파일을 저장하기 위해 도메인에 EFS 볼륨을 연결합니다. 이 EFS 볼륨은 도메인이 삭제된 후에도 유지됩니다.
-
EBS 볼륨 - 노트북이 실행되는 인스턴스에 EBS 연결됩니다. 이 볼륨은 인스턴스 기간 동안 지속됩니다.
를 사용한 유휴 암호화 AWS KMS
-
AWS KMS 키를 전달하여 노트북, 훈련, 튜닝, 배치 변환 작업 및 엔드포인트에 연결된 EBS 볼륨을 암호화할 수 있습니다.
-
KMS 키를 지정하지 않으면 SageMaker AI는 시스템 관리형 KMS 키로 운영 체제(OS) 볼륨과 ML 데이터 볼륨을 모두 암호화합니다.
-
규정 준수를 위해 KMS 키로 암호화해야 하는 민감한 데이터는 ML 스토리지 볼륨 또는 Amazon S3에 저장해야 하며, 둘 다 지정한 KMS 키를 사용하여 암호화할 수 있습니다.
전송 중 데이터 보호
SageMaker AI Studio는 ML 모델 아티팩트 및 기타 시스템 아티팩트가 전송 중 및 저장 중에 암호화되도록 합니다. SageMaker AI API 및 콘솔에 대한 요청은 보안(SSL) 연결을 통해 이루어집니다. 일부 인트라 네트워크의 전송 중 데이터(서비스 플랫폼 내)는 암호화되지 않습니다. 여기에는 다음이 포함됩니다.
-
서비스 컨트롤 플레인과 훈련 작업 인스턴스(고객 데이터 아님) 간의 명령 및 제어 통신.
-
분산 처리 및 훈련 작업(인트라 네크워크)의 노드 간 통신.
하지만 훈련 클러스터의 노드 간 통신을 암호화하도록 선택할 수도 있습니다. 컨테이너 간 트래픽 암호화를 활성화하면 훈련 시간이 늘어날 수 있는데, 분산된 딥 러닝 알고리즘을 사용하는 경우 특히 더 그렇습니다.
기본적으로 Amazon SageMaker AI는 Amazon에서 훈련 작업을 실행VPC하여 데이터를 안전하게 유지합니다. 프라이빗을 구성하여 훈련 컨테이너와 데이터를 보호하기 위해 다른 수준의 보안을 추가할 수 있습니다VPC. 또한 SageMaker AI Studio 도메인이 VPC 전용 모드로 실행되도록 구성하고 인터넷을 통해 트래픽을 내보내지 않고 프라이빗 네트워크를 통해 트래픽을 라우팅하도록 VPC 엔드포인트를 설정할 수 있습니다.
데이터 보호 가드레일
유휴 SageMaker AI 호스팅 볼륨 암호화
온라인 추론을 위해 SageMaker AI 엔드포인트를 호스팅하는 동안 암호화를 적용하려면 다음 정책을 사용합니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "Encryption", "Effect": "Allow", "Action": [ "sagemaker:CreateEndpointConfig" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false" } } } ] }
모델 모니터링 중에 사용되는 S3 버킷 암호화하기
모델 모니터링
모델 모니터링 서비스는 엔드포인트 출력을 캡처하는 것 외에도, 사전 지정된 기준선을 기준으로 드리프트를 확인합니다. 드리프트를 모니터링하는 데 사용되는 출력 및 중간 스토리지 볼륨을 암호화해야 합니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "Encryption", "Effect": "Allow", "Action": [ "sagemaker:CreateMonitoringSchedule", "sagemaker:UpdateMonitoringSchedule" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false", "sagemaker:OutputKmsKey": "false" } } } ] }
SageMaker AI Studio 도메인 스토리지 볼륨 암호화
Studio 도메인에 연결된 스토리지 볼륨에 암호화를 적용합니다. 이 정책은 사용자가 스튜디오 도메인에 연결된 스토리지 볼륨을 암호화CMK하기 위해를 제공해야 합니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "EncryptDomainStorage", "Effect": "Allow", "Action": [ "sagemaker:CreateDomain" ], "Resource": "*", "Condition": { "Null": { "sagemaker:VolumeKmsKey": "false" } } } ] }
노트북을 공유하는 데 사용되는 S3에 저장된 데이터를 암호화합니다.
이는 SageMaker AI Studio 도메인의 사용자 간에 노트북을 공유하는 데 사용되는 버킷에 저장된 모든 데이터를 암호화하는 정책입니다.
{ "Version": "2012-10-17", "Statement": [ { "Sid": "EncryptDomainSharingS3Bucket", "Effect": "Allow", "Action": [ "sagemaker:CreateDomain", "sagemaker:UpdateDomain" ], "Resource": "*", "Condition": { "Null": { "sagemaker:DomainSharingOutputKmsKey": "false" } } } ] }
제한 사항
-
도메인이 생성되면 연결된 EFS 볼륨 스토리지를 사용자 지정 AWS KMS 키로 업데이트할 수 없습니다.
-
키가 생성된 후에는 KMS 키로 훈련/처리 작업 또는 엔드포인트 구성을 업데이트할 수 없습니다.