기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker HyperPod EKS 클러스터에서 Amazon EBS CSI 드라이버 사용
SageMaker HyperPod는 Amazon Elastic Block Store(Amazon EBS) 컨테이너 스토리지 인터페이스(CSI) 드라이버를 지원하며, 이 드라이버는 Amazon EBS 볼륨의 수명 주기를 사용자가 생성하는 Kubernetes 볼륨의 스토리지로 관리합니다. Amazon EBS CSI 드라이버를 사용하면 Amazon EKS 오케스트레이션을 통해 SageMaker HyperPod 클러스터에서 실행되는 기계 학습 워크로드에 대한 Amazon EBS 볼륨을 생성, 연결 및 관리할 수 있습니다.
주요 스토리지 기능
SageMaker HyperPod의 Amazon EBS CSI 드라이버는 다음과 같은 스토리지 기능을 지원합니다.
-
정적 프로비저닝: 사전 생성된 Amazon EBS 볼륨을 포드에 사용할 Kubernetes 영구 볼륨
과 연결합니다. -
동적 프로비저닝:
PersistentVolumeClaims에서 Amazon EBS 볼륨 및 연결된 영구 볼륨을 자동으로 생성합니다. 볼륨 생성을 세밀하게 제어하기 위해 StorageClass를 통해 파라미터를 전달할 수 있습니다. -
볼륨 크기 조정: 실행 중인 워크로드를 중단하지 않고
PersistentVolumeClaims크기 사양을 업데이트하여 기존 볼륨을 확장합니다. 이는 증가하는 모델 리포지토리를 처리하거나 서비스 중단 없이 더 큰 노드를 사용하는 데 필수적입니다. -
볼륨 스냅샷: 백업, 복구 및 데이터 버전 관리를 위한 볼륨의 특정 시점 스냅샷을 생성합니다.
-
블록 볼륨: 직접 스토리지 액세스가 필요한 고성능 애플리케이션에 원시 블록 디바이스 액세스를 제공합니다.
-
볼륨 수정: 유형, 초당 입출력 작업량(IOPS) 또는 볼륨 속성 클래스
를 사용한 처리량과 같은 볼륨 속성을 변경합니다.
Amazon EBS CSI 드라이버에 대한 자세한 내용은 Amazon EKS 사용 설명서의 Amazon EBS와 함께 Kubernetes 볼륨 스토리지 사용을 참조하세요.
클러스터의 포드 스토리지에 대한 자세한 내용은 Kubernetes 설명서의 Storage
사용 사례
Amazon EBS CSI 드라이버 통합을 사용하면 SageMaker HyperPod EKS 클러스터에서 훈련 및 추론 워크로드 둘 다에 대한 몇 가지 주요 사용 사례를 지원할 수 있습니다.
훈련 워크로드
-
데이터세트 스토리지: 포드 재시작 전반에 걸쳐 지속되는 훈련 데이터세트에 대한 볼륨 프로비저닝
-
체크포인트 스토리지: 모델 체크포인트 및 중간 훈련 결과 저장
-
공유 아티팩트: 여러 훈련 작업에서 공통 데이터세트 및 모델 아티팩트에 액세스
추론 워크로드
-
모델 스토리지: 모델 요구 사항에 따라 적절한 크기의 볼륨을 동적으로 프로비저닝
-
컨테이너 캐싱: 추론 성능 향상을 위한 임시 스토리지 생성
-
이벤트 로깅: 영구 스토리지와 함께 추론 결과 및 로그 저장
SageMaker HyperPod EKS 클러스터에서 Amazon EBS CSI 드라이버 설정
Amazon Elastic Block Store(Amazon EBS) 컨테이너 스토리지 인터페이스(CSI) 드라이버를 사용하면 EKS 오케스트레이션을 통해 SageMaker HyperPod 클러스터에서 실행되는 컨테이너화된 워크로드에 대해 Amazon EBS 볼륨을 동적으로 프로비저닝하고 관리할 수 있습니다. 이 섹션에서는 기계 학습 워크로드에 영구 스토리지를 활성화하도록 Amazon EBS CSI 드라이버를 설치하고 구성하는 방법을 안내합니다.
사전 조건
시작하기 전에 다음을 수행하십시오.
-
v1.47.0
버전으로 Amazon EBS CSI 드라이버 설치
추가 권한
Amazon EBS CSI 드라이버 추가 기능을 설정하려면 Amazon EKS 사용 설명서의 Amazon EBS와 함께 Kubernetes 볼륨 스토리지 사용의 지침을 따르세요. 또한 드라이버 추가 기능을 실행하는 데 사용되는 IAM 역할에 다음과 같은 추가 권한을 추가해야 합니다. 이는 HyperPod 클러스터 실행 역할이 아닌 드라이버 추가 기능에 대한 서비스 계정 구성에 지정된 IAM 역할입니다.
API 사용
다른 방법으로, AttachClusterNodeVolume 및 DetachClusterNodeVolume API 작업을 사용하여 Amazon EBS 볼륨을 SageMaker HyperPod EKS 클러스터 인스턴스에 연결하고 분리할 수 있습니다.
이러한 API를 사용하기 위한 주요 요구 사항은 다음과 같습니다.
-
Amazon EBS 볼륨과 SageMaker HyperPod EKS 클러스터는 모두 동일한 AWS 계정에서 소유해야 합니다.
-
연결 또는 분리 작업을 성공적으로 수행하려면 직접적으로 호출하는 위탁자에게 특정 최소 권한이 필요합니다. 이러한 권한에 대한 자세한 내용은 다음 섹션을 참조하세요.
-
볼륨을 HyperPod 노드에 연결한 후 SageMaker HyperPod 클러스터 노드에 액세스의 지침을 따라 클러스터 노드에 액세스하고 Make a volume available for use의 지침을 따라 연결된 볼륨을 탑재합니다.
sagemaker:AttachClusterNodeVolume에 필요한 권한
sagemaker:DetachClusterNodeVolume에 필요한 권한
AWS KMS 키에 필요한 권한
고객 관리형 KMS 키를 사용하여 HyperPod 클러스터 노드에 연결된 Amazon EBS 볼륨을 암호화하는 경우에만 다음 AWS KMS 권한을 추가합니다. AWS관리형 KMS 키(기본 암호화 옵션)를 사용하는 경우 이러한 권한이 필요하지 않습니다.
참고
이러한 AWS KMS 권한은 고객 관리형 KMS 키로 암호화된 클러스터 자동 볼륨 연결(CAVA) 볼륨을 분리할 sagemaker:DetachClusterNodeVolume 때 필요하지 않습니다.